پردازش متن در پایتون: از واکشی داده تا مدل‌سازی زبانی

پروژه

12 ساعت

این پروژه با هدف آشنایی عملی با مباحث پردازش متن و مدل‌سازی زبان‌های طبیعی، به ویژه در حوزه متون موجود در اینترنت، انجام می‌شود. در این پروژه، داده‌های متنی از منابع مختلف مانند ویکی‌پدیا، سایت‌های خبری فارسی زبان، گنجور و نظرات کاربران در سایت‌های فروشگاهی جمع‌آوری و پس از پاکسازی و پیش‌پردازش، برای آموزش مدل‌های یادگیری ماشین یا فاین‌تونینگ مدل‌های پیش‌آموزش شده در محیط پایتون مورد استفاده قرار می‌گیرند.

هدف از این پروژه، جمع‌آوری و پاکسازی داده‌های متنی و انجام یکی از وظایف دسته‌بندی متون، مدل‌سازی عناوین، تشخیص موجودیت‌های نامدار، تحلیل احساسات، تولید متن، خلاصه‌سازی متن یا پاسخ به سوالات است (بخش اختیاری). در نهایت، عملکرد مدل‌های آموزش دیده بر روی داده‌های آزمون ارزیابی و نتایج در قالب گزارش، اسلاید و کد کامل پروژه ارائه می‌شود.

اهداف

فهرست:

1 درس12h

معرفی پروژه

مراحل انجام پروژه

خروجی پروژه

سعید مجیدی

سعید مجیدی فارغ التحصیل دکتری علوم کامپیوتر از دانشگاه تافتس آمریکا است و همکاری‌های متعددی به عنوان مدرس و دیتاساینتیست ارشد با مجموعه دقیقه انجام داده است.

4.48 (21 نظر)

14 دوره ها

4392 دانشجو

حسام محمدحسینی

مهندس داده در ایرانسل

مدیر ارشد مهندسی داده و پلتفرم مدیریت ارزش مشتری (CVM) در ایرانسل، سابقه مدیریت محصول در پلتفرم کلان‌داده دیجیکالا
مدیر ارشد اسبق عملکرد شبکه در ایرانسل
کارشناسی ارشد مخابرات سیستم از دانشگاه تربیت مدرس

4.75 (4 نظر)

7 دوره ها

478 دانشجو

نظرات

5.0

جمعاً 1 نظر

1 نظر

0 نظر

زف

زهره فولادچنگ

1 سال قبل

بسیار عالی بود!

خرید اشتراک

داده‌ها

پیش‌نیاز

مخاطبین

پژوهشگران NLP: منبعی برای تحقیقات و پروژه‌های پردازش زبان طبیعی.
توسعه‌دهندگان نرم‌افزار: بهبود برنامه‌های کاربردی مبتنی بر NLP
شرکت‌های فناوری: بهبود محصولات و خدمات مرتبط با پردازش زبان
سازمان‌ها: بهبود فرآیندهای مرتبط با داده‌های متنی
کاربران: استفاده بهتر از فناوری‌های مبتنی بر زبان‌های طبیعی

Python

تحلیل داده مدل‌های زبانی مطالعات کاربردی

مدرسه پردازش و تحلیل داده دقیقه