پردازش متن در پایتون: از واکشی داده تا مدل‌سازی زبانی

48
12 ساعت

این پروژه با هدف آشنایی عملی با مباحث پردازش متن و مدل‌سازی زبان‌های طبیعی، به ویژه در حوزه متون موجود در اینترنت، انجام می‌شود. در این پروژه، داده‌های متنی از منابع مختلف مانند ویکی‌پدیا، سایت‌های خبری فارسی زبان، گنجور و نظرات کاربران در سایت‌های فروشگاهی جمع‌آوری و پس از پاکسازی و پیش‌پردازش، برای آموزش مدل‌های یادگیری ماشین یا فاین‌تونینگ مدل‌های پیش‌آموزش شده در محیط پایتون مورد استفاده قرار می‌گیرند.

هدف از این پروژه، جمع‌آوری و پاکسازی داده‌های متنی و انجام یکی از وظایف دسته‌بندی متون، مدل‌سازی عناوین، تشخیص موجودیت‌های نامدار، تحلیل احساسات، تولید متن، خلاصه‌سازی متن یا پاسخ به سوالات است (بخش اختیاری). در نهایت، عملکرد مدل‌های آموزش دیده بر روی داده‌های آزمون ارزیابی و نتایج در قالب گزارش، اسلاید و کد کامل پروژه ارائه می‌شود.

اهداف

فهرست:

1 درس12h

معرفی پروژه

مراحل انجام پروژه

خروجی پروژه

سعید مجیدی فارغ التحصیل دکتری علوم کامپیوتر از دانشگاه تافتس آمریکا است و همکاری‌های متعددی به عنوان مدرس و دیتاساینتیست ارشد با مجموعه دقیقه انجام داده است.

4.55 (11 نظر)

7 دوره ها

3231 دانشجو

حسام محمدحسینی

مهندس داده در ایرانسل

مدیر ارشد مهندسی داده و پلتفرم مدیریت ارزش مشتری (CVM) در ایرانسل، سابقه مدیریت محصول در پلتفرم کلان‌داده دیجیکالا
مدیر ارشد اسبق عملکرد شبکه در ایرانسل
کارشناسی ارشد مخابرات سیستم از دانشگاه تربیت مدرس

0 (0 نظر)

4 دوره ها

230 دانشجو

نظرات

پیش‌نیاز

مخاطبین

  • پژوهشگران NLP: منبعی برای تحقیقات و پروژه‌های پردازش زبان طبیعی.
  • توسعه‌دهندگان نرم‌افزار: بهبود برنامه‌های کاربردی مبتنی بر NLP
  • شرکت‌های فناوری: بهبود محصولات و خدمات مرتبط با پردازش زبان
  • سازمان‌ها: بهبود فرآیندهای مرتبط با داده‌های متنی
  • کاربران: استفاده بهتر از فناوری‌های مبتنی بر زبان‌های طبیعی
Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors