دوره آموزشی تحلیلگری داده با R دانشگاه صنعتی شریف

r4da

در این صفحه دوره آموزشی «تحلیلگری داده با R» معرفی شده و امکان ثبت نام برای دسترسی شرکت‌کنندگان دوره به محتوای اختصاصی آن فراهم شده است. برای دسترسی به محتوای دوره، لطفا کد ارائه شده توسط برگزارکنندگان را در انتهای صفحه وارد کنید و اطلاعات مورد نیاز را تکمیل کنید تا حساب کاربری و دسترسی به محتوا ایجاد شود. در صورت بروز مشکل با پشتیبانی دوره تماس بگیرید.

معرفی دوره

علوم داده‌ علاقه‌مندان زیادی را از رشته‌های گوناگون به خود جذب می‌کند. اما گستره وسیع امکانات و تنوع کاربردها، یادگیری و ورود به این حوزه را برای بسیاری با سردرگمی مواجه کرده است. شمار زیادی از علاقه‌مندان کار در علوم داده با این سوال دست به گریبانند که یادگیری را از کجا شروع کنند و چه مسیری را برای توسعه دانش و تقویت مهارت‌هایشان طی کنند. این سردرگمی برای کسانی که با پیش‌زمینه‌ای غیر از مهندسی کامپیوتر یا علوم کامپیوتر قصد عزیمت به بازار کار علوم داده را دارند، به خاطر ترس از یادگیری فناوری‌های جدید بیشتر هم هست. 

این افراد معمولا علاقه‌مندند به عنوان «تحلیلگر داده» در کسب و کارها یا پژوهشگاه‌های حوزه‌های اقتصاد و علوم اجتماعی مشغول به کار شوند و اتفاقا می‌توانند بسیار هم موفق و اثرگذار باشند. با این حال در گام‌های نخست نیاز به دریافت مسیر مناسب یادگیری، راهنمایی‌های درست و شبکه‌ای از افراد مشابه خود برای تمرین و تعامل هستند.  

این دوره آموزشی برای کسانی طراحی شده که به علوم داده علاقه دارند و می‌خواهند در آن مشغول به کار شوند اما پیش‌زمینه‌ای در آن ندارند و سابقه تحصیلی‌شان لزوما کامپیوتر و علوم مهندسی نیست.  

ویژگی‌های این دوره آموزشی

ویژگی‌هایی که این دوره آموزشی را با دیگر دوره‌های آموزشی متمایز می‌کند در ادامه به اختصار معرفی شده است.

تحلیل داده برای نابرنامه‌نویسان

دوره آموزشی «تحلیلگری داده با R» یک دوره مقدماتی برای قدم گذاشتن در مسیر یادگیری علوم داده است. R ابزاری است که مطابق اظهارات طراحانش از ابتدا برای نابرنامه‌نویسان طراحی شده و همین ویژگی آن را به یکی از محبوب‌ترین ابزارهای تحلیل داده در دنیا بدل کرده است. قابلیت‌های گوناگون R در کنار سادگی آن به تحلیلگر کمک می‌کند تا تمام تمرکز خود را روی کار با داده بگذارد و ایده‌های تحلیلی خود را پیاده‌سازی کند. اگر به تحلیل داده علاقه‌ دارید اما میانه‌ای با برنامه‌نویسی ندارید، این دوره آموزشی برای شما طراحی شده است. 

یادگیری برای استفاده

تمامی مدرسان این دوره آموزشی علاوه بر تحصیلات مرتبط و سابقه تدریس، تجربه کار حرفه‌ای در حوزه علوم داده را دارند و در این دوره آموزشی نیز در جلسات مختلف با داده‌های واقعی کار می‌کنند و به حل مسائل واقعی می‌پردازند. به همین خاطر، محتوای آموزشی و تمرین‌هایی که ارائه می‌کنند به گونه‌ای طراحی شده که شرکت‌کنندگان بتوانند به صورت گام به گام در مواجهه با چالش‌های مسائل واقعی تحلیل داده توانمند شوند. 

تقویت شبکه ارتباطی

در این دوره آموزشی، شرکت‌کنندگان علاوه برای دنبال کردن محتوای آموزشی و حل تمرین‌ و دریافت بازخورد، پروژه را به صورت گروهی انجام می‌دهند و فرصتی برای ایجاد با دیگر شرکت‌کنندگان پیدا می‌کنند. علاوه بر این یک رویداد حضوری در نیمه دوم دوره برگزار می‌شود که در این رویداد نیز فرصت گپ و گفت با دیگر شرکت‌کنندگان به وجود می‌آید. البته شرکت در این رویداد حضوری اختیاری است اما تجربه نشان داده ایجاد ارتباط با همکاران و هم‌صنفی‌ها در رشد و موفقیت افراد نقش مهمی بازی می‌کند و فرصت‌های تازه‌ای برای اشتغال آنان فراهم می‌کند. 

برنامه آموزشی

این دوره آموزشی از پنج بخش زیر تشکیل می‌شود:  
 
  1. معرفی علوم داده و آشنایی با R
  2. مصورسازی داده‌ و ترسیم نمودار
  3. تغییر ساختار و تحلیل اکتشافی داده
  4. آشنایی با آمار و مدلسازی
  5. پروژه پایانی
 

موضوعات هر بخش در ادامه با جزئیات بیشتر آمده است.

بهمن اجدری

  • علوم داده و کاربردهای آن
  • آشنایی با کامپیوتر و تفکر محاسباتی
  • معرفی زبان R و قابلیت‌های آن
  • نصب R و Rstudio
  • آشنایی با عملگرها و مقدارهای پایه در R

علیرضا کدیور

  • توابع پیش‌ساخته، بردار، ماتریس در R
  • لیست و جدول (data.frame)

بهمن اجدری

  • آشنایی با کتابخانه ggplot2 برای مصورسازی داده

بهمن اجدری

  • ارتقای کیفیت بصری‌ نمودارها در ggplot2 و ترسیم نقشه
  • کارگاه مصورسازی برای تحلیل داده

بهمن اجدری

  • آشنایی با اکوسیستم tidyverse
  • تبدیل داده با dplyr
  • ساخت زیرمجموعه از داده‌ها با استفاده از subset و filter
  • مرتب کردن داده‌ها (arrange)
  • محاسبات تجمیعی روی داده‌های گروه‌بندی شده (group_by)

بهمن اجدری

  • وارد کردن انواع فایل در R
  • آشنایی با ساختارهای ذخیره‌سازی فایل‌ها
  • چگونگی وارد کردن داده‌های مختلف در R
  • وارد کردن داده‌های فارسی در R
  • کارگاه دست‌ورزی با داده‌های واقعی

علیرضا کدیور

  • تحلیل داده و طرح پرسش
  • بررسی تغییرات مقادیر و روابط متغیرها
  • فرضیه‌سازی با تحلیل اکتشافی
  • برقراری ارتباط میان منابع مختلف داده
  • کار با توابع merge و join
  • آشنایی با جداول رابطه‌ای و پایگاه‌های داده
  • اتصال به پایگاه‌های داده رابطه‌ای

حمیده حسین زاده

  • تعریف توابع جدید
  • ساختارهای شرطی و حلقه‌های تکرار در R
  • کار با مقدارهایی از نوع تاریخ و ساعت
  • توابع پرکاربرد برای پردازش رشته‌ها
  • کارگاه رویارویی با چالش‌های حل مسائل واقعی تحلیل داده

علیرضا کدیور

  • پرسش‌های آماری
  • تفاوت توصیف و استنتاج آماری
  • اندازه‌گیری گرایش به مرکز با میانه و میانگین
  • واریانس، چندک‌بندی و دامنه بین چارکی

علیرضا کدیور

  • متغیر تصادفی و توزیع‌های آماری 
  • قضیه حد مرکزی و توزیع‌ نرمال
  • محاسبه p-value
  • کارگاه آمار و احتمال (شبیه‌سازی مونت‌کارلو و bootstrap)

علیرضا کدیور

  • مدلسازی آماری
  • تحلیل رگرسیون

حمیده حسین زاده 

  • رگرسیون‌های غیرخطی (loess و …)

سعید مجیدی

  • مدل‌های دسته‌بندی classification مانند درخت تصمیم، رگرسیون لجستیک و نزدیک‌ترین k-همسایه

سعید مجیدی

کارگاه مدلسازی و تحلیل داده‌های رسته‌ای

دانشگاه صنعتی شریف

گروه‌بندی و تعریف پروژه (حضوری – آنلاین) 

اطلاعات برگزاری

  • سطح دوره: مقدماتی و متوسط
  • طول دوره آموزشی: 4۰ ساعت
  • شیوه برگزاری: آنلاین
    (۲ جلسه برای کسانی که علاقه‌مندند به صورت حضوری با مدرس ارتباط بگیرند به صورت حضوری-آنلاین برگزار خواهد شد. شرکت حضوری در این دو جلسه اجباری نخواهد بود)
  • نوع ارزشیابی: ارزیابی تمرین‌ها و پروژه پایانی
  • زمان برگزاری کلاس‌ها: یکشنبه و چهارشنبه از ساعت ۱۷:۳۰ تا ۲۰:۴۵
  • زمان شروع: 22 مرداد ۱۴۰۲
  • زمان پایان: پایان مهر۱۴۰۲
  • زمان ارائه گواهینامه دانشگاه: آبان ۱۴۰۲

مدرسان

محمدامین فضلی

محمدامین فضلی

دکترای مهندسی نرم‌افزار از دانشگاه صنعتی شریف، محقق بین رشته‌ای، عضو هیئت علمی دانشگاه و مدیر گروه نرم‌افزار دانشگاه صنعتی شریف (مدیر علمی دوره)

علیرضا کدیور

علیرضا کدیور

کارشناسی ارشد آمار و تحقیق در عملیات از دانشگاه اسکس انگلستان، تحلیلگر داده، مدرس دانشگاه صنعتی شریف

سعید مجیدی

سعید مجیدی

دکترای علوم کامپیوتر از دانشگاه تافتز آمریکا، متخصص یادگیری ماشین و پردازش زبان‌های طبیعی

حمیده حسین زاده

حمیده حسین زاده

دکترای علوم ریاضی از دانشگاه الزهرا، متخصص علوم داده و پردازش داده‌های حجیم

بهمن اجدری

بهمن اجدری

کارشناسی ارشد مدیریت بازاریابی و تجارت الکترونیک از دانشگاه لولئا سوئد، تحلیلگر داده‌های کسب و کار

برگزارکننده

مرکز آموزش‌های تخصصی دانشگاه صنعتی شریف

دسترسی به محتوای اختصاصی

برای دسترسی به محتوای اختصاصی رویداد لطفا کدی را که در اختیار شما قرار گرفته را وارد کنید و بقیه مراحل را طی کنید.

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors