
چرا علوم اجتماعی به تحلیل داده نیاز دارد؟
استفاده از توان پردازش کامپیوتر برای پژوهشگران علوم اجتماعی مانند استفاده از تلسکوپ برای منجِّمان است. چهارصد سال پیش از این، وقتی گالیله تلسکوپ را به عنوان ابزاری جدید برای شناخت ستارگان به کار گرفت علم نجوم دستخوش تحولاتی عمیق شد و بسیاری از گزارههای نادرست برای همیشه از آن رخت بر بست. پژوهشگران علوم اجتماعی تلاش میکنند تا پدیدهها و رخدادهای اجتماعی مانند انقلاب، فقر، تغییرات جمعیتی، شکافهای طبقاتی و پیامدهای هر یک از آنها را تبیین کنند. در روزگار حاضر، دادههای زیادی در ارتباط با هر یک از این پدیدهها وجود دارد یا قابل تولید است و پژوهشگران میتوانند با گردآوری و تحلیل آنها توانایی موضوعات مورد علاقه در علوم اجتماعی را با تکیه بر مستندات بسیار بررسی

برای تحلیل داده با R چه چیزهایی یاد بگیرم؟
بسیاری از کسانی که دوست دارند وارد بازار کار علوم داده شوند با این سوال دست به گریبانند که یادگیری را از کجا شروع کنند و چه مسیری را برای توسعه دانش و تقویت مهارتهایشان طی کنند. در این نوشته با پرداختن به یکی از این مسیرهای یادگیری به نام «تحلیلگر داده با R» به این سوال داده میشود.

ایجاد انگیزه و افزایش مشارکت در یادگیری علوم داده
خلأ اصلی نیروی انسانی در بازار کار علوم داده، افرادی هستند که توانایی تجزیه و تحلیلِ پیچیدگیهای ناشی از ابعاد اقتصادی و مدیریتی و مهمتر از آن ابعاد انسانی و اجتماعی مسائل را داشته باشند. اما مسئله این اینجاست که این قابلیتها به صورت متداول در دانشگاهها و موسسات آموزشی و همینطور در محیطهای کاری پرورش پیدا نمیکند. این مقاله نیز روی همین نکته دست میگذارد و روشی مبتنی بر «مشارکت و ارزیابی مشارکت» برای پرورش توانایی تفکر انتقادی در میان دانشجویان و متخصصان علوم داده پیشنهاد میکند.
دادههای سبد غذایی ایرانیان
مرکز آمار ایران سالانه ۲۰ هزار نفر را برای طرح بودجه خانوار مورد پرسش قرار میدهد. دادههای خام این پژوهش در وبسایت مرکز آمار ایران قابل
آموزش مقدماتی علوم داده با پایتون دانشگاه شریف
مدرسه پردازش و تحلیل داده دقیقه اقدام به برگزاری کارگاه تحلیل دادههای نظرسنجی در R کرده است.
تحلیل دادههای کسب و کار در R
مدرسه پردازش و تحلیل داده دقیقه اقدام به برگزاری کارگاه تحلیل دادههای نظرسنجی در R کرده است.
دوره تحلیل دادههای نظرسنجی برگزار شد
کارگاه ۳ روزه دادههای نظرسنجی در R برگزار شد. مدرسه پردازش و تحلیل داده دقیقه در ادامه رویدادهای آموزشی خود بک کارگاه سه روزه تحلیل داده برگزار کرد.
دادههای پیمایش ارزشهای جهانی
دادههای پیمایش ارشهای جهانی کاری ارزشمند در حوزههای علوم اجتماعی، سیاسی و حتی مدیریت محسوب میشود. این دادههاامکان مقایسه کشورها را در بسیاری حوزهها فراهم میکند و به دلیل آنکه این دادهها از سال ۱۳۵۹ شمسی بطور مستمر جمع آوری شده است امکان مقایسهها طولی را نیز به تحلیلگران می دهد.
کارگاه تحلیل دادههای نظرسنجی در R
مدرسه پردازش و تحلیل داده دقیقه اقدام به برگزاری کارگاه تحلیل دادههای نظرسنجی در R کرده است.
گزارش جلسه اول کارگاه تحلیل داده در R
روز نخست کارگاه «تحلیل داده در R» در هفتهای که گذشت در دانشکده مهندسی صنایع دانشگاه شریف برگزار شد. در روز اول خیلی سریع با R آشنا شدیم و با بررسی دادههای آلودگی هوای تهران سوالات متعددی طرح کردیم تا در ادامه کارگاه سعی کنیم با تحلیل داده به یکی از اون سوالات پاسخ بدیم. این سوال را با رایگیری از بین ده ایدهای که در کلاس مطرح شد انتخاب کردیم. شرح کامل آنچه در روز اول در کارگاه تحلیل داده با R گذشت را در این مطلب مطالعه کنید.
دوره آموزشی تحلیل داده، ویژه گروه کسب و کار آن (آنسو)
برگزاری دوره تحلیل داده با همکاری آکادمی آنسو.
جادی؛ معلم فناوری و مدافع اینترنت آزاد
گستردگی موضوعات و پراکندگی منابع انتشار محتوای جادی، گاهی دسترسی به تولیداتش را دشوار میکند. به پاس زحمات زیاد جادی برای جامعه کاربران فارسیزبان اینترنت و با احترام به رویای همیشگیاش یعنی اینترنت آزاد و حفظ آزادگی در کار، فهرستی از محتوایی که در سالهای اخیر تولید کرده را در کنار معرفی مختصری از وی منتشر میکنیم.
گزارش جلسه پایانی دوره تحلیل داده برای دیتاژورنالیسم
نخستین دوره تحلیل داده برای گزارشنویسی و دیتاژورنالیسم در شهریور ۱۴۰۱ برگزار شد.
تحلیل داده برای گزارشنویسی و دیتاژورنالیسم در R ویژه کانون کارگزاران
این صفحه به معرفی دوره آموزش غیرحضوری (آنلاین) «دیتاژورنالیسم؛ مقدمهای بر آمار و تحلیل داده در R» برای انجمن جامعهشناسی ایران اختصاص دارد. این دوره از هفت بخش تشکیل شده و در تابستان ۱۴۰۱ برگزار میشود.
مقدمهای بر آمار و تحلیل داده در R؛ ویژه انجمن جامعهشناسی ایران
این صفحه به معرفی دوره آموزش غیرحضوری (آنلاین) «مقدمهای بر آمار و تحلیل داده در R» برای انجمن جامعهشناسی ایران اختصاص دارد. این دوره از هفت بخش تشکیل شده و در تابستان ۱۴۰۱ برگزار میشود.

چهارچوب اکتشاف
اگر R را برای کار با دادهها انتخاب کردهاید و میخواهید یک کتاب درباره علوم داده بخوانید، یکی از بهترین انتخابها «R برای علوم داده» است.

پرواز با ارتفاع مناسب
معرفی و مرور کتاب «علم داده» از سری کتابهای دانشهای ضروری انتشارات دانشگاه امآیتی

تصویرگری با قلموی الگوریتم
در تصاویر هنر زایشگر معمولا جزئیات زیادی وجود دارد. اشکال و رنگها با ظرافت و هارمونی خیرهکنندهای در کنار یکدیگر قرار میگیرند و توجه بیننده را به خود جلب میکنند. اما آنچه در چنین آثاری بیننده را به مشاهده و کشفوشهود دعوت میکند این اجزا نیست، بلکه یک چیز دیگر است!
آیا میدانید این تصاویر با چه ابزارهایی ساخته شدهاند؟


فرهنگ داده کلید اثرگذاری علوم داده در کسبوکار
بر اساس بررسی مکنزی بخش عمدهای از شرکتهای برتر نوآور در دنیا در حوزه داده نیز فعالیت میکنند. با این حــــال، تنــها ۲۰٪ از راهحــلهایی که ریــشه در پردازش و تحلیل داده دارد در نهایت به خروجی مـوثـر و پایــدار خــتــم میشــوند. علت این ناکامی چیست؟ یکی از مهمترین عوامل این ناکامی، عدم تقویت فرهنگ داده در کسبوکارهاست.
مقایسه واریانس در R
مقایسه واریانس در موارد متعددی کاربرد دارد از جمله: ۱- هنگامی که مایل هستید بدانید که آیا واریانس دادهها در دو گروه نمونه یکسان است
مدیریت دادههای گمشده در R
یکی از متداولترین و اولین کارها در پاکسازی دادهها، مدیریت دادههای گم شده است. دادههای گم شده یا همان missing value معمولا به دلایل مختلفی به وجود میآیند. اشتباه کاربر در ورود داده، موجود نبودن مقادیر در زمان ثبت دادهها و مسائلی از این دست دلایل بوجود آمدن دادههای گم شده است.


جادی؛ معلم فناوری و مدافع اینترنت آزاد
گستردگی موضوعات و پراکندگی منابع انتشار محتوای جادی، گاهی دسترسی به تولیداتش را دشوار میکند. به پاس زحمات زیاد جادی برای جامعه کاربران فارسیزبان اینترنت و با احترام به رویای همیشگیاش یعنی اینترنت آزاد و حفظ آزادگی در کار، فهرستی از محتوایی که در سالهای اخیر تولید کرده را در کنار معرفی مختصری از وی منتشر میکنیم.


تحلیل داده به عنوان مزیت رقابتی استراتژیک در کسبوکار
اگر بخواهید کسب و کار خود را صرفاً با تکیه بر ویژگیهای محصول خود با دیگران متمایز کنید راه به جایی نخواهید برد. رقبا هم به منابعی که شما دسترسی دارید دسترسی دارند و ویژگیهایی شبیه به ویژگیهای محصول شما را توسعه میدهند. چاره کار در ایجاد مزیت رقابتی مبتنی بر «بهرهبرداریِ تحلیلی از دادهها» است. این مقاله چرا و چگونهاش را توضیح خواهد داد.


پایگاه داده گرافی چیست؟
در علم محاسبات یک پایگاه داده گراف، پایگاه دادهای است که از ساختار گرافها برای پرسوجوهای معنایی، نمایش و ذخیره دادهها استفاده میکند و از گرهها، یالها و ویژگیهای آنها تشکیل شده است.
اغلب پایگاهدادههای گرافی بهطور طبیعی زیرمجموعهای از محسوب میشوند و اطلاعاتشان را به صورت یا پایگاه داده سند محور ذخیره میکنند.
مقایسه واریانس در R
مقایسه واریانس در موارد متعددی کاربرد دارد از جمله: ۱- هنگامی که مایل هستید بدانید که آیا واریانس دادهها در دو گروه نمونه یکسان است
مدیریت دادههای گمشده در R
یکی از متداولترین و اولین کارها در پاکسازی دادهها، مدیریت دادههای گم شده است. دادههای گم شده یا همان missing value معمولا به دلایل مختلفی به وجود میآیند. اشتباه کاربر در ورود داده، موجود نبودن مقادیر در زمان ثبت دادهها و مسائلی از این دست دلایل بوجود آمدن دادههای گم شده است.
- معمای هفته
اینجا هر هفته یک معما طرح میشود. پاسخ به معما را برای ما ارسال کنید (لینک ارسال). بهترین پاسخ پس از یک هفته همینجا منتشر میشود.
پیدا کردن سارقان موبایل با تحلیل داده
تعداد موارد سرقت موبایل در ساعتهای مختلف شبانهروز در یکی از مناطق شهر بسیار زیاد است. پلیس مسئله را بررسی کرده و با کنار هم قرار دادن مشخصات ظاهری سارقین و سایر اطلاعات به این نتیجه رسیده که با دو سارق مختلف طرف هستیم: سارق A و سارق B. در بیشتر موارد در گزارشها مشخص شده که سرقت را کدام یک از این دو شخص انجام دادهاند. اما در بعضی موارد اطلاعاتی که در گزارشها آمده برای تعیین سارق کافی نیست. با این حال، پلیس اطلاعاتی مبنی بر این که در این موارد، سرقت توسط شخصی غیر از این دو
رقابت استادبزرگان شطرنج
قرار است دو استادبزرگ شطرنج جهان در ۱۲ بازی با یکدیگر رقابت کنند. در هر بازی برد ۱ امتیاز، شکست ۰ امتیاز و مساوی ۰.۵ امتیاز دارد (۱) اگر احتمال برد نفر اول در هر بازی ۲۰%، احتمال برد نفر دوم ۱۵% و احتمال مساوی ۶۵% است. در این رقابت یعنی در مجموع تمامی بازیها کسی برنده میشود که بیش از نصف امتیازات کسب کند. نفر نخست چقدر شانس برای بردن رقابت دارد؟ (۲) برای اینکه نفر نخست ۷۵% شانس پیروزی داشته باشد تقریباً چند بازی لازم است؟ برای ۹۰% چطور؟