چرا علوم اجتماعی به تحلیل داده‌ نیاز دارد؟

استفاده از توان پردازش کامپیوتر برای پژوهشگران علوم اجتماعی مانند استفاده از تلسکوپ برای منجِّمان است. چهارصد سال پیش از این، وقتی گالیله تلسکوپ را به عنوان ابزاری جدید برای شناخت ستارگان به کار گرفت علم نجوم دستخوش تحولاتی عمیق شد و بسیاری از گزاره‌های نادرست برای همیشه از آن رخت بر بست. پژوهشگران علوم اجتماعی تلاش می‌کنند تا پدیده‌ها و رخدادهای اجتماعی مانند انقلاب، فقر، تغییرات جمعیتی، شکاف‌های طبقاتی و پیامد‌های هر یک از آن‌ها را تبیین کنند. در روزگار حاضر، داده‌های زیادی در ارتباط با هر یک از این پدیده‌ها وجود دارد یا قابل تولید است و پژوهشگران می‌توانند با گردآوری و تحلیل آن‌ها توانایی موضوعات مورد علاقه در علوم اجتماعی را با تکیه بر مستندات بسیار بررسی

برای تحلیل داده با R چه چیزهایی یاد بگیرم؟

بسیاری از کسانی که دوست دارند وارد بازار کار علوم داده شوند با این سوال دست به گریبانند که یادگیری را از کجا شروع کنند و چه مسیری را برای توسعه دانش و تقویت مهارت‌هایشان طی کنند. در این نوشته با پرداختن به یکی از این مسیرهای یادگیری به نام «تحلیلگر داده با R» به این سوال داده می‌شود.

ایجاد انگیزه و افزایش مشارکت در یادگیری علوم داده

خلأ اصلی نیروی انسانی در بازار کار علوم داده، افرادی هستند که توانایی تجزیه و تحلیلِ پیچیدگی‌های ناشی از ابعاد اقتصادی و مدیریتی و مهم‌تر از آن ابعاد انسانی و اجتماعی مسائل را داشته باشند. اما مسئله این اینجاست که این قابلیت‌ها به صورت متداول در دانشگاه‌ها و موسسات آموزشی و همینطور در محیط‌های کاری پرورش پیدا نمی‌کند. این مقاله نیز روی همین نکته دست می‌گذارد و روشی مبتنی بر «مشارکت و ارزیابی مشارکت» برای پرورش توانایی تفکر انتقادی در میان دانشجویان و متخصصان علوم داده پیشنهاد می‌کند.

داده‌های سبد غذایی ایرانیان

مرکز آمار ایران سالانه ۲۰ هزار نفر را برای طرح  بودجه خانوار مورد پرسش قرار می‌دهد. داده‌های خام این پژوهش در وب‌سایت مرکز آمار ایران قابل

داده‌های پیمایش ارزش‌های جهانی

داده‌های پیمایش ارش‌های جهانی کاری ارزشمند در حوزه‌های علوم اجتماعی، سیاسی و حتی مدیریت محسوب می‌شود. این داده‌هاامکان مقایسه کشورها را در بسیاری حوزه‌ها فراهم می‌کند و به دلیل آن‌که این داده‌ها از سال ۱۳۵۹ شمسی بطور مستمر جمع آوری شده است امکان مقایسه‌ها طولی را نیز به تحلیل‌گران می دهد.

گزارش جلسه اول کارگاه تحلیل داده در R

روز نخست کارگاه «تحلیل داده در R» در هفته‌ای که گذشت در دانشکده مهندسی صنایع دانشگاه شریف برگزار شد. در روز اول خیلی سریع با R آشنا شدیم و با بررسی داده‌های آلودگی هوای تهران سوالات متعددی طرح کردیم تا در ادامه کارگاه سعی کنیم با تحلیل داده به یکی از اون سوالات پاسخ بدیم. این سوال را با رای‌گیری از بین ده ایده‌ای که در کلاس مطرح شد انتخاب کردیم. شرح کامل آنچه در روز اول در کارگاه تحلیل داده با R گذشت را در این مطلب مطالعه کنید.

جادی؛ معلم فناوری و مدافع اینترنت آزاد

گستردگی موضوعات و پراکندگی منابع انتشار محتوای جادی، گاهی دسترسی به تولیداتش را دشوار می‌کند. به پاس زحمات زیاد جادی برای جامعه کاربران فارسی‌زبان اینترنت و با احترام به رویای همیشگی‌اش یعنی اینترنت آزاد و حفظ آزادگی در کار، فهرستی از محتوایی که در سال‌های اخیر تولید کرده را در کنار معرفی مختصری از وی منتشر می‌کنیم.

چهارچوب اکتشاف

اگر R را برای کار با داده‌ها انتخاب کرده‌اید و می‌خواهید یک کتاب درباره علوم داده بخوانید، یکی از بهترین انتخاب‌ها «R برای علوم داده» است.

پرواز با ارتفاع مناسب

معرفی و مرور کتاب «علم داده» از سری کتاب‌های دانش‌های ضروری انتشارات دانشگاه ام‌آی‌تی

سواد داده

فرهنگ داده کلید اثرگذاری علوم داده در کسب‌وکار

بر اساس بررسی مکنزی بخش عمده‌ای از شرکت‌های برتر نوآور در دنیا در حوزه داده نیز فعالیت می‌کنند. با این حــــال، تنــها ۲۰٪ از راه‌حــل‌هایی که ریــشه در پردازش و تحلیل داده‌ دارد در نهایت به خروجی مـوثـر و پایــدار خــتــم می‌شــوند. علت این ناکامی چیست؟ یکی از مهمترین عوامل این ناکامی، عدم تقویت فرهنگ داده در کسب‌وکارهاست.

مقایسه واریانس در R

مقایسه واریانس در موارد متعددی کاربرد دارد از جمله: ۱- هنگامی که مایل هستید بدانید که آیا واریانس داده‌ها در دو گروه نمونه یکسان است

مدیریت داده‌های گمشده در R

یکی از متداول‌ترین و اولین کارها در پاک‌سازی داده‌ها، مدیریت داده‌های گم شده است. داده‌های گم شده یا همان missing value معمولا به دلایل مختلفی به وجود می‌آیند. اشتباه کاربر در ورود داده، موجود نبودن مقادیر در زمان ثبت داده‌ها و مسائلی از این دست دلایل بوجود آمدن داده‌های گم شده است.

جادی؛ معلم فناوری و مدافع اینترنت آزاد

گستردگی موضوعات و پراکندگی منابع انتشار محتوای جادی، گاهی دسترسی به تولیداتش را دشوار می‌کند. به پاس زحمات زیاد جادی برای جامعه کاربران فارسی‌زبان اینترنت و با احترام به رویای همیشگی‌اش یعنی اینترنت آزاد و حفظ آزادگی در کار، فهرستی از محتوایی که در سال‌های اخیر تولید کرده را در کنار معرفی مختصری از وی منتشر می‌کنیم.

استراتژی

تحلیل داده‌ به عنوان مزیت رقابتی استراتژیک در کسب‌وکار

اگر بخواهید کسب و کار خود را صرفاً با تکیه بر ویژگی‌های محصول خود با دیگران متمایز کنید راه به جایی نخواهید برد. رقبا هم به منابعی که شما دسترسی دارید دسترسی دارند و ویژگی‌هایی شبیه به ویژگی‌های محصول شما را توسعه می‌دهند. چاره کار در ایجاد مزیت رقابتی مبتنی بر «بهره‌برداریِ تحلیلی از داده‌ها» است. این مقاله چرا و چگونه‌اش را توضیح خواهد داد.

پایگاه داده گرافی

پایگاه داده گرافی چیست؟

در علم محاسبات یک پایگاه داده گراف، پایگاه داده‌ای است که از ساختار گراف‌ها برای پرس‌وجوهای معنایی، نمایش و ذخیره داده‌ها استفاده می‌کند و از گره‌ها،‌ یال‌ها و ویژگی‌های آنها تشکیل شده است.
اغلب پایگاه‌داده‌های گرافی به‌طور طبیعی زیرمجموعه‌ای از محسوب می‌شوند و اطلاعاتشان را به صورت یا پایگاه داده سند محور ذخیره می‌کنند.

مقایسه واریانس در R

مقایسه واریانس در موارد متعددی کاربرد دارد از جمله: ۱- هنگامی که مایل هستید بدانید که آیا واریانس داده‌ها در دو گروه نمونه یکسان است

مدیریت داده‌های گمشده در R

یکی از متداول‌ترین و اولین کارها در پاک‌سازی داده‌ها، مدیریت داده‌های گم شده است. داده‌های گم شده یا همان missing value معمولا به دلایل مختلفی به وجود می‌آیند. اشتباه کاربر در ورود داده، موجود نبودن مقادیر در زمان ثبت داده‌ها و مسائلی از این دست دلایل بوجود آمدن داده‌های گم شده است.

اینجا هر هفته یک معما طرح می‌شود. پاسخ‌ به معما را برای ما ارسال کنید (لینک ارسال). بهترین پاسخ‌ پس از یک هفته همین‌جا منتشر می‌شود.

پیدا کردن سارقان موبایل با تحلیل داده

تعداد موارد سرقت موبایل در ساعت‌های مختلف شبانه‌روز در یکی از مناطق شهر بسیار زیاد است. پلیس مسئله را بررسی کرده و با کنار هم قرار دادن مشخصات ظاهری سارقین و سایر اطلاعات به این نتیجه رسیده که با دو سارق مختلف طرف هستیم: سارق A و سارق B. در بیشتر موارد در گزارش‌ها مشخص شده که سرقت را کدام یک از این دو شخص انجام داده‌اند. اما در بعضی موارد اطلاعاتی که در گزارش‌ها آمده برای تعیین سارق کافی نیست. با این حال، پلیس اطلاعاتی مبنی بر این که در این موارد، سرقت توسط شخصی غیر از این دو

رقابت استادبزرگان شطرنج

قرار است دو استادبزرگ شطرنج جهان در ۱۲ بازی با یکدیگر رقابت کنند. در هر بازی برد ۱ امتیاز، شکست ۰ امتیاز و مساوی ۰.۵ امتیاز دارد (۱) اگر احتمال برد نفر اول در هر بازی ۲۰%، احتمال برد نفر دوم ۱۵% و احتمال مساوی ۶۵% است. در این رقابت یعنی در مجموع تمامی بازی‌ها کسی برنده می‌شود که بیش از نصف امتیازات کسب کند. نفر نخست چقدر شانس برای بردن رقابت دارد؟ (۲) برای اینکه نفر نخست ۷۵% شانس پیروزی داشته باشد تقریباً چند بازی لازم است؟ برای ۹۰% چطور؟