اگر R را برای کار با دادهها انتخاب کردهاید و میخواهید یک کتاب درباره علوم داده بخوانید، یکی از بهترین انتخابها «R برای علوم داده» است.
این کتاب، کار در علوم داده با زبان R را به صورت گام به گام و البته جذاب آموزش میدهد. در «R برای علوم داده» وارد کردن داده، تبدیل آن به قابل استفادهترین ساختارها، مصورسازی و مدلسازی معرفی خواهند شد و طیف گستردهای از مهارتهای رایج در علوم داده تمرین خواهند شد. اما از جمله هیجانانگیزترین بخشهای کتاب میتوان به آموزش قواعد مصورسازی داده در نمونههای واقعی و فوتوفن استفاده از مدلسازی برای تحلیلهای اکتشافی اشاره کرد.
بطور خلاصه این کتاب تقریبا تمام مهارتهای لازم برای کار با داده را پوشش میدهد و با ایجاد حس کنجکاوی شما را برای کشف بیشتر ترغیب میکند. همچنین خواندن این کتاب احتیاج به دانش برنامهنویسی ندارد و هر آنچه لازم باشد در حین خواندن کتاب یاد خواهید گرفت.
نویسندگان این کتاب هدلی ویکام (Hadley Wickham) و گرِت گرولموند (Garrett Grolemund) هستند. هدلی ویکام در میان تحلیگرانی که از زبان R برای پردازش و تحلیل دادهها استفاده میکنند فردی کاملاً شناختهشده و تاثیرگذار است. چند نمونه از محبوبترین کتابخانههای R مانند ggplot2، dplyr و tidyr محصول کار هَدلی است. او بیشتر زمان خود را صرف به وجود آوردن ابزارهایی میکند که کار در علوم داده را برای تحلیلگران تسهیل کند و هماکنون به عنوان راهبر علمی در شرکت RStudio و استاد کمکی در دانشگاههای آکلند، استنفورد و رایس در آمریکا مشغول به کار است. گرت گرولموند مدرس علوم داده با زبان R، ویرایشگر ارشد کتابخانه Shiny و R Markdown در شرکت RStudio و دانشآموخته رواشناسی و آمار از دانشگاههای هاروارد و رایس است.
هدلی از دوران دانشجویی دلبستۀ ابزارها و روشهای عملی برای اکتشاف در دادهها بود و پایاننامه دکتری خود را نیز با همین موضوع نوشت (+). هدلی ویکام، وقتی به عنوان استاد آمار در دانشگاه رایس مشغول به کار بود مشاور پایاننامه گرت گرولوموند شد که این آشنایی مقدمه همکاریهای بعدی آنها شد.
«R برای علوم داده» دربرگیرنده تجربه نویسندگان آن است و برای نخستین بار به زبان انگلیسی با عنوان R for Data Science در سال 2017 میلادی به صورت عمومی منتشر شده است. نسخه کاغذی آن را انتشارات O’Reilly عرضه کرده است. بهمن اجدری و علیرضا کدیور ترجمه این کتاب را در سال 1400 آغاز کردهاند. تاکنون ترجمۀ نیمی از آن انجام شده و پیشبینی میشود در سال 1402 نسخه کامل آن عرضه شود.
با مطالعه این کتاب، علاوه بر یادگیری فوت و فن تحلیل اکتشافی و اصولِ بصریسازی داده، سواد برنامهنویسی شما نیز ارتقا خواهد یافت و با تکرارپذیری در طراحی فرایندهای تحلیل داده آشنا میشوید. دانستن این موارد منجر به صرفهجوییهای قابل توجهی در زمان تحلیلگر میشود. در عین حال، شما در این کتاب چگونگی مدیریت منابع شناختی گوناگون خواهید آموخت. این کار اکتشاف در دادهها و فرایند رسیدن به نتایج نهایی و بازتولید آنها را در صورت نیاز تسهیل میکند.
نسخۀ اصلی این کتاب به زبان انگلیسی نوشته شده و برای نخستین بار با عنوان R for Data Science یا به اختصار R4DS در سال 2017 میلادی منتشر شده است. نسخه کاغذی آن را انتشارات O’Reilly عرضه کرده و نسخه دیجیتال آن به صورت رایگان در وبسایت نویسنده در آدرس زیر در دسترس عموم قرار گرفته است: