مجله پرانتز

چهارچوب اکتشاف

cover

اگر R را برای کار با داده‌ها انتخاب کرده‌اید و می‌خواهید یک کتاب درباره علوم داده بخوانید، یکی از بهترین انتخاب‌ها «R برای علوم داده» است. 

این کتاب، کار در علوم داده با زبان R را به صورت گام به گام و البته جذاب آموزش می‌دهد. در «R برای علوم داده» وارد کردن داده، تبدیل آن به قابل استفاده‌ترین ساختارها، مصورسازی و مدلسازی معرفی خواهند شد و طیف گسترده‌ای از مهارت‌های رایج در علوم داده تمرین خواهند شد. اما از جمله هیجان‌انگیزترین بخش‌های کتاب می‌توان به آموزش قواعد مصورسازی داده در نمونه‌های واقعی و  فوت‌و‌فن استفاده از مدلسازی برای تحلیل‌های اکتشافی اشاره کرد. 

بطور خلاصه این کتاب تقریبا تمام مهارت‌های لازم برای کار با داده را پوشش می‌دهد و با ایجاد حس کنجکاوی شما را برای کشف بیشتر ترغیب می‌کند. همچنین خواندن این کتاب احتیاج به دانش برنامه‌نویسی ندارد و هر آنچه لازم باشد در حین خواندن کتاب یاد خواهید گرفت.

نویسندگان این کتاب هدلی ویکام (Hadley Wickham) و گرِت گرولموند (Garrett Grolemund) هستند.  هدلی ویکام در میان تحلیگرانی که از زبان R برای پردازش و تحلیل داده‌ها استفاده می‌‎کنند فردی کاملاً شناخته‌شده و تاثیرگذار است. چند نمونه از محبوب‌ترین کتابخانه‌های R مانند ggplot2، dplyr و tidyr محصول کار هَدلی است. او بیشتر زمان خود را صرف به وجود آوردن ابزارهایی می‌‎کند که کار در علوم داده را برای تحلیلگران تسهیل کند و هم‌اکنون به عنوان راهبر علمی در شرکت RStudio و استاد کمکی در دانشگاه‌های آکلند، استنفورد و رایس در آمریکا مشغول به کار است. گرت گرولموند مدرس علوم داده با زبان R، ویرایشگر ارشد کتابخانه Shiny و R Markdown در شرکت RStudio و دانش‌آموخته رواشناسی و آمار از دانشگاه‌های هاروارد و رایس است.

هدلی از دوران دانشجویی دلبستۀ ابزارها و روش‌های عملی برای اکتشاف در داده‌ها بود و پایان‌نامه دکتری خود را نیز با همین موضوع نوشت (+). هدلی ویکام، وقتی به عنوان استاد آمار در دانشگاه رایس مشغول به کار بود مشاور پایان‌نامه گرت گرولوموند شد که این آشنایی مقدمه همکاری‌های بعدی آن‌ها شد.

«R برای علوم داده» دربرگیرنده تجربه نویسندگان آن است و برای نخستین بار به زبان انگلیسی با عنوان R for Data Science در سال 2017 میلادی به صورت عمومی منتشر شده است. نسخه کاغذی آن را انتشارات O’Reilly عرضه کرده است. بهمن اجدری و علیرضا کدیور ترجمه این کتاب را در سال 1400 آغاز کرده‌اند. تاکنون ترجمۀ نیمی از آن انجام شده و پیش‌بینی می‌شود در سال 1402 نسخه کامل آن عرضه شود. 

این کتاب بدون آنکه شما در تئوری‌ها غرق کند دانش عملیاتی شما را به صورت چشمگیری ارتقا خواهد داد. هدف کتاب بیش از هر چیز ساختن ذهنیت خواننده برای فعالیت حرفه‌ای در این حوزه است. درست همانطور که یک شیمیدان می‌آموزد که چگونه لوله‌های آزمایش را پاک کند و آزمایشگاه را برای فعالیتش تجهیز کند، خواننده این کتاب نیز می‌آموزد که چگونه داده‌ها را پاکسازی کند تا برای پردازش، مصورسازی و تحلیل آماده شود. این‌ها مهارت‌هایی هستند که علوم داده را ممکن می‌کنند. در این کتاب، امتحان‌پس‌داده‌ترین روال‌ها برای استفاده از R در علوم داده معرفی خواهند شد. 

با مطالعه این کتاب، علاوه بر یادگیری فوت و فن تحلیل اکتشافی و اصولِ بصری‌سازی داده، سواد برنامه‌نویسی شما نیز ارتقا خواهد یافت و با تکرارپذیری در طراحی فرایندهای تحلیل داده آشنا می‌شوید. دانستن این موارد منجر به صرفه‌جویی‌های قابل توجهی در زمان تحلیلگر می‌شود. در عین حال، شما در این کتاب چگونگی مدیریت منابع شناختی گوناگون خواهید آموخت. این کار اکتشاف در داده‌ها و فرایند رسیدن به نتایج نهایی و بازتولید آن‌ها را در صورت نیاز تسهیل می‌کند. 

نسخۀ اصلی این کتاب به زبان انگلیسی نوشته شده و برای نخستین بار با عنوان R for Data Science یا به اختصار R4DS در سال 2017 میلادی منتشر شده است. نسخه کاغذی آن را انتشارات O’Reilly عرضه کرده و نسخه دیجیتال آن به صورت رایگان در وبسایت نویسنده در آدرس زیر در دسترس عموم قرار گرفته است:

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors