ابزار غالب برای کار در علوم داده در دنیا، آر و پایتون است. همین نکته تا حد زیادی از ابهام افراد برای انتخاب فناوری مورد نظر خود در شروع یادگیری میکاهد. با این حال، برای کسانی که سراغ تحلیل داده میروند همچنان یک سوال در ابتدای کار مطرح میشود:
پایتون یاد بگیرم یا R؟
جواب سوال فوق این است که هر دو زبانهای بسیار قدرتمندی برای تحلیل داده هستند و هر یک از آنها به تنهایی پاسخگوی اکثر قریب به اتفاق نیازهای شما برای پردازش و تحلیل داده هستند. در نتیجه، با خیال راحت سراغ هر کدام که دوست دارید بروید.
اما ممکن است فکر کنید کسی که شناختی از این دو ندارد چگونه بین آنها انتخاب کند؟
این محتوا در قالب یک وبینار نیز ارائه شده است. ویدئو و اسلایدهای این وبینار در ادامه قابل مشاهده است.
برای تصمیمگیری بین یادگیری R یا Python ما با یک انتخاب مواجهیم. به بیان دیگر، هیچ گزینه درست و غلطی در این انتخاب وجود ندارد. هر کدام را انتخاب کنیم و روی یادگیری آن وقت بگذاریم و تجربه کسب کنیم، میتوانیم یک تحلیلگر داده موفق باشیم. در ادامه برخی سرنخهای کلی که ممکن است در انتخاب بین آنها کمک کنند آمده است.
زبان برنامهنویسی همهمنظوره و خاصمنظوره
Python یک زبان همهمنظوره است و برای تمامی نیازهای یک برنامهنویس مانند تولید وبسایت، توسعه نرمافزار، کار با داده و … به کار گرفته میشود.
R یک زبان خاصمنظوره است و از ابتدا برای آمار و تحلیل داده به وجود آمده است، اما به مرور امکانات برنامهنویسی آن برای توسعه خدمات و محصولات مرتبط با داده مانند وباسکرپینگ، اتصال به پایگاه داده، توسعه داشبورد اطلاعاتی و … به آن اضافه شده است.
مقایسه مقدمات لازم برای تحلیل داده
R یک زبان خاصمنظوره برای پردازش و تحلیل داده است و پس از مقدمات کوتاهی به آمار و تحلیل داده میرسد. اما Python یک زبان برنامهنویسی همهمنظوره است و برای اینکه در آن با داده کار کنیم مقدمات بیشتری از برنامهنویسی لازم است.
به عنوان مثال در R بدون فراخوانی هیچ کتابخانهای یا استفاده از حلقههای تکرار میتوانید با دادهها در قالب بردار، ماتریس، لیست و جدول (data.frame) تحلیل و مدلسازی کنید. اما در پایتون برای اینکه بتوانید با جداول داده کار کنید لازم است پس از یادگیری مفاهیم و امکانات پایه، کار با کتابخانههای numpy و pandas و scikit-learn را یاد بگیرید تا بتوانید دادهها را در یک جدول (DataFrame) پردازش و مدلسازی کنید.
مقایسه سهولت یادگیری در مراحل ابتدایی
سختی یا سادگی یادگیری در مراحل ابتدایی را میتوان به تجربه در سه دسته به صورت زیر تعریف کرد:
- اگر با ریاضی، آمار و مصورسازی داده مانوس هستید و ذهنیت شما در تعامل با آنها شکل گرفته، احتمالا یادگیری R برای شما راحتتر است و با آن ارتباط بیشتری برقرار میکنید.
- اگر با طراحی الگوریتم، برنامهنویسی، توسعه نرمافزار و هوش مصنوعی مانوس هستید و ذهنتان در آن عوالم سیر میکند، احتمالا با Python بیشتر ارتباط برقرار میکنید.
- اگر به هیچ یک از دو دســته فوق تعلق ندارید، در ســایر رشــتهها مثل
علوم انسانی، علوم تجربی، هنر و … تحصیل کردهاید و علی رغم احساسهایی از نوع تکنولوژیگریزی و برنامهنویسیهراسی میخواهید سراغ تحلیل داده بروید احتمالا با R راحتتر ارتباط برقرار میکنید.
انتخاب بر اساس پیشزمینه و چشمانداز
معمولا کسانی که میانهای با برنامهنویسی ندارند با R بیشتر ارتباط برقرار میکنند. در نتیجه، محبوبیتR در میان تحلیلگرانی که سابقه تحلیل داده در علوم اجتماعی، اقتصاد، مدیریت، روانشناسی، روزنامهنگاری، مهندسی صنایع، سیاستگذاری عمومی، پزشکی، آمار، علوم زیستی و ژنتیک، روزنامهنگاری و … دارند قابل توجه است. اگر در چشمانداز خود تصویر چندانی از برنامهنویسی و توسعه نرمافزار نمیبینید و میخواهید صرفا روی آمار و تحلیل داده تمرکز کنید احتمالا با R راحتتر ارتباط برقرار میکنید.
اگر با هدف تحلیل داده سراغ پایتون میروید و پیشزمینهای در برنامهنویسی ندارید، لازم است در مراحل ابتدایی صبر پیشه کنید تا به مفاهیم و امکانات پایه مسلط شوید و بعد از آن به تحلیل داده برسید. وقتی به اینجا برسید، پردازش و تحلیل داده آسان میشود.
فراموش نکنید
هر انتخابی که کردید فراموش نکنید R و Python بهترین ابزارها برای فعالیت در علوم داده در دنیا هستند و امکانات بینظیری برای کار با داده در اختیار شما قرار میدهند.
وقتی یک زبان برنامهنویسی را برای اولین بار یاد بگیرید و با آن کار کنید، یادگیری زبانهای دیگر بسیار ساده میشود.
اگر میخواهید برای موقعیت شغلی مشخصی اقدام کنید ببینید ابزار مورد نیاز در آن کدام است و همان را یاد بگیرید تا با همکاران خود زبان مشترک بیشتری داشته باشید.
اگر دوست دارید درباره R بیشتر بدانید مطلب زیر را مطالعه کنید:
لینک مقاله:
اگر میخواهید درباره پایتون بیشتر بدانید مطلب زیر را مطالعه کنید:
لینک مقاله:
منابع بیشتر
* طرح نخست برگرفته تصویرسازی وبسایت posit است.