چه مهارت‌هایی در علوم داده لازم است؟

data science skill set - cover

علوم داده، حوزه‌ای بین رشته‌ای است و همانطور که در «علوم داده چیست؟» اشاره شد سه مولفه اصلی دارد: (۱) شناخت موضوع، (۲) امکانات پردازش داده و (۳) روش‌های تحلیل داده. شناخت موضوع نیازمندی‌های ویژه خود را دارد. مثلا اگر بخواهیم علوم داده را در یک کسب و کار مورد استفاده قرار دهیم، باید توان تحلیل آن کسب و کار را داشته باشیم و کمیت‌های مهم و شاخص‌های کلیدی آن را بشناسیم تا بتوانیم از داده‌ها بهره‌برداری کنیم. اما در سایر حوزه‌ها مثلا در علوم اجتماعی یا زیست‌شناسی محاسباتی، شناخت موضوع پیش‌نیازهای دیگری دارد.

اگر سایر مهارت‌هایی که در علوم داده مورد نیاز است را در کنار شناختِ موضوع قرار دهیم، به نقشه‌ای کلی از دانش‌ها و مهارت‌های مورد نیاز برای کار در علوم داده می‌رسیم:

اساس تحلیل داده آمار و احتمال است. بدون آمار و مدلسازی امکان بررسی و فهم روشمند داده‌ها وجود ندارد. اما تحلیل هر چقدر هم پیچیده باشد باید نتیجه آن به زبانی ساده و ملموس به مخاطبان و ذی‌نفعان انتقال یابد، چون علوم داده یک ورزش گروهی است و به همین دلیل مهارت‌های ارتباطی در آن اهمیت ویژه دارد. اینجاست که اهمیت مصورسازی داده‌ها، گزارش‌نویسی درست و همینطور روش‌های موثر ارائه اطلاعات برجسته‌تر می‌شود و اهمیت کلیدی پیدا می‌کند. 

داده‌هایی که پردازش و تحلیل می‌شوند و خلق ارزش می‌کنند، از منابع گوناگون گردآوری می‌شوند. به همین سبب معمولا با آنچه بتوان در تحلیل و مدلسازی استفاده کرد فاصله زیادی دارند. برای این که آن‌ها را تغییر ساختار دهیم و برای بهره‌برداری تحلیلی آماده کنیم با روش‌ها و ابزارهای تغییر ساختار و تبدیل داده‌ها آشنا باشیم. گاهی هم حجم داده‌ها مسئله‌ساز می‌شود. مدیریت حجم داده‌ها و همینطور مدیریت پردازش آن‌ها، بدون توانایی تحلیل پیچیدگی الگوریتم‌ها و استفاده از ابزارهای مدیریت داده‌های حجیم امکان‌پذیر نیست. 

تحلیل‌ها از نظر نوع استفاده‌ای که از نتایجشان می‌شود با یکدیگر تفاوت دارند. بسیاری از تحلیل‌ها برای پاسخ به نیازهای روزمره به کار گرفته می‌شوند، یعنی مراجعه به نتایج آن‌ها تکرار می‌شود و نیاز به بهبود و به‌روزرسانی دارند. به همین خاطر صرفه در این است که زیرساختی فراهم شود تا با استفاده از روش‌های یادگیری ماشین، فرایند تحلیل خودکارسازی شود و نتایج پردازش و تحلیل، یک سامانه را به صورت مستمر تغذیه کند و عملکرد آن را بهبود ببخشد. الگوریتمی که در فرایند یادگیری ماشین مورد استفاده قرار می‌گیرد و آن را ممکن می‌سازد نتیجه کار داده‌کاوی است. 

نکته دیگری که باید در علوم داده به آن توجه داشت پایبندی به قواعد اخلاقی بهر‌برداری از داده‌ها مانند احترام به حریم شخصی افراد یا در جریان قرار دادن و اخذ رضایت آن‌ها هنگام استفاده داده‌های ایشان و همینطور آشنایی با اصول حکمرانی داده‌ها در سطح خرد و کلان است. 

آیا کسی که در حوزه علوم داده کار می‌کند همه را بلد است؟

اگرچه گاهی شرکت‌ها سعی می‌کنند همه انتظارات را از یک نفر داشته باشند و همه مهارت‌های ممکن در حوزه علوم داده را در آگهی‌های شغلی خود پوشش دهند، اما واقعیت این است که هیچ کس بر تمامی این موارد تسلط ندارد. کسی که در حوزه علوم داده فعالیت می‌کند با دانش‌ها و مهارت‌های یادشده آشنایی اولیه دارد و بسته به آن که در کدام یک از سه مولفه‌ای که در ابتدا به آن‌ها اشاره شد فعالیت می‌کند بر تعدادی از دانش‌ها و مهارت‌های یادشده تسلط دارد. 

این که مسیر شغلی شما در کدام یک از سه موردِ تحلیل موضوع (مثلا تحلیل کسب و کار)، تحلیل داده یا مهندسی داده قرار بگیرد، تعیین می‌کند که برای تقویت کدام از دانش‌ها و مهارت‌های بالا باید بیشتر وقت صرف کنید.

توصیه به یادگیری دیتاژورنالیسم برای تحلیلگران داده

اگر تحلیلگر داده یا تحلیلگر موضوع خاصی هستید یا برای انجام آن در آینده برنامه‌ریزی می‌کنید سعی کنید دستی در دیتاژورنالیسم پیدا کنید. دیتاژورنالیسم کلیدواژه‌ای است که می‌توانید مهارت‌های زیادی مانند شناسایی موضوع، آمار و احتمال، تغییر ساختار داده‌ها، مصورسازی داده، ارائه، ارتباط، گزارش‌نویسی و … را در آن تمرین کنید و یاد بگیرید. 

علوم داده تنها در دل یک موضوع خاص و بر بسترِ یک زمینه مشخص است که به کار می‌آید و معنا پیدا می‌کند. این مطلب معمولا توسط تحلیلگران داده دست کم گرفته می‌شود و چندان بی‌راه نخواهد بود اگر بگوییم مهم‌ترین خلأ بازار کار تحلیل داده کسی است که بتواند بین روش‌ها و ابزارهای تحلیل داده و نیازمندی‌های یک موضوع خاص ارتباط موثر ایجاد کند. دیتاژورنالیسم بهترین جایی است که می‌توان چنین چیزی را تمرین کرد.

اگر دوست دارید درباره تحلیل داده و دیتاژورنالیسم بیشتر بدانید، در دوره آموزشی «تحلیل داده برای گزارش‌نویسی و دیتاژورنالیسم» ثبت نام کنید:

 

تحلیل داده برای گزارش‌نویسی و دیتاژورنالیسم

استفاده از علوم داده را در زمینه‌های مختلف تمرین کنید و یاد بگیرید.

* مهارت‌های یاد شده از کتاب «علوم داده» جان دی کِلهِر چاپ انتشارات دانشگاه ام‌آی‌تی در سال 2018 اقتباس شده، اگر می‌خواهید درباره این کتاب بیشتر بدانید به مرور و معرفی این کتاب با عنوان «پرواز با ارتفاع مناسب» رجوع کنید.

 

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors