علوم داده، حوزهای بین رشتهای است و همانطور که در «علوم داده چیست؟» اشاره شد سه مولفه اصلی دارد: (۱) شناخت موضوع، (۲) امکانات پردازش داده و (۳) روشهای تحلیل داده. شناخت موضوع نیازمندیهای ویژه خود را دارد. مثلا اگر بخواهیم علوم داده را در یک کسب و کار مورد استفاده قرار دهیم، باید توان تحلیل آن کسب و کار را داشته باشیم و کمیتهای مهم و شاخصهای کلیدی آن را بشناسیم تا بتوانیم از دادهها بهرهبرداری کنیم. اما در سایر حوزهها مثلا در علوم اجتماعی یا زیستشناسی محاسباتی، شناخت موضوع پیشنیازهای دیگری دارد.
اگر سایر مهارتهایی که در علوم داده مورد نیاز است را در کنار شناختِ موضوع قرار دهیم، به نقشهای کلی از دانشها و مهارتهای مورد نیاز برای کار در علوم داده میرسیم:
اساس تحلیل داده آمار و احتمال است. بدون آمار و مدلسازی امکان بررسی و فهم روشمند دادهها وجود ندارد. اما تحلیل هر چقدر هم پیچیده باشد باید نتیجه آن به زبانی ساده و ملموس به مخاطبان و ذینفعان انتقال یابد، چون علوم داده یک ورزش گروهی است و به همین دلیل مهارتهای ارتباطی در آن اهمیت ویژه دارد. اینجاست که اهمیت مصورسازی دادهها، گزارشنویسی درست و همینطور روشهای موثر ارائه اطلاعات برجستهتر میشود و اهمیت کلیدی پیدا میکند.
دادههایی که پردازش و تحلیل میشوند و خلق ارزش میکنند، از منابع گوناگون گردآوری میشوند. به همین سبب معمولا با آنچه بتوان در تحلیل و مدلسازی استفاده کرد فاصله زیادی دارند. برای این که آنها را تغییر ساختار دهیم و برای بهرهبرداری تحلیلی آماده کنیم با روشها و ابزارهای تغییر ساختار و تبدیل دادهها آشنا باشیم. گاهی هم حجم دادهها مسئلهساز میشود. مدیریت حجم دادهها و همینطور مدیریت پردازش آنها، بدون توانایی تحلیل پیچیدگی الگوریتمها و استفاده از ابزارهای مدیریت دادههای حجیم امکانپذیر نیست.
تحلیلها از نظر نوع استفادهای که از نتایجشان میشود با یکدیگر تفاوت دارند. بسیاری از تحلیلها برای پاسخ به نیازهای روزمره به کار گرفته میشوند، یعنی مراجعه به نتایج آنها تکرار میشود و نیاز به بهبود و بهروزرسانی دارند. به همین خاطر صرفه در این است که زیرساختی فراهم شود تا با استفاده از روشهای یادگیری ماشین، فرایند تحلیل خودکارسازی شود و نتایج پردازش و تحلیل، یک سامانه را به صورت مستمر تغذیه کند و عملکرد آن را بهبود ببخشد. الگوریتمی که در فرایند یادگیری ماشین مورد استفاده قرار میگیرد و آن را ممکن میسازد نتیجه کار دادهکاوی است.
نکته دیگری که باید در علوم داده به آن توجه داشت پایبندی به قواعد اخلاقی بهربرداری از دادهها مانند احترام به حریم شخصی افراد یا در جریان قرار دادن و اخذ رضایت آنها هنگام استفاده دادههای ایشان و همینطور آشنایی با اصول حکمرانی دادهها در سطح خرد و کلان است.
آیا کسی که در حوزه علوم داده کار میکند همه را بلد است؟
اگرچه گاهی شرکتها سعی میکنند همه انتظارات را از یک نفر داشته باشند و همه مهارتهای ممکن در حوزه علوم داده را در آگهیهای شغلی خود پوشش دهند، اما واقعیت این است که هیچ کس بر تمامی این موارد تسلط ندارد. کسی که در حوزه علوم داده فعالیت میکند با دانشها و مهارتهای یادشده آشنایی اولیه دارد و بسته به آن که در کدام یک از سه مولفهای که در ابتدا به آنها اشاره شد فعالیت میکند بر تعدادی از دانشها و مهارتهای یادشده تسلط دارد.
این که مسیر شغلی شما در کدام یک از سه موردِ تحلیل موضوع (مثلا تحلیل کسب و کار)، تحلیل داده یا مهندسی داده قرار بگیرد، تعیین میکند که برای تقویت کدام از دانشها و مهارتهای بالا باید بیشتر وقت صرف کنید.
توصیه به یادگیری دیتاژورنالیسم برای تحلیلگران داده
اگر تحلیلگر داده یا تحلیلگر موضوع خاصی هستید یا برای انجام آن در آینده برنامهریزی میکنید سعی کنید دستی در دیتاژورنالیسم پیدا کنید. دیتاژورنالیسم کلیدواژهای است که میتوانید مهارتهای زیادی مانند شناسایی موضوع، آمار و احتمال، تغییر ساختار دادهها، مصورسازی داده، ارائه، ارتباط، گزارشنویسی و … را در آن تمرین کنید و یاد بگیرید.
علوم داده تنها در دل یک موضوع خاص و بر بسترِ یک زمینه مشخص است که به کار میآید و معنا پیدا میکند. این مطلب معمولا توسط تحلیلگران داده دست کم گرفته میشود و چندان بیراه نخواهد بود اگر بگوییم مهمترین خلأ بازار کار تحلیل داده کسی است که بتواند بین روشها و ابزارهای تحلیل داده و نیازمندیهای یک موضوع خاص ارتباط موثر ایجاد کند. دیتاژورنالیسم بهترین جایی است که میتوان چنین چیزی را تمرین کرد.
اگر دوست دارید درباره تحلیل داده و دیتاژورنالیسم بیشتر بدانید، در دوره آموزشی «تحلیل داده برای گزارشنویسی و دیتاژورنالیسم» ثبت نام کنید:
تحلیل داده برای گزارشنویسی و دیتاژورنالیسم
* مهارتهای یاد شده از کتاب «علوم داده» جان دی کِلهِر چاپ انتشارات دانشگاه امآیتی در سال 2018 اقتباس شده، اگر میخواهید درباره این کتاب بیشتر بدانید به مرور و معرفی این کتاب با عنوان «پرواز با ارتفاع مناسب» رجوع کنید.