دادۀ بزرگ[1]، تحولی عمیق در تولیدِ دانش در قلمرو علوم تجربی و حتی فراتر از آن را وعده داده است. استفاده از روشهای بدیع و کارآمد در طراحی، راهبری، انتشار و ارزیابی تحقیقات علمی سبب شده تا چشمانداز انقلابی جدید در علوم گشوده شود. در دهههای اخیر شاهد ابداع روشهای نوین در تولید، ذخیرهسازی و تحلیل دادهها بودهایم. این تحولات با پدید آمدن شاخهای جدید به نام علوم داده [2] به اوج خود رسیدهاند. در این شاخه روشهای پردازشی، الگوریتمی، آماری و ریاضیاتی به کار گرفته میشوند تا دانش را از دادههای بزرگ برونیابی کنند. در همین زمان، شعار شفافیت در سیاستهایی مانند دولت باز [3] و علم باز [4] سبب شده تا جنبشی به نام دادههای باز [5] نیز آغاز شود. این سیاستها با بهرهمندی از زیرساختهای دیجیتالِ قدرتمند، به اشتراک گذاشتنِ دادهها و ایجاد ارتباط بین آنها را علی رغم تنوع و ناهمگونی موضوعاتشان فراهم کردهاند.
دسترسی به گسترۀ وسیعی از دادههای قابل فهم برای ماشین [6]، پژوهشگران را به ابداع فرایندهای کارآمدترِ گردآوری، ساماندهی، مصورسازی و مدلسازی دادهها ترغیب میکند. این زیرساختها اگرچه عمدتاً برای توسعه بسترهایی برای ارائه خدماتِ هوش مصنوعی گسترش یافتهاند اما نگاهی به افزایش اعتبار، سرعت و شفافیت در سازوکارهای خلقِ دانش نیز دارند. پژوهشگران، رفتهرفته در تمامی رشتهها به این قابلیتهای نوپدید پی میبرند. آنها بین دادهها در منابع گوناگون پل میزنند تا دقت و قدرت پیشبینیها را در یافتههای علمی خود ارتقا بخشند. این قابلیتها به آنها کمک میکند تا جهتگیریهای آتی تحقیقات را مشخص کنند و مطالعات کمّی را از ابتدا با آگاهی نسبت امکانات تازه از نقاط جدیدی شروع کنند. برای پی بردن به نقشآفرینی گستردۀ دادههای بزرگ، کافیست نگاهی به سرفصلهای بودجه، برنامههای آموزشی و مطالبی که در این حوزه منتشر میشود بیاندازید. در تمامی این موارد، دادۀ بزرگ مانند طلیعهای نوظهور در سازماندهی تحقیقات علمی قد علم کرده و فهم موجود از برآمدن دانش از علوم تجربی و مطالعات کمّی را به چالش میکشد.
این مدخل، گزارههای یادشده را با توجه به نقش دادههای بزرگ در تحقیقات علمی مورد کنکاش قرار میدهد. آنچه در متنِ پیشِ رو مورد تاکید قرار گرفته مجموعهای از مسائل فلسفی است که با بهرهبرداری تحقیقاتی از دادههای بزرگ – آنچنان که گفته شد – سر و کلهشان پیدا میشود. به همین منظور، این مدخل، تاثیر پیدایش دادههای بزرگ و همینطور فناوریها، موسسات و هنجارهای مرتبط با آن را بر موضوعات زیر مورد بحث قرار میدهد:
- مدلهای کلاسیک و پردازشی در آمار و نقش آنها در برونیابی الگو از دادهها و نتیجهبخشی آنها
- نقش تفکر انتقادی (هوش انسانی) در یادگیری ماشین و ارتباط آن با قابلیت هوشمندسازی فرایندهای تحقیقاتی
- طبیعت داده به عنوان مولفه اصلی در تحقیقات
- ارتباط بین شواهد و دادهها، و نقش داده به عنوان منبعی برای بصیرتیافتن در مطالعات تجربی
- رویکرد نظریهمحور به دانش
- فهمهای موجود از ارتباط پیشبینی و علیت
- جدایی واقعیتِ مسلّم و ارزش
- مخاطرات و ملاحظات اخلاقی علوم داده
توجه به زمینههای فوق در تحقیقاتی که گردِ دادههای بزرگ تعریف میشوند فلسفه را نیز به ویژه در معرفتشناسی و روششناسی علمی بهرهمند میکند. این مدخل، پیشینه پژوهشی وسیعی که در این حوزه وجود دارد را پوشش نمیدهد. همچنین، مطالعات اجتماعی مرتبط با علم که در سالهای اخیر در ارتباط با همین موضوع انتشار یافته در این مدخل پوشش داده نمیشود. اگرچه، در برخی موارد به اقتضای مفاهیم طرح شده، به آن موارد نیز اشاره شده است. تحلیل فلسفی مطالعات مبتنی بر داده، علاوه بر تکمیل روند تاریخی بررسیهای فکری و اجتماعی در این حوزه، میتواند شیفتگی روزافزونی که حول علوم داده شکل گرفته را به چالش بکشد و نوعی فهم انتقادی را نسبت به هوش مصنوعی متکی بر داده سازماندهی کند.
ترجمه از مدخل «تحقیقات علمی و دادههای بزرگ» در دانشنامه فلسفی استنفورد؛ نوشته سابینا لیونلی استاد فلسفه و تاریخ علم دانشگاه اگزتر انگلستان، ویراسته ادوارد زالتا استاد فلسفه ریاضیات دانشگاه استنفورد