ابزار مهمتر است یا اهداف تحلیل داده؟

نمی دانم چه زمانی در حال مطالعه این متن هستید. آیا در دوره ای است که هنوز مفاهیم تحلیل داده و ابزارهای آن به قدری جذاب هستند که به خودی خود هم درد هستند و هم درمان؟ یا دیگر این ابزار مهیج از مد افتاده اند؟ در هر صورت نوشته حاضر قصد دارد از فریب بزرگی که در ابزار تحلیل داده (و شاید هر ابزار دیگری) وجود دارد پرده بردارد. فریبی که ناشی از کم توجهی به اهداف تحلیل داده و حلوا حلوا کردن ابزار است. درباره تحلیل داده این موضوع شاید از پرطمطراق بودن اصطلاحات آن سرچشمه می‌گیرد. یا حتی برآمده از پیوند قوی آن با بصری‌سازی‌های چشم‌نواز باشد. شاید منظورم کمی گنگ باشد پس بهتر است اطاله کلام نکنم و نوشته را با هم بخوانیم.

بکاربردن ابزار اشتباه

در نوشته قبل (وقتی تحلیل داده بخشی از مغز را از کار می اندازد) درباره دومین فریب استفاده از تحلیل داده صحبت کردیم. در این نوشته به فریب دیگری اشاره می کنیم.

در نظر بگیرید وقتی کسی می‌گوید «برای حل مشکل شرکت از روش کلاسترینگ (Clustering) یا فازی تایپ تو استفاده کردم» کلی بر اعتبار کارش افزوده می‌شود و می تواند حسابی اصطلاحا پز بدهد تا این که بگوید «5 درصد بازدهی شرکت را بهبود دادم.» اینجاست که اهداف تحلیل داده جهت حل مساله به فراموشی سپرده شده است.

  • آیا مشکل این است که ما خیلی اهل پز دادن و بکار بردن اصطلاحات قلمبه سلمبه یا حتی اهل مُدهای علمی و فناورانه شده‌ایم؟
  • آیا مشکل در نامهای جذاب برای انواع روشها و ابزار تحلیل داده است که بقیه آن را ندارند؟
  • آیا مشکل در فاصله دانشگاه و صنعت است؟
  • یا …
توزیع پوآسون

قضیه توزیع پوآسون و فدا شدن اهداف تحلیل داده

قبل از نظر دادن در این باره توجه شما را به یک نمونه واقعی جلب می‌کنم:

در دفتر استاد راهنمایم در مقطع کارشناسی ارشد در دانشکده مهندسی صنایع دانشگاه امیرکبیر نشسته بودم. آقای سن و سال داری که آشنای استادم بود وارد شد و پس از سلام و احوالپرسی گفت: «می‌خواهم مساله‌ای را در شرکتم با استفاده از توزیع پوآسون حل کنم». از او پرسیده شد: «خب…مساله چیست؟» گفت: «فرقی نمی‌کند مهم این است که از توزیع پوآسون حل شود!!؟!»

ممکن است با توزیع پوآسون آشنا نباشید. فقط همین را بگویم که توزیع پوآسون یک ابزار برای حل بعضی مسائل است. این درخواستی که آن آقا داشت مثل این است که کسی از ما بخواهد در شرکتش از تور ماهیگیری استفاده کنیم. آیا برای شما این سوال پیش نمی‌آید که تور برای چه؟ می‌خواهید دکور بزنید، کسی را تور کنید یا حوض ماهی دارید؟ چه شما از آن دسته کسانی باشید که همین جا پرسنده سوال را تور می‌کنند چه نباشید حرف من چیز دیگری است:

استفاده از تحلیل داده، چنین فریبنده می تواند باشد. و شاید این فریب واقعا دردناک باشد؛ زیرا در چنین شرایطی ابزار مهمتر از اهداف تحلیل داده شده است. این، نوعی سطحی‌نگری است یا نوعی بیماری روانی؟ نمی‌دانم فقط همین قدر می‌دانم که عاقبت خوبی نخواهد داشت. ویژگی دیگر این فریب این است که واگیردار هم هست.

نتیجه گیری: بهتر است که ابتدا مساله را تعریف کنیم، به اهداف تحلیل داده توجه کنیم و راه‌حل را بیابیم. سپس به دنبال ابزار برویم!

پ.ن.: البته چنین فریبی مدتهاست که در تعریف اغلب پایان نامه ها دیده می شود. ابتدا ابزار تعیین می شود سپس به دنبال مطالعه موردی متناسب با آن می گردند. شاید هم فعلا راهی غیر از این وجود ندارد.

امیرمحسن کریمی مجد
karimimajd@busihoush.ir
مدرک دکتری را در رشته مهندسی صنایع گرایش مهندسی سیستمهای اقتصادی اجتماعی در سال 1396 از دانشگاه علم و صنعت دریافت کرده ام. در دوره دکتری حوزه پژوهشی من حوزه تحلیل شبکه های اجتماعی بوده است. دو کسب و کار به همراه دوستانم در حوزه‌های داده کاوی و هوش تجاری راه اندازی کرده ام. در دوره کارشناسی و کارشناسی ارشد در دانشگاههای تهران و امیرکبیر، در پروژه های گوناگونی در حوزه سیستمهای اطلاعاتی و هوش مصنوعی شرکت داشته ام.

4 دیدگاه برای “ابزار تحلیل داده مهمتر از اهداف!؟”

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *