این روزها همه جا از داده، تحلیل داده، داده کاوی و دیتا ماینینگ می شنویم. مثل فوتبال که به تعداد تماشاگرانش کارشناس دارد، این روزها تحلیل داده هم به تعداد کاربرانش کارشناس دارد! این خیلی خوب است که افراد زیادی با تحلیل داده آشنا باشند و آن را در کار و زندگی به کار بگیرند. اما اغلب این کارشناسان صرفا با به کار بردن یکی دو تا ابزار و نرم افزار و به دور از مفاهیم، تجربیات و واقعیت‌های تحلیل داده در این حوزه فعالیت می کنند. از این رو، در این نوشته به جای اینکه با تحلیل داده آشنا شویم، میخواهیم با فریب‌های تحلیل داده بیشتر آشنا شویم.

تحلیلگر داده
تحلیلگر داده راست می گوید یا نه؟

اولین رویارویی

تحلیل داده، فرایندی است که هدف آن کشف گزاره‌های دانشی مفید جهت پشتیبانی از تصمیم‌گیری است.

خب، ممکن است این جمله خیلی پیچیده و گنگ به نظر آید پس سعی می کنم کمی بیشتر توضیح دهم. فرض کنید شما می‌خواهید تصمیم بگیرید که با استفاده از تبلیغات، مشتریان خود را ترغیب به خرید کنید. چه محصولی را به کدام مشتری و چگونه تبلیغ می کنید؟ چقدر و کجا هزینه می کنید؟ ممکن است بخواهید درباره تعدیل نیرو یا استخدام تصمیم‌گیری کنید. یا این که تصمیم بگیرید کجا سرمایه‌گذاری کنید که عایدی بیشتری بدست آورید؟

الان زمانی است که تحلیلگر داده وارد ماجرا می‌شود. او پس از شناخت مساله و درک فضای کسب و کار، سوال مدیر را تبدیل به سوال تحلیلی می‌کند. در واقع به دنبال حل مساله با استفاده از اطلاعاتی است که از مشتریان در دست دارند. او فرایند تحلیل داده را برای هر سوال تحلیلی طی می‌کند تا به گزاره‌های زیر می‌رسد:

  • مشتریان را هم اینک می‌توان در سه دسته تصور کرد: مشتریان برجسته (آنهایی که متعدد و زیاد خرید می‌کنند) مشتریان هرازگاهی (آنهایی که گاهی هستند گاهی نیستند) و مشتریان معمولی (افرادی بین دو دسته قبلی).
  • تبلیغات تا کنون روی رفتار خرید مشتریان برجسته تاثیری نداشته و فقط اندکی بر تعداد آنها افزوده
  • کمپین‌های با تخفیف بالا رشد چشمگیری در تعداد و تراکنش‌های مشتریان هرازگاهی داشته
  • اغلب مشتریان معمولی کالاهایی به قیمت 50 هزار تا 500 هزار تومان می‌خرند
  • مشتریان برجسته اغلب افرادی از شرکت‌های بزرگ هستند

اینها همان گزاره‌های دانشی است.

گزاره‌های دانشی

گزاره‌هایی که بر دانش مدیریت از حال سیستمش اضافه می‌کند به طوری که در تصمیم‌گیری مفید باشد. کشف چنین گزاره‌هایی به طور دستی و خارج از فرایند تحلیل داده واقعا ساده نیست.

مدیر، با استفاده از این گزاره‌ها می‌تواند تصمیم بگیرید که مثلا برای جذب بیشتر مشتریان معمولی، چه تیپ محصولاتی را با چه تخفیفی باید در ویترین قرار دهد یا چه باید بکند تا مشتریان هرازگاهی را تبدیل به مشتریان معمولی کند (مثلا آیا استفاده از روش امتیاز دادن به خریدها جهت اهدای کد تخفیف فایده دارد یا نه).

پس همان گونه که دیدیم، تحلیل داده:

  • یک «فرایند» است نه یک ابزار.
  • برای «پشتیبانی از تصمیم» استفاده می شود و به جای ما تصمیم نمی گیرد.
  • و خروجی آن، گزاره های دانشی است نه اطلاعات.

فریب‌های تحلیل داده

حال زمان آن رسیده است که با فریب‌های تحلیل داده آشنا شویم.

فریب اولممکن است به نظر آید که بعضی از گزاره‌های دانشی، گزاره‌های بدیهی و بدردنخوری باشند. واقعیت این است که چنین اتفاقی اغلب میفتد. اما این به معنای مفید نبودن تحلیل داده نیست. این گزاره‌ها، مهر تاییدی بر شناخت ما از سیستم هستند که در کنار مکاشفات، ارزشمند خواهند بود.

فریب دوم: بعضی‌ها به سرعت یک نرم‌افزار تحلیل داده را باز می‌کنند، داده را وارد آن کرده و دکمه تحلیل را زده، سپس مجموعه‌ای از نتایج چاپ می‌شود و تمام! به جرات بگویم که این، تحلیل داده نیست. فریب نخورید. اما چرا؟ این را در یک نوشته جداگانه توضیح دهم.

فریب سوم: فراوان دیده شده بعضی‌ها به جای بیان مشکل، راه‌حل را می‌گویند!!! طرف آمده و میگوید بیا با فلان روش یک مسأله با هم حل کنیم. در نوشته ای دیگر درباره این فریب بیشتر توضیح خواهم داد.

فریب چهارم: «می خواهیم پروژه تحلیل داده را یک بار انجام داده و تمام عمر از آن استفاده کنیم. آیا می شود؟» اگر همه مشتریان، بازار و شما بدون تغییر هستید و استفاده از نتایج تحلیل داده تاثیری در کسب و کارتان نخواهد داشت، پاسخ این سوال بله است. در غیر این صورت، نخیر. تحلیل داده باید مدام انجام بگیرد. اما چون ممکن است هزینه‌بر و زمان‌بر باشد می‌توان به نوعی آن را اتوماتیک کرد. چاره این کار را در نوشته ای جداگانه توضیح دهم.

فریب پنجم: ابزارهای داده کاوی ابزارهای قدرتمندی هستند که از پس مسائل پیچیده و بزرگ برمیآیند. اما این دلیل نمی شود همه مسائل را با آنها حل کنیم. هر مسأله نیازمندیهای خاص خود را دارد. یک متخصص تحلیل داده می داند که کدام مسأله نیازمند کدام ابزار است. این موضوع نیاز به بحث بیشتر دارد که در نوشته ای جداگانه به آن خواهم پرداخت.

امیرمحسن کریمی مجد
karimimajd@busihoush.ir
مدرک دکتری را در رشته مهندسی صنایع گرایش مهندسی سیستمهای اقتصادی اجتماعی در سال 1396 از دانشگاه علم و صنعت دریافت کرده ام. در دوره دکتری حوزه پژوهشی من حوزه تحلیل شبکه های اجتماعی بوده است. دو کسب و کار به همراه دوستانم در حوزه‌های داده کاوی و هوش تجاری راه اندازی کرده ام. در دوره کارشناسی و کارشناسی ارشد در دانشگاههای تهران و امیرکبیر، در پروژه های گوناگونی در حوزه سیستمهای اطلاعاتی و هوش مصنوعی شرکت داشته ام.

5 دیدگاه برای “آیا فریب‌های تحلیل داده را می شناسید؟”

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *