رسیدن از خاک داده تا طلای تحلیل دردسرهای متعددی دارد. تحلیل داده به همه کس می‌تواند کمک کند. و همگان می‌توانند از «تحلیل داده» استفاده کنند. اما این شروع مشکلات و معضلات است. چرا که ما اغلب با این چاقوی دو لبه به اندازه کافی آشنا نیستیم.

بعضی موضوعات را اگر از زاویه دیگر نگاه کنیم شاید چیز دیگری ببینیم!

در نوشته قبلی با عنوان «آیا فریبهای تحلیل داده را می شناسید؟» سعی کردم با نگاه متفاوتی به تحلیل داده آن را معرفی کنم. چرا؟ چون باور دارم که اغلب کسانی که از عنوان «تحلیل داده» استفاده می کنند یا برایشان مفهوم تحلیل داده بد جا افتاده یا اصلا جا نیفتاده است. اما چون کار با ابزارش راحت است داریم بدون مشکل (!) از آن استفاده می‌کنیم. با این همه، چون باور دیگری دارم و آن این است که پشت این فریبندگی، کسی سوء نیت نداشته، پس قصد دارم فریب هایی را که در این زمینه شناسایی کرده ام، در طی چند نوشته با شما به اشتراک بگذارم؛ فریب هایی که امیدوارم گرفتار آنها نشوید. در نوشته حاضر بنا دارم تا درباره اولین آسیب استفاده از تحلیل داده توضیحاتی عرض بکنم.

آیا همه خروجی های تحلیل داده، گزاره دانشی است؟

در نوشته قبل مثال‌هایی از گزاره‌های دانشی (گزاره‌هایی که بر دانش مدیریت از حال سیستمش اضافه می‌کند به طوری که در تصمیم‌گیری مفید باشد) زدم و گفتم زمانی که با استفاده از تحلیل داده به یک سری از خروجی ها (گزاره‌های دانشی) دست پیدا می‌کنیم، به طور قطع با اولین آسیب تحلیل داده مواجه می‌شویم که آن عبارت است از:

ممکن است این مساله پیش آید که بعضی از این گزاره‌ها، گزاره‌های بدیهی و به درد نخوری هستند و به دانش مدیریت اضافه نمی کنند. واقعیت این است که چنین اتفاقی اغلب میفتد. اما این به معنای مفید نبودن تحلیل داده نیست. این گزاره‌ها، مهر تاییدی بر شناخت ما از سیستم هستند که در کنار گزاره‌های تازه کشف شده، ارزشمند خواهند بود.

اگر کمی دقیق‌تر و عمیق‌تر نگاه کنیم برایمان مشخص می شود که بخش اصلی محاسبات در فرایند تحلیل داده توسط ماشین (کامپیوتر) انجام می‌شود. و کامپیوتر، کسب و کار را نمی‌فهمد. پس گزاره‌های دانشی را همان گونه که از محاسباتش برآمده، خروجی می‌دهد. چون همه این گزاره‌ها برآمده از اطلاعات ما است (و نه کس دیگر) پس همه گزاره‌های دانشی مربوط به کسب و کار ما است.

اگر می بینید خروجی های تحلیل داده واقعا دور از ذهن و دور از کسب و کار مورد نظر است، یعنی تحلیلگر داده، کسب و کار را خوب متوجه نشده است. البته اگر همه چیز خوب بود باز هم مهر تاییدی بر کار تحلیلگر داده نیست.

بدیهیات، مهملات و مکاشفات

در میان خروجی های تحلیل داده، ممکن است بعضی کاملا جدید باشند و بعضی دیگر کاملا شناخته‌شده و قدیمی. «جدیدها» جزو مکاشفات ما هستند و «قدیمی‌ها» مهر تاییدی بر شناخت ما از سیستم می زنند. البته این دسته‌بندی غیرمنصفانه است؛ چرا که برای هر گزاره خروجی از کامپیوتر، توجیهی ارائه می‌دهد تا آن را موجه کند. این اشتباه است. واقعیت این است که احتمال دارد حتی تحلیل داده، گزاره‌هایی خروجی دهد که قابل درک و قابل استفاده نباشد (مهملات). این‌ها از آن جهت است که یا اطلاعات کافی و مناسب نبوده یا هنوز بعضی از گزاره‌ها در رفتار مشتریان شکل نگرفته است.

با این همه، با استفاده از تحلیل داده، همیشه به دنبال بدیهیات (جهت تایید شناخت ما از سیستم) و مکاشفات (جهت حرکت رو به جلو سیستم) هستیم. پس اگر در خروجی ابزاری که برای تحلیل داده استفاده کردید، بدیهیات و مهملات دیدید دلسرد نشوید. گاهی حتی یک گزاره دانشی ارزشمند (یک مکاشفه) می‌تواند کسب و کار شما را متحول کند. و نشان می دهد که از خاک داده تا طلای تحلیل را با موفقیت پیموده اید.

مثال

به عنوان مثال، در یکی از مقاله‌هایم (لینک) که بر مبنای تحقیقی روی کاربران بلاگفا در سال 1394 بود، پس از کنار زدن کلی مهملات (که بیشتر حاصل داده‌های ناکافی بودند) این نتایج بدست آمد:

  • وبلاگ‌نویسان فعال را می‌توان در دو دسته عمده جای داد: 1) آنهایی که فقط دنبال انتشار محتوای خود هستند. 2) آنهایی که دنبال نظرات دیگران درباره محتوای خود (متن، عکس و غیره) هستند.
  • خروجی‌ها عمدتا حول کاربرانی شکل گرفته که یا دانشجو و دانش‌آموز یا زنان خانه‌دار هستند. تاثیر بقیه اقشار در تحلیل‌ها نامحسوس است.

ممکن است به ذهنمان بیاید که یافتن هر کدام از این گزاره‌ها با کمی جستجو در بلاگفا ممکن است. این درست نیست؛ چون با کمی گشت و گذار فقط می‌توانیم حدسی راجع به کاربران بلاگفا بزنیم. پس هر دو گزاره می‌تواند مکاشفات ما باشد.

پ.ن.: در این نوشته عمداً به جای واژه مکشوفات از مکاشفات استفاده کرده ام.

بدیهیات (محیط)، مهملات (نقش‌های پیرامون جغد) و مکاشفات (خود جغد) در یک قاب
امیرمحسن کریمی مجد
karimimajd@busihoush.ir
مدرک دکتری را در رشته مهندسی صنایع گرایش مهندسی سیستمهای اقتصادی اجتماعی در سال 1396 از دانشگاه علم و صنعت دریافت کرده ام. در دوره دکتری حوزه پژوهشی من حوزه تحلیل شبکه های اجتماعی بوده است. دو کسب و کار به همراه دوستانم در حوزه‌های داده کاوی و هوش تجاری راه اندازی کرده ام. در دوره کارشناسی و کارشناسی ارشد در دانشگاههای تهران و امیرکبیر، در پروژه های گوناگونی در حوزه سیستمهای اطلاعاتی و هوش مصنوعی شرکت داشته ام.

5 دیدگاه برای “از خاک داده تا طلای تحلیل”

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *