بی شک انبار داده، قلب هوش تجاری است. بدون انبار داده، هوش تجاری معنا و مفهوم ندارد. اما همین انبار داده هم دارد پوست می اندازد، همان گونه که هوش تجاری هم نسلهای مختلفی در طول زمان به خود دیده است. توصیه می کنیم با نسل جدید انبار داده بیشتر آشنا شوید. در این نوشته می خواهیم پنج جذابیت نسل جدید انبار داده را با هم مرور کنیم.

البته شاید مایل باشید ابتدا با نسل‌های هوش تجاری آشنا شوید. پس میتوانید ابتدا با خانواده بیزی هوش آشنا شوید را مطالعه بفرمایید.

 

جذابیت اول؛ قابلیت پردازش همزمان

انبارهای داده نسل جدید از پردازش موازی (یا همزمان) به طور گسترده استفاده می کنند. روشی که امکان استفاده، پردازش و پرس و جو داده ها را در چندین ماشین آن هم به طور همزمان فراهم می کند. این برای کسب و کارهایی که به طور دوره ای، حجم داده عظیمی توسط ETL یا ELT باید روی انبار داده آنها بارگذاری شود بسیار سودمند خواهد بود. به بیان دیگر، نتیجه  بکارگیری این فناوری، عملکرد به مراتب سریعتر از انبارهای داده سنتی است.

پردازش همزمان

البته ایده، ایده جدیدی به نظر نمی رسد. اما همین که یک ایده کارا اما قدیمی بتواند بهبود قابل ملاحظه ای ایجاد کند مورد استقبال خواهد بود. به ویژه اینکه چنین دستاوردی با نیازمندی‌های جدید هوش تجاری خود را وفق می‌دهد. به بیان دیگر، فناوری پردازش موازی در زمانی که حجم بالایی از داده نیاز است تا در زمان اندک بارگذاری شود بسیار کمک کننده خواهد بود.

 

جذابیت دوم؛ معماری هیچ اشتراک

یک معماری مشترک با هیچ چیز تضمین می کند که هیچ نقطه شکستی در محیط های انبار داده نسل بعدی وجود نداشته باشد. در این نوع معماری، هر پردازنده مستقل از بقیه عمل می کند. بنابراین اگر یک دستگاه از کار بیفتد، سایرین در حال اجرا هستند. این امر به ویژه در محیط های پردازش موازی حائز اهمیت است. زیرا در این محیط‌ها، خرابی یکی از صدها دستگاه امری اجتناب ناپذیر است.

زمانی می توان از چنین معماری استفاده کرد که مطمئن باشیم می توان کارهای بارگذاری بخش های داده را روی انبار داده به طور مستقل انجام داد. شاید این با هدف انبار داده که یکپارچه سازی داده های متولد شده در سیستمهای عملیاتی است در تناقض به نظر برسد. اما شدنی است. و اتفاقا یکی از جذابیت‌های نسل جدید انبارهای داده استفاده کردن از چنین فناوری مهمی به شمار می رود.

معماری هیچ اشتراک

 

جذابیت سوم؛ معماری ستونی

اغلب ما عادت کرده ایم وقتی راجع به ذخیره سازی داده صحبت می کنیم، رکوردها را به طور ردیفی در ذهنمان زیر هم بچینیم. در نسل جدید انبار داده چنین وریه ای منسوخ شده است. در این نسل، بجای ذخیره و پردازش داده‌ها در ردیف‌ها، از معماری ستونی استفاده می کنند. در محیط های ستونی، فقط ستون‌هایی که داده های لازم را برای تعیین «پاسخ» برای پرس و جو داده در بر دارند، به جای کل ردیف داده ها پردازش می شوند. و بدین ترتیب منجر به نتایج پرس و جو می شوند. این همچنین بدان معنی است که داده ها نیازی به ساخت در جداول مرتب مانند داده های سنتی رابطه ای ندارند.

 

جذابیت چهارم؛ فشرده سازی داده ها

قابلیت فشرده سازی پیشرفته داده ها به انبارهای داده نسل بعدی اجازه می دهد تا حجم بیشتری از داده ها را ذخیره کنند. آنها این کار را با منابع سخت افزاری بسیار کمتری نسبت به پایگاههای داده سنتی انجام دهند. فشرده سازی داده ها و تکنیک مرتبط با  آن بنام رمزگذاری داده ها برای عملکرد در حجم گسترده ای از داده ها به شدت  ضروری هستند. به عنوان مثال یک انبار با قابلیت فشرده سازی 10 برابر می تواند 10 ترابایت داده را تا 1 ترابایت فشرده کند.

فشرده سازی پیشرفته داده ها

البته ذخیره داده ها به شکل ستونی به طور قابل ملاحظه ای به فشرده سازی کمک می کند. اما در نسل جدید انبارهای داده، روشهای پیشرفته دیگری برای این امر مورد استفاده قرار می گیرند.

 

جذابیت پنجم؛ سخت افزار کالا

مانند سایر خوشه های Hadoop، بیشتر انبارهای داده نسل بعدی بر روی سخت افزار کالای غیر قفسه ای اجرا می شوند. البته برخی از این قاعده مستثنا هستند. بدین ترتیب آنها میتوانند پردازش‌های زیادی را با روشی کم هزینه انجام دهند. به نوعی، بزرگ شدن حجم فعالیت‌ها تاثیر چندانی روی هزینه ها نخواهد داشت.

 

انبار داده ابری

فضایی که می تواند امکانات مناسبی برای بکارگیری این پنج جذابیت ایجاد کند، فضای ابری است. اگر چه هوش تجاری ابری، نسل دوم هوش تجاری محسوب می شود (و ما الان در پی ظهور نسل چهارم هوش تجاری هستیم) اما بروز نسل جدیدی از انبار داده آن هم با مشخصه های یادشده به خودی خود می تواند جذاب باشد.

امیرمحسن کریمی مجد
karimimajd@busihoush.ir
مدرک دکتری را در رشته مهندسی صنایع گرایش مهندسی سیستمهای اقتصادی اجتماعی در سال 1396 از دانشگاه علم و صنعت دریافت کرده ام. در دوره دکتری حوزه پژوهشی من حوزه تحلیل شبکه های اجتماعی بوده است. دو کسب و کار به همراه دوستانم در حوزه‌های داده کاوی و هوش تجاری راه اندازی کرده ام. در دوره کارشناسی و کارشناسی ارشد در دانشگاههای تهران و امیرکبیر، در پروژه های گوناگونی در حوزه سیستمهای اطلاعاتی و هوش مصنوعی شرکت داشته ام.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *