فصل اول: دریچه ورود به دنیای بیگ دیتا
فصل دوم: ابزارهای فنی کار با بیگ دیتا

درس هفتم: بیگ دیتا دقیقاً چطور کار می‌کند؟

اصلی‌ترین نکته مبحث بیگ دیتا موضوع تحلیل و بررسی آمار و اطلاعات است. شما بعد از اینکه از طریق پایگاه‌های داده و منابع مختلف اطلاعات لازم را به دست آوردید، وقت آن می‌رسد تا آن‌ها را مورد بررسی و تجزیه و تحلیل قرار دهید. در ابتدای این مقاله هم گفتیم که ویژگی اصلی بیگ دیتا حجم زیاد و سرعت بالای پردازش و تحلیل اطلاعات است و مسلماً ما نمی‌توانیم به صورت دستی و تک به تک این حجم زیاد از اطلاعات را بررسی کنیم.

برای این کار باید از سیستم‌های کامپیوتری و ابزارهای مربوطه مثل نرم‌افزارهای مخصوص استفاده کنیم. یکی از معروف‌ترین این نرم‌افزارها، مجموعه ابزارهای Apache Hadoop است که در قالب یک برنامه چندمنظوره، به شما این امکان راه می‌دهد تا مقدار زیادی از اطلاعات را به شیوه‌های خاص بررسی و آنالیز کنید. درواقع Hadoop یک پلتفرم از مجموعه‌ای از ابزارها می‌باشد. نحوه عملکرد این ابزارها استفاده از توان پردازشی چندین کامپیوتر برای تحلیل داده‌ها است. این سیستم متدهای مختلفی برای تجزیه و تحلیل داده‌ها دارد که یکی از مهم‌ترین آن‌ها استفاده از مدل برنامه‌نویسی نگاشت‌کاهش (MapReduce) است.

مکانیزم حرفه‌ای و استفاده از الگوریتم‌های ظریف و معادلاتی این نرم‌افزار را قادر می‌سازد تا بتواند حجم اطلاعات را در مقیاس پتابایت نیز تجزیه و تحلیل کند! بزرگترین کمپانی‌های اینترنتی دنیا مثل یاهو از این ابزار استفاده می‌کنند و البته به عنوان مشارکت‌کننده این پروژه نیز شناخته می‌شوند. کمپانی گوگل نیز سیستمی مشابه و انحصاری در اختیار دارد که صرفاً به منظور اهداف تجاری همین کمپانی یا شرکت‌های همکار استفاده می‌شود.

در کل باید گفت که مسئله بیگ دیتا پیچیدگی‌های بسیاری دارد و احتمالاً کسب‌وکارهای کوچک نمی‌توانند بدون مشاوره یا کمک گرفتن از سازمان‌های دیگر در این مسیر اقدام خاصی کنند. به همین خاطر شرکت‌های خاصی راه‌اندازی شده و این سرویس را به مشتریان ارائه می‌دهند. اگرچه مبحث بیگ دیتا هنوز در ایران آنطور که باید شناخته شده نیست و سرویس‌دهندگان کمی هم دارد، اما با این حال سایت‌ها و شرکت‌هایی هستند که این سرویس را برای کاربران ایرانی فراهم کنند.

جالب است بدانید شرکت بزرگ دیجی‌کالا نیز قرار است به این حوزه وارد شده و قصد دارد تا به دیگر شرکت‌ها خدمات بیگ دیتا ارائه دهد (اطلاعات بیشتر در این لینک). این شرکت‌ها هرآنچه که شما در این مورد لازم داشته باشید را در اختیارتان قرار خواهند داد.

در حقیقت باید گفت برای بهره‌مند شدن از کلان‌داده‌ها باید به سه نکته اصلی یعنی فضای ذخیره‌سازی اطلاعات حجیم، ابزارهای تحلیل و بررسی و نحوه استفاده صحیح از نتایج تجزیه و تحلیل‌ها دقت کرد. این یعنی شما بعد از اینکه نتیجه نهایی را گرفتید، وارد مرحله اجرا و عملیاتی کردن آن می‌شوید. برای این بخش هم باید استراتژی‌های مخصوصی را به کار ببرید.

اسکرول به بالا