ممکن است برخی دادهکاوی (Data Mining) را مجموعهای از نرمافزارهای خودکار یا روشهای ریاضی و آماری بدانند. درواقع دادهکاوی یک فرآیند و متدولوژی است که به مدیران کمک میکند تا از دادههای خام به اطلاعات ارزشمندی برسند که به بهبود تصمیمگیریهای آنان منجر شود. یکی از متداولترین فرآیندها برای انجام پروژههای دادهکاوی، CRISP-DM (Cross-Industry Standard Process for Data Mining) نام دارد.
این استاندارد اولین بار در میانه دهه ۱۹۹۰ میلادی توسط گروهی از شرکتهای اروپایی بهعنوان روشی برای انجام پروژههای دادهکاوی ارائه شد. این فرآیند شش مرحلهای از درک نیازهای اصلی کسبوکار شروع میشود و به ارائه راهکاری برای آن نیاز ختم میشود. اگرچه مراحل این فرآیند به دنبال یکدیگر میآیند اما در عمل رفتوبرگشتهای زیادی بین مراحل مختلف این فرآیند وجود دارد. کسانی که درگیر پروژههای دادهکاوی بودهاند، بهخوبی میدانند که کار کردن با داده نیازمند سعی و خطا و آزمایش کردن است.
این فرآیند شامل شش گام زیر است:
باید تأکید کنم که مدیران نباید پروژههای دادهکاوی را یک جعبه سیاه ببینند که از خروجی آن میتوانند استفاده کنند. چنین رویکردی عموماً به شکست میخورد. مدیران باید از فرآیند دادهکاوی آگاهی داشته باشند، در توسعه آن مشارکت فعال کنند و فهم خود را از کسبوکار به شکل سازندهای به تیم پروژه منتقل کنند. این تعامل هم کمک میکند تا مدل بهتری ساخته شود و هم به مدیران کمک میکند تا به نتایج اطمینان بیشتری داشته باشند و در تصمیمگیریهای خود از آن استفاده کنند.