تاریخ انتشار: ۲۱ آبان ۱۳۸۶ - ۱۳:۵۷

مهدی صارمی فر: در طول دهه‌های گذشته حجم زیادی از داده‌ها در پایگاه‌های اطلاعاتی انباشته و ذخیره شده‌اند و نتیجه این انباشتگی این است که سازمان‌ها در داده غنی ولی در کسب دانش مفید و کاربردی از این داده‌های عظیم، بسیار ضعیف هستند.

امروزه میزان داده‌های در دسترس هر 5 سال دو برابر می‌شود و سازمانی توانا است که بتواند حداقل 7 درصد از اطلاعاتش را مدیریت کند.

تحقیقات انجام‌یافته نشان می‌دهد که سازمان‌ها امروزه کمتر از یک درصد از داده‌هایشان را برای تحلیل استفاده می‌کنند.

به‌عبارت دیگر امروزه سازمان‌ها در اطلاعات غرق شده‌اند در حالی‌که گرسنه دانش هستند، چرا که سازمان‌ها داده‌های زیادی را در تصرف خود دارند درحالی‌که هنوز با فقدان دانش پنهان درون داده‌ها مواجه‌اند.

امروزه با توجه به تنوع زیاد مخاطبین، مشتریان، بازارها، تنوع و پیچیدگی خدمات و محیط‌های کسب‌و‌کار، دسترسی به اطلاعات مناسب برای تصمیم‌گیری صحیح ضروری است. از این‌رو استفاده از راهکارهای مناسب برای طبقه‌بندی و تولید اطلاعات از میان انبوهی از داده‌ها برای سازمان‌ها امری ضروری و حیاتی است.

علم داده‌کاوی (Data Mining) پاسخی به این نیاز برای کشف دانش پنهان داده‌ها و تامین اطلاعات مورد نیاز مدیران است.

دانش داده‌کاوی ابزاری است که مدیران را قادر می‌سازد تا سریع‌تر نسبت به آینده عمل کنند، فعال باشند، به‌جای آن‌که واکنش‌پذیر باشند و بدانند و مطمئن باشند به‌جای آن‌که حدس بزنند. واضح است که با داشتن این قابلیت، سازمان‌ها می‌توانند دانش ارزشمندی را از داده‌هایشان به‌دست آورند.

فناوری داده‌کاوی

سازمان‌ها با به‌کاربردن فناوری داده‌کاوی می‌توانند از سرمایه داده‌هایشان بهره‌برداری کنند.از این ابزار برای پشتیبانی فرایند تصمیم‌گیری استفاده می‌شود. داده‌کاوی پردازش بهینه تصمیم‌گیری را در سازمان‌ها تسهیل کرده و با انجام فرایند تصمیم‌سازی از طریق استخراج دانش با ارزش از داده، تصمیم گیری را برای مدیران سازمان تسهیل می‌کند.

نابراین ضروری است تا برای به‌کاربستن این ابزار در سازمان‌ها، اهمیت بیشتری قائل شده تا در نهایت به فرایند تصمیم‌گیری بهینه مدیران منجر شود.

دانش داده‌کاوی

دانش داده کاوی یکی از 10دانش در حال توسعه است که دهه آینده را با انقلاب فناوری مواجه خواهد ساخت. برای همین در سال‌های اخیر در دنیا گسترش فوق‌‌العاده سریعی داشته‌است.

دانش داده‌کاوی فرآیند کشف دانش پنهان درون داده‌ها  است که با  برخورداری از دامنه وسیع زیرزمینه‌های تخصصی با توصیف، تشریح، پیش‌بینی و کنترل پدیده‌های گوناگون پیرامونی، امروزه کاربرد بسیار وسیعی در حوزه‌های مختلف از جمله صنعتی، پزشکی، ارتباطات، کشاورزی، انرژی، علوم اجتماعی، فرهنگی، سیاسی، اقتصادی، بازرگانی، نظامی، آموزشی و... دارد.

به‌گونه‌ای‌که امروزه مرز و محدودیتی برای کاربرد این دانش در نظر گرفته نشده و زمینه‌های کاری این دانش را در تمامی عرصه‌های برخوردار از داده می‌دانند.

به این ترتیب اولین کنفرانس ملی داده‌کاو‌ی در کشورمان، در انتهای ماه جاری با هدف مشارکت گسترده دانشگاهیان، دانش‌پژوهان و سازمان‌های مختلف و زمینه‌سازی برای گسترش این دانش در حوزه پژوهش و توسعه کاربردی در تمامی عرصه های مختلف کشور در دانشگاه صنعتی امیرکبیر برگزار می‌شود.

دکتر جمال شهرابی، عضو هیأت علمی دانشگاه صنعتی امیر کبیر و دبیر کنفرانس ملی داده‌کاوی در مورد دانش داده‌کاوی می‌گوید: «داده‌کاوی فرآیند تصمیم‌گیری را بر اساس مدیریت علمی داده‌ها و کاوش دانش درون داده‌ها، بسیار آسان می‌کند و از این دانش به‌دست‌آمده، 4 نوع مدل توصیفی، تشریحی، پیش‌بینی و کنترلی از پدیده‌های گوناگون اطرافمان تولید می‌کند.»

در نگاه اول ممکن است تفاوتی بین آمار، سنجش‌های آماری و مدل‌های آماری از یک طرف و داده‌کاوی و دانشی که از آن به‌دست می‌آید از طرف دیگر دیده‌نشود.

شهرابی درباره تفاوت ماهیت داده‌کاوی با آمار می‌گوید:‌ «مهم‌ترین تفاوت دانش داده‌کاوی با دانش آمار این است که در آمار از قبل می‌دانیم که به‌دنبال چه هستیم اما داده‌کاوی به 2 دسته هدایت‌شده و غیرهدایت‌شده تقسیم می‌شود که در داده‌کاوی غیرهدایت‌شده اساسا ما نمی‌دانیم که دنبال چه می‌گردیم.

به‌عبارت بهتر، فرض اولیه نداریم. به‌همین دلیل معلوم نیست که چه دانشی قرار است از حجم داده‌های یک سازمان بیرون بیاید.

یعنی داده‌کاوی، اصولا نتایج غیرقابل پیش‌بینی دارد. تفاوت مهم‌ دیگر داده‌کاوی با آمار در اندازه نمونه‌هاست. در آمار یک نمونه‌گیری کوچک و نتایج آن به کل تعمیم داده می‌شود اما در داده‌کاوی با داده‌های در مقیاس بزرگ روبه‌رو هستیم.

چون روابط درون داده‌ها در مقیاس بزرگ خودشان را نشان می‌دهند. تفاوت سوم این است که فرض‌های ساده‌ساز آمار را در این‌جا نداریم.


مهم‌ترین این فرض‌ها در آمار، بحث‌های استقلال ارتباط متغیرها از هم است. در آمار معمولا با یک متغیر یا در نهایت 2 متغیر سروکار داریم اما در داده‌کاوی همه متغیرها به هم مربوط‌ هستند.

در داده‌کاوی مکان‌محور یک جمله معروف، به‌عنوان ضرب‌المثل وجود دارد که می‌گوید: «همه‌چیز به همه‌چیز مربوط است و آن‌ها که به‌هم نزدیک‌ترند، به‌هم مربوط‌ترند». به این‌ترتیب، داده‌کاوی بسیار پیچیده‌تر از آمار است.

در کنار این کنفرانس قرار است نمایشگاه جانبی با هدف ارائه آخرین دستاوردهای تحقیقاتی وزارتخانه‌ها، سازمان‌ها، نهادهای دولتی، خصوصی و شرکت‌ها درخصوص پیاده‌سازی و به‌کارگیری دانش نوین داده‌کاوی در موضوعات مرتبط با مأموریت دستگاه‌ها از یک سو و ارائه نیازها و زمینه‌های کاری داده‌کاوی از سوی دیگر در محل دائمی نمایشگاه‌های دانشگاه صنعتی امیرکبیر برگزار شود.