Crisp dm.1.0

A
‫شناسی‬ ‫روش‬ ‫مرجع‬ ‫مدل‬
CRISP-DM
‫تنظیم‬ ‫و‬ ‫تهیه‬
‫احمدی‬ ‫علی‬
‫مقدمه‬
1
Crisp-dm‫سال‬ ‫در‬1996‫تیارتنر‬ ‫سیا‬ ‫ایایس‬ ‫کنسرسیووی‬ ‫توسط‬
،‫دایملرکرایسلر‬NCR‫و‬SPSS‫واگایا‬ ‫یخفی‬ ‫کا‬ ‫اده‬ ‫داده‬ ‫توسعا‬
‫است‬ ‫زیر‬:
Cross Industry Standard Process for Data Mining
‫هل‬ ‫سرفصل‬
2
‫و‬ ‫یقدیا‬
‫یعرف‬
‫یدل‬
‫یرجع‬
crisp-
dm
‫خروج‬
‫های‬
crisp-
dm
‫راهنمای‬
‫کاربر‬
crisp-
dm
‫معرفی‬ ‫و‬ ‫مقدمه‬
‫اناس‬ ‫روش‬CRISP-DM
‫یراتب‬ ‫سلسلا‬ ‫اکست‬
3
‫شناسی‬ ‫روش‬crisp‫مراتبی‬ ‫سلسله‬ ‫فرآیندی‬ ‫مدل‬ ‫یک‬ ‫صورت‬ ‫به‬
‫در‬ ‫که‬ ‫است‬ ‫وظایف‬ ‫از‬ ‫ای‬ ‫مجموعه‬ ‫شامل‬ ‫مدل‬ ‫این‬ ،‫است‬ ‫شده‬ ‫تعریف‬
4‫اند‬ ‫شده‬ ‫تعریف‬ ‫انتزاع‬ ‫سطح‬.
•‫مراحل‬:‫و‬ ‫شود‬ ‫می‬ ‫دهی‬ ‫سازمان‬ ‫فاز‬ ‫تعدادی‬ ‫به‬ ‫کاوی‬ ‫داده‬ ‫فرآیند‬
‫است‬ ‫عمومی‬ ‫وظیفه‬ ‫چند‬ ‫شامل‬ ‫فاز‬ ‫هر‬.
•‫عمومی‬ ‫وظایف‬:‫داده‬ ‫پاکسازی‬ ‫مانند‬.
•‫خاص‬ ‫وظایف‬:‫عددی‬ ‫های‬ ‫داده‬ ‫در‬ ‫داده‬ ‫پاکسازی‬ ‫مانند‬.
•‫فرآیند‬ ‫های‬ ‫نمونه‬:‫صورت‬ ‫به‬ ‫کاوی‬ ‫داده‬ ‫از‬ ‫شده‬ ‫حاصل‬ ‫نتایج‬
‫اول‬ ‫الیه‬ ‫خالف‬ ‫بر‬ ،‫جزیی‬.
‫معرفی‬ ‫و‬ ‫مقدمه‬
‫اناس‬ ‫روش‬CRISP-DM
‫کاربر‬ ‫راهنمای‬ ‫و‬ ‫یرجع‬ ‫یدل‬
4
‫شناسی‬ ‫روش‬CRISP‫است‬ ‫قایل‬ ‫تمایز‬ ‫کاربر‬ ‫راهنمای‬ ‫و‬ ‫مرجع‬ ‫مدل‬ ‫میان‬.
‫کاربر‬ ‫راهنمای‬ ‫ولی‬ ‫دهد‬ ‫می‬ ‫ارایه‬ ‫ها‬ ‫خروجی‬ ‫و‬ ‫وظایف‬ ‫و‬ ‫مراحل‬ ‫از‬ ‫کلی‬ ‫نگاه‬ ‫یک‬ ‫مرجع‬ ‫مدل‬
‫پر‬ ‫مدیریت‬ ‫روش‬ ‫و‬ ‫دهد‬ ‫می‬ ‫فاز‬ ‫هر‬ ‫درون‬ ‫وظایف‬ ‫و‬ ‫فاز‬ ‫هر‬ ‫مورد‬ ‫در‬ ‫بیشتری‬ ‫نکات‬ ‫و‬ ‫جزییات‬‫وژه‬
‫کند‬ ‫می‬ ‫مدیریت‬ ‫را‬ ‫کاوی‬ ‫داده‬.
‫دهیم‬ ‫می‬ ‫پوشش‬ ‫عمومی‬ ‫سطح‬ ‫در‬ ‫را‬ ‫مورد‬ ‫دو‬ ‫هر‬ ‫مستند‬ ‫این‬ ‫در‬.
‫معرفی‬ ‫و‬ ‫مقدمه‬
‫خاص‬ ‫های‬ ‫مدل‬ ‫به‬ ‫عمومی‬ ‫های‬ ‫مدل‬ ‫نگاشت‬
‫کاوی‬ ‫داده‬ ‫زمینه‬
‫ها‬ ‫روش‬ ‫و‬ ‫ابزار‬‫فنی‬ ‫جنبه‬‫مساله‬ ‫نوع‬‫کاوی‬ ‫داده‬‫کاربرد‬‫ابعاد‬
Clementine‫مقادیر‬‫مفقود‬‫بندی‬ ‫بخش‬‫رویگردان‬ ‫بینی‬ ‫پیش‬‫ی‬
‫مثال‬
MineSet‫پرت‬ ‫های‬ ‫داده‬‫بندی‬ ‫دسته‬‫کشف‬‫پولشویی‬
‫درخت‬‫تصمیم‬‫بینی‬ ‫پیش‬‫تقلب‬ ‫کشف‬
‫وابستگی‬ ‫تحلیل‬
5
‫در‬ ‫وخاص‬ ‫عمومی‬ ‫سطوح‬ ‫بین‬ ‫نگاشن‬ ‫یک‬ ‫کاوی‬ ‫داده‬ ‫زمینه‬crisp‫کند‬ ‫می‬ ‫ایجاد‬.‫از‬ ‫عبارتند‬ ‫کاوی‬ ‫داده‬ ‫های‬ ‫زمینه‬ ‫بعد‬ ‫چهار‬
‫رویگردانی‬ ‫بینی‬ ‫پیش‬ ‫در‬ ‫بندی‬ ‫دسته‬ ‫مساله‬ ‫یک‬ ‫مثل‬ ‫کاوی‬ ‫داده‬ ‫زمینه‬ ‫یک‬
‫معرفی‬ ‫و‬ ‫مقدمه‬
‫خاص‬ ‫های‬ ‫یدل‬ ‫با‬ ‫عموی‬ ‫های‬ ‫یدل‬ ‫نگاات‬
‫ها‬ ‫زمینه‬ ‫با‬ ‫نگاشت‬
6
•‫حال‬ ‫برای‬ ‫نگاشت‬:‫کنیم‬ ‫اجرا‬ ‫پروژه‬ ‫یک‬ ‫برای‬ ‫را‬ ‫عمومی‬ ‫فرآیند‬ ‫مدل‬ ‫بخواهیم‬ ‫اگر‬
•‫آینده‬ ‫برای‬ ‫نگاشت‬:‫در‬ ‫مشابه‬ ‫های‬ ‫زمینه‬ ‫در‬ ‫عمومی‬ ‫فرآیندی‬ ‫مدل‬ ‫از‬ ‫بخواهیم‬ ‫اگر‬
‫کنیم‬ ‫استفاده‬ ‫آینده‬
‫کنیم‬ ‫می‬ ‫انتخاب‬ ‫را‬ ‫مناسب‬ ‫مورد‬ ‫سازمان‬ ‫نیازهای‬ ‫و‬ ‫کاوی‬ ‫داده‬ ‫زمینه‬ ‫به‬ ‫توجه‬ ‫با‬.
‫معرفی‬ ‫و‬ ‫مقدمه‬
‫خاص‬ ‫های‬ ‫یدل‬ ‫با‬ ‫عموی‬ ‫های‬ ‫یدل‬ ‫نگاات‬
‫نگاشت‬ ‫چگونگی‬
7
‫است‬ ‫زیر‬ ‫صورت‬ ‫به‬ ‫و‬ ‫است‬ ‫یکسان‬ ‫نگاشت‬ ‫نوع‬ ‫دو‬ ‫هر‬ ‫برای‬ ‫نگاشت‬ ‫استراتژی‬:
•‫نظر‬ ‫مورد‬ ‫زمینه‬ ‫تحلیل‬
•‫نیست‬ ‫شما‬ ‫زمینه‬ ‫مناسب‬ ‫که‬ ‫جزییاتی‬ ‫حذف‬
•‫است‬ ‫زمینه‬ ‫مناسب‬ ‫که‬ ‫جزییاتی‬ ‫کردن‬ ‫اضافه‬
•‫نظر‬ ‫مورد‬ ‫زمینه‬ ‫مشخصات‬ ‫با‬ ‫مطابق‬ ‫عمومی‬ ‫محتوای‬ ‫کردن‬ ‫مشخص‬
•‫تر‬ ‫شفاف‬ ‫معانی‬ ‫ارایه‬ ‫برای‬ ‫عمومی‬ ‫محتوای‬ ‫نام‬ ‫تغییر‬
‫مرجع‬ ‫مدل‬CRISP-DM
8
‫این‬‫مدل‬‫فرآیندی‬‫نگاه‬‫کلی‬‫از‬‫چرخه‬‫عمر‬‫پروژه‬‫های‬‫داده‬‫کاوی‬‫ارایه‬‫می‬‫کند‬‫و‬‫شامل‬‫فازهای‬،‫پروژه‬
‫وظایف‬‫مرتبط‬‫با‬‫هر‬‫فاز‬‫و‬‫روابط‬‫بین‬‫این‬‫وظایف‬‫است‬.‫در‬‫این‬‫مرحله‬‫شناسایی‬‫همه‬‫روابط‬‫ممکن‬‫ن‬‫یست‬‫و‬
‫به‬،‫اهداف‬‫پیش‬‫زمینه‬‫و‬‫خواسته‬‫های‬‫کاربر‬‫روی‬‫داده‬‫وابسته‬‫است‬.
‫چرخه‬‫عمر‬‫پروژه‬‫های‬‫داده‬‫کاوی‬‫شامل‬6‫فاز‬‫است‬‫که‬‫در‬‫اسالید‬‫بعدی‬‫آمده‬‫است‬.‫رعایت‬‫کردن‬‫توالی‬
‫این‬‫روابط‬‫خیلی‬‫مهم‬‫نیست‬‫و‬‫رفت‬‫و‬‫برگشت‬‫بین‬‫مراحل‬‫مختلف‬‫همواره‬‫مورد‬‫نیاز‬‫است‬‫و‬‫خروجی‬‫هر‬
‫مرحله‬‫تعیین‬‫می‬‫کند‬‫که‬‫کدام‬‫فاز‬‫یا‬‫وظیفه‬‫خاص‬‫باید‬‫دوباره‬‫اجرا‬‫شوند‬.‫جهت‬‫های‬‫پیکان‬‫ها‬‫واب‬‫ستگی‬
‫های‬‫مهم‬‫و‬‫پرتکرار‬‫را‬‫بین‬‫هر‬‫مرحله‬‫نشان‬‫می‬‫دهد‬.
‫تعری‬
‫مرجع‬ ‫مدل‬CRISP-DM
‫تاتدی‬ ‫ماهیدت‬ ‫دهندده‬ ‫نشان‬ ‫خارجی‬ ‫دایره‬
‫است‬ ‫کاوی‬ ‫داده‬ ‫بودن‬ ‫ای‬ ‫چرخه‬.‫واقدع‬ ‫در‬
‫مدی‬ ‫سدازی‬ ‫پیداده‬ ‫رهیافدت‬ ‫یک‬ ‫که‬ ‫زمانی‬
‫شدود‬ ‫نمدی‬ ‫تمام‬ ‫کاوی‬ ‫داده‬ ‫شود‬.‫آموختده‬
‫رهیاف‬ ‫سازی‬ ‫پیاده‬ ‫و‬ ‫فرآیند‬ ‫از‬ ‫ناشی‬ ‫های‬‫ت‬
‫بی‬ ‫تمرکز‬ ‫با‬ ‫رو‬ ‫جدیدی‬ ‫پروژه‬ ‫تواند‬ ‫می‬‫شتر‬
‫و‬ ‫دد‬‫د‬‫کن‬ ‫داز‬‫د‬‫آد‬ ‫دار‬‫د‬‫ک‬ ‫و‬ ‫دب‬‫د‬‫کس‬ ‫دواالت‬‫د‬‫س‬ ‫روی‬
‫اس‬ ‫قبلی‬ ‫تجربیات‬ ‫از‬ ‫بعدی‬ ‫فرآیندهای‬‫تفاده‬
‫کرد‬ ‫خواهند‬.‫تشدریح‬ ‫بعدد‬ ‫هدای‬ ‫اسالید‬ ‫در‬
‫کنیم‬ ‫می‬ ‫بیان‬ ‫را‬ ‫فاز‬ ‫هر‬ ‫از‬ ‫مختصری‬.
9
‫یرجع‬ ‫یدل‬ ‫دیاارام‬
‫مرجع‬ ‫مدل‬CRISP-DM
‫کار‬ ‫و‬ ‫کسب‬ ‫درک‬
‫ب‬ ‫رسیدن‬ ‫برای‬ ‫مقدماتی‬ ‫طرح‬ ‫یک‬ ‫تدوین‬ ‫و‬ ‫کاوی‬ ‫داده‬ ‫مساله‬ ‫به‬ ‫آمده‬ ‫بدست‬ ‫دانش‬ ‫تبدیل‬ ‫و‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫دید‬ ‫از‬ ‫پروژه‬ ‫های‬ ‫نیازمندی‬ ‫و‬ ‫اهداف‬ ‫درک‬‫ه‬
‫اهداف‬.
‫داده‬ ‫درک‬
‫دا‬ ‫کیفیت‬ ‫مساله‬ ‫شناسایی‬ ،‫کند‬ ‫آشنا‬ ‫داده‬ ‫با‬ ‫را‬ ‫شما‬ ‫که‬ ‫یابد‬ ‫می‬ ‫ادامه‬ ‫هایی‬ ‫فعالیت‬ ‫با‬ ‫و‬ ‫میشود‬ ‫آداز‬ ‫اولیه‬ ‫داده‬ ‫آوری‬ ‫جمع‬ ‫با‬ ‫مرحله‬ ‫این‬،‫ده‬‫ک‬‫بینش‬ ‫شف‬
‫پنهان‬ ‫اطالعات‬ ‫با‬ ‫مرتبط‬ ‫فرضیات‬ ‫به‬ ‫دادن‬ ‫شکل‬ ‫برای‬ ‫ای‬ ‫زیرمجموعه‬ ‫ایجاد‬ ،‫داده‬ ‫به‬ ‫نسبت‬ ‫اولیه‬.
‫داده‬ ‫سازی‬ ‫آماده‬
‫سازد‬ ‫می‬ ‫خام‬ ‫ی‬ ‫داده‬ ‫از‬ ‫را‬ ‫نهایی‬ ‫داده‬ ‫مجموعه‬ ‫که‬ ‫هایی‬ ‫فعالیت‬ ‫همه‬.‫ندار‬ ‫ای‬ ‫شده‬ ‫تجویز‬ ‫ترتیب‬ ‫گونه‬ ‫هیچ‬ ‫و‬ ‫شود‬ ‫می‬ ‫تکرار‬ ‫بار‬ ‫چندین‬ ‫مرحله‬ ‫این‬‫د‬.
‫سازی‬ ‫مدل‬ ‫ابزار‬ ‫برای‬ ‫داده‬ ‫پاکسازی‬ ‫و‬ ‫تبدیل‬ ‫همچنین‬ ‫رکوردها‬ ‫و‬ ‫ها‬ ‫ویژگی‬ ،‫جداول‬ ‫انتخاب‬ ‫شامل‬ ‫آن‬ ‫وظایف‬.
10
‫مرجع‬ ‫مدل‬CRISP-DM
‫سازی‬ ‫مدل‬
:‫بهینه‬ ‫مقادیر‬ ‫به‬ ‫پارامترها‬ ‫کردن‬ ‫کالیبره‬ ‫و‬ ‫ها‬ ‫آن‬ ‫سازی‬ ‫پیاده‬ ‫و‬ ‫مختلف‬ ‫سازی‬ ‫مدل‬ ‫های‬ ‫روش‬ ‫انتخاب‬.‫ب‬ ،‫دارد‬ ‫وجود‬ ‫کاوی‬ ‫داده‬ ‫مساله‬ ‫یک‬ ‫برای‬ ‫روش‬ ‫چندین‬ ‫معموال‬‫از‬ ‫رخی‬
‫است‬ ‫نیاز‬ ‫مورد‬ ‫داده‬ ‫سازی‬ ‫آماده‬ ‫مرحله‬ ‫به‬ ‫برگشت‬ ‫دارندبنابراین‬ ‫خاص‬ ‫نوع‬ ‫یک‬ ‫به‬ ‫ها‬ ‫داده‬ ‫شکل‬ ‫نیازمند‬ ‫ها‬ ‫روش‬.
‫ارزیابی‬
‫دارند‬ ‫باالیی‬ ‫کیفیت‬ ‫داده‬ ‫تحلیل‬ ‫نگاه‬ ‫از‬ ‫که‬ ‫شده‬ ‫ساخته‬ ‫هایی‬ ‫مدل‬ ‫تاکنون‬.‫برا‬ ‫شده‬ ‫اجرا‬ ‫مراحل‬ ‫بازنگری‬ ‫و‬ ‫آن‬ ‫جامع‬ ‫ارزیابی‬ ،‫مدل‬ ‫نهایی‬ ‫سازی‬ ‫پیاده‬ ‫از‬ ‫قبل‬‫به‬ ‫مدل‬ ‫خلق‬ ‫ی‬
‫دارد‬ ‫بسازایی‬ ‫اهمیت‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫اهداف‬ ‫به‬ ‫مدل‬ ‫درست‬ ‫دستیابی‬ ‫از‬ ‫اطمینان‬ ‫منظور‬.‫است‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫در‬ ‫مهمی‬ ‫مسایلی‬ ‫کردن‬ ‫مشخص‬ ‫کلیدی‬ ‫مسایل‬ ‫از‬ ‫یکی‬‫اندازه‬ ‫به‬ ‫که‬
‫است‬ ‫نگرفته‬ ‫قرار‬ ‫توجه‬ ‫مورد‬ ‫کافی‬.‫خیر‬ ‫یا‬ ‫شود‬ ‫استفاده‬ ‫کاوی‬ ‫داده‬ ‫نتایج‬ ‫از‬ ‫آیا‬ ‫که‬ ‫رسید‬ ‫تصمیم‬ ‫این‬ ‫به‬ ‫باید‬ ‫فاز‬ ‫این‬ ‫پایان‬ ‫در‬!
‫سازی‬ ‫پیاده‬
‫نیست‬ ‫پروژه‬ ‫پایان‬ ‫مدل‬ ‫خلق‬.‫آ‬ ‫از‬ ‫بتواند‬ ‫مشتری‬ ‫که‬ ‫است‬ ‫نوعی‬ ‫به‬ ‫ارایه‬ ‫و‬ ‫سازماندهی‬ ‫به‬ ‫نیاز‬ ‫آمده‬ ‫بدست‬ ‫دانش‬ ،‫است‬ ‫داده‬ ‫از‬ ‫دانش‬ ‫افزایش‬ ‫مدل‬ ‫هدف‬ ‫اگر‬ ‫حتی‬‫استفاده‬ ‫ن‬
‫کند‬.‫کاوی‬ ‫داده‬ ‫تکرارپذیر‬ ‫فرآیند‬ ‫یک‬ ‫سازی‬ ‫پیاده‬ ‫پیچیدگی‬ ‫یا‬ ‫باشد‬ ‫گزارش‬ ‫یک‬ ‫تولید‬ ‫سادگی‬ ‫به‬ ‫تواند‬ ‫می‬ ‫سازی‬ ‫پیاده‬ ‫فاز‬ ‫ها‬ ‫نیازمندی‬ ‫به‬ ‫بسته‬‫د‬‫ر‬‫باشد‬ ‫سازمان‬ ‫سطح‬.‫در‬
‫مشت‬ ‫که‬ ‫است‬ ‫مهم‬ ‫بسیار‬ ‫دهد‬ ‫انجام‬ ‫را‬ ‫اقدام‬ ‫این‬ ‫تحلیلگر‬ ‫هم‬ ‫اگر‬ ‫کند‬ ‫می‬ ‫مدیریت‬ ‫را‬ ‫سازی‬ ‫پیاده‬ ‫مراحل‬ ‫که‬ ‫است‬ ‫مشتری‬ ‫این‬ ‫موارد‬ ‫از‬ ‫بسیاری‬‫ری‬‫ک‬ ‫کند‬ ‫درک‬‫چه‬ ‫ه‬
‫شده‬ ‫ساخته‬ ‫های‬ ‫مدل‬ ‫از‬ ‫استفاده‬ ‫برای‬ ‫دارد‬ ‫نیاز‬ ‫اقداماتی‬.
11
‫مرجع‬ ‫مدل‬CRISP-DM
‫هر‬ ‫و‬ ‫باشد‬ ‫می‬ ‫عمومی‬ ‫وظایف‬ ‫سری‬ ‫یک‬ ‫دارای‬ ‫مرجع‬ ‫مدل‬ ‫از‬ ‫فاز‬ ‫هر‬
‫هر‬ ‫بحث‬ ‫ادامه‬ ‫در‬ ‫که‬ ‫هستند‬ ‫هایی‬ ‫خروجی‬ ‫دارای‬ ‫وظایف‬ ‫این‬ ‫از‬ ‫کدام‬
‫ه‬ ‫خروجی‬ ‫و‬ ‫وظایف‬ ‫و‬ ‫میگیرد‬ ‫قرار‬ ‫بررسی‬ ‫مورد‬ ‫مستقل‬ ‫طور‬ ‫به‬ ‫فاز‬‫ای‬
‫کنیم‬ ‫می‬ ‫مطرح‬ ‫را‬ ‫فاز‬ ‫هر‬.
12
‫مرجع‬ ‫مدل‬CRISP-DM–‫کار‬ ‫و‬ ‫کسب‬ ‫درک‬
‫وظایف‬
‫عمومی‬
‫ها‬ ‫خروجی‬
13
‫مرجع‬ ‫مدل‬CRISP-DM–‫کار‬ ‫و‬ ‫کسب‬ ‫درک‬
‫وظیفه‬‫عمومی‬:‫تعیین‬‫اهداف‬‫کسب‬‫و‬‫کار‬
‫هدف‬‫اول‬‫این‬‫است‬‫به‬‫راستی‬‫مشتری‬‫خواهان‬‫انجام‬‫چه‬‫چیزی‬‫است‬.‫ادلب‬‫مشتری‬‫محدودیت‬‫ها‬‫و‬‫اهداف‬‫رقابتی‬‫زیادی‬‫دارد‬‫که‬‫باید‬‫بین‬‫این‬‫ها‬‫تعادل‬‫برقرار‬‫ک‬‫رد‬.
‫هدف‬‫تحلیل‬‫گر‬‫کشف‬‫عوامل‬‫مهم‬‫که‬‫می‬‫توانند‬‫روی‬‫خروجی‬‫پروژه‬‫تاثیر‬‫بگذارند‬‫می‬‫باشد‬.‫نتیجه‬‫دفلت‬‫از‬‫این‬‫مرحله‬‫صرف‬‫هزینه‬‫برای‬‫پاسخ‬‫درست‬‫ب‬‫ه‬‫سوال‬‫های‬
‫دلط‬‫است‬.
•‫پس‬‫زمینه‬:‫ثیت‬‫و‬‫ضبط‬‫اطالعات‬‫شناسایی‬‫شده‬‫از‬‫وضعیت‬‫کسب‬‫و‬‫کار‬‫سازمان‬‫در‬‫در‬‫آداز‬‫پروژه‬.
•‫اهداف‬‫پروژه‬:‫توصیف‬‫اهداف‬‫اصلی‬‫مشتری‬‫از‬‫نگاه‬‫کسب‬‫و‬‫کار‬.‫معموال‬‫سواالت‬‫کسب‬‫و‬‫کار‬‫مرتبط‬‫دیگری‬‫وجود‬‫دارد‬‫که‬‫مشتری‬‫مورد‬‫توجه‬‫قرار‬‫میدهد‬.‫ب‬‫رای‬
‫مثال‬‫فرض‬‫کنید‬‫هدف‬‫اصلی‬‫کسب‬‫و‬‫کار‬‫نگهداری‬‫مشتریان‬‫فعلی‬‫از‬‫طریق‬‫پیش‬‫بینی‬‫مشتریانی‬‫است‬‫که‬‫تمایل‬‫به‬‫رفتن‬‫به‬‫سمت‬‫رقیب‬‫را‬‫د‬‫ارند‬‫در‬‫این‬‫حالت‬
‫سوال‬‫کسب‬‫و‬‫کار‬‫مرتبط‬‫عبارت‬‫است‬‫از‬‫کانال‬‫اصل‬‫مورد‬‫استفاده‬‫که‬‫اثر‬‫میگذارد‬‫بر‬‫تصمیم‬‫مشتری‬‫چیست؟‬(POS,ATM,…)
•‫معیار‬‫موفقیت‬‫کسب‬‫و‬‫کار‬:‫تعریف‬‫معیار‬‫برای‬‫موفقیت‬‫و‬‫مفید‬‫بودن‬‫نتایج‬‫پروژه‬‫از‬‫نگاه‬‫کسب‬‫و‬‫کار‬‫برای‬‫مثال‬‫کاهش‬‫رویگردانی‬‫مشتری‬‫به‬‫ی‬‫ک‬‫سطح‬‫معین‬‫که‬
‫یک‬‫معیار‬‫عینی‬‫است‬‫یا‬‫ارایه‬‫یک‬‫بینش‬‫مفید‬‫در‬‫مورد‬‫روابط‬‫یک‬‫معیار‬‫قضاوتی‬‫است‬‫در‬‫این‬‫مورد‬‫باید‬‫تعیین‬‫شود‬‫چه‬‫کسی‬‫این‬‫قضاوت‬‫را‬‫انجام‬‫د‬‫هد‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
14
‫مرجع‬ ‫مدل‬CRISP-DM–‫کار‬ ‫و‬ ‫کسب‬ ‫درک‬
‫وظیفه‬‫عمومی‬:‫ارزیابی‬‫وضعیت‬
‫در‬‫این‬‫مورد‬‫جزییات‬‫بیشتری‬‫در‬‫مورد‬‫محدودیت‬،‫ها‬‫فرضیات‬‫و‬‫منابع‬‫و‬‫دیگر‬‫عواملی‬‫که‬‫باید‬‫در‬‫نظر‬‫گرفته‬‫شود‬‫د‬‫ر‬‫تعیین‬
‫هدف‬‫تحلیل‬‫داده‬‫و‬‫طرح‬‫پروژه‬.‫در‬‫بخش‬‫هدف‬‫درک‬‫سریع‬‫از‬‫وضعیت‬‫بود‬‫اینجا‬‫با‬‫جزییات‬‫بیشتری‬‫مطرح‬‫شود‬.
•‫موجودی‬‫منابع‬:‫لیست‬‫کردن‬‫منابع‬‫در‬‫دسترس‬‫در‬‫پروژه‬‫شامل‬‫پرسنل‬(‫متخصص‬‫کسب‬‫و‬،‫کار‬‫متخصص‬،‫داده‬‫پش‬‫تیبانی‬
،‫فنی‬‫متخصص‬‫داده‬‫کاوی‬)‫؛‬‫داده‬(‫داده‬‫های‬،‫عملیاتی‬‫انباره‬‫های‬،‫داده‬‫دسترسی‬‫در‬‫لحظه‬‫به‬‫داده‬)،‫منابع‬‫رایانش‬(‫بس‬‫ترهای‬
‫سخت‬‫افزاری‬)‫و‬‫نرم‬‫افزاز‬(‫ابزارهای‬‫داده‬‫کاوی‬)
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
15
‫مرجع‬ ‫مدل‬CRISP-DM–‫کار‬ ‫و‬ ‫کسب‬ ‫درک‬
‫عمومی‬ ‫وظیفه‬:‫وضعیت‬ ‫ارزیابی‬
•‫خطرات‬‫و‬‫نیازمندی‬‫ها‬:‫لیست‬‫کردن‬‫خطرات‬‫یا‬‫اتفاقاتی‬‫که‬‫ممکن‬‫است‬‫در‬‫پروژه‬‫تاخیر‬‫ایجاد‬‫کنند‬‫یا‬‫باعث‬‫شکست‬‫پروژه‬‫شوند‬‫در‬‫ای‬‫ن‬‫مورد‬‫باید‬
‫یک‬‫طرح‬‫مدیریت‬‫ریسک‬‫فراهم‬‫شود‬‫به‬‫این‬‫صورت‬‫که‬‫در‬‫برابر‬‫خطرات‬‫و‬‫اتفاقات‬‫چه‬‫اقداماتی‬‫را‬‫انجام‬‫دهیم‬.
•‫واژه‬‫شناسی‬:‫گردآوری‬‫فرهنگ‬‫لغاتی‬‫از‬‫واژگان‬‫مرتبط‬‫با‬‫پروژه‬‫که‬‫شامل‬‫دو‬‫جز‬‫است‬
‫فرهنگ‬‫لغات‬‫مرتبط‬‫با‬‫واژگان‬‫کسب‬‫و‬‫کار‬
‫فرهنگ‬‫لغات‬‫مرتبط‬‫با‬‫داده‬‫کاوی‬‫همراه‬‫با‬‫مثال‬‫هایی‬‫از‬‫مساله‬‫کسب‬‫و‬‫کار‬
•‫هزینه‬‫ها‬‫و‬‫منافع‬:‫انجام‬‫تحلیل‬‫هزینه‬-‫منافع‬‫برای‬‫پروژه‬‫که‬‫همان‬‫مقایسه‬‫بین‬‫هزینه‬‫های‬‫پروژه‬‫با‬‫منافع‬‫بلقوه‬‫آن‬‫در‬‫صورت‬‫موفقیت‬‫اس‬‫ت‬.
•‫نیازمندی‬،‫های‬‫فرضیات‬‫و‬‫محدودیت‬‫ها‬:‫لیست‬‫کردن‬‫همه‬‫نیازمندی‬‫های‬‫پروژه‬‫شامل‬‫زمان‬‫بندی‬،‫تکیل‬‫کیفیت‬‫و‬‫قابل‬‫درک‬‫بودن‬‫نتای‬‫ج‬‫و‬‫امنیت‬
‫به‬‫عالوه‬‫مسایل‬‫قانونی‬.‫بخشی‬‫از‬‫خروجی‬‫این‬‫قسمت‬‫شامل‬‫اطمینان‬‫از‬‫اجازه‬‫استفاده‬‫از‬‫داده‬.‫لیست‬‫کردن‬‫فرضیات‬‫ساخته‬‫شده‬‫توسط‬‫پروژه‬.‫این‬
‫فرضیات‬‫ممکن‬‫است‬‫در‬‫مورد‬‫داده‬‫باشند‬‫که‬‫میتوانند‬‫در‬‫طی‬‫داده‬‫کاوی‬‫تایید‬‫شوند‬‫و‬‫همچنین‬‫ممکن‬‫است‬‫فرضیات‬‫دیرقابل‬‫تایید‬‫ی‬‫باشند‬‫که‬
‫مرتبط‬‫با‬‫کسب‬‫و‬‫کار‬‫پروژه‬‫هستند‬.‫مورد‬‫دوم‬‫در‬‫صورتی‬‫که‬‫روی‬‫اعتبارسنجی‬‫نتایج‬‫اثر‬‫بگذارد‬‫اهمیت‬‫بیشتری‬‫دارد‬.‫لیست‬‫کردن‬‫محدودیت‬‫های‬
‫پروژه‬.‫این‬‫محدودیت‬‫ها‬‫می‬‫توانند‬‫محدودیت‬‫دسترسی‬‫به‬‫منابع‬‫باشد‬‫یا‬‫محدودیت‬‫های‬‫فنی‬‫مانند‬‫اندازه‬‫مجموعه‬‫داده‬‫که‬‫برای‬‫ساخت‬‫مد‬‫ل‬
‫عملی‬‫است‬.
‫ها‬ ‫خروجی‬
16
‫مرجع‬ ‫مدل‬CRISP-DM–‫کار‬ ‫و‬ ‫کسب‬ ‫درک‬
‫وظیفه‬‫عمومی‬:‫تعیین‬‫اهداف‬‫داده‬‫کاوی‬
‫هدف‬‫کسب‬‫و‬‫کار‬‫اهدافی‬‫را‬‫با‬‫اصطالحات‬‫تجاری‬‫بیان‬‫می‬‫کند‬‫و‬‫هدف‬‫داده‬‫کاوی‬‫اهداف‬‫پروژه‬‫را‬‫به‬‫صورت‬‫فنی‬‫بیان‬‫م‬‫ی‬
‫کند‬.
•‫اهداف‬‫داده‬‫کاوی‬:‫تشریح‬‫خروجی‬‫های‬‫مورد‬‫نظر‬‫پروژه‬‫که‬‫ما‬‫را‬‫قادر‬‫به‬‫دستیابی‬‫به‬‫اهداف‬‫کسب‬‫و‬‫کار‬‫می‬‫کنند‬.
•‫معیارهای‬‫موفقیت‬‫داده‬‫کاوی‬:‫تشریح‬‫برای‬‫خروجی‬‫های‬‫موفق‬‫با‬‫اصطالحات‬‫فنی‬‫برای‬‫مثال‬‫سطح‬‫معینی‬‫از‬‫دقت‬‫پیش‬
‫بینی‬‫مانند‬‫معیارهای‬‫موفقیت‬‫کسب‬‫و‬‫کار‬‫ممکن‬‫الزم‬‫باشد‬‫اینها‬‫را‬‫با‬‫اصطالحات‬SUBJECTIVE‫توصیف‬‫کنید‬.
‫تعریف‬‫وظیف‬‫ه‬
‫خروجی‬‫ها‬
17
‫مرجع‬ ‫مدل‬CRISP-DM–‫کار‬ ‫و‬ ‫کسب‬ ‫درک‬
‫عمومی‬ ‫وظیفه‬:‫پروژ‬ ‫طرح‬ ‫تولید‬‫ه‬
‫کار‬ ‫و‬ ‫کسب‬ ‫اهداف‬ ‫آن‬ ‫واسطه‬ ‫به‬ ‫و‬ ‫کاوی‬ ‫داده‬ ‫اهداف‬ ‫به‬ ‫دسترسی‬ ‫برای‬ ‫مطلوب‬ ‫طرح‬ ‫تشریح‬.‫ب‬ ‫در‬ ‫باید‬ ‫که‬ ‫کند‬ ‫مشخص‬ ‫را‬ ‫هایی‬ ‫قدم‬ ‫باید‬ ‫طرح‬ ‫این‬‫مانده‬ ‫اقی‬
‫ها‬ ‫روش‬ ‫و‬ ‫ابزار‬ ‫انتخاب‬ ‫مانند‬ ‫شوند‬ ‫انجام‬ ‫پروژه‬.
‫پروژه‬ ‫طرح‬
‫ها‬ ‫وابستگی‬ ‫و‬ ‫ها‬ ‫خروجی‬ ،‫ها‬ ‫ورودی‬ ،‫ها‬ ‫آن‬ ‫نیاز‬ ‫مورد‬ ‫منابع‬ ،‫ها‬ ‫آن‬ ‫اجرای‬ ‫زمان‬ ‫با‬ ‫همراه‬ ‫درپروژه‬ ‫اجرا‬ ‫برای‬ ‫هایی‬ ‫قدم‬ ‫کردن‬ ‫لیست‬.‫امکان‬ ‫صورت‬ ‫در‬
‫ارزیابی‬ ‫و‬ ‫سازی‬ ‫مدل‬ ‫فاز‬ ‫تکرار‬ ‫مانند‬ ‫کاوی‬ ‫داده‬ ‫فرآیند‬ ‫در‬ ‫تکرارها‬ ‫تعیین‬.
‫دارد‬ ‫بسزایی‬ ‫اهمیت‬ ‫خطرات‬ ‫و‬ ‫بندی‬ ‫زمان‬ ‫میان‬ ‫های‬ ‫وابستگی‬ ‫تحلیل‬ ،‫پروژه‬ ‫طرح‬ ‫از‬ ‫بخشی‬ ‫عنوان‬ ‫به‬.
‫تذکر‬:‫است‬ ‫مرحله‬ ‫هر‬ ‫بر‬ ‫برای‬ ‫پروژه‬ ‫طرح‬ ‫شامل‬ ‫پروژه‬ ‫طرح‬.‫تص‬ ‫ارزیابی‬ ‫فاز‬ ‫در‬ ‫استفاده‬ ‫مورد‬ ‫ارزیابی‬ ‫استراتژی‬ ‫مورد‬ ‫در‬ ‫باید‬ ‫نقطه‬ ‫این‬ ‫در‬‫گرفت‬ ‫میم‬.
‫وظیف‬ ‫تعریف‬‫ه‬
‫ها‬ ‫خروجی‬
18
‫مرجع‬ ‫مدل‬CRISP-DM–‫کار‬ ‫و‬ ‫کسب‬ ‫درک‬
‫عمومی‬ ‫وظیفه‬:‫پروژ‬ ‫طرح‬ ‫تولید‬‫ه‬
‫طرح‬‫پروژه‬‫یک‬‫سند‬‫پویا‬‫می‬‫باشد‬‫و‬‫در‬‫پایان‬‫هرفاز‬‫نیاز‬‫به‬‫بازنگری‬‫پیشرفت‬‫و‬‫دست‬‫یافته‬‫ها‬‫می‬‫باشد‬‫همچنی‬‫ن‬‫به‬‫روزرسانی‬
‫طرح‬‫پروژه‬.‫نقاط‬‫بازنگری‬‫برای‬‫بروزرسانی‬‫ها‬‫بخشی‬‫از‬‫طرح‬‫پروژه‬‫است‬.
•‫ارزیابی‬‫اولیه‬‫ابزار‬‫و‬‫روش‬‫ها‬:‫فرض‬‫کنید‬‫ابزاری‬‫را‬‫انتخاب‬‫کرده‬‫اید‬‫که‬‫روش‬‫های‬‫مختلفی‬‫را‬‫پشتیبانی‬‫می‬‫کن‬‫د‬‫ارزیابی‬
‫این‬‫ابزار‬‫و‬‫روش‬‫ها‬‫در‬‫ابتدای‬‫فرآیند‬‫اهمیت‬‫بسزایی‬‫دارد‬‫زیرا‬‫انتخاب‬‫این‬‫ابزار‬‫و‬‫روش‬‫ها‬‫ممکن‬‫است‬‫روی‬‫کل‬‫پروژ‬‫ه‬‫اثر‬
‫بگذارد‬.
‫ها‬ ‫خروجی‬
19
‫مرجع‬ ‫مدل‬CRISP-DM-‫داده‬ ‫درک‬
‫وظایف‬
‫عمومی‬
‫خروجی‬‫ها‬
20
‫مرجع‬ ‫مدل‬CRISP-DM-‫داده‬ ‫درک‬
‫وظیفه‬‫عمومی‬:‫جمع‬‫آوری‬‫اولیه‬‫داده‬
‫جمع‬‫آوری‬‫داده‬‫های‬‫لیست‬‫شده‬‫در‬‫منابع‬،‫پروژه‬‫این‬‫تالش‬‫ممکن‬‫است‬‫شروع‬‫کننده‬‫قدم‬‫هایی‬‫آماده‬‫سازی‬‫داده‬‫باشد‬.
‫تذکر‬:‫اگر‬‫داده‬‫ها‬‫در‬‫چند‬‫منبع‬،‫باشند‬‫تجمیع‬‫داده‬‫ها‬‫یک‬‫مساله‬‫دیگری‬‫است‬‫چه‬‫در‬‫این‬‫مرحله‬‫چه‬‫در‬‫مرحله‬‫آماده‬‫سازی‬
‫داده‬.
•‫گزارش‬‫جمع‬‫آوری‬‫داده‬‫مقدماتی‬:‫لیست‬‫کردن‬‫مجموعه‬‫داده‬‫های‬‫بدست‬‫آمده‬‫همراه‬‫با‬‫محل‬‫آن‬،‫ها‬
‫روش‬‫های‬‫استفاده‬‫شده‬‫برای‬‫بدست‬‫آوردن‬‫آن‬‫ها‬‫و‬‫هر‬‫مشکلی‬‫که‬‫با‬‫آن‬‫مواجه‬‫شدیم‬‫و‬‫راه‬‫حل‬‫های‬
‫ارایه‬‫شده‬‫برای‬‫مشکل‬.
‫تعریف‬‫وظیف‬‫ه‬
‫خروجی‬‫ها‬
21
‫مرجع‬ ‫مدل‬CRISP-DM-‫داده‬ ‫درک‬
‫عمومی‬ ‫وظیفه‬:‫داده‬ ‫اکتشاف‬
‫آو‬ ‫جمع‬ ‫نتایج‬ ،‫کلیدی‬ ‫های‬ ‫ویژگی‬ ‫میان‬ ‫روابط‬ ‫شامل‬ ‫همچنین‬ ‫گیری‬ ‫گزارش‬ ‫های‬ ‫روش‬ ‫و‬ ‫مصورسازی‬ ،‫جو‬ ‫و‬ ‫پرس‬ ‫طریق‬ ‫از‬ ‫کاوی‬ ‫داده‬ ‫سواالت‬ ‫به‬ ‫پاسخ‬‫ری‬‫س‬ ‫های‬‫و‬ ‫اده‬
‫آماری‬ ‫ساده‬ ‫های‬ ‫تحلیل‬.‫دهن‬ ‫انجام‬ ‫داده‬ ‫کیفیت‬ ‫های‬ ‫گزارش‬ ‫و‬ ‫داده‬ ‫تشریح‬ ‫به‬ ‫کمک‬ ‫اینکه‬ ‫یا‬ ‫دهد‬ ‫قرار‬ ‫هدف‬ ‫را‬ ‫کاوی‬ ‫داده‬ ‫اهداف‬ ‫مستقیما‬ ‫است‬ ‫ممکن‬ ‫موارد‬ ‫این‬‫یا‬ ‫د‬
‫داده‬ ‫سازی‬ ‫آماده‬ ‫مراحل‬ ‫برای‬ ‫باشند‬ ‫ای‬ ‫مقدمه‬.
•‫داده‬ ‫اکتشاف‬ ‫گزارش‬:‫پروژه‬ ‫روی‬ ‫ها‬ ‫آن‬ ‫اثرات‬ ‫و‬ ‫اولیه‬ ‫فرضیات‬ ‫و‬ ‫ها‬ ‫یافته‬ ‫شامل‬ ‫نتایج‬ ‫تشریح‬.‫ه‬‫مچنین‬
‫دهند‬ ‫می‬ ‫نشان‬ ‫را‬ ‫داده‬ ‫مشخصات‬ ‫که‬ ‫نمودارهایی‬ ‫و‬ ‫ها‬ ‫گراف‬ ‫ترسیم‬ ‫امکان‬ ‫صورت‬ ‫در‬.
‫وظوف‬ ‫تعری‬‫ا‬
‫ها‬ ‫خروج‬
22
‫مرجع‬ ‫مدل‬CRISP-DM-‫داده‬ ‫درک‬
‫وظیفه‬‫عمومی‬:‫تایید‬‫کیفیت‬‫داده‬
‫بررسی‬‫کیفیت‬‫داده‬‫که‬‫پرسش‬‫هایی‬‫شامل‬‫موارد‬‫زیر‬‫را‬‫درنظر‬‫میگیرد‬:‫آیا‬‫داده‬‫ها‬‫کامل‬‫هستند‬(‫آیا‬‫همه‬‫نیازها‬‫را‬‫پوشش‬‫می‬‫دهند‬)‫؟‬‫آیا‬‫داده‬‫ها‬‫صحیح‬‫هست‬‫ند‬‫یا‬‫خطا‬
‫دارند‬‫در‬‫صورت‬‫وجود‬‫خطا‬‫چه‬‫خطاهایی‬‫متداول‬‫هستند؟‬‫آیا‬‫مقادیر‬‫مفقوده‬‫در‬‫داده‬‫داریم؟‬‫اگر‬‫بله‬‫چگونه‬‫نمایش‬‫یافته‬‫اند‬‫و‬‫در‬‫کجا‬‫رخ‬‫داده‬‫اند‬‫و‬‫کدام‬‫ها‬‫متدا‬‫ول‬
‫هستند؟‬
•‫گزارش‬‫کیفیت‬‫داده‬:‫در‬‫صورت‬‫وجود‬‫مشکالت‬‫راه‬‫حل‬‫های‬‫آن‬‫ها‬‫را‬‫لیست‬‫کنید‬.‫راه‬‫کارهای‬‫مشکال‬‫ت‬
‫کیفیت‬‫داده‬‫عموما‬‫وابستگی‬‫زیادی‬‫به‬‫دانش‬‫داده‬‫و‬‫کسب‬‫و‬‫کار‬‫دارند‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
23
‫مرجع‬ ‫مدل‬CRISP-DM-‫داده‬ ‫سازی‬ ‫آماده‬
‫وظایف‬
‫عمومی‬
‫ها‬ ‫خروجی‬
24
‫مرجع‬ ‫مدل‬CRISP-DM–‫داده‬ ‫سازی‬ ‫آماده‬
•‫داده‬ ‫مجموعه‬:‫یا‬ ‫سازی‬ ‫مدل‬ ‫برای‬ ‫که‬ ،‫داده‬ ‫سازی‬ ‫آماده‬ ‫فاز‬ ‫در‬ ‫شده‬ ‫تولید‬ ‫داه‬ ‫مجموعه‬
‫گرفت‬ ‫خواهد‬ ‫قرار‬ ‫استفاده‬ ‫مورد‬ ‫اصلی‬ ‫های‬ ‫تحلیل‬.
•‫داده‬ ‫مجموعه‬ ‫توصیف‬:‫آمده‬ ‫بدست‬ ‫داده‬ ‫مجموعه‬ ‫تشریح‬ ‫و‬ ‫توصیف‬
‫ها‬ ‫خروج‬25
‫مرجع‬ ‫مدل‬CRISP-DM–‫داده‬ ‫سازی‬ ‫آماده‬
‫عمومی‬ ‫وظیفه‬:‫داده‬ ‫انتخاب‬
‫شود‬ ‫استفاده‬ ‫باید‬ ‫که‬ ‫ای‬ ‫داده‬ ‫روی‬ ‫گیری‬ ‫تصمیم‬.‫محد‬ ‫و‬ ‫داده‬ ‫کیفیت‬ ،‫کاوی‬ ‫داده‬ ‫اهداف‬ ‫با‬ ‫ارتباط‬ ‫میزان‬ ‫از‬ ‫هستند‬ ‫عبارت‬ ‫انتخاب‬ ‫معیارهای‬‫های‬ ‫ودیت‬
‫داده‬ ‫نوع‬ ‫یا‬ ‫داده‬ ‫حجم‬ ‫روی‬ ‫محدودیت‬ ‫مانند‬ ‫فنی‬.‫هست‬ ‫جداول‬ ‫رکوردهای‬ ‫انتخاب‬ ‫همچنین‬ ‫و‬ ‫ها‬ ‫ویژگی‬ ‫داده‬ ‫انتخاب‬ ‫کنید‬ ‫توجه‬.
•‫خروج‬ ‫و‬ ‫شمول‬ ‫منطق‬:‫دالید‬ ‫و‬ ‫شدوند‬ ‫خارج‬ ‫و‬ ‫شوند‬ ‫شامل‬ ‫باید‬ ‫که‬ ‫هایی‬ ‫داده‬ ‫کردن‬ ‫لیست‬‫ل‬
‫تصمیم‬ ‫این‬
‫وظوف‬ ‫تعری‬‫ا‬
‫ها‬ ‫خروج‬
26
‫مرجع‬ ‫مدل‬CRISP-DM–‫داده‬ ‫سازی‬ ‫آماده‬
‫عمومی‬ ‫وظیفه‬:‫داده‬ ‫پاکسازی‬
‫شده‬ ‫انتخاب‬ ‫تحلیل‬ ‫های‬ ‫روش‬ ‫توسط‬ ‫داده‬ ‫کیفیت‬ ‫سطح‬ ‫افزایش‬.‫ید‬ ‫باشدد‬ ‫داده‬ ‫از‬ ‫پداک‬ ‫ای‬ ‫زیرمجموعده‬ ‫انتخداب‬ ‫طریق‬ ‫از‬ ‫است‬ ‫ممکن‬ ‫اقدام‬ ‫این‬‫وارد‬ ‫ا‬
‫سازی‬ ‫مدل‬ ‫توسط‬ ‫مفقود‬ ‫مقادیر‬ ‫تخمین‬ ‫مانند‬ ‫دیگری‬ ‫های‬ ‫روش‬ ‫یا‬ ‫مناسب‬ ‫فرض‬ ‫پیش‬ ‫مقادیر‬ ‫کردن‬.
•‫داده‬ ‫پاکسازی‬ ‫گزارش‬:‫د‬ ‫کیفیت‬ ‫مشکالت‬ ‫حل‬ ‫برای‬ ‫گرفته‬ ‫صورت‬ ‫واقدامات‬ ‫تصمیامات‬ ‫تشریح‬‫در‬ ‫کده‬ ‫اده‬
‫اند‬ ‫شده‬ ‫گزارش‬ ‫داده‬ ‫درک‬ ‫فاز‬ ‫در‬ ‫در‬ ‫داده‬ ‫کیفیت‬ ‫تایید‬ ‫وظیفه‬ ‫طی‬.‫پ‬ ‫اهداف‬ ‫برای‬ ‫داده‬ ‫تبدیالت‬‫اکسدازی‬
‫شوند‬ ‫گرفته‬ ‫نظر‬ ‫در‬ ‫باید‬ ‫تحلیلی‬ ‫نتایج‬ ‫روی‬ ‫آن‬ ‫ممکن‬ ‫اثرات‬ ‫و‬.
‫وظوف‬ ‫تعری‬‫ا‬
‫ها‬ ‫خروج‬
27
‫مرجع‬ ‫مدل‬CRISP-DM–‫داده‬ ‫سازی‬ ‫آماده‬
‫وظیفه‬‫عمومی‬:‫ساخت‬‫داده‬
‫این‬‫وظیفه‬‫عملیات‬‫آماده‬‫سازی‬‫داده‬‫تولیدی‬‫مانند‬‫تولید‬‫ویژگی‬‫های‬‫مشتق‬‫شده‬‫رکورد‬‫های‬‫جدید‬‫یا‬‫تبدیل‬‫مقاد‬‫یر‬‫برای‬
‫ویژگی‬‫های‬‫موجود‬.
•‫ویژگی‬‫های‬‫مشتق‬‫شده‬:‫ویژگی‬‫های‬‫مشتق‬‫شده‬‫ویژگی‬‫های‬‫جدیدی‬‫هستند‬‫که‬‫از‬‫روی‬‫یک‬‫یا‬‫تعداد‬‫بیشتری‬‫و‬‫یژگی‬
‫موجود‬‫ساخته‬‫شده‬‫اند‬.‫مانند‬‫مساحت‬‫که‬‫از‬‫روی‬‫طول‬‫و‬‫عرض‬‫ساخته‬‫می‬‫شود‬.
•‫رکورد‬‫های‬‫ساخته‬‫شده‬:‫تشریح‬‫ساخت‬‫رکورد‬‫های‬‫جدید‬.‫مانند‬:‫ساخت‬‫رکورد‬‫برای‬‫مشتری‬‫هایی‬‫که‬‫هیچ‬‫خریدی‬‫د‬‫ر‬
‫یک‬‫سال‬‫گذشته‬‫انجام‬‫نداده‬‫اند‬.‫هیچ‬‫دلیلی‬‫وجود‬‫ندارد‬‫که‬‫این‬‫چنین‬‫رکوردهایی‬‫در‬‫داده‬‫خام‬‫وجود‬‫داشته‬‫باشد‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
28
‫مرجع‬ ‫مدل‬CRISP-DM–‫داده‬ ‫سازی‬ ‫آماده‬
‫وظیفه‬‫عمومی‬:‫تجمیع‬‫داده‬
‫در‬‫این‬‫قسمت‬‫روش‬‫های‬‫وجود‬‫دارند‬‫که‬‫به‬‫وسیله‬‫آن‬‫ها‬‫اطالعات‬‫از‬‫چند‬‫جدول‬‫یا‬‫رکورد‬‫ترکیب‬‫می‬‫شوند‬‫برای‬‫خلق‬‫رک‬‫ورد‬
‫ها‬‫یا‬‫مقادیر‬‫جدید‬.
•‫داده‬‫های‬‫یکی‬‫شده‬:‫یکی‬‫کردن‬‫جداول‬‫همان‬JOIN‫کردن‬‫دو‬‫یا‬‫تعدادی‬‫بیشتر‬‫از‬‫جداول‬‫است‬‫که‬‫اطالعات‬‫متفاوتی‬‫از‬
‫آبجکت‬‫های‬‫یکسان‬‫دارند‬.‫داده‬‫های‬‫یکی‬‫شده‬‫همچنین‬‫جمع‬‫آوری‬‫را‬‫پوشش‬‫می‬‫دهد‬(aggregation)‫که‬‫عبارت‬‫است‬
‫از‬‫عملیاتی‬‫که‬‫در‬‫نتیجه‬‫ان‬‫ها‬‫مقادیر‬‫جدیدی‬‫محاسبه‬‫می‬‫شوند‬‫توسط‬‫خالصه‬‫سازی‬‫اطالعات‬‫از‬‫چند‬‫رکورد‬‫یا‬‫ج‬‫دول‬
‫برای‬‫مثال‬‫تبدیل‬‫یک‬‫جدول‬‫خرید‬‫مشتری‬‫که‬‫در‬‫آن‬‫برای‬‫هر‬‫خرید‬‫یک‬‫رکورد‬‫وجود‬‫دارد‬‫به‬‫یک‬‫جدول‬‫جدید‬‫که‬‫ب‬‫رای‬
‫هر‬‫مشتری‬‫یک‬‫رکورد‬‫وجود‬‫دارد‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
29
‫مرجع‬ ‫مدل‬CRISP-DM–‫داده‬ ‫سازی‬ ‫آماده‬
‫عمومی‬ ‫وظیفه‬:‫داد‬ ‫به‬ ‫دادن‬ ‫شکل‬‫ه‬
‫نک‬ ‫ایجاد‬ ‫معنی‬ ‫در‬ ‫تغییری‬ ‫که‬ ‫نوعی‬ ‫به‬ ‫شود‬ ‫می‬ ‫انجام‬ ‫داده‬ ‫روی‬ ‫که‬ ‫است‬ ‫نحوی‬ ‫اصالحات‬ ‫همان‬ ‫داده‬ ‫فرمتی‬ ‫تبدیالت‬‫ام‬ ‫نند‬
‫باشند‬ ‫سازی‬ ‫مدل‬ ‫ابزارهای‬ ‫نیاز‬ ‫مورد‬ ‫است‬ ‫ممکن‬.
•‫داده‬‫های‬‫تغییر‬‫فرمت‬‫یافته‬:‫برخی‬‫از‬‫ابزارها‬‫نیاز‬‫به‬‫ترتیب‬‫ویژگی‬‫ها‬،‫دارند‬‫به‬‫عنوان‬‫مثال‬‫ویژگی‬‫اول‬‫را‬‫به‬‫عنوان‬‫شناسه‬‫منحصر‬‫ب‬‫ه‬‫فرد‬‫می‬‫گیرند‬
‫و‬‫ویژگی‬‫آخر‬‫ویژگی‬‫است‬‫که‬‫باید‬‫پیش‬‫بینی‬‫شود‬.‫یا‬‫حتی‬‫ممکن‬‫است‬‫ترتیب‬‫رکوردها‬‫اهمیت‬‫داشته‬‫باشد‬‫مثال‬‫در‬‫شبکه‬‫های‬‫عص‬‫بی‬‫باید‬‫رکورد‬
‫های‬‫ترتیب‬‫تصادفی‬‫داشته‬‫باشند‬‫اگرچه‬‫برخی‬‫از‬‫ابزار‬‫به‬‫صورت‬‫خودکار‬‫این‬‫مورد‬‫را‬‫مدیریت‬‫میکنند‬‫و‬‫نیازی‬‫به‬‫دخالت‬‫کاربر‬‫ندار‬‫ند‬.‫به‬‫عالوه‬
‫برخی‬‫از‬‫تغییرات‬‫کامال‬‫نحوی‬‫ممکن‬‫است‬‫مورد‬‫نیاز‬‫ابزارهای‬‫مدل‬‫سازی‬‫باشند‬‫برای‬‫مثال‬‫حذف‬‫کاما‬‫ازفیلدهای‬‫متنی‬‫در‬‫یک‬‫دیتاست‬‫جدا‬‫شده‬
‫توسط‬،‫کاما‬‫یا‬‫پیرایش‬‫مقادیری‬‫به‬‫تعداد‬‫حداکثر‬32‫کاراکتر‬.
‫وظوف‬ ‫تعری‬‫ا‬
‫ها‬ ‫خروج‬
30
‫مرجع‬ ‫مدل‬CRISP-DM–‫سازی‬ ‫مدل‬
‫وظایف‬
‫عمومی‬
‫ها‬ ‫خروجی‬
31
‫مرجع‬ ‫مدل‬CRISP-DM–‫سازی‬ ‫مدل‬
‫وظیفه‬‫عمومی‬:‫انتخاب‬‫روش‬‫های‬‫مدل‬‫سازی‬
‫اولین‬‫قدم‬‫در‬‫مدل‬‫سازی‬‫انتخاب‬‫تکنیک‬‫های‬‫مدل‬‫سازی‬‫است‬‫که‬‫باید‬‫استفاده‬‫شود‬.‫اگرچه‬‫ممکن‬‫است‬‫در‬‫فاز‬‫درک‬‫کسب‬‫و‬‫کار‬‫ابزارهایی‬‫را‬‫انتخاب‬
‫کرده‬،‫باشید‬‫در‬‫این‬‫وظیفه‬‫روش‬‫مدل‬‫سازی‬‫به‬‫صورت‬‫خاص‬‫انتخاب‬‫می‬‫شود‬‫برای‬‫مثال‬‫درخت‬‫تصمیم‬5.0‫یا‬‫شبکه‬‫عصبی‬‫پس‬‫انتشاربنابراین‬‫اگر‬
‫چند‬‫تکنیک‬‫به‬‫کار‬‫خواهید‬‫برد‬‫این‬‫وظیفه‬‫را‬‫برای‬‫هر‬‫تکنیک‬‫انجام‬‫دهید‬.
•‫تکنیک‬‫مدل‬‫سازی‬:‫مستند‬‫سازی‬‫تکنیک‬‫های‬‫مدل‬‫سازی‬‫که‬‫قرار‬‫است‬‫استفاده‬‫شود‬.
•‫مفروضات‬‫مدل‬‫سازی‬:‫بسیاری‬‫از‬‫روش‬‫های‬‫مدل‬‫سازی‬‫مفروضات‬‫مشخصی‬‫در‬‫مورد‬‫داده‬‫دارند‬‫برای‬
‫مثال‬‫همه‬‫ویژگی‬‫ها‬‫باید‬‫توزیع‬‫یکسانی‬‫داشته‬،‫باشند‬‫مقادیر‬‫مفقوده‬‫مجاز‬،‫نیست‬‫برچسب‬‫ک‬‫الس‬‫باید‬
‫نمادین‬‫باشد‬.‫همه‬‫مفروضات‬‫را‬‫ثبت‬‫کنید‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
32
‫مرجع‬ ‫مدل‬CRISP-DM–‫سازی‬ ‫مدل‬
‫وظیفه‬‫عمومی‬:‫ساخت‬‫طرح‬‫آزمون‬
‫پیش‬‫از‬‫ساخت‬‫مدل‬‫نیاز‬‫داریم‬‫که‬‫مکانیزم‬‫و‬‫رویه‬‫ای‬‫برای‬‫آزمون‬‫کیفیت‬‫و‬‫اعتبار‬‫مدل‬‫طراحی‬‫کنیم‬.‫برای‬‫مثال‬‫در‬‫داده‬‫کاوی‬‫با‬‫ناظر‬‫مثل‬‫دسته‬
‫بندی‬‫معموال‬‫از‬‫نرخ‬‫خطا‬‫برای‬‫ارزیابی‬‫کیفیت‬‫مدل‬‫های‬‫داده‬‫کاوی‬‫استفاده‬‫می‬‫شود‬‫بنابراین‬‫مجموعه‬‫داده‬‫را‬‫به‬‫دو‬‫بخش‬‫آزمون‬‫و‬‫آموزش‬‫تق‬‫سیم‬‫می‬
‫کنیم‬‫و‬‫مدل‬‫را‬‫روی‬‫داده‬‫آموزش‬‫می‬‫سازیم‬‫سپس‬‫کیفیت‬‫را‬‫با‬‫استفاده‬‫از‬‫داده‬‫آزمون‬‫تخمین‬‫می‬‫زنیم‬.
•‫طرح‬‫آزمون‬:‫تشریح‬‫طرح‬‫مورد‬‫نظر‬‫برای‬،‫آموزش‬‫آزمون‬‫و‬‫ارزیابی‬‫مدل‬.‫یکی‬‫از‬‫بخش‬‫های‬‫اصلی‬‫طرح‬
‫تعیین‬‫نحوه‬‫تقسیم‬‫مجموعه‬‫داده‬‫به‬train,test,validate‫است‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
33
‫مرجع‬ ‫مدل‬CRISP-DM–‫سازی‬ ‫مدل‬
‫وظیفه‬‫عمومی‬:‫ساخت‬‫مدل‬
‫پیاده‬‫سازی‬‫الگوریتم‬‫های‬‫ابزار‬‫مدل‬‫سازی‬‫روی‬‫مجموعه‬‫داده‬‫آماده‬‫سازی‬‫شده‬‫برای‬‫خلق‬‫یک‬‫یا‬‫چند‬
‫مدل‬.
•‫تظیم‬‫پارامترها‬:‫در‬‫هرابزار‬‫مدل‬‫سازی‬‫ادلب‬‫تعداد‬‫زیادی‬‫از‬‫پارامترها‬‫می‬‫توانند‬‫تنظیم‬‫شوند‬.‫این‬‫پارامترها‬‫و‬‫مقاد‬‫یر‬
‫انتخابی‬‫آن‬‫ها‬‫و‬‫همین‬‫طور‬‫منطق‬‫تنظیم‬‫پارامترها‬‫را‬‫لیست‬‫کنید‬.
•‫مدل‬‫ها‬:‫در‬‫این‬‫بخش‬‫مدل‬‫های‬‫ساخته‬‫شده‬‫ارایه‬‫می‬‫شوند‬‫و‬‫نه‬‫گزارشی‬‫از‬‫مدل‬‫ها‬.
•‫توصیف‬‫مدل‬‫ها‬:‫تشریح‬‫مدل‬‫های‬‫منتج‬‫شده‬‫و‬‫تفسیر‬‫مدل‬‫ها‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
34
‫مرجع‬ ‫مدل‬CRISP-DM–‫سازی‬ ‫مدل‬
‫عمومی‬ ‫وظیفه‬:‫مدل‬ ‫ممیزی‬(ASSESSS MODEL)
‫کند‬ ‫می‬ ‫تفسیر‬ ‫مطلوب‬ ‫آزمون‬ ‫طرح‬ ‫و‬ ‫کاوی‬ ‫داده‬ ‫موفقیت‬ ‫معیارهای‬ ‫و‬ ‫نظر‬ ‫مورد‬ ‫دامنه‬ ‫زمینه‬ ‫در‬ ‫خود‬ ‫دانش‬ ‫با‬ ‫مطابق‬ ‫را‬ ‫ها‬ ‫مدل‬ ‫کاوی‬ ‫داده‬ ‫مهندس‬‫د‬‫و‬
‫د‬ ‫کداوی‬ ‫داده‬ ‫نتدایج‬ ‫بررسدی‬ ‫منظدور‬ ‫به‬ ‫حوزه‬ ‫خبرگان‬ ‫و‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫گران‬ ‫تحلیل‬ ‫با‬ ‫همچنین‬ ‫کند‬ ‫می‬ ‫قضاوت‬ ‫مدل‬ ‫های‬ ‫کاربرد‬ ‫موفقیت‬ ‫روی‬‫زمینده‬ ‫ر‬
‫کنددد‬ ‫مددی‬ ‫برقددرار‬ ‫ارتبدداط‬ ‫کددار‬ ‫و‬ ‫کسددب‬.‫فدداز‬ ‫در‬ ‫کدده‬ ‫صددورتی‬ ‫در‬ ‫گیددرد‬ ‫مددی‬ ‫نظددر‬ ‫در‬ ‫را‬ ‫مدددل‬ ‫فقددط‬ ‫وظددایف‬ ‫ایددن‬ ‫کدده‬ ‫شددود‬ ‫توجدده‬ ‫اسددت‬ ‫الزم‬
‫ارزیابی‬(ECALUATION PHASE)‫گیرد‬ ‫می‬ ‫قرار‬ ‫توجه‬ ‫مورد‬ ‫آمده‬ ‫بدست‬ ‫پروژه‬ ‫در‬ ‫که‬ ‫نتایجی‬ ‫همه‬.
‫کند‬ ‫می‬ ‫بندی‬ ‫رتبه‬ ‫را‬ ‫ها‬ ‫مدل‬ ‫کاوی‬ ‫داده‬ ‫مهندس‬.‫کند‬ ‫می‬ ‫ممیزی‬ ‫ارزیابی‬ ‫معیارهای‬ ‫با‬ ‫مطابق‬ ‫را‬ ‫ها‬ ‫مدل‬ ‫او‬.‫کسدب‬ ‫اهدداف‬ ‫اسدت‬ ‫ممکدن‬ ‫که‬ ‫جایی‬ ‫تا‬
‫گیرد‬ ‫می‬ ‫نظر‬ ‫در‬ ‫را‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫موفقیت‬ ‫معیارهای‬ ‫و‬ ‫وکار‬.‫یک‬ ‫از‬ ‫بیش‬ ‫را‬ ‫تکنیک‬ ‫یک‬ ‫کاوی‬ ‫داده‬ ‫مهندس‬ ،‫کاوی‬ ‫داده‬ ‫های‬ ‫پروژه‬ ‫از‬ ‫بعضی‬ ‫در‬‫اجدرا‬ ‫بار‬
‫کند‬ ‫می‬ ‫ایحاد‬ ‫مختلف‬ ‫های‬ ‫تکنیک‬ ‫با‬ ‫را‬ ‫مختلف‬ ‫نتایج‬ ‫یا‬ ‫میکند‬.‫کند‬ ‫می‬ ‫مقایسه‬ ‫ارزیابی‬ ‫معیارهای‬ ‫با‬ ‫مطابق‬ ‫را‬ ‫نتایج‬ ‫همچنین‬ ‫او‬.
‫وظوف‬ ‫تعری‬‫ا‬
35
‫مرجع‬ ‫مدل‬CRISP-DM–‫سازی‬ ‫مدل‬
‫عمومی‬ ‫وظیفه‬:‫مدل‬ ‫ممیزی‬(ASSESSS MODEL)
•‫ممیزی‬‫مدل‬:‫خالصه‬‫سازی‬‫نتایج‬‫این‬‫وظیفه‬‫و‬‫لیست‬‫کردن‬‫کیفیت‬‫مدل‬‫های‬‫ساخته‬‫شده‬(‫مثال‬‫دقت‬=accuracy)‫و‬
‫کیفیت‬‫ها‬‫را‬‫نسبت‬‫به‬‫هم‬‫رتبه‬‫بندی‬‫کنید‬.
•‫بازنگری‬‫تنظیمات‬‫پارامتر‬:‫برحسب‬‫ممیزی‬،‫مدل‬‫تنظیمات‬‫پارامتر‬‫ها‬‫را‬‫بازنگری‬‫کنید‬‫و‬‫آن‬‫ها‬‫را‬‫برای‬‫اجرای‬‫ب‬‫عدی‬‫در‬
‫وطیفه‬‫ساخت‬‫مدل‬‫تنظیم‬‫کنید‬.‫ساخت‬‫مدل‬‫و‬‫ممیزی‬‫مدل‬‫را‬‫تا‬‫جایی‬‫تکرار‬‫کنید‬‫که‬‫به‬‫بهترین‬‫مدل‬‫برسی‬‫د‬.‫همه‬
‫ممیزی‬‫و‬‫بازنگری‬‫ها‬‫را‬‫مستند‬‫کنید‬.
‫ها‬ ‫خروج‬
36
‫مرجع‬ ‫مدل‬CRISP-DM–‫ارزیابی‬
‫وظایف‬
‫عمومی‬
‫ها‬ ‫خروجی‬
37
‫مرجع‬ ‫مدل‬CRISP-DM–‫ارزیابی‬
‫وظیفه‬‫عمومی‬:‫ارزیابی‬‫نتایج‬(EVALUATE RESULTS)
‫در‬‫مرحله‬‫قبل‬‫با‬‫عواملی‬‫همچون‬accuracy‫و‬generality‫مدل‬‫سروکار‬‫داشتیم‬.‫در‬‫این‬‫قدم‬‫میزان‬‫برآورده‬‫کردن‬‫اهداف‬
‫کسب‬‫و‬‫کار‬‫توسط‬‫مدل‬‫را‬‫ارزیابی‬‫می‬‫کنیم‬‫و‬‫در‬‫صورت‬‫ناکارآمدی‬‫مدل‬‫جستجوی‬‫دالیل‬‫کسب‬‫و‬‫کار‬‫که‬‫منجر‬‫به‬
‫ناکارآمدی‬‫مدل‬‫شده‬.‫مورد‬‫بعد‬‫آزمایش‬‫مدل‬‫روی‬‫اپلیکیشن‬‫آزمایشی‬‫است‬‫در‬‫صورت‬‫عدم‬‫محدودیت‬‫زمان‬‫و‬‫بودجه‬.
‫عالوه‬‫براین‬‫ارزیابی‬‫دیگر‬‫نتایج‬‫بدست‬‫آمده‬‫توسط‬‫داده‬‫کاوی‬‫را‬‫بررسی‬‫می‬‫کند‬‫شامل‬‫سایر‬‫یافته‬‫هایی‬‫که‬‫ارت‬‫باط‬‫ضروری‬‫با‬
‫اهداف‬‫کسب‬‫و‬‫کار‬‫اصلی‬‫ندارند‬‫اما‬‫ممکن‬‫است‬‫اطالعات‬‫و‬‫اشارات‬‫را‬‫برای‬‫آینده‬‫آشکار‬‫سازد‬.
‫تعری‬‫وظوف‬‫ا‬
38
‫مرجع‬ ‫مدل‬CRISP-DM–‫ارزیابی‬
‫عمومی‬ ‫وظیفه‬:‫نتایج‬ ‫ارزیابی‬(EVALUATE RESULTS)
•‫ارزیابی‬‫نتایج‬‫داده‬‫کاوی‬‫با‬‫توجه‬‫به‬‫معیارموفقیت‬‫کسب‬‫و‬‫کار‬:‫خالصه‬‫سازی‬‫نتایج‬‫ارزیابی‬‫ب‬‫ه‬‫لحاظ‬
‫معیارهای‬‫موفقیت‬‫کسب‬‫و‬،‫کار‬‫شامل‬‫اظهار‬‫نظر‬‫نهایی‬‫در‬‫مورد‬‫برآورده‬‫کردن‬‫اهداف‬‫کسب‬‫و‬‫کار‬‫اول‬‫یه‬.
•‫مدل‬‫های‬‫تایید‬‫شده‬:‫پس‬‫از‬‫بررسی‬‫مدل‬‫ها‬‫با‬‫توجه‬‫به‬‫معیارهای‬‫موفقیت‬‫کسب‬‫و‬،‫کار‬‫مدل‬‫های‬‫ت‬‫ولید‬
‫شده‬‫که‬‫معیارهای‬‫موفقیت‬‫را‬‫برآورده‬‫می‬‫کند‬‫مدل‬‫های‬‫تایید‬‫شده‬‫می‬‫شوند‬.
‫ها‬ ‫خروج‬
39
‫مرجع‬ ‫مدل‬CRISP-DM–‫ارزیابی‬
‫بازنگری‬ ‫فرآیند‬
‫کنند‬ ‫می‬ ‫برآورده‬ ‫را‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫نیازهای‬ ‫ظاهر‬ ‫در‬ ‫شده‬ ‫ساخته‬ ‫های‬ ‫مدل‬ ‫نقطه‬ ‫این‬ ‫در‬.‫دا‬ ‫مسیر‬ ‫روی‬ ‫تری‬ ‫جامع‬ ‫ارزیابی‬ ‫که‬ ‫است‬ ‫مناسب‬ ‫اکنون‬‫ده‬
‫اند‬ ‫شده‬ ‫پوشی‬ ‫چشم‬ ‫که‬ ‫وظایفی‬ ‫یا‬ ‫عوامل‬ ‫تعیین‬ ‫منظور‬ ‫به‬ ‫شود‬ ‫انجام‬ ‫کاوی‬.‫دهد‬ ‫می‬ ‫پوشش‬ ‫را‬ ‫کیفیت‬ ‫تضمین‬ ‫بازنگری‬ ‫این‬ ‫همچنین‬‫آیا‬ ‫مثال‬ ‫برای‬
‫دسترس‬ ‫در‬ ‫آینده‬ ‫های‬ ‫تحلیل‬ ‫در‬ ‫و‬ ‫هستیم‬ ‫ها‬ ‫آن‬ ‫از‬ ‫استفاده‬ ‫به‬ ‫مجاز‬ ‫که‬ ‫ایم‬ ‫کرده‬ ‫استفاده‬ ‫هایی‬ ‫ویژگی‬ ‫از‬ ‫آیا‬ ‫ایم؟‬ ‫ساخته‬ ‫درستی‬ ‫به‬ ‫را‬ ‫مدل‬‫هس‬‫تند؟‬
•‫فرآیند‬ ‫بازنگری‬:‫که‬ ‫هایی‬ ‫فعالیت‬ ‫کردن‬ ‫مشخص‬ ‫و‬ ‫فرآیند‬ ‫بازنگری‬ ‫سازی‬ ‫خالصه‬‫فراموش‬
‫شوند‬ ‫تکرار‬ ‫باید‬ ‫که‬ ‫هایی‬ ‫آن‬ ‫و‬ ‫اند‬ ‫شده‬.
‫وظوف‬ ‫تعری‬‫ا‬
‫ها‬ ‫خروج‬
40
‫مرجع‬ ‫مدل‬CRISP-DM–‫ارزیابی‬
‫تعیین‬‫قدم‬‫های‬‫بعدی‬
‫باتوجه‬‫به‬‫نتایج‬‫ممیزی‬‫و‬‫فرآیند‬،‫بازنگری‬‫تیم‬‫پروژه‬‫تصمیم‬‫می‬‫گیرد‬‫چگونه‬‫ادامه‬‫دهد‬.‫همچنین‬‫تیم‬‫تصمیم‬‫می‬‫گیرد‬‫آیا‬‫این‬‫پرو‬‫ژه‬‫را‬‫تمام‬‫کند‬‫و‬‫به‬
‫سمت‬‫پیاده‬‫سازی‬‫حرکت‬،‫کند‬‫آیا‬‫تکرارهای‬‫بیشتری‬‫را‬‫انجام‬،‫دهد‬‫آیا‬‫پروژه‬‫جدید‬‫داده‬‫کاوی‬‫را‬‫شروع‬‫کنند‬.‫این‬‫وظیفه‬‫شامل‬‫تحلیل‬‫ب‬‫اقی‬‫مانده‬
‫منابع‬‫و‬‫بودجه‬‫هست‬‫که‬‫ممکن‬‫است‬‫روی‬‫تصمیمات‬‫تاثیر‬‫بگذارد‬.
•‫لیستی‬‫از‬‫اقدامات‬‫محتمل‬
•‫لیستی‬‫از‬‫اقدامات‬‫محتمل‬‫برای‬‫آینده‬‫و‬‫دالیل‬‫آنها‬
•‫تصمیم‬
•‫تشریح‬‫تصمیم‬‫اینکه‬‫چگونه‬‫ادامه‬‫بدهیم‬‫همراه‬‫با‬‫منطق‬‫این‬‫تصمیم‬
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
41
‫مرجع‬ ‫مدل‬CRISP-DM-‫سازی‬ ‫پیاده‬
‫وظایف‬
‫عمومی‬
‫ها‬ ‫خروجی‬
42
‫مرجع‬ ‫مدل‬CRISP-DM-‫سازی‬ ‫پیاده‬
‫طرح‬‫ریزی‬‫پیاده‬‫سازی‬
‫این‬‫وظیفه‬‫نتایج‬‫ارزیابی‬‫را‬‫دریافت‬‫می‬‫کند‬‫و‬‫برای‬‫پیاده‬‫سازی‬‫استراتژی‬‫تعیین‬‫می‬‫کند‬.‫اگر‬‫یک‬‫روند‬‫عام‬‫ت‬‫ری‬‫برای‬‫خلق‬
‫مدل‬‫های‬‫مرتبط‬‫شناسایی‬‫شود‬‫این‬‫روند‬‫برای‬‫پیاده‬‫سازی‬‫های‬‫بعدی‬‫مستند‬‫می‬‫شود‬.
•‫طرح‬‫پیاده‬‫سازی‬:‫خالصه‬‫سازی‬‫استراتژی‬‫پیاده‬،‫سازی‬‫شامل‬‫قدم‬‫های‬‫الزم‬‫و‬‫نحوه‬‫اجرای‬‫آن‬‫ها‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
43
‫مرجع‬ ‫مدل‬CRISP-DM-‫سازی‬ ‫پیاده‬
‫طرح‬‫ریزی‬‫پایش‬‫و‬‫نگهداری‬
‫اگر‬‫نتایج‬‫داده‬‫کاوی‬‫بخشی‬‫از‬‫کسب‬‫و‬‫کار‬‫روزانه‬‫باشد‬‫پایش‬‫و‬‫نگهداری‬‫مساله‬‫مهمی‬‫است‬.‫تهیه‬‫دقیق‬‫استراتژی‬‫نگهداری‬‫کمک‬‫به‬‫اجت‬‫ناب‬‫از‬‫دوره‬
‫های‬‫طوالنی‬‫دیرضروری‬‫استفاده‬‫دیر‬‫صحیح‬‫از‬‫نتایج‬‫داده‬‫کاوی‬‫می‬‫کند‬.‫به‬‫منظور‬‫پیاده‬‫سازی‬‫نتایج‬‫داده‬‫کاوی‬‫پروژه‬‫نیاز‬‫به‬‫یک‬‫فرآ‬‫یند‬‫پایش‬‫دقیق‬
‫دارد‬.
•‫طرح‬‫پایش‬‫و‬‫نگهداری‬:‫خالصه‬‫ای‬‫از‬‫استراتژی‬‫پایش‬‫و‬‫نگهداری‬‫شامل‬‫قدم‬‫های‬‫الزم‬‫و‬‫نحوه‬‫اجرای‬‫آ‬‫ن‬
‫ها‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
44
‫مرجع‬ ‫مدل‬CRISP-DM-‫سازی‬ ‫پیاده‬
‫تولید‬‫گزارش‬‫نهایی‬
‫در‬‫پایان‬،‫پروژه‬‫تیم‬‫پروژه‬‫یک‬‫گزارش‬‫نهایی‬‫را‬‫تدوین‬‫می‬‫کند‬.‫وابسته‬‫به‬‫طرح‬‫پیاده‬‫سازی‬‫این‬‫گزارش‬‫می‬‫توان‬‫د‬‫صرفا‬
‫خالصه‬‫ای‬‫از‬‫پروژه‬‫و‬‫تجربیاتش‬‫باشد‬(‫اگرپیش‬‫از‬‫این‬‫به‬‫عنوان‬‫یک‬‫فعالیت‬‫مستمر‬‫مستند‬‫نشده‬‫باشد‬)‫یا‬‫یک‬‫ارایه‬‫جامع‬‫و‬
‫نهایی‬‫از‬‫نتایج‬‫داده‬‫کاوی‬‫باشد‬.
•‫گزارش‬‫نهایی‬:‫گزارش‬‫نهایی‬‫مکتوب‬‫از‬‫فرآیند‬‫داده‬‫کاوی‬‫که‬‫شامل‬‫تحویل‬‫دادنی‬‫ها‬‫و‬‫نتایج‬‫س‬‫ازماندهی‬
‫شده‬‫و‬‫خالصه‬‫شده‬‫است‬.
•‫ارایه‬‫نهایی‬:‫جلسه‬‫ای‬‫که‬‫در‬‫آن‬‫به‬‫ارایه‬‫نتایج‬‫به‬‫مشتری‬‫پرداخته‬‫می‬‫شود‬.
‫تعری‬‫وظوف‬‫ا‬
‫خروج‬‫ها‬
45
‫مرجع‬ ‫مدل‬CRISP-DM-‫سازی‬ ‫پیاده‬
‫پروژه‬ ‫بازنگری‬
‫نی‬ ‫چیزهایی‬ ‫چه‬ ‫و‬ ‫دادیم‬ ‫انجام‬ ‫درستی‬ ‫به‬ ‫را‬ ‫چیزهایی‬ ‫چه‬ ‫و‬ ‫اشتباه‬ ‫به‬ ‫را‬ ‫چیزهایی‬ ‫چه‬ ‫اینکه‬ ‫بررسی‬‫به‬ ‫از‬
‫دارند‬ ‫بهبود‬.
•‫مستندسازی‬‫تجربیات‬:‫مستندسازی‬‫نتایج‬‫مهم‬‫بدست‬‫آمده‬‫در‬‫طول‬‫پروژه‬‫برای‬‫مثال‬‫رویکرده‬‫ای‬‫دلط‬
‫یا‬‫اشاراتی‬‫برای‬‫انتخاب‬‫مناسب‬‫ترین‬‫تکنیک‬‫داده‬‫کاوی‬‫در‬‫وضعیت‬‫های‬‫مشابه‬.‫در‬‫یک‬‫پروژه‬‫ایده‬‫آل‬
‫مستندسازی‬‫تجربیات‬‫گزارش‬‫هایی‬‫که‬‫توسط‬‫اعضای‬‫پروژه‬‫در‬‫هر‬‫فاز‬‫مکتوب‬‫شده‬‫را‬‫نیز‬‫پوش‬‫ش‬‫می‬
‫دهد‬.
‫وظوف‬ ‫تعری‬‫ا‬
‫ها‬ ‫خروج‬
46
1 de 47

Más contenido relacionado

Similar a Crisp dm.1.0

RUPRUP
RUPLida Zareian
664 vistas21 diapositivas
Scrum PresentationScrum Presentation
Scrum PresentationS.Mostafa Sayyedi
334 vistas16 diapositivas

Similar a Crisp dm.1.0(20)

Agile & BABOK | By Ali RaziAgile & BABOK | By Ali Razi
Agile & BABOK | By Ali Razi
Iran Agile Community538 vistas
RUPRUP
RUP
Lida Zareian664 vistas
Big Data and select suitable toolsBig Data and select suitable tools
Big Data and select suitable tools
Meghdad Hatami4.1K vistas
Scrum PresentationScrum Presentation
Scrum Presentation
S.Mostafa Sayyedi334 vistas
Scrum docScrum doc
Scrum doc
S.Mostafa Sayyedi223 vistas
پیش مقدمه آموزش نرم افزار متلبپیش مقدمه آموزش نرم افزار متلب
پیش مقدمه آموزش نرم افزار متلب
Technical University of Denamrk110 vistas
Csp   criteriaCsp   criteria
Csp criteria
alijoneidi26 vistas
مقدمه ای بر هوش تجاریمقدمه ای بر هوش تجاری
مقدمه ای بر هوش تجاری
Zahra Mansoori62 vistas
Ibm modelerIbm modeler
Ibm modeler
Esmaeil Hadavandi668 vistas
Sql tuningSql tuning
Sql tuning
mehrdadkarami36 vistas
داشبوردهای دیجیتالیداشبوردهای دیجیتالی
داشبوردهای دیجیتالی
hodais pirdadeh382 vistas
Persian Document   ITBSCPersian Document   ITBSC
Persian Document ITBSC
Hamideh Iraj661 vistas
طرح چارچوب  متن باز تولید نرم افزار طرح چارچوب  متن باز تولید نرم افزار
طرح چارچوب متن باز تولید نرم افزار
عباس بني اسدي مقدم383 vistas
اسلايد آموزشي هوش تجارياسلايد آموزشي هوش تجاري
اسلايد آموزشي هوش تجاري
Ali Masoombeigi7.9K vistas
Data cleansingData cleansing
Data cleansing
SiminZolfi90 vistas

Crisp dm.1.0