Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

Data Mining for Thai

5.957 visualizaciones

Publicado el

This slide presents how to use Data Mining in business. All the demonstrations using RapidMiner Studio 6.

Publicado en: Datos y análisis

Data Mining for Thai

  1. 1. Data Mining for Thai Eakasit Pacharawongsakda, Ph.D. Data Cube : http://facebook.com/datacube.th (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  2. 2. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • แนะนำข่าวสารข้อมูลทางด้าน Data Mining • จัดอบรมและสัมมนาการวิเคราะห์ข้อมูลทาง Data Mining • http://facebook.com/datacube.th 2
  3. 3. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • ชื่อ: เอกสิทธิ์ พัชรวงศ์ศักดา • การศึกษา: • ปริญญาเอก วิทยาการคอมพิวเตอร์ สถาบันเทคโนโลยีนานาชาติสิรินธร (SIIT) มหาวิทยาลัยธรรมศาสตร์ • ปริญญาโท วิศวกรรมคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์ • ปริญญาตรี วิศวกรรมคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์ 
 (เกียรตินิยมอันดับ 2) • ประสบการณ์ • Certified RapidMiner Analyst (คนแรกของเมืองไทย) • Data scientist at GloriSys Cloud Solutions Co., Ltd. • วิทยากรอบรมการใช้งานซอฟต์แวร์ open source ทางด้าน data mining 3
  4. 4. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube 4 RapidMiner Analyst This is to Certify that The candidate has proven the ability to: Prepare data With: Date: Eakasit Pacharawongsakda
  5. 5. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • ชื่อ: รัตนาวลี เครือสวัสดิ์ • การศึกษา: • กำลังศึกษา ปริญญาโท วิทยาการคอมพิวเตอร์ มหาวิทยาลัยธรรมศาสตร์ • ปริญญาตรี วิทยาการคอมพิวเตอร์ มหาวิทยาลัยธรรมศาสตร์ • ประสบการณ์ • ผู้ช่วยวิทยากรอบรมการใช้งานซอฟต์แวร์ RapidMiner Studio 6 ในการวิเคราะห์ ข้อมูลทางด้าน Data Mining 5
  6. 6. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • วิทยากรรับเชิญอบรมทางด้าน Data Mining ให้กับหน่วยงานต่างๆ Data Cube 6 มหาวิทยาลัย หน่วยงานและบริษัทเอกชน
  7. 7. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • หลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6 (ขั้นพื้นฐานและปานกลาง) รุ่นที่ 1 7
  8. 8. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • หลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6 (ขั้นพื้นฐานและปานกลาง) รุ่นที่ 2 8
  9. 9. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube • หลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 6 (ขั้นพื้นฐานและปานกลาง) รุ่นที่ 3 9
  10. 10. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Outline for seminar • Data Mining for Business with RapidMiner Studio 6 • 13:00 - 14:30 โดย ดร.เอกสิทธิ์ พัชรวงศ์ศักดา
 หสม. ดาต้า คิวบ์ ! • Social Media Intelligence • 15:00 - 16:30 โดย คุณชัชวาล สังคีตตระการ และ คุณก่อเกียรติ วรรณพัฒน์
 ห้องปฏิบัติการวิจัยเทคโนโลยีเสียง 
 ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ ! • #dataminingforthai 10
  11. 11. Data Mining for Business with RapidMiner Studio 6 Eakasit Pacharawongsakda, Ph.D. Rattanawalee Khruasawat Data Cube : http://facebook.com/datacube.th (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  12. 12. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Outline • Part 1: Introduction to data mining • เทคนิคการวิเคราะห์ข้อมูลด้วย data mining คืออะไร • ตัวอย่างการนำ data mining ไปใช้งาน • Part 2: Introduction to RapidMiner Studio 6 • แนะนำส่วนประกอบต่างๆ ของ RapidMiner Studio 6 • Part 3: Data mining for business • การแบ่งกลุ่มลูกค้าด้วยเทคนิค Segmentation • การหาสินค้าที่ลูกค้ามักจะซื้อร่วมกันบ่อยๆ • การคาดการณ์การตอบรับโปรโมชันของลูกค้าแต่ละราย 12
  13. 13. Introduction to Data Mining Part 1 (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  14. 14. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Where does data come from? • ข้อมูลแบ่งตามที่มา • ภายในบริษัท/องค์กร • ข้อมูลการซื้อขาย • ข้อมูลประวัติลูกค้า • ข้อมูลประวัติพนักงาน • ภายนอกบริษัท/องค์กร • ข้อมูลจาก social media ต่างๆ • ข้อมูลข่าวต่างๆ • ข้อมูลรูปภาพและเสียง 14 source: http://dailyprivacy.files.wordpress.com/2013/02/2012_big_data_study_infographic_600.jpg
  15. 15. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Database & warehouse & mining 15 Database Sales Accounting CRM Extract
 Transform
 Load
 (ETL) Data Mining Data Warehouse Knowledge/Patterns
  16. 16. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Database & warehouse & mining • Database • ฐานข้อมูลใช้ในการจัดเก็บข้อมูล ลดความซ้ำซ้อนของข้อมูล เน้นการจัดเก็บ เพ่ิม แก้ไข และลบข้อมูล • Data warehouse • คลังข้อมูลรวบรวมช้อมูลจากหลายๆ ฐานข้อมูล แปลงข้อมูลให้มีความเหมือนกัน เหมาะสำหรับการเรียกดู (view) เพื่อสร้างรายงานสรุป • Data Mining • การวิเคราะห์ข้อมูลเพื่อค้นหาความสัมพันธ์หรือรูปแบบที่มีประโยชน์ในฐานข้อมูล 16
  17. 17. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th What is data mining • “The exploration and analysis of large quantities 
 of data in order to discover meaningful patterns and rules” – Data Mining Techniques (3rd Edition) • เป็นการวิเคราะห์ข้อมูล เพื่อหารูปแบบ (patterns) หรือความสัมพันธ์ (relation) ระหว่างข้อมูลในฐานข้อมูลขนาดใหญ่ • “Extraction of interesting (non-trivial, previously, unknown and potential useful) information from data in large databases” – Data Mining Concepts & Techniques (3rd Edition) • เป็นกระบวนการดึงข่าวสารที่น่าสนใจ และมีประโยชน์แต่ไม่เคยรู้มา ก่อนจากฐานข้อมูลขนาดใหญ่ 17
  18. 18. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • บัตรสมาชิก (loyalty card) • ติดตามพฤติกรรมการซื้อสินค้า ของลูกค้าจากบัตร loyalty • นำมาวิเคราะห์และนำเสนอเป็น โปรโมชันพิเศษให้แต่ละบุคคล • เพิ่มโอกาสในการขายสินค้าให้กับ ลูกค้า • กระตุ้นให้ลูกค้าได้ซื้อสินค้ามาก ขึ้น เช่น ซื้อสินค้าวันนี้ จะได้ ส่วนลดพิเศษ ทำให้ลูกค้าเกิดการ ตัดสินใจซื้อทันที 18 image source: http://www.positioningmag.com
  19. 19. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • ทราบพฤติกรรมการซื้อสินค้าของลูกค้า เพื่อนำมาวิเคราะห์ และนำ เสนอเป็นโปรโมชันพิเศษให้แต่ละบุคคล 19
  20. 20. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • เบียร์และผ้าอ้อม • ห้าง Walmart พบว่าทุกวันศุกร์ หลังบ่ายโมง จะมีลูกค้าเพศชาย อายุระหว่าง 25 – 35 ปี ซื้อสินค้า Beers และ Diapers มากที่สุด 20
  21. 21. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • แนะนำสินค้าที่เกี่ยวข้อง • amazon.com แนะนำหนังสือที่เกี่ยวข้องกับ RapidMiner ! ! ! ! • Netflix แนะนำภาพยนต์ที่คล้ายกับที่เคยดู เช่น Life of Pi 21
  22. 22. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data mining application • Facebook แนะนำหน้า Facebook Page ที่คล้ายๆ กัน เมื่อเรากด like 22
  23. 23. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • Commercial software • SAS Enterprise Miner ! ! ! • IBM SPSS Modeller Data mining software 23 • Open source software • RapidMiner Studio ! ! • Weka ! • R
  24. 24. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Why Data Mining ? 24 source: http://oursocialtimes.com/wp-content/uploads/2012/02/Content-Marketing1.jpg
  25. 25. Introduction to RapidMiner Studio 6 Part 2 (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  26. 26. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Why RapidMiner? • ผลการสำรวจจากเว็บไซต์ KDnuggets ในปี 2014 พบว่าผู้ร่วมตอบ แบบสำรวจใช้ RapidMiner ในการวิเคราะห์ข้อมูลมากเป็นอันดับ 1 • Gartner ได้จัดให้ RapidMiner อยู่
 ในกลุ่ม Leaders สำหรับซอฟต์แวร์
 ในการวิเคราะห์ข้อมูล • SAS • IBM • RapidMiner • Knime 26 source: http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html
 http://rapidminer.com/leader-gartners-magic-quadrant-advanced-analytics/
  27. 27. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • download ได้จาก http://rapidminer.com/download-rapidminer/ ! 27
  28. 28. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • เลือกดาวน์โหลด version ที่เหมาะสมกับระบบปฏิบัติการของเรา 28
  29. 29. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • พบกับหน้าต่าง Home Screen 29 1 สร้าง process ใหม่ 2 3 เปิด process ที่มีอยู่ เปิด process ตัวอย่าง
  30. 30. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • องค์ประกอบของ RapidMiner Studio 6 30 Operators Repositories Process Parameter help 1 2 3 4 5
  31. 31. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • ตัวอย่างข้อมูลที่โหลดเข้าไปใน RapidMiner Studio 6 31 คลิกที่ header ของแต่ละ คอลัมน์เพื่อ sort
  32. 32. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • ข้อมูลที่โหลดเข้าไปแสดงในรูปแบบของค่าสถิติ 32 คลิกที่แถวเพื่อแสดง
 ข้อมูลทางสถิติ
  33. 33. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • ข้อมูลที่โหลดเข้าไปแสดงในรูปแบบของกราฟประเภท Histogram 33
  34. 34. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • ข้อมูลที่โหลดเข้าไปแสดงในรูปแบบของกราฟประเภท Scatter Plot 34
  35. 35. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th RapidMiner Studio 6 • โมเดล Decision Tree ที่สร้างได้ 35 โมเดล decision tree
  36. 36. RapidMiner Studio 6 DEMO (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  37. 37. Data Mining for Business Part 3 (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  38. 38. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation • แบ่งลูกค้าออกเป็นกลุ่มๆ ย่อย • ลูกค้าในแต่ละกลุ่มมีลักษณะที่คล้ายๆ กัน • เพื่อจะได้พิจารณาลักษณะของแต่ละกลุ่มได้ง่ายขึ้น • แบ่งตามลักษณะต่างๆ • แบ่งกลุ่มลูกค้าตามแหล่งที่อยู่ของลูกค้า (geography) • แบ่งกลุ่มลูกค้าตามวัยของลูกค้า (age) • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 38
  39. 39. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by geography • แบ่งกลุ่มลูกค้าตามแหล่งที่อยู่ของลูกค้า • ภาคเหนือ • ภาคกลาง • ภาคตะวันออกเฉียงเหนือ • ภาคตะวันออก • ภาคใต้ 39
  40. 40. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by age • แบ่งกลุ่มลูกค้าตามวัยต่างๆ เป็น 5 รุ่น (generation) 40 Silent Generation • อายุ 65 ปีขึ้นไป • ใช้ชีวิตเรียบง่าย • เคร่งครัดในแบบแผน 1 Baby Boomer • อายุ 46-64 ปี • มีความขยันอดทนมาก • ประหยัด รอบคอบ 2 Generation X • อายุ 33-45 ปี • ชอบอะไรง่ายๆ • เป็นตัวของตัวเองสูง 3 Generation Y • อายุ 17-33 ปี • มีความคิดสร้างสรรค์ • ไม่ค่อยมีความอดทน 4 Generation Z • อายุ 1-16 ปี • ใช้เทคโนโลยีได้เก่ง • เรียนรู้ได้เร็ว 5 source: Digital Marketing: Concept & Case Study, InfoPress และ http://hilight.kapook.com/view/83492
  41. 41. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อล่าสุดที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 41 Customer ID Recency Frequency Monetary C10001 C10002 C10003 หมายเหตุ: คำนวณ ณ วันที่ 24/06/2014 OrderID Customer ID Order Date Total Amount O14001 C10003 01-01-2014 10.00 O14002 C10001 01-13-2014 20.00 O14003 C10002 01-14-2014 200.00 O14004 C10001 01-15-2014 10.00 O14005 C10001 02-10-2014 30.00 O14006 C10002 02-14-2014 300.00 ตาราง order detail
  42. 42. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อล่าสุดที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 42 Customer ID Recency Frequency Monetary C10001 4.47 3 60 หมายเหตุ: คำนวณ ณ วันที่ 24/06/2014 OrderID Customer ID Order Date Total Amount O14001 C10003 01-01-2014 10.00 O14002 C10001 01-13-2014 20.00 O14003 C10002 01-14-2014 200.00 O14004 C10001 01-15-2014 10.00 O14005 C10001 02-10-2014 30.00 O14006 C10002 02-14-2014 300.00 ตาราง order detail
  43. 43. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อล่าสุดที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 43 Customer ID Recency Frequency Monetary C10001 4.47 3 60 C10002 4.33 2 500 C1003 หมายเหตุ: คำนวณ ณ วันที่ 24/06/2014 OrderID Customer ID Order Date Total Amount O14001 C10003 01-01-2014 10.00 O14002 C10001 01-13-2014 20.00 O14003 C10002 01-14-2014 200.00 O14004 C10001 01-15-2014 10.00 O14005 C10001 02-10-2014 30.00 O14006 C10002 02-14-2014 300.00 ตาราง order detail
  44. 44. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าตามพฤติกรรมการซื้อสินค้าของลูกค้า • ระยะเวลาการซื้อล่าสุดที่ผ่านมา (Recency) • ความถี่ของการซื้อสินค้า (Frequency) • การใช้จ่ายของลูกค้า (Monetary) 44 Customer ID Recency Frequency Monetary C10001 4.47 3 60 C10002 4.33 2 500 C10003 5.80 1 10 หมายเหตุ: คำนวณ ณ วันที่ 24/06/2014 OrderID Customer ID Order Date Total Amount O14001 C10003 01-01-2014 10.00 O14002 C10001 01-13-2014 20.00 O14003 C10002 01-14-2014 200.00 O14004 C10001 01-15-2014 10.00 O14005 C10001 02-10-2014 30.00 O14006 C10002 02-14-2014 300.00 ตาราง order detail
  45. 45. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM • แบ่งกลุ่มลูกค้าด้วยวิธี RFM • เรียงลำดับข้อมูล • Recency จากน้อยไปมาก • Frequency และ Monetary จากมากไปน้อย • แบ่งข้อมูลออกเป็น 5 กลุ่ม กลุ่มละจำนวนเท่าๆ กัน (quintile) • คำนวณคะแนน RFM ของแต่ละกลุ่ม 45 source: http://www.b-eye-network.com/view/10256 score = 5 score = 4 score = 3 score = 2 score = 1 น้อย มาก Recency score = 5 score = 4 score = 3 score = 2 score = 1 มาก น้อย Frequency score = 5 score = 4 score = 3 score = 2 score = 1 มาก น้อย Monetary 20% ของข้อมูล 20% ของข้อมูล 20% ของข้อมูล 20% ของข้อมูล 20% ของข้อมูล
  46. 46. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • แบ่งกลุ่มลูกค้าด้วยวิธี RFM • ลูกค้าในแต่ละกลุ่มจะมีลักษณะต่างๆ กัน เช่น • ลูกค้ากลุ่ม RFM = 555 • เป็นกลุ่มลูกค้าที่มีค่ามากสุด • ลูกค้ากลุ่ม RFM = 551 • เป็นกลุ่มลูกค้าที่มีการซื้อบ่อยๆ 
 แต่ซื้อจำนวนน้อย • ออก campaign กระตุ้นให้ลูกค้าซื้อสินค้าที่มีราคาสูงขึ้น (up-selling) • ลูกค้ากลุ่ม RFM = 115 • เป็นกลุ่มลูกค้าที่นานๆ จะซื้อสักครั้ง แต่ซื้อสินค้าที่มีราคาสูง • ออก campaign กระตุ้นให้ลูกค้าซื้อสินค้าบ่อยขึ้น Segmentation by RFM 46 Recency Frequency M onetary 1 2 3 4 5 5 4 3 2 1 5 4 3 2 1
  47. 47. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM in RM 6 • เลือกโอเปอเรเตอร์ต่างๆ มาวางไว้ในส่วนของ Process 47
  48. 48. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM in RM 6 • ผลการทำงานแสดงแอตทริบิวต์ rfm_score ที่เพิ่มขึ้นมา 48 RFM score
  49. 49. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Segmentation by RFM in RM 6 • RFM score ในรูปแบบกราฟ Histogram 49
  50. 50. Segmentation by RFM DEMO (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  51. 51. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Market Basket Analysis • เริ่มจากการสังเกตุการซื้อสินค้าของลูกค้าแต่ละราย • วิเคราะห์ข้อมูลเพื่อดูว่า สินค้าอะไรบ้างที่ลูกค้ามักจะซื้อร่วมกันบ่อยๆ • ใช้ในการออกโปรโมชันเพ่ือเพิ่มยอดขาย 51
  52. 52. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1K APPLE 45.00 1P CEREAL 120.00 1P DIAPERS 300.00 Total ****490.00 CASH 500.00 Change 10.00 01-13-2009 20:04Recpt#104071 THANK YOU • ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง Market Basket Analysis 52 TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers
  53. 53. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง Market Basket Analysis 53 Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1K APPLE 45.00 1P BEER 25.00 1P DIAPERS 300.00 Total **** 370.00 CASH 500.00 Change 130.00 01-13-2014 20:04Recpt#104071 THANK YOU TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****155.00 CASH 500.00 Change 345.00 01-14-2014 11:30Recpt#104071 THANK YOU
  54. 54. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง Market Basket Analysis 54 Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1K APPLE 45.00 1P BEER 25.00 1P DIAPERS 300.00 Total **** 370.00 CASH 500.00 Change 130.00 01-13-2014 20:04Recpt#104071 THANK YOU TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs 3 01-15-2014 14:30 Apple 3 01-15-2014 14:30 Beer 3 01-15-2014 14:30 Cereal 3 01-15-2014 14:30 Eggs Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****155.00 CASH 500.00 Change 345.00 01-14-2014 11:30Recpt#104071 THANK YOU Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P APPLE 45.00 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****200.00 CASH 500.00 Change 300.00 01-15-2014 14:30Recpt#104071 THANK YOU
  55. 55. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th • ข้อมูลที่ได้จากการซื้อสินค้าแต่ละครั้ง Market Basket Analysis 55 Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1K APPLE 45.00 1P BEER 25.00 1P DIAPERS 300.00 Total **** 370.00 CASH 500.00 Change 130.00 01-13-2014 20:04Recpt#104071 THANK YOU TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs 3 01-15-2014 14:30 Apple 3 01-15-2014 14:30 Beer 3 01-15-2014 14:30 Cereal 3 01-15-2014 14:30 Eggs 4 01-16-2014 14:15 Beer 4 01-16-2014 14:15 Eggs Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****155.00 CASH 500.00 Change 345.00 01-14-2014 11:30Recpt#104071 THANK YOU Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P APPLE 45.00 1P BEER 25.00 1P CEREAL 100.00 1P EGGS 30.00 Total ****200.00 CASH 500.00 Change 300.00 01-15-2014 14:30Recpt#104071 THANK YOU Data Cube Supermarket TAX ID # 3011693025 POS ID # 10C400101700934 RECEIPT/TAX INVOICE (ABB.) 1P BEER 25.00 1P EGGS 30.00 Total **** 55.00 CASH 100.00 Change 45.00 01-16-2014 14:15Recpt#104071 THANK YOU
  56. 56. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Market Basket Analysis • แปลงข้อมูลจาก POS database เป็น transaction database โดย group by ตามเวลาที่ซื้อสินค้า 56 TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Cereal 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs 3 01-15-2014 14:30 Apple 3 01-15-2014 14:30 Beer 3 01-15-2014 14:30 Cereal 3 01-15-2014 14:30 Eggs 4 01-16-2014 14:15 Beer 4 01-16-2014 14:15 Eggs Transaction ID Items 1 Apple, Cereal, Diapers 2 Beer, Cereal, Eggs 3 Apple, Beer, Cereal, Eggs 4 Beer, Eggs
  57. 57. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Market Basket Analysis • สินค้าที่มีการซื้อมากกว่าหรือเท่ากับ 50% เรียกว่า frequent itemset 57 Frequent itemset Support Size {Apple} 2/4 = 50% 1 {Beer} 3/4 = 75% 1 {Cereal} 3/4 = 75% 1 {Eggs} 3/4 = 75% 1 {Apple, Cereal} 2/4 = 50% 2 {Beer, Cereal} 2/4 = 50% 2 {Beer, Eggs} 3/4 = 75% 2 {Cereal, Eggs} 2/4 = 50% 2 {Beer, Cereal, Eggs} 2/4 = 50% 3 Transaction ID Items 1 Apple, Cereal, Diapers 2 Beer, Cereal, Eggs 3 Apple, Beer, Cereal, Eggs 4 Beer, Eggs transaction database
  58. 58. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Association rules • กฏความสัมพันธ์ (association rules) • สร้างจากสินค้าที่ลูกค้าซื้อบ่อยๆ • รูปแบบของกฏความสัมพันธ์ คือ • LHS คือ Left Hand Side สินค้าที่ซื้อพร้อมกันบ่อยๆ ด้านซ้ายของกฏ • RHS คือ Right Hand Side สินค้าที่ซื้อพร้อมกันบ่อยๆ ด้านขวาของกฏ 58 Frequent itemset Support Size {Apple, Cereal} 2/4 = 50% 2 {Beer, Cereal} 2/4 = 50% 2 {Beer, Eggs} 3/4 = 75% 2 {Cereal, Eggs} 2/4 = 50% 2 {Beer, Cereal, Eggs} 2/4 = 50% 3 LHS RHS Apple Cereal Beer Eggs Eggs Beer Cereal Apple Beer Cereal Cereal Eggs Cereal, Eggs Beer
  59. 59. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Applications • ใช้ในการเพิ่มยอดขายโดยการแนะนำสินค้าที่ลูกค้ามักจะซื้อพร้อม
 กันบ่อยๆ (cross-selling) • ใช้ในการจัดสินค้าในร้าน • วางสินค้าที่ลูกค้ามักจะซื้อพร้อมกันไว้ใกล้ๆ กัน • วางสินค้าที่ลูกค้ามักจะซื้อพร้อมกันไว้ไกลๆ กัน 59
  60. 60. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Market Basket using RM 6 • แปลงข้อมูลจาก POS database เป็นตาราง 60 TID Transaction time Product 1 01-13-2014 20:04 Apple 1 01-13-2014 20:04 Beer 1 01-13-2014 20:04 Diapers 2 01-14-2014 11:30 Beer 2 01-14-2014 11:30 Cereal 2 01-14-2014 11:30 Eggs 3 01-15-2014 14:30 Apple 3 01-15-2014 14:30 Beer 3 01-15-2014 14:30 Cereal 3 01-15-2014 14:30 Eggs 4 01-16-2014 14:15 Beer 4 01-16-2014 14:15 Eggs TID Apple Beer Cereal Diapers Eggs 1 TRUE TRUE FALSE TRUE FALSE 2 FALSE TRUE TRUE FALSE TRUE 3 TRUE TRUE TRUE FALSE TRUE 4 FALSE TRUE FALSE FALSE TRUE
  61. 61. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data preparation in RM 6 • เลือกโอเปอเรเตอร์ที่เกี่ยวข้องมาวางใน Process 61
  62. 62. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Data preparation in RM 6 • ผลการแปลงจาก POS database 62 ข้อมูลในรูปแบบ transaction database
  63. 63. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Association rules in RM 6 • เลือกโอเปอเรเตอร์ที่เกี่ยวข้องมาวางใน Process 63 โอเปอเรเตอร์ที่เพิ่มขึ้นมา
 สำหรับการหากฏความสัมพันธ์
  64. 64. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Association rules in RM 6 • แสดงสินค้าที่มีการซื้อร่วมกันบ่อยๆ 64 ส่วน filter ส่วนสินค้าที่พบว่าซื้อพร้อมกันบ่อยๆ คลิกที่ header ของแต่ละ คอลัมน์เพื่อ sort
  65. 65. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Association rules in RM 6 • แสดงกฏความสัมพันธ์ที่หาได้ 65 ส่วน filter ส่วนแสดงกฏความสัมพันธ์
  66. 66. Market Basket Analysis DEMO (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  67. 67. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Mass Marketing vs Direct Marketing • การตลาดแบบ mass marketing 67 marketing 
 campaign 20 40 60 80 100 120 140 160 8 16 จำนวนผู้ตอบรับ campaign (responders) จำนวนผู้ได้รับ campaign (prospects) 24 32 40 48 56 64
  68. 68. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Mass Marketing vs Direct Marketing • การตลาดแบบ direct marketing 68 marketing 
 campaign 20 40 60 80 100 120 140 160 8 16 จำนวนผู้ตอบรับ campaign (responders) จำนวนผู้ได้รับ campaign (prospects) 24 32 40 48 56 64 Mass Direct
  69. 69. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Mass Marketing vs Direct Marketing • การตลาดแบบ direct marketing 69 marketing 
 campaign 20 40 60 80 100 120 140 160 8 16 จำนวนผู้ตอบรับ campaign (responders) จำนวนผู้ได้รับ campaign (prospects) 24 32 40 48 56 64 Benefit
  70. 70. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th How to collect data ? • แอตทริบิวต์ (attribute) คุณลักษณะของลูกค้าแต่ละราย • ในทางสถิติจะเรียกว่าตัวแปรอิสระ (independent variable) • Demographic data คือ ข้อมูลเชิงประชากร เช่น เพศ อายุ รายได้ ที่อยู่อาศัย • Behavioural data คือ ข้อมูลพฤติกรรมการใช้งานของลูกค้า • ส่วนใหญ่มักจะช่วยในการ predict ได้มากกว่า demographic data (Ref: Data Mining cookbook, Wiley) • ลาเบล (label) คำตอบที่สนใจ เช่น การตอบรับ campaign หรือไม่ • ในทางสถิติจะเรียกว่าตัวแปรตาม (dependent variable) 70 Customer_id Age Gender Area Email Mobile Logins 4 weeks Sales 4 weeks Response ID140001 64 female urban free never 1 0 no ID140002 49 male urban premium never 0 0 yes ID140003 63 male urban free never 0 0 no ID140004 75 male urban premium yes 0 0 yes demographic data labelID behavioural data
  71. 71. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th How to collect data ? • ต้องหาข้อมูลที่มีผลการตอบรับ campaign เพื่อใช้ในการสร้าง predictive model • อาจจะใช้ข้อมูลจากการตอบรับ campaign ก่อนหน้าที่ใกล้เคียงกัน • ถ้าไม่มีอาจจะต้องสร้างข้อมูลใหม่โดยการสุ่มลูกค้าและส่ง campaign ไปให้ • ข้อมูลนี้เรียกว่า training data 71 ID A G Ar E M L S R 1 .. .. .. .. .. .. .. N 2 .. .. .. .. .. .. .. Y 3 .. .. .. .. .. .. .. N 4 .. .. .. .. .. .. .. Y ข้อมูลผลการตอบรับ campaign ก่อนหน้า ID A G Ar E M L R 1 .. .. .. .. .. .. .. 2 .. .. .. .. .. .. .. 3 .. .. .. .. .. .. .. 4 .. .. .. .. .. .. .. ช่วงเวลาในการส่ง campaign ID R 1 N 2 Y 3 N 4 Y ผลการตอบรับ campaign
  72. 72. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Decision Tree • เป็นเทคนิคที่นิยมใช้ในการทำ predictive modeling • ขั้นตอนการสร้าง decision tree จะเลือกแอตทริบิวต์ที่มีความสัมพันธ์ กับคลาสมาใช้งาน Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2 ! • IF Logins 4 weeks > 6.5 THEN Response = yes • IF Logins 4 weeks < 6.5 AND
 Email = premium THEN
 Response = yes • IF Logins 4 weeks < 6.5 AND
 Email = free AND
 Sales 4 weeks > 2 THEN
 Response = yes • IF Logins 4 weeks < 6.5 AND
 Email = free AND
 Sales 4 weeks < 2 THEN
 Response = no 72 business rule ที่ได้จากโมเดล decision tree
  73. 73. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Evaluate Decision Tree model • แบ่งข้อมูลที่ได้ออกเป็น 2 ส่วน • ส่วนที่ 1 training data ใช้ในการสร้างโมเดล แบ่งข้อมูลประมาณ 70% • ส่วนที่ 2 testing data ใช้ในการทดสอบโมเดล แบ่งข้อมูลประมาณ 30% • ใช้โมเดลที่ได้ทำนายผลการตอบรับ campaign • เปรียบเทียบกับข้อมูลผลการตอบรับ campaign ที่มีอยู่ 73 สร้าง Decision Tree model classification model ID R P 4 N N 5 Y Y 1 2 3 4 ID A G Ar E M L S Res 1 … … … … … … … N 2 … … … … … … … Y 3 … … … … … … … N ID A G Ar E M L S Res 4 … … … … … … … ? 5 … … … … … … … ? training data testing data
  74. 74. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Evaluate Decision Tree model • ตัววัดประสิทธิภาพของโมเดล • ค่าความถูกต้อง (Accuracy) คือจำนวนที่โมเดลทำนายได้ตรงกับผลเฉลย • จากตัวอย่างความถูกต้อง คือ 8/10 = 80% 74 ID Response Predicted 1 no no 2 yes yes 3 no yes 4 no no 5 yes yes 6 yes yes 7 yes no 8 no no 9 no no 10 yes yes ID Response Predicted 1 no no 2 yes yes 3 no yes 4 no no 5 yes yes 6 yes yes 7 yes no 8 no no 9 no no 10 yes yes
  75. 75. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 ? ID140012 premium never 3 0 ? Decision Tree model • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 75 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2
  76. 76. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 ? ID140012 premium never 3 0 ? Decision Tree model • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 76 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2
  77. 77. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Decision Tree model • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 77 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2 Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 no ID140012 premium never 3 0 ?
  78. 78. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Decision Tree model Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 no ID140012 premium never 3 0 ? • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 78 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2
  79. 79. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Decision Tree model Customer_id Email Mobile Logins 4 weeks Sales 4 weeks Res ID140011 free never 0 1 no ID140012 premium never 3 0 yes • ใช้โมเดลที่สร้างได้ทำนายผลการ response กับลูกค้าใหม่ 79 Logins 4 weeks > 6.5 < 6.5 Emailyes yes = free = premium โมเดล decision tree Sales 4 weeks yes no > 2 < 2
  80. 80. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • เลือก Application Wizard จากหน้า Home 80 เลือก Application Wizard
  81. 81. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ขั้นตอนที่ 1 เลือก Direct Marketing 81 เลือก Direct Marketing
  82. 82. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ขั้นตอนที่ 2 เลือกข้อมูลตัวอย่าง (demo) 82 เลือก demo data
  83. 83. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ขั้นตอนที่ 3 เลือกแอตทริบิวต์ที่ต้องการให้เป็นคำตอบ 83 เลือกแอตทริบิวต์ เริ่มการทำงาน
  84. 84. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ผลการทำงาน 84
  85. 85. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th Direct Marketing in RM 6 • ผลการทำงาน 85
  86. 86. Direct Marketing DEMO (data)3
 base|warehouse|mining http://www.dataminingtrend.com
 http://facebook.com/datacube.th
  87. 87. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th For more information • หนังสือเกี่ยวกับ RapidMiner version 5 และ 6 ! ! ! ! • Contact me: • Facebook: http://www.facebook.com/datacube.th • E-mail: sit.ake@gmail.com • Line: eakasitp 87
  88. 88. (data)3
 base|warehouse|mining http://dataminingtrend.com http://facebook.com/datacube.th For more information • เปิดรับสมัครหลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining 
 โดยซอฟต์แวร์ RapidMiner Studio 6 (ขั้นพื้นฐานและปานกลาง) 
 รุ่นที่ 4 • วันที่อบรม 26-28 กันยายน 2557 • อบรมที่ โรงแรม KU Home มหาวิทยาลัยเกษตรศาสตร์ บางเขน • รายละเอียดเพิ่มเติม • http://dataminingtrend.com/2014/training/rapidminer-training-4/ 88

×