More Related Content Similar to สถิติที่ควรรู้จัก (7) สถิติที่ควรรู้จัก3. กำรวิเครำะห์ควำมแปรปรวน
Analysis of Variance : ANOVA
การวิเคราะห์ความแปรปรวน มาจากภาษาอังกฤษคา ว่า Analysis
of Variance แทนด้วย ANOVA เป็นวิธีการแยกความผันแปรรวมของ
ข้อมูลออกเป็นส่วนๆ ตามแหล่งที่มาของความผันแปร (Source of
Variation: SOV) แหล่งที่มาของความผันแปรนั้นอาจจะทราบหรือไม่
ทราบสาเหตุ โดยแหล่งความผันแปรที่ทราบสาเหตุอาจจะมี 1 แหล่งหรือ
มากกว่าก็ได้
4. t –test เป็นการเปรียบเทียบค่าเฉลี่ย 2 ค่า ( 2 กลุ่ม ) แต่ถ้ามี 3 กลุ่ม ต้อง
ทดสอบถึง 3 ครั้ง กล่าวคือ กลุ่มที่ 1 – กลุ่มที่ 2 , กลุ่มที่1 – กลุ่มที่ 3 และ
กลุ่มที่ 2 – กลุ่มที่ 3 ซึ่งทา ให้เสียเวลา และความคลาดเคลื่อน
ประเภทที่ 1 ( Type I Ewor ) จะเพิ่มขึ้น เช่น กา หนด α = 0.5
ถ้าทดสอบ t –test 3 ครั้ง จะทา ให้ α ที่ได้จะเท่ากับ 1- ( 1- α )k-1 เมื่อ k
คือจา นวนกลุ่มผลที่ได้จะทา ให้ค่าความน่าจะเป็นที่ 1 แตกต่างกัน อย่างมี
นัยสา คัญ โดยบังเอิญมากขึ้น ดังนั้น เพื่อแก้ปัญหาดังกล่าว ในการทดสอบ
ความแตกต่างของค่าเฉลี่ยที่มากกว่าสองค่าจึงทดสอบด้วยการวิเคราะห์
ความแปรปรวน ด้วยสถิติ F -test
5. การทดสอบความแปรปรวนนั้น ในกรณีที่มีตัวแปรอิสระ 1 ตัวจะเรียก
One – way ANOVA , 2 ตัว เรียก Two –way ANOVA และ ถ้ามีตัวแปร
อิสระ 3 ตัว ก็จะเป็นการวิเคราะห์ 3-way ANOVA ซึ่งการวิเคราะห์และ
การตีความก็จะยากขึ้นตามลา ดับ
กำรวิเครำะห์ควำมแปรปรวนแบบจำแนกทำงเดียว ( One- way ANOVA )
ข้อตกลงเบื้องต้นในกำรวิเครำะห์ควำมแปรปรวน
1. เลือกตัวอย่างโดยสุ่มจากแต่ละประชากร รวม k ประชากร
2. แต่ละประชากรมีการแจกแจงแบบปกติ ประชากรที่ i มีค่าเฉลี่ย
i k i , 1,2,.....,
3. ความแปรปรวนของทุกประชากรต้องไม่ต่างกัน
( ... ) 2 2 2
2
1 2
k
7. ค่า SST หรือ SSA และ SSW เมื่อหารด้วยค่าองศาอิสระ (df) ของแต่
ละตัวจะหมายถึงความแปรปรวน (Mean of square : MS) โดยมี
dfT = n – 1 , dfA = k-1 และ dfw = n – k เมื่อ n คือจานวนข้อมูล
หรือกลุ่มตัวอย่างทั้งหมด และ K คือจา นวนกลุ่ม
กำรคำนวณค่ำสถิติ F – test
ในการวิเคราะห์ความแปรปรวนเพื่อเปรียบเทียบค่าเฉลี่ย 3 ค่าขึ้นไป
นั้นจะใช้ F-test สา หรับการทดสอบ ซึ่งในกรณีการวิเคราะห์ความแปรปรวน
ทางเดียวนี้ ค่า F หาได้จากอัตราส่วนความแปรปรวนโดยหาจากความ
แปรปรวนระหว่างกลุ่ม (SSA) หารด้วยความแปรปรวนภายในกลุ่ม (SSw)
ซึ่งมีค่า af = k – 1 (degree of freedom for the numerator)
และ dfL = n-k (degree of freedom the denominator)
การหาค่า F-test สามารถสรุปเป็นตารางได้ดังนี้
13. กำรวิเครำะห์ควำมแปรปรวนร่วม (Analysis of Covariance)
ใช้ตัวย่อว่า ANCOVA
หมายถึงวิธีการควบคุมทางสถิติที่ใช้ทดสอบความแตกต่างของค่าเฉลี่ย
ตั้งแต่ 2 กลุ่มขึ้นไป ซึ่งตัวแปรตามเป็นตัวแปรเชิงปริมาณ 1 ตัว และตัวแปรอิสระ
เชิงกลุ่ม(เชิงคุณภาพ) ANCOVA เป็นการกาจัดหรือควบคุมอิทธิพลของตัวแปร
เกินทางสถิติ(เชิงปริมาณ) ช่วยให้เกิดผลการวิจัยเป็นไปอย่างถูกต้องเที่ยงตรง
(Valid) ซึ่งมีวัตถุประสงค์เหมือนกับ ANOVA แต่การวิเคราะห์ANCOVA มีตัว
แปรร่วม (Covariate)
ลักษณะข้อมูลที่ใช้วิเครำะห์
1) ตัวแปรต้น/ ปัจจัย/ กรรมวิธี เป็นลักษณะข้อมูลเชิงคุณภาพ มาตรานามบัญญัติ
2) ตัวแปรตาม ลักษณะข้อมูลเชิงปริมาณ มาตราวัดแบบอันตรภาคขึ้นไป
3) ตัวแปรร่วม ลักษณะข้อมูลปริมาณ มาตราวัดแบบอันตรภาคขึ้นไป
14. ข้อตกลงเบื้องต้นกำรวิเครำะห์ตัวแปรร่วม
1) ตัวแปรตามและตัวแปรร่วม จะต้องเป็นข้อมูลที่อยู่มาตราวัดแบบ
อันตรภาค หรืออัตราส่วน
2) กลุ่มตัวอย่างแต่ละกลุ่มได้มาจากการสุ่มจากประชากรที่มีการแจกแจง
ปกติ
3) ความแปรปรวนของประชากรในแต่ละกลุ่มต้องไม่แตกต่างกันหรือ
มี ความแปรปรวน เป็นเอกพันธ์ (Homogeneity of variance)
4) ตัวแปรร่วมและตัวแปรตามมีความสัมพันธ์กันแบบเส้นตรง
5) ความสัมพันธ์ระหว่าง ตัวแปรร่วมและตัวแปรตาม ต้องมีความสัมพันธ์
เหมือนกันทุกกลุ่ม หรือเรียกว่า (Homogeneity of regression) โดย
มีสมการ ถ้าให้ C เป็นตัวแปรร่วม Y เป็นตัวแปรตาม
15. ยกตัวอย่าง การเปรียบเทียบวิธีสอนวิชาสถิติกับการบริหารในหลักสูตร MBA
โดยแบ่งนิสิตเป็น 3กลุ่ม (ใช้วิธีสอนที่ต่างกัน)
ANOVA เรียนจบก็สอบเทียบคะแนนเฉลี่ย เท่ากันหรือไม่
ANCOVA ต้องพิจารณาความรู้เดิมก่อน โดยสอบ Pretese เมื่อเรียนจบก็สอบ Posetese Pretese
เป็นตัวแปรร่วม
หลักกำรของ ANCOVA คือพยายามลดความแตกต่างภายในกลุ่มเดียวกัน หรือภายในวิธีสอน
เดียวกัน...จะใช้หลักวิเคราะห์ความถดถอยเชิงเส้น..กับวิเคราะห์ความถดถอยร่วมกัน
การวิเคราะห์การถดถอย (Regression Analysis) เป็นการศึกษาเกี่ยวกับความสัมพันธ์ของตัวแปร
วัตถุประสงค์หลักของการวิเคราะห์การถดถอยคือ เราต้องการประมาณค่าของตัวแปรตัวหนึ่ง
ซึ่งเรียกว่า ตัวแปรตาม (Dependent Variable) นิยมเขียนแทนด้วย Y โดยอาศัยความรู้จากตัวแปร
อื่น ซึ่งเรียกว่า ตัวแปรอิสระ (Independent Variable) นิยมเขียนแทนด้วย X หรือกล่าวอีกอย่าง
หนึ่งว่า เราใช้ความรู้ หรือสารสนเทศจาก X เป็นเกณฑ์ในการประมาณ Y ถ้าใช้ตัวแปร X เพียง
ตัวแปรเดียวในการประมาณ Y และความสัมพันธ์ของ Y และ X เป็นเชิงเส้นตรง เราเรียกว่า การ
ถดถอยเชิงเส้นอย่างง่าย (Simple Linear Regression)
17. ลักษณะของข้อมูลและสัญลักษณ์ในกำรวิเครำะห์ ควำมแปรปรวนร่วม
อย่ำงง่ำย
การวิเคราะห์ความแปรปรวนร่วมมีหลายแบบเท่ากันกับการวิเคราะห์
ความแปรปรวน (ANOVA) ในที่นี้จะกล่าวถึงการวิเคราะห์ความแปรปรวนร่วม
อย่างง่าย ซึ่งเป็นกรณีที่มีตัวแปรอิสระ 1 ตัว มีตัวแปรเกินที่ไม่ได้ควบคุมหรือ
ตัวแปรร่วม (covariate หรือ concomitant variable) ซึ่งจะทา การควบคุมโดยทาง
สถิติ 1 ตัว มีลักษณะของข้อมูลดังในภาพ
18. จากภาพ X แทน ตัวแปรที่ต้องการศึกษา Y แทนตัวแปรร่วมที่จะทา การ
ควบคุมทางสถิติ ตัวแปรที่เลือกเป็น Y ต้องมีหลักทฤษฎีว่าสัมพันธ์กับ X
ในการวิเคราะห์ความแปรปรวนร่วมอย่างง่ายนี้ มีตัวแปรอิสระ 1 ตัว
จากตัวอย่างกรณีที่ควรใช้ กาวิเคราะห์ความแปรปรนร่วมที่กล่าวมา
ซึ่งแบ่งออกเป็น k ระดับ หรือ ประเภท (กลุ่ม) เมื่อ k มีค่าตั้งแต่ 2 ขึ้นไป จา นวน
สมาชิกหรือตัวอย่างในแต่ละกลุ่มอาจเท่ากันหรือไม่เท่ากันก็ได้
กรณีที่ 1 ผลสัมฤทธ์ิที่วัดลังการทดลองคือ X ผลสัมฤทธ์ิที่วัดก่อนการทดลอง
คือ Y กรณีที่ 2 ผลสัมฤทธ์ิที่วัดหลังการทดลองคือ X คะแนนสติปัญญาคือ Y
กรณีที่ 3 ผลการวัด การปฏิบัติงานก่อนการทดลองให้ปัญญาคือ Y
20. กำรวิเครำะห์ควำมแปรปรวนพหุคูณ เป็นเทคนิควิธีการที่ใช้ในการแยกแหล่ง
ความแปรปรวนของข้อมูล ว่าความแปรปรวนของข้อมูลหรือความแตกต่างของ
ข้อมูลเป็นความแตกต่างอันเนื่อง มาจากตัวแปรอิสระ(ต้องเป็นตัวแปรเชิง
คุณภาพ) หรือเป็นความแตกต่างอันเนื่องมาจากความคลาดเคลื่อน (Error) ซึ่งเป็น
เทคนิคที่ใช้ตรวจสอบหรือเปรียบเทียบค่าเฉลี่ย โดยตัวแปรตามต้องเป็นตัวแปร
ต่อเนื่อง (ตัวแปรเชิงปริมาณ) หรือมีมาตราวัดตั้งแต่มาตราอันตรภาค (Interval
Scale) ขึ้นไป และมีจา นวนตั้งแต่ 2 ตัว ขึ้นไป ส่วนตัวแปรอิสระเป็นตัวแปร
แบ่งกลุ่ม (Categories) ซึ่งแบ่งกลุ่มตั้งแต่ 2 กลุ่มขึ้นไป เพื่อให้เห็นความชัดเจน
ของความแตกต่างในการเลือกใช้วิธีการวิเคราะห์ความแปรปรวน
21. ตัวแปรที่ใช้ในกำรวิเครำะห์ควำมแปรปรวนพหุคูณ
1) ตัวแปรตาม (Dependent Variable) ต้องเป็นตัวแปรต่อเนื่อง (Continuous)
จัดอยู่ในมาตรการวัดตั้งแต่อันตรภาค (Interval Scale) ขึ้นไป และมีจา นวนตั้งแต่ 2 ตัว
แปรขึ้นไป
2) ตัวแปรอิสระ (Independent Variable) เป็นตัวแปรแบ่งกลุ่ม (Categories) หรือ
อยู่ในมาตรานามบัญญัติ (Nominal Scale) หรือถ้าอยู่ในมาตราที่สูงกว่านี้ ให้ปรับลงมา
อยู่ในมาตรานามบัญญัติ มีจา นวนตั้งแต่ 1 ตัวแปรขึ้นไป
3) ตัวแปรร่วม (Covariate Variable) มีลักษณะเหมือนกันตัวแปรตามคือต้องอยู่
ในมาตราอันตรภาค (Interval Scale) ขึ้นไป เป็นตัวแปรที่ผู้วิจัยคาดว่าทา ให้เกิดความ
แตกต่างระหว่างกลุ่มในตอนต้น ซึ่งหากไม่ขจัดอิทธิพลของตัวแปรดังกล่าว
แล้ว ผลการวิจัยจะขาดความเที่ยงตรงภายใน (Internal Validity) นั่นคือการที่เกิดความ
แตกต่างของตัวแปรตาม ไม่ใช่เป็นผลอันเนื่องมาจากตัวแปรอิสระ แต่เป็นเหตุที่กลุ่มมี
ความแตกต่างกันมาก่อนแล้ว
22. ทำไมจึงจำเป็นต้องใช้ตัวแปรตำมหลำยตัวแปร?
1. ตัวแปรอิสระน่าจะส่งผลต่อตัวแปรตามหลายตัวมากกว่าตัวแปรเดียว
2. การใช้ตัวแปรหลายตัวแปรทา ให้สามารถศึกษาปรากฏการณ์ได้รอบด้าน ครอบคลุม และ
สะท้อนภาพปรากฏการณ์จริงได้ตรงกว่า
3. ในงานวิจัยเชิงทดลอง ต้นทุนในการได้มาซึ่งตัวแปรตามนั้นต่า กว่าตัวแปรกระทา การมาก
ดังนั้นการใช้ตัวแปรตามหลายตัวจึงคุ้มค่ากว่าการทา การทดลองหลายครั้ง
ทำไมไม่ใช้ ANOVA เปรียบเทียบทีละตัวแปร?
1. ทา ให้ค่า Alpha หรือ Type I Error สูงขึ้นเกินกว่าที่ตั้งไว้
2. การเปรียบเทียบทีละตัวแปรนั้นละเลยความสัมพันธ์ระหว่างตัวแปรตาม
3. มีอา นาจทดสอบ (Power) สูงกว่า เนื่องจากหากเปรียบเทียบแต่ละตัวแปรแล้วอาจไม่พบ
ความแตกต่าง แต่ถ้าใช้ MANOVA แล้ว อาจพบความแตกต่างซึ่งเกิดขึ้นจากหลายตัวแปร
ร่วมกัน
4. แก้ปัญหา Cancelling Out Effect กรณีเปรียบเทียบโดยนา เอาตัวแปรหลายตัวแปรมารวม
หรือเฉลี่ยกันก่อน เช่นนาคะแนนรายด้านมารวมหรือเฉลี่ยกันกลายเป็นคะแนนรวม แล้วจึง
นามาเปรียบเทียบด้วย ANOVA
23. MANOVA ไม่เหมำะในกรณี
1. ตัวแปรตามหลายตัวแปรไม่มีความสัมพันธ์กัน
2. ตัวแปรตามหลายตัวแปรมีความสัมพันธ์มากเกินไป (Multicollinearity)
3. มีจา นวนตัวแปรตามมากเกินไป
ข้อตกลงเบื้องต้นของ MANOVA
1. การแจกแจงแบบปกติหลายตัวแปร (Multivariate Normality Distribution)
2. มีเมทริกซ์ความแปรปรวนร่วมเท่ากันทุกกลุ่ม (Homogeneity of Covariance Matrix)
3. ความเป็นอิสระจากกันของคะแนนตัวแปร (Independent Observation)
เงื่อนไขของ MANOVA
1. มีการสุ่มตัวอย่างเป็นอิสระกัน
2. Variance – Covariance Matrice ของตัวแปรตามในแต่ละกลุ่มต้องเท่ากัน
3. ตัวแปรตาม p มีการแจกแจงแบบ Mutivariate Normal ต้องมีการแจกแจงแบบปกติ
26. สรุปเกี่ยวกับกำรวิเครำะห์ควำมแปรปรวนพหุคูณ
ในการวิเคราะห์ความแปรปรวนพหุคูณมีรายละเอียดที่เกี่ยวข้องใน
การวิเคราะห์เป็นจา นวนมาก ซึ่งไม่สามารถนาเสนอรายละเอียดได้ทั้งหมดใน
บทความนี้ โดยสรุปแล้ว การวิเคราะห์ความแปรปรวนพหุคูณ (MANOVA) ก็คือ
การขยายขอบเขตหรือข้อจากัดของการวิเคราะห์ความแปรปรวน (ANOVA) นั่นเอง
การวิเคราะห์ความแปรปรวนพหุคูณ เป็นการวิเคราะห์ในกรณีที่มีตัวแปรซึ่งใช้
หลักการเดียวกันนั่นคือ “หลักการวิเคราะห์หรือแยกแหล่งความแปรปรวน”
เพียงแต่ตามมากกว่า 1 ตัวแปรนั่นเอง แต่ในขั้นตอนของการวิเคราะห์ MANOVA
จะดา เนินการสร้างตัวแปรตามขึ้นมาใหม่ให้เหลือเพียงตัวเดียว โดยอาศัยผลรวมเชิง
เส้น (Linear Combination) ของตัวแปรตามทุกตัวด้วยสมการจาแนก (Discriminant
Function) ดังนั้นเมื่อรวมตัวแปรตามให้เหลือเพียงตัวเดียวแล้ว การวิเคราะห์
ดังกล่าวจึงเป็นการวิเคราะห์ความแปรปรวนโดยทั่วไปนั่นเอง
28. ข้อตกลงเบื้องต้นแตกต่ำงจำกสถิติพำรำเมตริก
• การวัดผลของข้อมูลไม่จา เป็นต้องอยู่ในระดับอันตรภาค อาจเป็น Ordinal
scale หรือ Nominal scale ก็ได้
• การกระจายของข้อมูลที่วัดได้ไม่จา เป็นต้องกระจายเป็นโค้งปกติ
• ค่าความแปรปรวนของกลุ่มประชากรไม่จาเป็นต้องเท่ากัน หรือเราไม่ทราบ
ว่าเท่ากันหรือไม่
นอนพำรำเมตริก
• ทดสอบความถูกต้องของทฤษฏี (Test of goodness of fit)
• ทดสอบความเป็นอิสระ (Test of independent)
• ทดสอบกลุ่มตัวอย่างมากกว่าสองกลุ่ม
29. กำรทดสอบไคร์สแควร์
ข้อมูลที่ได้จากการวิจัยบางเรื่องเป็นข้อมูลที่อยู่ในรูปของความถี่ (ซึ่งเป็นตัว
เลขที่นับได้จากข้อมูลในมำตรำนำมบัญญัติ) เช่น จานวนอาจารย์ที่มีวุฒิปริญญาตรี
จานวนอาจารย์ที่มีวุฒิปริญญาโท และจานวนอาจารย์ที่มีวุฒิปริญญาเอก เป็นต้น
หรืออาจจะอยู่ในรูปร้อยละก็ได้ (ซึ่งได้จากความถี่) หรืออาจเป็นข้อมูลในมำตรำ
อันตรภำค หรืออัตรำส่วน แต่ปรับอยู่ในรูปของความถี่ได้
จุดประสงค์ของกำรทดสอบไคร์สแควร์
• ทดสอบความถูกต้องของทฤษฏี (Test of goodness of fit)
• ทดสอบความเป็นอิสระ (Test of independent)
30. ทดสอบควำมถูกต้องของทฤษฏี
(Test of goodness of fit)
การทดสอบว่าสัดส่วนที่รวบรวมข้อมูลได้จริง ๆ นั้น (Observed
proportion) แ ตก ต่างไ ปจ าก สัด ส่วน ที่คาด ห วังตาม ท ฤษ ฎี (Expected
proportion) อย่างมีนัยสาคัญทางสถิติหรือไม่ ข้อมูลมาจากประชากรกลุ่มเดียว
31. ตัวอย่ำง
• จากการสอบถามนักเรียนชั้นมัธยมศึกษาปีที่ 5 จา นวน 200 คนว่า
จะเลือกเรียนต่อในคณะครุศาสตร์หรือไม่ พบว่ามีนักเรียนตอบว่าเลือก
50 คน ตอบว่าไม่เลือก 150 คน ตัวเลข 50 และ 150 เป็นความถี่
2 ตัวที่ได้จากการสังเกต ส่วนความถี่ที่คาดหวังก็จะเป็นตอบว่าเลือก
100 คน ตอบว่าไม่เลือก 100 คน
32. ทดสอบควำมถูกต้องของทฤษฏี (Test of goodness of fit)
สูตร
ค่าไคร์สแควร์
O E
i i
E
= ความถี่ที่รวบรวมได้จริง ๆ
= ความถี่ที่คาดหวัง
i O
i E
c
i 1
i
2
2
2
35. ผลกำรทดสอบ
ความคดิเห็น
9 8.3 .7
10 8.3 1.7
6 8.3 -2.3
25
เห็นดว้ย
ไม่เห็นดว้ย
ไม่มีความคดิเห็น
Total
Observed N Expected N Residual
36. ผลกำรทดสอบ
Test Statistics
1.040
2
.595
Chi-Squarea
df
Asymp. Sig.
ความคิดเห็น
0 cells (.0%) have expected frequencies less than
5. The minimum expected cell frequency is 8.3.
a.
38. ทดสอบควำมเป็นอิสระ (Test of independent)
การทดสอบความเป็นอิสระเป็นการทดสอบความสัมพันธ์ระหว่างตัว
แปร 2 ตัวเมื่อข้อมูลที่รวบรวมได้เป็นข้อมูลระดับนามบัญญัติ ซึ่งจะเป็น
ข้อมูลที่อยู่ในรูปความถี่ สัดส่วน หรือร้อยละ โดยที่ตัวแปรแต่ละตัว
แบ่งเป็นประเภทหรือเป็นกลุ่มย่อย ๆ ตัง้แต่ 2 กลุ่มขึน้ไป อาจเป็นแบบ
2x2, 2x3 หรือ 3x2, 3x3, 4x5 เป็นต้น การทดสอบความเป็นอิสระนีจ้ะ
ตัง้สมมติฐานไร้นัยสาคัญ ว่าตัวแปร 2 ตัวนัน้ไม่มีความสัมพันธ์กัน ซงึ่
กล่าวอีกอย่างหนงึ่ได้ว่าตัวแปร 2 ตัวนั้นเป็นอิสระจากกัน ดังนัน้จึง
เรียกการทดสอบนี้ว่าการทดสอบความเป็นอิสระ
39. สูตร
ทดสอบควำมเป็นอิสระ (Test of independent)
O E
ค่าไคร์สแควร์
= ความถี่ที่รวบรวมได้จริง ๆ
= ความถี่ที่คาดหวัง
i O
i E
rc
i i
E
i 1
i
2
2
2
40. ตัวอย่ำงทดสอบควำมเป็นอิสระ (Test of independent)
ต้องการศึกษาความสัมพันธ์ระหว่างความคิดเห็นของคนที่
ชอบและไม่ชอบพรรคการเมืองพรรคหนึ่งกับระดับรายได้ สุ่ม
ตัวอย่างได้ข้อมูลดังนี้
ความคิดเห็น รายได้
สูง กลาง ต่า
ชอบ 7 4 6
ไม่ชอบ 2 5 6
43. ผลกำรวิเครำะห์ข้อมูล
Chi-Square Tests Value df Asymp. Sig. (2-
sided)
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
2.398
2.518
1.386
30
2
2
1
.301
.284
.239
a 2 cells (33.3%) have expected count less than 5. The minimum expected count is 3.90.