Simple linear regression and correlation

การถดถอยเชิงเส้นอย่างง่ายและสหสัมพันธ์
(Simple linear regression and correlation)
Miss.Phimmat Kalawong
หัวข้อ
บทนา1
การถดถอยเชิงเส้นอย่างง่าย2
การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด3
ค่าสัมประสิทธิ์การตัดสินใจ6
การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น5
ตัวอย่างงานวิจัย8
สหสัมพันธ์7
คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด4
การนาไปใช้ในงานวิจัยที่สนใจ9
-2-
การวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย (Simple linear regression analysis)
1. บทนา
ตัวแปรอิสระ (Independent variable: x) และตัวแปรตาม (Dependent variable: y)
การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรสองตัว หรือมากกว่า
-3-
วิเคราะห์สหสัมพันธ์ (Correlation analysis)
การวิเคราะห์ว่าตัวแปร 2 ตัวแปรใด ๆ มีความสัมพันธ์หรือไม่นั้น สามารถใช้วิธีการด้านสถิติ
การวิเคราะห์ความถดถอย (Regression analysis)
หาก 2 ตัวแปรมีความสัมพันธ์กัน พบว่าตัวแปร x มีผลต่อตัวแปร y หากศึกษาวิธีการนาตัวแปร x
ใช้คาดคะเนผลที่อาจจะเกิดขึ้นได้ของตัวแปร y ด้วยวิธีการทางสถิติ
การวิเคราะห์การถดถอยเชิงเส้น (Linear regression analysis)
หากตัวแปรต่าง ๆ มีความสัมพันธ์กันในเชิงเส้นตรงจะ เรียกว่า
2. การถดถอยเชิงเส้นอย่างง่าย
รูปที่ 1 แผนภาพการกระจายของการอัด(y) กับแรงดัน(x)
ตัวอย่าง ในการพัฒนาวัสดุแผ่นฉนวนชนิดใหม่ ต้องการคาดคะเนการอัด
(y: หน่วยเป็น 0.1 นิ้ว) ของแผ่นฉนวนหนา 2 นิ้ว ภายใต้แรงดัน (x: หน่วย
เป็น 10 ปอนด์/ตารางนิ้ว) ในระดับต่างๆ โดยทาการทดสอบชิ้นงาน 5 ชิ้น
ชิ้นงาน
(Specimen)
ความดัน
(Pressure)
การอัด
(Compression)
1 1 1
2 2 1
3 3 2
4 4 2
5 5 4
ตารางที่ 1 ข้อมูลการทดสอบวัสดุแผ่นฉนวน
การศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระ (x) และตัว
แปรตาม (y) โดยจะศึกษาตัวแปรอิสระเพียงตัวเดียวที่มีผล
ต่อตัวแปรตาม
ใช้แผนภาพการกระจาย ในการวิเคราะห์ความสัมพันธ์
ความสัมพันธ์ของ 2 แปร และบนแผนภาพการกระจาย
แรงดัน (ตัวแปรอิสระ: x)
การอัด (ตัวแปรตาม: y) -4-
2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ)
ตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย (Simple linear regression model)
โดย
ตัวแบบแสดงดังสมการ
0 1y x    
y
x
= ตัวแปรตาม (Dependent variable)
= ตัวแปรอิสระ (Independentvariable)
= ค่าความคลาดเคลื่อนสุ่ม (Random error)
= จุดตัดแกนบน y (y-intercept)
= ความชัน (Slope)

0
1
และ เป็นค่าพารามิเตอร์ที่ไม่ทราบค่า
เรียกว่า สัมประสิทธิ์การถดถอย (Regression coefficient)
0 1เมื่อ
-5-
04 ความคลาดเคลื่อนกระจายตัวแบบอิสระ
ปราศจากอิทธิพลใดๆ
2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ)
สมมติฐานเฉพาะเกี่ยวกับความคลาดเคลื่อน: ( )
01
การแจกแจงความน่าจะเป็นค่าเฉลี่ยของความ
คลาดเคลื่อนเท่ากับศูนย์นั้นคือ ค่าเฉลี่ยของ
ความคลาดเคลื่อนเท่ากับศูนย์
( ) 0E  
02 ความแปรปรวนการแจกแจงความน่าจะเป็น
คลาดเคลื่อนของตัวแปรอิสระ (x) นั้นมีค่าคงที่
ทั้งหมด หมายความว่าความแปรปรวนของความ
คลาดเคลื่อนสุ่มมีค่าคงที่เท่ากับ
2
( )V  
2

03 ค่าความคลาดเคลื่อน มีการแจกแจงความ
น่าจะแบบปกติ
~ N
-6-
2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ)
รูปที่ 2 เส้นสมมติของ 0 1(y)E x  
เมื่อ x เพิ่มขึ้น 1 หน่วย
y จะเปลี่ยนไป หน่วย1
ซึ่งในความเป็นจริงค่า , และ
ไม่สามารถระบุค่าได้จึงต้องทาการประมาณ
จากข้อมูลตัวอย่าง
1 0 2

0 1(y)E x  
เมื่อ
ค่าเฉลี่ยของเส้นถดถอย อยู่ในรูป
( ) 0E  
-7-
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด
รูปที่ 3 แผนภาพการเบี่ยงเบนจุดของข้อมูลกับเส้นถดถอย
3.1 การประมาณค่าจุดตัด และความชัน ( และ )0 1
เส้นที่เหมาะสม (Best-fitting line)
ประมาณค่า ( และ )
วิธีกาลังสองน้อยที่สุด
(Method of least squares)
0 1
ค่าผลรวมของผลต่าง ระหว่าง
ค่าของข้อมูลจริงกับเส้นสมมติ
มีค่าน้อยที่สุด
-8-
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ)
2 2
0 1
1 1
( )
n n
i i i
i i
L y x  
 
    
ค่าความคลาดเคลื่อน นั้นสามารถเป็นได้ทั้งค่าบวกและค่า
ลบ จึงต้องทาให้อยู่ในรูปผลรวมกาลังสองของความ
คลาดเคลื่อน (Sum of squaresfor error: L )
0 1
0 1
1ˆ ˆ0 ,
ˆ ˆ2 ( ) 0
n
i i
i
L
y x
 
 
 

    


0 1
0 1
1ˆ ˆ1 ,
ˆ ˆ2 ( ) 0
n
i i i
i
L
y x x
 
 
 

    


การประมาณค่า และ เขียนแทนด้วย และ
โดยวิธีกาลังสองน้อยที่สุด ด้วยการหาค่าอนุพันธ์เชิงส่วน
เทียบกับ และ แล้วกาหนดให้สมการเท่ากับศูนย์
0 1 1
ˆ0
ˆ
0 1
สามารถคานวณหาค่าจุดตัดแกนและความชัน ได้ดังนี้
0 1
ˆ ˆy x   (1)
1 1
1
1 2
2 1
1
ˆ
n n
i in
i i
i i
i
n
in
i
i
i
y x
y x
n
x
x
n

 



  
  
  

 
 
 
 



(2)
0 1
1 1
ˆ ˆ
n n
i i
i i
n x y 
 
  
2
0 1
1 1 1
ˆ ˆ
n n n
i i i i
i i i
x x y x 
  
   
เมื่อจัดรูปสมการทั้งสองใหม่จะได้รูปสมการปกติ คือ
-9-
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ)
ดังนั้น เส้นประมาณการถดถอยที่เหมาะสม คือจากสมการหาความชัน นาแสดงใหม่โดยใช้
สัญลักษณ์แทนได้ดังนี้
1
ˆ( )
2
12 2
1 1
( )
n
in n
i
xx i i i
i i
x
S x x x
n

 
 
 
    

 
1 1
1 1
( )( )
n n
i in n
i i
xy i i i i
i i
x y
S y y x x x y
n
 
 
  
  
      
 
 
1
ˆ xy
xx
S
S
  (3)
0 1
ˆ ˆˆ iy x   (4)
สาหรับ แต่ละคู่ลาดับของข้อมูล(x, y) ที่ได้จากการ
สังเกตจริง แสดงดังสมการต่อไปนี้
0 1
ˆ ˆˆi i iy x e    i = 1,2,…,n
โดยที่ เรียกว่า ค่าเรสซิดวล (Residual)
หรือค่าความคลาดเคลื่อน
ˆi ie y y 
-10-
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ)
3.2 การประมาณค่าความแปรปรวน: 2

รูปที่ 4 ตัวอย่างความแปรปรวนของข้อมูล
การประมาณค่าความแปรปรวนโดยที่เรสซิดวล ถูกใช้เพื่อให้ได้ค่าประมาณ
ซึ่งค่าเรสซิดวลจะมีค่าเป็นไปได้ทั้งบวกและลบ จึงต้องกาหนดค่าให้อยู่ในรูปของ
ผลรวมกาลังสองของเรสซิดวล (Error sum of squares: )
2
1
n
E i
i
SS e

  2
1
ˆ( )
n
i
i
y y

 
โดยองศาอิสระ (Degrees of freedom) คือ
ค่าเฉลี่ยของผลรวมกาลังสองของเรสซิดวล คือ 2
ˆ( ) ( 2)EE SS n  
ดังนั้น ค่าประมาณความแปรปรวนของเรสซิดวลที่ไม่เอนเอียง คือ
ESS
2

2n 
2 2
ˆ
2
E
E
SS
MS S
n
   
 (5)
2
ˆ
2
ˆ
สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมน้อย
สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมมาก -11-
ตัวอย่าง
ตัวอย่างที่ 1 โรงงานผลิตกระดาษเพื่อใช้ทากล่องบรรจุชิ้นงานด้านอุตสาหกรรม ทาการศึกษาข้อมูลระหว่าง ค่าความต้านทานต่อการ
ฉีกขาดของกระดาษ (y: หน่วยเป็น 10 นิวตัน/ตารางมิลลิเมตร) กับเปอร์เซ็นต์ของกาวอัด (x) ที่ใช้เป็นส่วนผสมในการผลิตกระดาษ
โดยสุ่มเก็บรวบรวมข้อมูล มา 10 ตัวอย่างดังนี้คือ
ตัวอย่างที่ 1 2 3 4 5 6 7 8 9 10
x 1.6 1.5 1.5 1.4 2.0 2.0 2.2 2.4 2.5 2.5
y 10.1 11.7 11.7 11.5 13.1 13.2 14.2 14.0 13.7 14.1
จากข้อมูลข้างต้น หากต้องการทราบความสัมพันธ์ระหว่างกับเปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิต
กระดาษ กับความต้านทานต่อการฉีกขาดของกระดาษ จะทาการพิจารณาตัวแบบเชิงเส้นอย่างง่ายดังต่อไปนี้
0 1y x    
โดยที่
x = เปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ (ตัวแปรอิสระ)
y = ค่าความต้านทานต่อการฉีกขาดของกระดาษ (ตัวแปรตาม)
-12-
ตัวอย่าง (ต่อ)
รูปที่ 5 แผนภาพการกระจายของค่าความต้านทานต่อการฉีกขาดของกระดาษ(y)
กับเปอร์เซ็นต์กาวอัด (x)
เมื่อ x มีค่าสูงขึ้น y จะมีค่าสูงขึ้นด้วย
การใช้ค่าของข้อมูลวิเคราะห์ความสัมพันธ์ของตัวแปรต้นและตัว
แปรตาม ซึ่งมีข้อมูลดังต่อไปนี้
10n 
10
1
19.60i
i
x


10
1
127.30i
i
y


10
1
254.30i i
i
y x


10
2
1
40.12i
i
x


10
2
1
1638.03
i
y

 1.96x 12.73y 
คานวณค่าสัมประสิทธิ์ของสมการถดถอยเชิงเส้นอย่างง่าย
 
210
2
10
12
1
19.60
40.12 1.704
10
i
i
xx i
i
x
S x
n


 
 
     


  
10 10
10
1 1
1
19.60 127.30
254.3 4.7
10
0 92
i i
i i
xy i i
i
x y
S x y
n
 

  
  
      
 

ค่าความชัน และค่าจุดตัด
1
4.792ˆ 2.812
1.704
xy
xx
S
S
   
0 1
ˆ ˆ 12.73 (2.812 1.96) 7.218y x      
-13-
ตัวอย่าง (ต่อ)
รูปที่ 6 พล็อตของสมการถดถอยเชิงเส้นของตัวอย่างที่ 1
จากสมการถดถอยที่ได้อธิบายได้ว่า เมื่อ
จะได้ หมายความว่าถ้าไม่มี
อิทธิพลของกาวอัดเลย ค่าความต้านทานต่อการฉีกขาด
ของกระดาษจะเท่ากับ 72. 18 นิวตันต่อตารางมิลลิเมตร
(เนื่องจากหน่วยของค่าความต้านทานในตัวอย่างที่ 1
เท่ากับ 10 นิวตันต่อตารางมิลลิเมตร ดังนั้น
ˆ 7.218 2.812y x 
ดังนั้น สมการถดถอยเชิงเส้นอย่างง่ายที่ประมาณได้
0x 
ˆ 7.218 2.812(0) 7.218y   
7.218 10 72.18 
-14-
ตัวอย่าง (ต่อ)
ตัวอย่างที่ x y
1 1.60 10.10 11.72 -1.62 2.62
2 1.50 11.70 11.44 0.26 0.07
3 1.50 11.70 11.44 0.26 0.07
4 1.40 11.50 11.16 0.34 0.12
5 2.00 13.10 12.84 0.26 0.07
6 2.00 13.20 12.84 0.36 0.13
7 2.20 14.20 13.40 0.80 0.63
8 2.40 14.00 13.97 0.03 0.00
9 2.50 13.70 14.25 -0.55 0.30
10 2.50 14.10 14.25 -0.15 0.02
ผลรวม 19.60 127.30 127.30 0.00 4.02
ieˆiy 2
ie
ตารางที่ 2 ข้อมูลความคลาดเคลื่อนที่เกิดขึ้นจากตัวแบบและค่าสังเกตจากตัวอย่าง
ค่าความต้านทานต่อการฉีกขาดของกระดาษ แสดงดังนี้
ค่าประมาณความแปรปรวนของเรสซิดวล
2
2
2 1 (4.02)
ˆ 0.503
2 10 2
n
i
i
e
n
 
  
 

สามารถคานวณได้ดังนี้
-15-
ดังนั้น และ คือค่าประมาณที่ไม่เอนเอียงในตัวแบบการถดถอยเชิงเส้น
4. คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด
( ) 0E  
2
( )V  
คุณสมบัติทางสถิติของค่าประมาณพารามิเตอร์ และ
ของตัวแบบความสัมพันธ์เชิงเส้นด้วยวิธีกาลังสองน้อยที่สุด อธิบายได้
จากข้อสมมติฐานของความคลาดเคลื่อน
0 1
 1 1
ˆE  
ค่าเฉลี่ยของความชันและจุดตัด คือ
ค่าความแปรปรวนความชันและจุดตัด คือ
 
2
1
ˆ
xx
V
S

 
 0 0
ˆE  
 
2
2
0
1ˆ
xx
x
V
n S
 
 
  
 
ประมาณการความแปรปรวนของความชันและ
จุดตัด ผลจากการคานวณหารากที่สองของความแปรปรวน
เรียกว่า ความคลาดเคลื่อนมาตรฐานโดยประมาณ (Estimated
standard error) ของความชันและจุดตัด หาได้จาก
โดยที่ค่าความคลาดเคลื่อนมาตรฐานโดยประมาณเป็นค่าที่
ใช้ในการวัดความถูกต้องแม่นยาของการประมาณค่าสัมประสิทธิ์
ตัวแบบความสัมพันธ์ด้วยวิธีกาลังสองน้อยที่สุด นั่นคือค่าความ
คลาดเคลื่อนยิ่งน้อยยิ่งดีนั่นเอง1
ˆ 0
ˆ
 
2
1
ˆˆ
xx
se
S

  (6)
 
2
2
0
1ˆ ˆ
xx
x
se
n S
   (7)
-16-
5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น
5.1 การทดสอบสมมติฐานโดยการใช้ t-Test
การทดสอบสมมติฐานว่าความชัน เท่ากับค่าคงที่ สมมติฐานคือ
โดยที่ ตัวสถิติทดสอบความชัน ใช้การทดสอบแบบที
0 1 1,0:H  
1 1 1,0:H  
ซึ่งการแจกแจงแบบทีด้วยองศาอิสระ
จะปฏิเสธสมมติฐานหลัก เมื่อ 0 2, 2nt t 
2n
การวิเคราะห์ความเหมาะสมของตัวแบบถดถอยเชิงเส้นต้องทาการทดสอบสมมติฐานทางสถิติของค่าความชันและจุดตัดก่อนนาไปใช้
โดยมีข้อสมมติฐานคือ ความคลาดเคลื่อนกระจายตัวแบบอิสระ, , และ~ N ( ) 0E   2
( )V  
-17-
 
1 1,0 1 1,0
0 2
1
ˆ ˆ
ˆˆ xx
T
seS
   

 
  (8)
0 2, 2nt t 
การทดสอบสมมติฐานของจุดตัด
ปฏิเสธสมมติฐานหลักเมื่อ
 
0 0,0 0 0,0
0
2
02
ˆ ˆ
ˆ1
ˆ
xx
T
sex
n S
   


 
 
 
 
 
(9)
5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ)
5.1 การทดสอบสมมติฐานโดยการใช้ t-Test
0 1: 0H  
1 1: 0H  
โดยการทดสอบสมมติฐานนั้นมีความสาคัญ เนื่องเป็นการทดสอบเพื่อศึกษานัยสาคัญของความสัมพันธ์มีสมมติฐานคือ
(ไม่มีความสัมพันธ์ระหว่าง x และ y)
(มีความสัมพันธ์ระหว่าง x และ y)
รูปที่ 7 ไม่ปฏิเสธสมมติฐานหลัก (ไม่มีความสัมพันธ์ระหว่าง x และ y)0 1: 0H   รูปที่ 8 ปฏิเสธสมมติฐานหลัก (มีความสัมพันธ์ระหว่าง x และ y)
ค่าแปรปรวนน้อย ค่าแปรปรวนของข้อมูลมาก
0 1: 0H  
ดังนั้น การปฏิเสธสมมติฐานหลัก อาจหมายถึงว่ารูปแบบความสัมพันธ์เชิงตรงนั้นมีความเหมาะสม ดังรูปที่ 8 (a)
-18-
5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ)
5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
เป็นการวิเคราะห์ความแปรปรวนที่ใช้เพื่อทดสอบนัยสาคัญของการ
ถดถอย ซึ่งการวิเคราะห์ความแปรปรวนมีดังนี้
2 2 2
1 1 1
ˆ ˆ( ) ( ) ( )
n n n
i i i i
i i i
y y y y y y
  
      
2
1
ˆ( )
n
R i
i
SS y y

 
2
1
ˆ( )
n
E i i
i
SS y y

 
ผลรวมกาลังสองของความคลาดเคลื่อนจากการถดถอย
(Regression sum of squares)
ผลรวมกาลังสองของความคลาดเคลื่อน
(Error sum of squares)
เขียนสมการใหม่ได้ว่า
โดยที่
2
1
( )
n
T i
i
SS y y

 
2
12
1
n
in
i
i
i
y
y
n


 
 
  


-19-
T R ESS SS SS  (10)
1
ˆ
R xySS S (11)
E T RSS SS SS  (12)
5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ)
5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
ตัวสถิติที่ใช้ในการทดสอบ คือ
0
1
( 2)
R R
E E
SS MS
F
SS n MS
 

ซึ่งการแจกแจงแบบเอฟ ด้วยองศาอิสระ จะปฏิเสธสมมติฐานหลัก ถ้า พบว่าค่าสถิติเอฟ
ที่ได้จากการคานวณมากกว่าค่าที่เกิดจากการเปิดตารางเอฟ
2n 0 ,1, 2nF f 
แหล่งที่มา
(Source of variation)
ผลบวกกาลังสอง
(Sum of Squares)
องศาอิสระ
(Degrees of
Freedom)
ค่าเฉลี่ย
(Mean
Square)
ค่าสถิติ
0( )F
ตัวแบบ (Regression) RSS 1 RMS 0 R EF MS MS
ค่าความคลาดเคลื่อน (Error) ESS 2n  EMS
ทั้งหมด (Total) TSS 1n 
ตารางที่ 3 การวิเคราะห์ความแปรปรวนของการทดสอบนัยสาคัญการถดถอย
-20-
(13)
ตัวอย่าง
ตัวอย่างที่ 2 จากตัวอย่างที่ 1 ทดสอบสมมติฐานว่าความสัมพันธ์ของความต้านทานต่อการฉีกขาดของกระดาษกับเปอร์เซ็นต์ของกาวอัดที่ใช้
เป็นส่วนผสมในการผลิตกระดาษเป็นแบบเชิงเส้นที่ระดับนัยสาคัญ 5% หรือไม่
สมการถดถอยเชิงเส้นอย่างง่ายที่ได้จากตัวอย่างที่ 1 คือ ˆ 7.218 2.812y x 
การทดสอบสมมติฐานโดยการใช้ t-Test
10n  1
ˆ 2.812  1.704xxS  2
ˆ 0.503 
สมมติฐาน
0 1: 0H  
1 1: 0H  
(ไม่มีความสัมพันธ์ระหว่าง x และ y)
(มีความสัมพันธ์ระหว่าง x และ y)
0.05 
2
1 1,0
0
ˆ ˆ 0 2.812
5.176
0.503
1.704
ˆ
xx
T
S


  
   ตัวสถิติทดสอบ
ปฏิเสธ ถ้า0H 0 0.025,8 2.306T t 
0.0250.025
0.025,8 2.306t   0.025,8 2.306t 
สรุป เนื่องจาก ดังนั้น ปฏิเสธ
ที่ระดับนัยสาคัญ 0.05 มีหลักฐานแสดงว่า ค่าความต้านทานต่อการฉีก
ขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาวอัดที่ใช้
เป็นส่วนผสมในการผลิตกระดาษ
0 0.025,8( 5.176) 2.306T t   0 1: 0H  
-21-
0.05
0.05,1,8 5.32f 
ตัวอย่าง (ต่อ)
ทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
10n 
10
1
127.30i
i
y


10
2
1
1638.03
i
y

 12.73y 
ˆ 127.3iy  1
ˆ 2.812  4.792xyS 
สมมติฐาน
0 1: 0H  
1 1: 0H  
(ไม่มีความสัมพันธ์ระหว่าง x และ y)
(มีความสัมพันธ์ระหว่าง x และ y)
0.05 
2
1
ˆ( ) 4.02
n
E i i
i
SS y y

  
1
ˆ 2.812 4.792 13.475R xySS S   
2
2
12
1
127.3
1638.03 17.501
10
n
in
i
T i
i
y
SS y
n


 
 
     


13.475
13.475
1 1
R
R
SS
MS   
4.02
0.503
( 2) 10 2
E
E
SS
MS
n
  
 
0
13.475
26.78
0.5025
R
E
MS
F
MS
  
0 ,1, 2nF f ปฏิเสธ ถ้า0H
0 0.05,1,8( 5.32)F f 
-22-
แหล่งที่มา
(Source of variation)
ผลบวกกาลังสอง
(Sum of
Squares)
องศาอิสระ
(Degrees of
Freedom)
ค่าเฉลี่ย
(Mean
Square)
ค่าสถิติ
0( )F
ตัวแบบ (Regression) 13.475 1 13.475 26.78
ค่าความคลาดเคลื่อน (Error) 4.020 8 0.503
ทั้งหมด (Total) 17.501 9
ตัวอย่าง (ต่อ)
สรุป เนื่องจาก ดังนั้นปฏิเสธ ที่ระดับนัยสาคัญ 0.05 มี
หลักฐานแสดงว่า ค่าความต้านทานต่อการฉีกขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาว
อัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ
0 0.05,1,8( 26.78) ( 5.32)F f   0 1: 0H  
-23-
สมการถดถอยสามารถพยากรณ์ค่าของตัวแปรตาม (Y) ได้ดีมากยิ่งขึ้น
สมการถดถอยพยากรณ์ค่าของตัวแปรตาม (Y) ได้ไม่ดี
(เนื่องจากตัวแปรตามและตัวแปรอิสระมีความสัมพันธ์กันน้อย)
6. ค่าสัมประสิทธิ์การตัดสินใจ
สมการถดถอยที่ใช้ในการพยากรณ์นี้อาจพยากรณ์ค่าตัวแปรตาม (Y) ได้ดีหรือไม่ดีก็ได้ โดยที่ ค่าสัมประสิทธิ์การตัดสินใจ (Coefficient
of Determination; ) เป็นค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y ซึ่งค่าสัมประสิทธิ์การตัดสินใจนี้เป็น
ค่าที่ใช้บอกเปอร์เซ็นต์การเปลี่ยนแปลงของตัวแปรตาม (Y) ที่สามารถอธิบายได้ด้วยตัวแปรอิสระ (X) ในสมการถดถอย
2
R
2 2 1
1
ˆ
ˆ XX XY R
T T T
S S SS
R
SS SS SS

  
โดยที่ ค่า จะมีค่าอยู่ระหว่าง 0 ถึง 12
R
ค่าสัมประสิทธิ์การตัดสินใจ: 2
R
2
R
2
R
(14)
-24-
ตัวอย่าง
ตัวอย่างที่ 3 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้ คือ คานวณค่าสัมประสิทธิ์ของการตัดสินใจ
จากมูลในตัวอย่างที่ 2 ได้ค่าต่าง ๆ ดังนี้ และ
ˆ 7.218 2.812y x 
13.475RSS  17.501TSS 
2 13.475
0.77
17.501
R
T
SS
R
SS
  
สรุปได้ว่า ค่า หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษขึ้นอยู่กับเปอร์เซ็นต์
ของกาวอัดประมาณ 77% ส่วนอีก 23% จะขึ้นอยู่กับปัจจัยอื่น ๆ ที่ไม่ได้นามาศึกษาหรือสมการถดถอย
สามารถพยากรณ์ค่าค่าความต้านทานต่อการฉีกขาดของกระดาษได้ถูกต้อง 77%
2
0.77R 
ˆ 7.218 2.812y x 
-25-
7. สหสัมพันธ์
สมมติว่า การแจกแจงร่วมของ และ เป็นการแจกแจงแบบปกติของสองตัวแปรสุ่ม (Bivariatenormal distribution)
โดยมีค่าเฉลี่ยของตัวแปรคือ และ ความแปรปรวนของตัวแปรคือ และ และกาหนดให้ คือสัมประสิทธิ์
สหสัมพันธ์ระหว่างตัวแปร X และ Y ได้ว่า
iX iY
X Y 2
X 2
Y 
• สหสัมพันธ์เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรสุ่ม
• ใช้สาหรับการทดสอบความสัมพันธ์เชิงเส้นตรง
• สามารถระบุระดับความสัมพันธ์ได้ เช่น สูงกับน้าหนักว่ามีความสัมพันธ์กันมากหรือน้อย
• สามารถระบุทิศทางความสัมพันธ์ได้ เช่น สูงกับน้าหนักมีความสัมพันธ์ในทิศทางเดียวกันหรือตรงกันข้าม
• ตรวจสอบด้วยการใช้แผนภาพการกระจายและค่าสัมประสิทธิ์สหสัมพันธ์ (correlation coefficient)
การวิเคราะห์สหสัมพันธ์
XY
X Y


 

โดยที่ คือความแปรปรวนร่วมระหว่าง X และ YXY
-26-
7. สหสัมพันธ์ (ต่อ)
1
1 2 1 2
2 2
1 1
( )
ˆ
( SS )
( ) (Y )
n
i i
i XY
n n
XX T
i i
i i
Y X X
S
R
S
X X Y
 
 

  
 
  
 

 
โดยการประมาณของสัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Sample Correlation Coefficient: R)
1. ค่าของ R ไม่ได้ขึ้นอยู่กับการศึกษาภายใต้ตัวแปรสองตัว
2. ค่า R เป็นอิสระจากการตรวจวัดของ x และ y
3. ค่า R จะ มีค่าอยู่ในช่วง
4. R = 1 เมื่อ x มีค่ามาก y มีค่ามาก หรือเมื่อ x มีค่าน้อย y มีค่าน้อย (มีความสัมพันธ์เชิงเส้นเชิงบวก)
R = -1 เมื่อ x มีค่ามาก y มีค่าน้อย หรือเมื่อ x มีค่าน้อย y มีค่ามาก (มีความสัมพันธ์เชิงเส้นเชิงลบ)
5. ค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าค่าสัมประสิทธิ์การตัดสินใจ:
คุณสมบัติที่สาคัญที่สุดของ R คือ:
1 1R  
2
R
-27-
(15)
7. สหสัมพันธ์ (ต่อ)
รูปที่ 9 แผนภาพการกระจายของข้อมูลอธิบายค่า R
ซึ่งการตรวจสอบความสัมพันธ์ ทาการตรวจสอบโดย
แผนภาพกระจายข้อมูล รูปที่ 9 แสดงสถานการณ์ที่เป็นไปได้
สาหรับค่าของ R
•รูปที่ 9 (a) R>1 ความสัมพันธ์เชิงเส้น มีความชันเป็นบวก
•รูปที่ 9 (b) R<1 ความสัมพันธ์เชิงเส้น มีความชันเป็นลบ
•รูปที่ 9 (c) R=0 ไม่เป็นความสัมพันธ์เชิงเส้นโค้ง
•รูปที่ 9 (d) R=0 แสดงให้เห็นความสัมพันธ์ระหว่าง
x และ y ซึ่งเป็นความสัมพันธ์เชิงเส้นโค้ง
จะเห็นได้ว่า R=0 จะไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y
ดังนั้น การพิจารณาข้อมูลด้วยแผนภาพการกระจายจึงเป็นสิ่งที่
มีความสาคัญ
-28-
ตัวอย่าง
ตัวอย่างที่ 4 จงหาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์
กาวอัด จากข้อมูลในตัวอย่างที่ 1 และ2 ได้ค่าต่าง ๆ ดังนี้
1 2 1 2
4.792
ˆ 0.878
( SS ) (1.704 17.501)
XY
XX T
S
R
S
    

ดังนั้น ค่า R=0.878 นี้หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ของกาวอัด
มีความสัมพันธ์กันสูงประมาณ 87. 8% และเนื่องจากค่า R เป็นบวกจะแสดงว่ามีความสัมพันธ์กันในทิศทาง
เดียวกัน คือถ้าเปอร์เซ็นต์กาวอัดมีค่าสูงค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะสูงตามไปด้วยและ
ในทางตรงกันข้ามถ้าเปอร์เซ็นต์กาวอัดมีค่าต่าค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะต่าตามไปด้วย
4.792xyS  1.704xxS  17.501TSS 
-29-
สรุป
-30-
สหสัมพันธ์
(Correlation)
การถดถอยเชิงเส้นอย่างง่าย
(Simple linear regression)
จุดมุ่งหมาย การศึกษาความสัมพันธ์ระหว่างตัวแปรสุ่ม หาเส้นที่เหมาะสมที่สุดในการทานาย Y
ตัวแปร2ตัว ไม่คานึงถึงปัจจัยสาเหตุและผลกระทบ Xเป็นสาเหตุ และYให้เป็นผลกระทบ
ตรวจสอบ
ค่าสัมประสิทธิ์สหสัมพันธ์
(มีค่าอยู่ในช่วง -1 ถึง 1)
ค่าสัมประสิทธิ์การตัดสินใจ
(มีค่าอยู่ระหว่าง 0 ถึง 1)
8. ตัวอย่างงานวิจัย
Title: Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear Regression Model
Authors:Yan-ming YANG, Yue TENG and Rui-li ZHANG
1.วัตถุประสงค์ของการวิจัย
การพยากรณ์ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินเป็นสิ่งที่มีความสาคัญ และช่วย
ในการตัดสินใจการใช้ประโยชน์จากทรัพยากรที่มีอยู่เพื่อปรับปรุงความสามารถในการบารุงรักษา ใน
งานวิจัยนี้มุ่งเน้นไปที่ปัจจัยหลักที่มีอิทธิพลต่อการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน โดยใช้
แบบจาลองการทานายถดถอยเชิงเส้นของการใช้วัสดุในการบารุงรักษาอุปกรณ์ สร้างขึ้นโดยใช้ข้อมูล
ตัวอย่างที่เกิดขึ้นจริง บนพื้นฐานการวิเคราะห์จากตัวอย่าง วิธีการถดถอยเชิงเส้นอย่างง่ายใช้ในการ
ทานาย และการทดสอบการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน
-31-
8. ตัวอย่างงานวิจัย (ต่อ)
2.ขั้นตอนการวิจัย
2.1 เก็บสถิติข้อมูล
เก็บสถิติข้อมูลรายเดือนของชั่วโมงการบิน แสดงดังในตารางที่ 4 และข้อมูลของการใช้วัสดุในการ
บารุงรักษา แสดงดังในตารางที่ 5 ในปี ค.ศ. 2015-2016 เป็นเวลาสองปี สร้างแบบจาลองการถดถอยเชิงเส้นอย่าง
ง่าย เพื่อทานายปริมาณการใช้วัสดุในการบารุงรักษา
ตารางที่ 4 ชั่วโมงบินของเครื่องบิน ในปี ค.ศ. 2015-2016
ตารางที่ 5 ปริมาณการใช้วัสดุบารุงรักษาเครื่องบินในปี ค.ศ. 2015-2016
-32-
2.2 แบบจาลองการถดถอย
งานวิจัยนี้เลือกแบบจาลองการถดถอยเชิงเส้นอย่างง่ายที่อยู่บนพื้นฐานการประมาณความสัมพันธ์เชิงเส้น
ระหว่างตัวแปรอิสระ และตัวแปรตาม สร้างสมการเชิงเส้นเพื่อทานาย ตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย คือ
y a bx 
โดยกาหนดให้ y คือ ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน (ตัวแปรตาม)
x คือ ชั่วโมงบินของเครื่องบิน (ตัวแปรอิสระ)
a คือ จุดตัดแกนบน y (สัมประสิทธิ์การถดถอย)
b คือ ความชัน (สัมประสิทธิ์การถดถอย)
โดยการประมาณค่าสัมประสิทธิ์การถดถอย (a, b) และทาการทดสอบแบบจาลองการถดถอยโดยการทดสอบการ
ประมาณค่าความแปรปรวน และการทดสอบสัมประสิทธิ์สหสัมพันธ์โดยใช้ระดับนัยสาคัญ 0.05 ในการตรวจสอบ
8. ตัวอย่างงานวิจัย (ต่อ)
-33-
8. ตัวอย่างงานวิจัย (ต่อ)
3. ผลการวิจัย ใช้ซอฟต์แวร์ Minitab ในการวิเคราะห์การถดถอย แสดงดังรูปที่ 10 สมการถดถอยเชิงเส้นอย่างง่ายที่
ได้คือ 4.173 0.09901y x 
รูปที่ 10 พล็อตเส้นถดถอยของสายชั่วโมงของเครื่องบิน และปริมาณการใช้วัสดุในการบารุงรักษาหลัก
-34-
8. ตัวอย่างงานวิจัย (ต่อ)
3.1 การทดสอบนัยสาคัญของสมการถดถอย การวิเคราะห์ผลในตาราง ANOVA ตารางที่ 5 การวิเคราะห์ผล
ในตาราง ANOVA กาหนดระดับนัยสาคัญที่ 0.05 หรือที่ระดับความเชื่อมั่น 95 % โดยในงานวิจัยนี้ได้ใช้โปรแกรม
Mimitab ช่วยในการวิเคราะห์ จึงใช้ค่า P-value เป็นตัวช่วยในการตัดสินใจ เพราะค่า P-value คือระดับนัยสาคัญที่
น้อยที่สุดหรือโอกาสที่น้อยที่สุดที่จะสามารถปฎิเสธสมมติฐานหลัก จะเห็นได้ว่าค่า เนื่องจาก
ดังนั้น ปัจจัยอื่นๆ ไม่มีผลกระทบต่อปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน อย่างมี
นัยสาคัญ สมการการถดถอยโดยรวมจึงมีประสิทธิภาพอย่างมาก
ตารางที่ 5 การวิเคราะห์ความแปรปรวน
0.000P 
( 0.05) ( 0.00)P   
-35-
8. ตัวอย่างงานวิจัย (ต่อ)
3.2 การวัดของผลรวมของผลกระทบสมการการถดถอย ตารางที่ 6 R-Sq คือ 91.24% แสดงให้เห็นว่า ปริมาณ
การใช้วัสดุในการบารุงรักษาเครื่องบินขึ้นอยู่กับชั่วโมงการบิน ประมาณ 91.24% ส่วนอีก 8.76% จะขึ้นอยู่กับปัจจัย
อื่น ๆ ดังนั้นเส้นถดถอยสามารถอธิบายความสัมพันธ์เชิงเส้นได้ 91.24% สามารถพยากรณ์การใช้วัสดุในการ
บารุงรักษาเครื่องบิน (y) ได้ถูกต้อง 91.24% ดังนั้นการตัวแบบถดถอยที่ได้ จึงให้ผลที่ดี
ตารางที่ 6 สรุปผลของแบบจาลองถดถอย
-36-
8. ตัวอย่างงานวิจัย (ต่อ)
สมมติฐาน
0 1: 0H   1 1: 0H  (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) 0.05 
3.3 การทดสอบนัยสาคัญของสัมประสิทธิ์การถดถอย ตารางที่ 7 แสดงให้เห็นว่า สัมประสิทธิ์ชั่วโมงบินของ
เครื่องบิน (ตัวแปรอิสระ x) โดยเกณฑ์ในการปฏิเสธสมมติฐานหลัก โดยใช้ค่าพี คือ จะปฎิเสธ เมื่อระดับ
นัยสาคัญมากกว่าเท่ากับค่าพี P Value  
0H
ตารางที่ 7 สัมประสิทธิ์
ในตารางที่ 7 จะเห็นได้ว่า เนื่องจาก ดังนั้นปฏิเสธ แสดงว่า
ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบินมีความสัมพันธ์เชิงเส้นกับชั่วโมงบินของเครื่องบิน ซึ่งบ่งชี้ว่าชั่วโมงบิน
ของเครื่องบินเป็นปัจจัยที่มีนัยสาคัญ
0.000P  ( 0.05) ( 0.00)P    0 1: 0H  
4.173 0.09901y x 
-37-
8. ตัวอย่างงานวิจัย (ต่อ)
3.4 การวิเคราะห์เรสซิดวล เพื่อตรวจสอบความเหมาะสมของตัวแบบถดถอยและANOVA การตรวจสอบพล็อตจะช่วยให้
ทราบว่า ข้อสมมติกาลังสองน้อยที่สุดเป็นไปตามเงื่อนไขหรือไม่ หากสมมติฐานเป็นไปตามเงื่อนไข จากนั้นการถดถอยกาลัง
สองน้อยสุด จะประมาณค่าสัมประสิทธิ์ที่ไม่เอนเอียงที่มีความแปรปรวนน้อยที่สุด ใช้ Minitab พล็อตเรสซิดวล (ดังแสดงในรูป
ที่ 11)
รูปที่ 11 พล็อตเรสซิดวลของชั่วโมงบินเครื่องบินและการใช้วัสดุในการบารุงรักษาหลัก -38-
• เรสซิดวลแปรผันแบบสุ่ม และเป็นอิสระจากกัน
• รูปที่ 11 (ขวา) เรสซิดวลมีความแปรปรวนคงที่
• รูปที่ 11 (ซ้าย) เรสซิดวลมีการแจกแจงแบบปกติ
8. ตัวอย่างงานวิจัย (ต่อ)
4. สรุปผลการวิจัย
ดังนั้นงานวิจัยนี้ได้นาวิธีการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย ในการพยากรณ์ของปริมาณการใช้วัสดุใน
การบารุงรักษาอุปกรณ์การบิน พบว่า ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินกับชั่วการบินของ
เครื่องบินมีความสัมพันธ์เชิงเส้นกันที่ระดับความเชื่อมั่น 95 % และสามารถนาสมการถดถอยที่ได้ไปพยากรณ์การ
ใช้วัสดุในการบารุงรักษาเครื่องบินได้ถูกต้อง 91.24% คาดคะเนได้อย่างที่มีประสิทธิภาพ
-39-
1. Mendenhall, W. M., & Sincich, T. L. (2016). Statistics for Engineering and the Sciences. Chapman and
Hall/CRC.
2. Montgomery, D. C., & Runger, G. C. (2014). Applied statistics and probability for engineers. John Wiley
and Sons.
3. Devore, J. L. (2011). Probability and Statistics for Engineering and the Sciences. Cengage learning.
4. Ott, R. L., & Longnecker, M. T. (2015). An introduction to statistical methods and data analysis. Nelson
Education.
5. Yang, Y. M., Yue, T. E. N. G., & Zhang, R. L. (2018). Prediction of Maintenance Material Consumption
for Aviation Equipment Using Linear Regression Model. DEStech Transactions on Computer Science
and Engineering, (mso).
อ้างอิง
Thank You
1 de 41

Recomendados

Simple linear regression and correlation por
Simple linear regression and correlationSimple linear regression and correlation
Simple linear regression and correlationPhim Phimmat
273 vistas30 diapositivas
พื้นที่ใต้เส้นโค้งปกติม.6 por
พื้นที่ใต้เส้นโค้งปกติม.6พื้นที่ใต้เส้นโค้งปกติม.6
พื้นที่ใต้เส้นโค้งปกติม.6KruGift Girlz
91.5K vistas15 diapositivas
การแก้อสมการ por
การแก้อสมการการแก้อสมการ
การแก้อสมการAon Narinchoti
172.6K vistas5 diapositivas
ค่ากลางของข้อมูลม.6 por
ค่ากลางของข้อมูลม.6ค่ากลางของข้อมูลม.6
ค่ากลางของข้อมูลม.6KruGift Girlz
17.3K vistas14 diapositivas
ใบความรู้ เรื่องตรีโกณมิติ por
ใบความรู้ เรื่องตรีโกณมิติใบความรู้ เรื่องตรีโกณมิติ
ใบความรู้ เรื่องตรีโกณมิติnative
9.5K vistas8 diapositivas

Más contenido relacionado

La actualidad más candente

เฉลยค่ากลางของข้อมูล por
เฉลยค่ากลางของข้อมูลเฉลยค่ากลางของข้อมูล
เฉลยค่ากลางของข้อมูลkrurutsamee
180K vistas27 diapositivas
ชุดกิจกรรมการเรียนรู้แบบเพื่อนคู่คิด เล่มที่ 1 การเปรียบเทียบเศษส่วน por
ชุดกิจกรรมการเรียนรู้แบบเพื่อนคู่คิด เล่มที่ 1 การเปรียบเทียบเศษส่วนชุดกิจกรรมการเรียนรู้แบบเพื่อนคู่คิด เล่มที่ 1 การเปรียบเทียบเศษส่วน
ชุดกิจกรรมการเรียนรู้แบบเพื่อนคู่คิด เล่มที่ 1 การเปรียบเทียบเศษส่วนKanlayaratKotaboot
2.2K vistas20 diapositivas
เอกสารประกอบการเรียนการสอน por
เอกสารประกอบการเรียนการสอนเอกสารประกอบการเรียนการสอน
เอกสารประกอบการเรียนการสอนรัชดาภรณ์ เขียวมณี
21.8K vistas39 diapositivas
โจทย์ปัญหาค่าเฉลี่ยเลขคณิต por
โจทย์ปัญหาค่าเฉลี่ยเลขคณิตโจทย์ปัญหาค่าเฉลี่ยเลขคณิต
โจทย์ปัญหาค่าเฉลี่ยเลขคณิตKuntoonbut Wissanu
104.7K vistas4 diapositivas
202 por
202202
202สัมพันธ์ ชอบนา
4.3K vistas35 diapositivas
ใบงานเลขยกกำลังม.5 por
ใบงานเลขยกกำลังม.5ใบงานเลขยกกำลังม.5
ใบงานเลขยกกำลังม.5ลัดดา ครูคณิตฯ
38.9K vistas44 diapositivas

La actualidad más candente(20)

เฉลยค่ากลางของข้อมูล por krurutsamee
เฉลยค่ากลางของข้อมูลเฉลยค่ากลางของข้อมูล
เฉลยค่ากลางของข้อมูล
krurutsamee180K vistas
ชุดกิจกรรมการเรียนรู้แบบเพื่อนคู่คิด เล่มที่ 1 การเปรียบเทียบเศษส่วน por KanlayaratKotaboot
ชุดกิจกรรมการเรียนรู้แบบเพื่อนคู่คิด เล่มที่ 1 การเปรียบเทียบเศษส่วนชุดกิจกรรมการเรียนรู้แบบเพื่อนคู่คิด เล่มที่ 1 การเปรียบเทียบเศษส่วน
ชุดกิจกรรมการเรียนรู้แบบเพื่อนคู่คิด เล่มที่ 1 การเปรียบเทียบเศษส่วน
KanlayaratKotaboot2.2K vistas
โจทย์ปัญหาค่าเฉลี่ยเลขคณิต por Kuntoonbut Wissanu
โจทย์ปัญหาค่าเฉลี่ยเลขคณิตโจทย์ปัญหาค่าเฉลี่ยเลขคณิต
โจทย์ปัญหาค่าเฉลี่ยเลขคณิต
Kuntoonbut Wissanu104.7K vistas
อนุกรมเรขาคณิต por aoynattaya
อนุกรมเรขาคณิตอนุกรมเรขาคณิต
อนุกรมเรขาคณิต
aoynattaya60.5K vistas
การวิเคราะห์ข้อมูลเชิงปริมาณ por tanongsak
การวิเคราะห์ข้อมูลเชิงปริมาณการวิเคราะห์ข้อมูลเชิงปริมาณ
การวิเคราะห์ข้อมูลเชิงปริมาณ
tanongsak60.1K vistas
แบบฝึกทักษะคณิตศาสตร์เรื่องการบวกและการลบพหุนาม por วชิรญาณ์ พูลศรี
แบบฝึกทักษะคณิตศาสตร์เรื่องการบวกและการลบพหุนามแบบฝึกทักษะคณิตศาสตร์เรื่องการบวกและการลบพหุนาม
แบบฝึกทักษะคณิตศาสตร์เรื่องการบวกและการลบพหุนาม
การพิมพ์ข้อสอบให้สวยงาม ดูดีแบบมืออาชีพ por NoTe Tumrong
การพิมพ์ข้อสอบให้สวยงาม ดูดีแบบมืออาชีพการพิมพ์ข้อสอบให้สวยงาม ดูดีแบบมืออาชีพ
การพิมพ์ข้อสอบให้สวยงาม ดูดีแบบมืออาชีพ
NoTe Tumrong12.6K vistas
การแก้ปัญหา por Jintana Kujapan
การแก้ปัญหาการแก้ปัญหา
การแก้ปัญหา
Jintana Kujapan14.3K vistas
ความรู้เบื้องต้นเกี่ยวกับจำนวนจริง por Ritthinarongron School
ความรู้เบื้องต้นเกี่ยวกับจำนวนจริงความรู้เบื้องต้นเกี่ยวกับจำนวนจริง
ความรู้เบื้องต้นเกี่ยวกับจำนวนจริง
Ritthinarongron School33.5K vistas
46497232 ความรู้เบื้องต้นเกี่ยวกับเรขาคณิตวิเคราะห์ por Krudodo Banjetjet
46497232 ความรู้เบื้องต้นเกี่ยวกับเรขาคณิตวิเคราะห์46497232 ความรู้เบื้องต้นเกี่ยวกับเรขาคณิตวิเคราะห์
46497232 ความรู้เบื้องต้นเกี่ยวกับเรขาคณิตวิเคราะห์
Krudodo Banjetjet6.9K vistas
โดเมนและเรนจ์ por Y'Yuyee Raksaya
โดเมนและเรนจ์โดเมนและเรนจ์
โดเมนและเรนจ์
Y'Yuyee Raksaya2.4K vistas
Sequence and series 03 por manrak
Sequence and series 03Sequence and series 03
Sequence and series 03
manrak15.9K vistas
หน่วยที่1อัตราส่วนสัดส่วนและร้อยละ por fern1707
หน่วยที่1อัตราส่วนสัดส่วนและร้อยละหน่วยที่1อัตราส่วนสัดส่วนและร้อยละ
หน่วยที่1อัตราส่วนสัดส่วนและร้อยละ
fern1707329K vistas

Similar a Simple linear regression and correlation

4339 por
43394339
4339นัท นอย
1.2K vistas5 diapositivas
คำตอบของระบบสมการเชิงเส้น por
คำตอบของระบบสมการเชิงเส้นคำตอบของระบบสมการเชิงเส้น
คำตอบของระบบสมการเชิงเส้นChokchai Puatanachokchai
1.9K vistas43 diapositivas
พื้นที่ใต้โค้ง por
พื้นที่ใต้โค้งพื้นที่ใต้โค้ง
พื้นที่ใต้โค้งkrurutsamee
137.1K vistas33 diapositivas
บทที่10.pdf por
บทที่10.pdfบทที่10.pdf
บทที่10.pdfsewahec743
44 vistas21 diapositivas
Pre 7-วิชา 3 por
Pre  7-วิชา 3Pre  7-วิชา 3
Pre 7-วิชา 3Wanutchai Janplung
309 vistas8 diapositivas
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น por
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้นการคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้นChokchai Puatanachokchai
1.3K vistas50 diapositivas

Similar a Simple linear regression and correlation(20)

คำตอบของระบบสมการเชิงเส้น por Chokchai Puatanachokchai
คำตอบของระบบสมการเชิงเส้นคำตอบของระบบสมการเชิงเส้น
คำตอบของระบบสมการเชิงเส้น
พื้นที่ใต้โค้ง por krurutsamee
พื้นที่ใต้โค้งพื้นที่ใต้โค้ง
พื้นที่ใต้โค้ง
krurutsamee137.1K vistas
บทที่10.pdf por sewahec743
บทที่10.pdfบทที่10.pdf
บทที่10.pdf
sewahec74344 vistas
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น por Chokchai Puatanachokchai
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้นการคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น
สรุปเนื้อหา O- net ม.6 por sensehaza
สรุปเนื้อหา O- net ม.6 สรุปเนื้อหา O- net ม.6
สรุปเนื้อหา O- net ม.6
sensehaza47K vistas
Pre 7 วิชา ครั้งที่ 1 por Wanutchai Janplung
Pre  7 วิชา ครั้งที่ 1Pre  7 วิชา ครั้งที่ 1
Pre 7 วิชา ครั้งที่ 1
Wanutchai Janplung246 vistas
สรุปตรีโกณมิติ por Thphmo
สรุปตรีโกณมิติสรุปตรีโกณมิติ
สรุปตรีโกณมิติ
Thphmo78.7K vistas
คณิตศาสตร์ม.34 por krookay2012
คณิตศาสตร์ม.34คณิตศาสตร์ม.34
คณิตศาสตร์ม.34
krookay20121.2K vistas
กฎของเลขยกกำลัง por Niwat Namisa
กฎของเลขยกกำลังกฎของเลขยกกำลัง
กฎของเลขยกกำลัง
Niwat Namisa7.5K vistas
ตัวกำหนด(Determinant) por kroojaja
ตัวกำหนด(Determinant)ตัวกำหนด(Determinant)
ตัวกำหนด(Determinant)
kroojaja200 vistas
Ch3 high order_od_es por Wk Kal
Ch3 high order_od_esCh3 high order_od_es
Ch3 high order_od_es
Wk Kal2.2K vistas
ข้อสอบ O net คณิต ม.3 ชุด 2 por Manas Panjai
ข้อสอบ O net คณิต ม.3 ชุด 2ข้อสอบ O net คณิต ม.3 ชุด 2
ข้อสอบ O net คณิต ม.3 ชุด 2
Manas Panjai2.9K vistas
ว เคราะห แบบทดสอบ 5 ข_อ por 4821010054
ว เคราะห แบบทดสอบ 5 ข_อว เคราะห แบบทดสอบ 5 ข_อ
ว เคราะห แบบทดสอบ 5 ข_อ
4821010054611 vistas

Simple linear regression and correlation

  • 3. การวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย (Simple linear regression analysis) 1. บทนา ตัวแปรอิสระ (Independent variable: x) และตัวแปรตาม (Dependent variable: y) การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรสองตัว หรือมากกว่า -3- วิเคราะห์สหสัมพันธ์ (Correlation analysis) การวิเคราะห์ว่าตัวแปร 2 ตัวแปรใด ๆ มีความสัมพันธ์หรือไม่นั้น สามารถใช้วิธีการด้านสถิติ การวิเคราะห์ความถดถอย (Regression analysis) หาก 2 ตัวแปรมีความสัมพันธ์กัน พบว่าตัวแปร x มีผลต่อตัวแปร y หากศึกษาวิธีการนาตัวแปร x ใช้คาดคะเนผลที่อาจจะเกิดขึ้นได้ของตัวแปร y ด้วยวิธีการทางสถิติ การวิเคราะห์การถดถอยเชิงเส้น (Linear regression analysis) หากตัวแปรต่าง ๆ มีความสัมพันธ์กันในเชิงเส้นตรงจะ เรียกว่า
  • 4. 2. การถดถอยเชิงเส้นอย่างง่าย รูปที่ 1 แผนภาพการกระจายของการอัด(y) กับแรงดัน(x) ตัวอย่าง ในการพัฒนาวัสดุแผ่นฉนวนชนิดใหม่ ต้องการคาดคะเนการอัด (y: หน่วยเป็น 0.1 นิ้ว) ของแผ่นฉนวนหนา 2 นิ้ว ภายใต้แรงดัน (x: หน่วย เป็น 10 ปอนด์/ตารางนิ้ว) ในระดับต่างๆ โดยทาการทดสอบชิ้นงาน 5 ชิ้น ชิ้นงาน (Specimen) ความดัน (Pressure) การอัด (Compression) 1 1 1 2 2 1 3 3 2 4 4 2 5 5 4 ตารางที่ 1 ข้อมูลการทดสอบวัสดุแผ่นฉนวน การศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระ (x) และตัว แปรตาม (y) โดยจะศึกษาตัวแปรอิสระเพียงตัวเดียวที่มีผล ต่อตัวแปรตาม ใช้แผนภาพการกระจาย ในการวิเคราะห์ความสัมพันธ์ ความสัมพันธ์ของ 2 แปร และบนแผนภาพการกระจาย แรงดัน (ตัวแปรอิสระ: x) การอัด (ตัวแปรตาม: y) -4-
  • 5. 2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ) ตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย (Simple linear regression model) โดย ตัวแบบแสดงดังสมการ 0 1y x     y x = ตัวแปรตาม (Dependent variable) = ตัวแปรอิสระ (Independentvariable) = ค่าความคลาดเคลื่อนสุ่ม (Random error) = จุดตัดแกนบน y (y-intercept) = ความชัน (Slope)  0 1 และ เป็นค่าพารามิเตอร์ที่ไม่ทราบค่า เรียกว่า สัมประสิทธิ์การถดถอย (Regression coefficient) 0 1เมื่อ -5-
  • 6. 04 ความคลาดเคลื่อนกระจายตัวแบบอิสระ ปราศจากอิทธิพลใดๆ 2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ) สมมติฐานเฉพาะเกี่ยวกับความคลาดเคลื่อน: ( ) 01 การแจกแจงความน่าจะเป็นค่าเฉลี่ยของความ คลาดเคลื่อนเท่ากับศูนย์นั้นคือ ค่าเฉลี่ยของ ความคลาดเคลื่อนเท่ากับศูนย์ ( ) 0E   02 ความแปรปรวนการแจกแจงความน่าจะเป็น คลาดเคลื่อนของตัวแปรอิสระ (x) นั้นมีค่าคงที่ ทั้งหมด หมายความว่าความแปรปรวนของความ คลาดเคลื่อนสุ่มมีค่าคงที่เท่ากับ 2 ( )V   2  03 ค่าความคลาดเคลื่อน มีการแจกแจงความ น่าจะแบบปกติ ~ N -6-
  • 7. 2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ) รูปที่ 2 เส้นสมมติของ 0 1(y)E x   เมื่อ x เพิ่มขึ้น 1 หน่วย y จะเปลี่ยนไป หน่วย1 ซึ่งในความเป็นจริงค่า , และ ไม่สามารถระบุค่าได้จึงต้องทาการประมาณ จากข้อมูลตัวอย่าง 1 0 2  0 1(y)E x   เมื่อ ค่าเฉลี่ยของเส้นถดถอย อยู่ในรูป ( ) 0E   -7-
  • 8. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด รูปที่ 3 แผนภาพการเบี่ยงเบนจุดของข้อมูลกับเส้นถดถอย 3.1 การประมาณค่าจุดตัด และความชัน ( และ )0 1 เส้นที่เหมาะสม (Best-fitting line) ประมาณค่า ( และ ) วิธีกาลังสองน้อยที่สุด (Method of least squares) 0 1 ค่าผลรวมของผลต่าง ระหว่าง ค่าของข้อมูลจริงกับเส้นสมมติ มีค่าน้อยที่สุด -8-
  • 9. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ) 2 2 0 1 1 1 ( ) n n i i i i i L y x          ค่าความคลาดเคลื่อน นั้นสามารถเป็นได้ทั้งค่าบวกและค่า ลบ จึงต้องทาให้อยู่ในรูปผลรวมกาลังสองของความ คลาดเคลื่อน (Sum of squaresfor error: L ) 0 1 0 1 1ˆ ˆ0 , ˆ ˆ2 ( ) 0 n i i i L y x               0 1 0 1 1ˆ ˆ1 , ˆ ˆ2 ( ) 0 n i i i i L y x x               การประมาณค่า และ เขียนแทนด้วย และ โดยวิธีกาลังสองน้อยที่สุด ด้วยการหาค่าอนุพันธ์เชิงส่วน เทียบกับ และ แล้วกาหนดให้สมการเท่ากับศูนย์ 0 1 1 ˆ0 ˆ 0 1 สามารถคานวณหาค่าจุดตัดแกนและความชัน ได้ดังนี้ 0 1 ˆ ˆy x   (1) 1 1 1 1 2 2 1 1 ˆ n n i in i i i i i n in i i i y x y x n x x n                            (2) 0 1 1 1 ˆ ˆ n n i i i i n x y       2 0 1 1 1 1 ˆ ˆ n n n i i i i i i i x x y x         เมื่อจัดรูปสมการทั้งสองใหม่จะได้รูปสมการปกติ คือ -9-
  • 10. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ) ดังนั้น เส้นประมาณการถดถอยที่เหมาะสม คือจากสมการหาความชัน นาแสดงใหม่โดยใช้ สัญลักษณ์แทนได้ดังนี้ 1 ˆ( ) 2 12 2 1 1 ( ) n in n i xx i i i i i x S x x x n                1 1 1 1 ( )( ) n n i in n i i xy i i i i i i x y S y y x x x y n                      1 ˆ xy xx S S   (3) 0 1 ˆ ˆˆ iy x   (4) สาหรับ แต่ละคู่ลาดับของข้อมูล(x, y) ที่ได้จากการ สังเกตจริง แสดงดังสมการต่อไปนี้ 0 1 ˆ ˆˆi i iy x e    i = 1,2,…,n โดยที่ เรียกว่า ค่าเรสซิดวล (Residual) หรือค่าความคลาดเคลื่อน ˆi ie y y  -10-
  • 11. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ) 3.2 การประมาณค่าความแปรปรวน: 2  รูปที่ 4 ตัวอย่างความแปรปรวนของข้อมูล การประมาณค่าความแปรปรวนโดยที่เรสซิดวล ถูกใช้เพื่อให้ได้ค่าประมาณ ซึ่งค่าเรสซิดวลจะมีค่าเป็นไปได้ทั้งบวกและลบ จึงต้องกาหนดค่าให้อยู่ในรูปของ ผลรวมกาลังสองของเรสซิดวล (Error sum of squares: ) 2 1 n E i i SS e    2 1 ˆ( ) n i i y y    โดยองศาอิสระ (Degrees of freedom) คือ ค่าเฉลี่ยของผลรวมกาลังสองของเรสซิดวล คือ 2 ˆ( ) ( 2)EE SS n   ดังนั้น ค่าประมาณความแปรปรวนของเรสซิดวลที่ไม่เอนเอียง คือ ESS 2  2n  2 2 ˆ 2 E E SS MS S n      (5) 2 ˆ 2 ˆ สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมน้อย สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมมาก -11-
  • 12. ตัวอย่าง ตัวอย่างที่ 1 โรงงานผลิตกระดาษเพื่อใช้ทากล่องบรรจุชิ้นงานด้านอุตสาหกรรม ทาการศึกษาข้อมูลระหว่าง ค่าความต้านทานต่อการ ฉีกขาดของกระดาษ (y: หน่วยเป็น 10 นิวตัน/ตารางมิลลิเมตร) กับเปอร์เซ็นต์ของกาวอัด (x) ที่ใช้เป็นส่วนผสมในการผลิตกระดาษ โดยสุ่มเก็บรวบรวมข้อมูล มา 10 ตัวอย่างดังนี้คือ ตัวอย่างที่ 1 2 3 4 5 6 7 8 9 10 x 1.6 1.5 1.5 1.4 2.0 2.0 2.2 2.4 2.5 2.5 y 10.1 11.7 11.7 11.5 13.1 13.2 14.2 14.0 13.7 14.1 จากข้อมูลข้างต้น หากต้องการทราบความสัมพันธ์ระหว่างกับเปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิต กระดาษ กับความต้านทานต่อการฉีกขาดของกระดาษ จะทาการพิจารณาตัวแบบเชิงเส้นอย่างง่ายดังต่อไปนี้ 0 1y x     โดยที่ x = เปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ (ตัวแปรอิสระ) y = ค่าความต้านทานต่อการฉีกขาดของกระดาษ (ตัวแปรตาม) -12-
  • 13. ตัวอย่าง (ต่อ) รูปที่ 5 แผนภาพการกระจายของค่าความต้านทานต่อการฉีกขาดของกระดาษ(y) กับเปอร์เซ็นต์กาวอัด (x) เมื่อ x มีค่าสูงขึ้น y จะมีค่าสูงขึ้นด้วย การใช้ค่าของข้อมูลวิเคราะห์ความสัมพันธ์ของตัวแปรต้นและตัว แปรตาม ซึ่งมีข้อมูลดังต่อไปนี้ 10n  10 1 19.60i i x   10 1 127.30i i y   10 1 254.30i i i y x   10 2 1 40.12i i x   10 2 1 1638.03 i y   1.96x 12.73y  คานวณค่าสัมประสิทธิ์ของสมการถดถอยเชิงเส้นอย่างง่าย   210 2 10 12 1 19.60 40.12 1.704 10 i i xx i i x S x n                  10 10 10 1 1 1 19.60 127.30 254.3 4.7 10 0 92 i i i i xy i i i x y S x y n                    ค่าความชัน และค่าจุดตัด 1 4.792ˆ 2.812 1.704 xy xx S S     0 1 ˆ ˆ 12.73 (2.812 1.96) 7.218y x       -13-
  • 14. ตัวอย่าง (ต่อ) รูปที่ 6 พล็อตของสมการถดถอยเชิงเส้นของตัวอย่างที่ 1 จากสมการถดถอยที่ได้อธิบายได้ว่า เมื่อ จะได้ หมายความว่าถ้าไม่มี อิทธิพลของกาวอัดเลย ค่าความต้านทานต่อการฉีกขาด ของกระดาษจะเท่ากับ 72. 18 นิวตันต่อตารางมิลลิเมตร (เนื่องจากหน่วยของค่าความต้านทานในตัวอย่างที่ 1 เท่ากับ 10 นิวตันต่อตารางมิลลิเมตร ดังนั้น ˆ 7.218 2.812y x  ดังนั้น สมการถดถอยเชิงเส้นอย่างง่ายที่ประมาณได้ 0x  ˆ 7.218 2.812(0) 7.218y    7.218 10 72.18  -14-
  • 15. ตัวอย่าง (ต่อ) ตัวอย่างที่ x y 1 1.60 10.10 11.72 -1.62 2.62 2 1.50 11.70 11.44 0.26 0.07 3 1.50 11.70 11.44 0.26 0.07 4 1.40 11.50 11.16 0.34 0.12 5 2.00 13.10 12.84 0.26 0.07 6 2.00 13.20 12.84 0.36 0.13 7 2.20 14.20 13.40 0.80 0.63 8 2.40 14.00 13.97 0.03 0.00 9 2.50 13.70 14.25 -0.55 0.30 10 2.50 14.10 14.25 -0.15 0.02 ผลรวม 19.60 127.30 127.30 0.00 4.02 ieˆiy 2 ie ตารางที่ 2 ข้อมูลความคลาดเคลื่อนที่เกิดขึ้นจากตัวแบบและค่าสังเกตจากตัวอย่าง ค่าความต้านทานต่อการฉีกขาดของกระดาษ แสดงดังนี้ ค่าประมาณความแปรปรวนของเรสซิดวล 2 2 2 1 (4.02) ˆ 0.503 2 10 2 n i i e n         สามารถคานวณได้ดังนี้ -15-
  • 16. ดังนั้น และ คือค่าประมาณที่ไม่เอนเอียงในตัวแบบการถดถอยเชิงเส้น 4. คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด ( ) 0E   2 ( )V   คุณสมบัติทางสถิติของค่าประมาณพารามิเตอร์ และ ของตัวแบบความสัมพันธ์เชิงเส้นด้วยวิธีกาลังสองน้อยที่สุด อธิบายได้ จากข้อสมมติฐานของความคลาดเคลื่อน 0 1  1 1 ˆE   ค่าเฉลี่ยของความชันและจุดตัด คือ ค่าความแปรปรวนความชันและจุดตัด คือ   2 1 ˆ xx V S     0 0 ˆE     2 2 0 1ˆ xx x V n S          ประมาณการความแปรปรวนของความชันและ จุดตัด ผลจากการคานวณหารากที่สองของความแปรปรวน เรียกว่า ความคลาดเคลื่อนมาตรฐานโดยประมาณ (Estimated standard error) ของความชันและจุดตัด หาได้จาก โดยที่ค่าความคลาดเคลื่อนมาตรฐานโดยประมาณเป็นค่าที่ ใช้ในการวัดความถูกต้องแม่นยาของการประมาณค่าสัมประสิทธิ์ ตัวแบบความสัมพันธ์ด้วยวิธีกาลังสองน้อยที่สุด นั่นคือค่าความ คลาดเคลื่อนยิ่งน้อยยิ่งดีนั่นเอง1 ˆ 0 ˆ   2 1 ˆˆ xx se S    (6)   2 2 0 1ˆ ˆ xx x se n S    (7) -16-
  • 17. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น 5.1 การทดสอบสมมติฐานโดยการใช้ t-Test การทดสอบสมมติฐานว่าความชัน เท่ากับค่าคงที่ สมมติฐานคือ โดยที่ ตัวสถิติทดสอบความชัน ใช้การทดสอบแบบที 0 1 1,0:H   1 1 1,0:H   ซึ่งการแจกแจงแบบทีด้วยองศาอิสระ จะปฏิเสธสมมติฐานหลัก เมื่อ 0 2, 2nt t  2n การวิเคราะห์ความเหมาะสมของตัวแบบถดถอยเชิงเส้นต้องทาการทดสอบสมมติฐานทางสถิติของค่าความชันและจุดตัดก่อนนาไปใช้ โดยมีข้อสมมติฐานคือ ความคลาดเคลื่อนกระจายตัวแบบอิสระ, , และ~ N ( ) 0E   2 ( )V   -17-   1 1,0 1 1,0 0 2 1 ˆ ˆ ˆˆ xx T seS          (8) 0 2, 2nt t  การทดสอบสมมติฐานของจุดตัด ปฏิเสธสมมติฐานหลักเมื่อ   0 0,0 0 0,0 0 2 02 ˆ ˆ ˆ1 ˆ xx T sex n S                 (9)
  • 18. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ) 5.1 การทดสอบสมมติฐานโดยการใช้ t-Test 0 1: 0H   1 1: 0H   โดยการทดสอบสมมติฐานนั้นมีความสาคัญ เนื่องเป็นการทดสอบเพื่อศึกษานัยสาคัญของความสัมพันธ์มีสมมติฐานคือ (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) รูปที่ 7 ไม่ปฏิเสธสมมติฐานหลัก (ไม่มีความสัมพันธ์ระหว่าง x และ y)0 1: 0H   รูปที่ 8 ปฏิเสธสมมติฐานหลัก (มีความสัมพันธ์ระหว่าง x และ y) ค่าแปรปรวนน้อย ค่าแปรปรวนของข้อมูลมาก 0 1: 0H   ดังนั้น การปฏิเสธสมมติฐานหลัก อาจหมายถึงว่ารูปแบบความสัมพันธ์เชิงตรงนั้นมีความเหมาะสม ดังรูปที่ 8 (a) -18-
  • 19. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ) 5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน เป็นการวิเคราะห์ความแปรปรวนที่ใช้เพื่อทดสอบนัยสาคัญของการ ถดถอย ซึ่งการวิเคราะห์ความแปรปรวนมีดังนี้ 2 2 2 1 1 1 ˆ ˆ( ) ( ) ( ) n n n i i i i i i i y y y y y y           2 1 ˆ( ) n R i i SS y y    2 1 ˆ( ) n E i i i SS y y    ผลรวมกาลังสองของความคลาดเคลื่อนจากการถดถอย (Regression sum of squares) ผลรวมกาลังสองของความคลาดเคลื่อน (Error sum of squares) เขียนสมการใหม่ได้ว่า โดยที่ 2 1 ( ) n T i i SS y y    2 12 1 n in i i i y y n            -19- T R ESS SS SS  (10) 1 ˆ R xySS S (11) E T RSS SS SS  (12)
  • 20. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ) 5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน ตัวสถิติที่ใช้ในการทดสอบ คือ 0 1 ( 2) R R E E SS MS F SS n MS    ซึ่งการแจกแจงแบบเอฟ ด้วยองศาอิสระ จะปฏิเสธสมมติฐานหลัก ถ้า พบว่าค่าสถิติเอฟ ที่ได้จากการคานวณมากกว่าค่าที่เกิดจากการเปิดตารางเอฟ 2n 0 ,1, 2nF f  แหล่งที่มา (Source of variation) ผลบวกกาลังสอง (Sum of Squares) องศาอิสระ (Degrees of Freedom) ค่าเฉลี่ย (Mean Square) ค่าสถิติ 0( )F ตัวแบบ (Regression) RSS 1 RMS 0 R EF MS MS ค่าความคลาดเคลื่อน (Error) ESS 2n  EMS ทั้งหมด (Total) TSS 1n  ตารางที่ 3 การวิเคราะห์ความแปรปรวนของการทดสอบนัยสาคัญการถดถอย -20- (13)
  • 21. ตัวอย่าง ตัวอย่างที่ 2 จากตัวอย่างที่ 1 ทดสอบสมมติฐานว่าความสัมพันธ์ของความต้านทานต่อการฉีกขาดของกระดาษกับเปอร์เซ็นต์ของกาวอัดที่ใช้ เป็นส่วนผสมในการผลิตกระดาษเป็นแบบเชิงเส้นที่ระดับนัยสาคัญ 5% หรือไม่ สมการถดถอยเชิงเส้นอย่างง่ายที่ได้จากตัวอย่างที่ 1 คือ ˆ 7.218 2.812y x  การทดสอบสมมติฐานโดยการใช้ t-Test 10n  1 ˆ 2.812  1.704xxS  2 ˆ 0.503  สมมติฐาน 0 1: 0H   1 1: 0H   (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) 0.05  2 1 1,0 0 ˆ ˆ 0 2.812 5.176 0.503 1.704 ˆ xx T S         ตัวสถิติทดสอบ ปฏิเสธ ถ้า0H 0 0.025,8 2.306T t  0.0250.025 0.025,8 2.306t   0.025,8 2.306t  สรุป เนื่องจาก ดังนั้น ปฏิเสธ ที่ระดับนัยสาคัญ 0.05 มีหลักฐานแสดงว่า ค่าความต้านทานต่อการฉีก ขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาวอัดที่ใช้ เป็นส่วนผสมในการผลิตกระดาษ 0 0.025,8( 5.176) 2.306T t   0 1: 0H   -21-
  • 22. 0.05 0.05,1,8 5.32f  ตัวอย่าง (ต่อ) ทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน 10n  10 1 127.30i i y   10 2 1 1638.03 i y   12.73y  ˆ 127.3iy  1 ˆ 2.812  4.792xyS  สมมติฐาน 0 1: 0H   1 1: 0H   (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) 0.05  2 1 ˆ( ) 4.02 n E i i i SS y y     1 ˆ 2.812 4.792 13.475R xySS S    2 2 12 1 127.3 1638.03 17.501 10 n in i T i i y SS y n               13.475 13.475 1 1 R R SS MS    4.02 0.503 ( 2) 10 2 E E SS MS n      0 13.475 26.78 0.5025 R E MS F MS    0 ,1, 2nF f ปฏิเสธ ถ้า0H 0 0.05,1,8( 5.32)F f  -22-
  • 23. แหล่งที่มา (Source of variation) ผลบวกกาลังสอง (Sum of Squares) องศาอิสระ (Degrees of Freedom) ค่าเฉลี่ย (Mean Square) ค่าสถิติ 0( )F ตัวแบบ (Regression) 13.475 1 13.475 26.78 ค่าความคลาดเคลื่อน (Error) 4.020 8 0.503 ทั้งหมด (Total) 17.501 9 ตัวอย่าง (ต่อ) สรุป เนื่องจาก ดังนั้นปฏิเสธ ที่ระดับนัยสาคัญ 0.05 มี หลักฐานแสดงว่า ค่าความต้านทานต่อการฉีกขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาว อัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ 0 0.05,1,8( 26.78) ( 5.32)F f   0 1: 0H   -23-
  • 24. สมการถดถอยสามารถพยากรณ์ค่าของตัวแปรตาม (Y) ได้ดีมากยิ่งขึ้น สมการถดถอยพยากรณ์ค่าของตัวแปรตาม (Y) ได้ไม่ดี (เนื่องจากตัวแปรตามและตัวแปรอิสระมีความสัมพันธ์กันน้อย) 6. ค่าสัมประสิทธิ์การตัดสินใจ สมการถดถอยที่ใช้ในการพยากรณ์นี้อาจพยากรณ์ค่าตัวแปรตาม (Y) ได้ดีหรือไม่ดีก็ได้ โดยที่ ค่าสัมประสิทธิ์การตัดสินใจ (Coefficient of Determination; ) เป็นค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y ซึ่งค่าสัมประสิทธิ์การตัดสินใจนี้เป็น ค่าที่ใช้บอกเปอร์เซ็นต์การเปลี่ยนแปลงของตัวแปรตาม (Y) ที่สามารถอธิบายได้ด้วยตัวแปรอิสระ (X) ในสมการถดถอย 2 R 2 2 1 1 ˆ ˆ XX XY R T T T S S SS R SS SS SS     โดยที่ ค่า จะมีค่าอยู่ระหว่าง 0 ถึง 12 R ค่าสัมประสิทธิ์การตัดสินใจ: 2 R 2 R 2 R (14) -24-
  • 25. ตัวอย่าง ตัวอย่างที่ 3 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้ คือ คานวณค่าสัมประสิทธิ์ของการตัดสินใจ จากมูลในตัวอย่างที่ 2 ได้ค่าต่าง ๆ ดังนี้ และ ˆ 7.218 2.812y x  13.475RSS  17.501TSS  2 13.475 0.77 17.501 R T SS R SS    สรุปได้ว่า ค่า หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษขึ้นอยู่กับเปอร์เซ็นต์ ของกาวอัดประมาณ 77% ส่วนอีก 23% จะขึ้นอยู่กับปัจจัยอื่น ๆ ที่ไม่ได้นามาศึกษาหรือสมการถดถอย สามารถพยากรณ์ค่าค่าความต้านทานต่อการฉีกขาดของกระดาษได้ถูกต้อง 77% 2 0.77R  ˆ 7.218 2.812y x  -25-
  • 26. 7. สหสัมพันธ์ สมมติว่า การแจกแจงร่วมของ และ เป็นการแจกแจงแบบปกติของสองตัวแปรสุ่ม (Bivariatenormal distribution) โดยมีค่าเฉลี่ยของตัวแปรคือ และ ความแปรปรวนของตัวแปรคือ และ และกาหนดให้ คือสัมประสิทธิ์ สหสัมพันธ์ระหว่างตัวแปร X และ Y ได้ว่า iX iY X Y 2 X 2 Y  • สหสัมพันธ์เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรสุ่ม • ใช้สาหรับการทดสอบความสัมพันธ์เชิงเส้นตรง • สามารถระบุระดับความสัมพันธ์ได้ เช่น สูงกับน้าหนักว่ามีความสัมพันธ์กันมากหรือน้อย • สามารถระบุทิศทางความสัมพันธ์ได้ เช่น สูงกับน้าหนักมีความสัมพันธ์ในทิศทางเดียวกันหรือตรงกันข้าม • ตรวจสอบด้วยการใช้แผนภาพการกระจายและค่าสัมประสิทธิ์สหสัมพันธ์ (correlation coefficient) การวิเคราะห์สหสัมพันธ์ XY X Y      โดยที่ คือความแปรปรวนร่วมระหว่าง X และ YXY -26-
  • 27. 7. สหสัมพันธ์ (ต่อ) 1 1 2 1 2 2 2 1 1 ( ) ˆ ( SS ) ( ) (Y ) n i i i XY n n XX T i i i i Y X X S R S X X Y                   โดยการประมาณของสัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Sample Correlation Coefficient: R) 1. ค่าของ R ไม่ได้ขึ้นอยู่กับการศึกษาภายใต้ตัวแปรสองตัว 2. ค่า R เป็นอิสระจากการตรวจวัดของ x และ y 3. ค่า R จะ มีค่าอยู่ในช่วง 4. R = 1 เมื่อ x มีค่ามาก y มีค่ามาก หรือเมื่อ x มีค่าน้อย y มีค่าน้อย (มีความสัมพันธ์เชิงเส้นเชิงบวก) R = -1 เมื่อ x มีค่ามาก y มีค่าน้อย หรือเมื่อ x มีค่าน้อย y มีค่ามาก (มีความสัมพันธ์เชิงเส้นเชิงลบ) 5. ค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าค่าสัมประสิทธิ์การตัดสินใจ: คุณสมบัติที่สาคัญที่สุดของ R คือ: 1 1R   2 R -27- (15)
  • 28. 7. สหสัมพันธ์ (ต่อ) รูปที่ 9 แผนภาพการกระจายของข้อมูลอธิบายค่า R ซึ่งการตรวจสอบความสัมพันธ์ ทาการตรวจสอบโดย แผนภาพกระจายข้อมูล รูปที่ 9 แสดงสถานการณ์ที่เป็นไปได้ สาหรับค่าของ R •รูปที่ 9 (a) R>1 ความสัมพันธ์เชิงเส้น มีความชันเป็นบวก •รูปที่ 9 (b) R<1 ความสัมพันธ์เชิงเส้น มีความชันเป็นลบ •รูปที่ 9 (c) R=0 ไม่เป็นความสัมพันธ์เชิงเส้นโค้ง •รูปที่ 9 (d) R=0 แสดงให้เห็นความสัมพันธ์ระหว่าง x และ y ซึ่งเป็นความสัมพันธ์เชิงเส้นโค้ง จะเห็นได้ว่า R=0 จะไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y ดังนั้น การพิจารณาข้อมูลด้วยแผนภาพการกระจายจึงเป็นสิ่งที่ มีความสาคัญ -28-
  • 29. ตัวอย่าง ตัวอย่างที่ 4 จงหาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ กาวอัด จากข้อมูลในตัวอย่างที่ 1 และ2 ได้ค่าต่าง ๆ ดังนี้ 1 2 1 2 4.792 ˆ 0.878 ( SS ) (1.704 17.501) XY XX T S R S       ดังนั้น ค่า R=0.878 นี้หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ของกาวอัด มีความสัมพันธ์กันสูงประมาณ 87. 8% และเนื่องจากค่า R เป็นบวกจะแสดงว่ามีความสัมพันธ์กันในทิศทาง เดียวกัน คือถ้าเปอร์เซ็นต์กาวอัดมีค่าสูงค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะสูงตามไปด้วยและ ในทางตรงกันข้ามถ้าเปอร์เซ็นต์กาวอัดมีค่าต่าค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะต่าตามไปด้วย 4.792xyS  1.704xxS  17.501TSS  -29-
  • 30. สรุป -30- สหสัมพันธ์ (Correlation) การถดถอยเชิงเส้นอย่างง่าย (Simple linear regression) จุดมุ่งหมาย การศึกษาความสัมพันธ์ระหว่างตัวแปรสุ่ม หาเส้นที่เหมาะสมที่สุดในการทานาย Y ตัวแปร2ตัว ไม่คานึงถึงปัจจัยสาเหตุและผลกระทบ Xเป็นสาเหตุ และYให้เป็นผลกระทบ ตรวจสอบ ค่าสัมประสิทธิ์สหสัมพันธ์ (มีค่าอยู่ในช่วง -1 ถึง 1) ค่าสัมประสิทธิ์การตัดสินใจ (มีค่าอยู่ระหว่าง 0 ถึง 1)
  • 31. 8. ตัวอย่างงานวิจัย Title: Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear Regression Model Authors:Yan-ming YANG, Yue TENG and Rui-li ZHANG 1.วัตถุประสงค์ของการวิจัย การพยากรณ์ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินเป็นสิ่งที่มีความสาคัญ และช่วย ในการตัดสินใจการใช้ประโยชน์จากทรัพยากรที่มีอยู่เพื่อปรับปรุงความสามารถในการบารุงรักษา ใน งานวิจัยนี้มุ่งเน้นไปที่ปัจจัยหลักที่มีอิทธิพลต่อการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน โดยใช้ แบบจาลองการทานายถดถอยเชิงเส้นของการใช้วัสดุในการบารุงรักษาอุปกรณ์ สร้างขึ้นโดยใช้ข้อมูล ตัวอย่างที่เกิดขึ้นจริง บนพื้นฐานการวิเคราะห์จากตัวอย่าง วิธีการถดถอยเชิงเส้นอย่างง่ายใช้ในการ ทานาย และการทดสอบการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน -31-
  • 32. 8. ตัวอย่างงานวิจัย (ต่อ) 2.ขั้นตอนการวิจัย 2.1 เก็บสถิติข้อมูล เก็บสถิติข้อมูลรายเดือนของชั่วโมงการบิน แสดงดังในตารางที่ 4 และข้อมูลของการใช้วัสดุในการ บารุงรักษา แสดงดังในตารางที่ 5 ในปี ค.ศ. 2015-2016 เป็นเวลาสองปี สร้างแบบจาลองการถดถอยเชิงเส้นอย่าง ง่าย เพื่อทานายปริมาณการใช้วัสดุในการบารุงรักษา ตารางที่ 4 ชั่วโมงบินของเครื่องบิน ในปี ค.ศ. 2015-2016 ตารางที่ 5 ปริมาณการใช้วัสดุบารุงรักษาเครื่องบินในปี ค.ศ. 2015-2016 -32-
  • 33. 2.2 แบบจาลองการถดถอย งานวิจัยนี้เลือกแบบจาลองการถดถอยเชิงเส้นอย่างง่ายที่อยู่บนพื้นฐานการประมาณความสัมพันธ์เชิงเส้น ระหว่างตัวแปรอิสระ และตัวแปรตาม สร้างสมการเชิงเส้นเพื่อทานาย ตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย คือ y a bx  โดยกาหนดให้ y คือ ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน (ตัวแปรตาม) x คือ ชั่วโมงบินของเครื่องบิน (ตัวแปรอิสระ) a คือ จุดตัดแกนบน y (สัมประสิทธิ์การถดถอย) b คือ ความชัน (สัมประสิทธิ์การถดถอย) โดยการประมาณค่าสัมประสิทธิ์การถดถอย (a, b) และทาการทดสอบแบบจาลองการถดถอยโดยการทดสอบการ ประมาณค่าความแปรปรวน และการทดสอบสัมประสิทธิ์สหสัมพันธ์โดยใช้ระดับนัยสาคัญ 0.05 ในการตรวจสอบ 8. ตัวอย่างงานวิจัย (ต่อ) -33-
  • 34. 8. ตัวอย่างงานวิจัย (ต่อ) 3. ผลการวิจัย ใช้ซอฟต์แวร์ Minitab ในการวิเคราะห์การถดถอย แสดงดังรูปที่ 10 สมการถดถอยเชิงเส้นอย่างง่ายที่ ได้คือ 4.173 0.09901y x  รูปที่ 10 พล็อตเส้นถดถอยของสายชั่วโมงของเครื่องบิน และปริมาณการใช้วัสดุในการบารุงรักษาหลัก -34-
  • 35. 8. ตัวอย่างงานวิจัย (ต่อ) 3.1 การทดสอบนัยสาคัญของสมการถดถอย การวิเคราะห์ผลในตาราง ANOVA ตารางที่ 5 การวิเคราะห์ผล ในตาราง ANOVA กาหนดระดับนัยสาคัญที่ 0.05 หรือที่ระดับความเชื่อมั่น 95 % โดยในงานวิจัยนี้ได้ใช้โปรแกรม Mimitab ช่วยในการวิเคราะห์ จึงใช้ค่า P-value เป็นตัวช่วยในการตัดสินใจ เพราะค่า P-value คือระดับนัยสาคัญที่ น้อยที่สุดหรือโอกาสที่น้อยที่สุดที่จะสามารถปฎิเสธสมมติฐานหลัก จะเห็นได้ว่าค่า เนื่องจาก ดังนั้น ปัจจัยอื่นๆ ไม่มีผลกระทบต่อปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน อย่างมี นัยสาคัญ สมการการถดถอยโดยรวมจึงมีประสิทธิภาพอย่างมาก ตารางที่ 5 การวิเคราะห์ความแปรปรวน 0.000P  ( 0.05) ( 0.00)P    -35-
  • 36. 8. ตัวอย่างงานวิจัย (ต่อ) 3.2 การวัดของผลรวมของผลกระทบสมการการถดถอย ตารางที่ 6 R-Sq คือ 91.24% แสดงให้เห็นว่า ปริมาณ การใช้วัสดุในการบารุงรักษาเครื่องบินขึ้นอยู่กับชั่วโมงการบิน ประมาณ 91.24% ส่วนอีก 8.76% จะขึ้นอยู่กับปัจจัย อื่น ๆ ดังนั้นเส้นถดถอยสามารถอธิบายความสัมพันธ์เชิงเส้นได้ 91.24% สามารถพยากรณ์การใช้วัสดุในการ บารุงรักษาเครื่องบิน (y) ได้ถูกต้อง 91.24% ดังนั้นการตัวแบบถดถอยที่ได้ จึงให้ผลที่ดี ตารางที่ 6 สรุปผลของแบบจาลองถดถอย -36-
  • 37. 8. ตัวอย่างงานวิจัย (ต่อ) สมมติฐาน 0 1: 0H   1 1: 0H  (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) 0.05  3.3 การทดสอบนัยสาคัญของสัมประสิทธิ์การถดถอย ตารางที่ 7 แสดงให้เห็นว่า สัมประสิทธิ์ชั่วโมงบินของ เครื่องบิน (ตัวแปรอิสระ x) โดยเกณฑ์ในการปฏิเสธสมมติฐานหลัก โดยใช้ค่าพี คือ จะปฎิเสธ เมื่อระดับ นัยสาคัญมากกว่าเท่ากับค่าพี P Value   0H ตารางที่ 7 สัมประสิทธิ์ ในตารางที่ 7 จะเห็นได้ว่า เนื่องจาก ดังนั้นปฏิเสธ แสดงว่า ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบินมีความสัมพันธ์เชิงเส้นกับชั่วโมงบินของเครื่องบิน ซึ่งบ่งชี้ว่าชั่วโมงบิน ของเครื่องบินเป็นปัจจัยที่มีนัยสาคัญ 0.000P  ( 0.05) ( 0.00)P    0 1: 0H   4.173 0.09901y x  -37-
  • 38. 8. ตัวอย่างงานวิจัย (ต่อ) 3.4 การวิเคราะห์เรสซิดวล เพื่อตรวจสอบความเหมาะสมของตัวแบบถดถอยและANOVA การตรวจสอบพล็อตจะช่วยให้ ทราบว่า ข้อสมมติกาลังสองน้อยที่สุดเป็นไปตามเงื่อนไขหรือไม่ หากสมมติฐานเป็นไปตามเงื่อนไข จากนั้นการถดถอยกาลัง สองน้อยสุด จะประมาณค่าสัมประสิทธิ์ที่ไม่เอนเอียงที่มีความแปรปรวนน้อยที่สุด ใช้ Minitab พล็อตเรสซิดวล (ดังแสดงในรูป ที่ 11) รูปที่ 11 พล็อตเรสซิดวลของชั่วโมงบินเครื่องบินและการใช้วัสดุในการบารุงรักษาหลัก -38- • เรสซิดวลแปรผันแบบสุ่ม และเป็นอิสระจากกัน • รูปที่ 11 (ขวา) เรสซิดวลมีความแปรปรวนคงที่ • รูปที่ 11 (ซ้าย) เรสซิดวลมีการแจกแจงแบบปกติ
  • 39. 8. ตัวอย่างงานวิจัย (ต่อ) 4. สรุปผลการวิจัย ดังนั้นงานวิจัยนี้ได้นาวิธีการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย ในการพยากรณ์ของปริมาณการใช้วัสดุใน การบารุงรักษาอุปกรณ์การบิน พบว่า ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินกับชั่วการบินของ เครื่องบินมีความสัมพันธ์เชิงเส้นกันที่ระดับความเชื่อมั่น 95 % และสามารถนาสมการถดถอยที่ได้ไปพยากรณ์การ ใช้วัสดุในการบารุงรักษาเครื่องบินได้ถูกต้อง 91.24% คาดคะเนได้อย่างที่มีประสิทธิภาพ -39-
  • 40. 1. Mendenhall, W. M., & Sincich, T. L. (2016). Statistics for Engineering and the Sciences. Chapman and Hall/CRC. 2. Montgomery, D. C., & Runger, G. C. (2014). Applied statistics and probability for engineers. John Wiley and Sons. 3. Devore, J. L. (2011). Probability and Statistics for Engineering and the Sciences. Cengage learning. 4. Ott, R. L., & Longnecker, M. T. (2015). An introduction to statistical methods and data analysis. Nelson Education. 5. Yang, Y. M., Yue, T. E. N. G., & Zhang, R. L. (2018). Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear Regression Model. DEStech Transactions on Computer Science and Engineering, (mso). อ้างอิง