Bahan ajar analisis regresi

Ian Sang Awam
Ian Sang AwamPenulis Novel

EDUCATION

BAHAN AJAR ANALISIS REGRESI
Oleh: ENDANG LISTYANI
ANALISIS REGRESI
Dalam kehidupan sehari-hari sering kali ingin diketahui hubungan antar
peubah, misalnya hubungan antara : prestasi belajar dengan IQ, tingkat pendidikan
ibu dengan gizi balita, dan sebagainya. Umumnya suatu peubah bersifat
mempengaruhi peubah yang lainnya. Peubah yang mempengaruhi disebut peubah
bebas sedangkan yang dipengaruhi disebut sebagai peubah tak bebas atau peubah
terikat.
Secara kuantitatif hubungan antara peubah bebas dan peubah terikat dapat
dimodelkan dalam suatu persamaan matematik, sehingga dapat diduga nilai suatu
peubah terikat bila diketahui nilai peubah bebasnya. Persamaan matematik yang
menggambarkan hubungan antara peubah bebas dan terikat sering disebut persamaan
regresi.
Persamaan regresi dapat terdiri dari satu atau lebih peubah bebas dan satu
peubah terikat. Persamaan yang terdiri dari satu peubah bebas dan satu peubah terikat
disebut persamaan regresi sederhana, sedangkan yang terdiri dari satu peubah terikat
dan beberapa peubah bebas disebut persamaan regresi berganda. Regresi dapat
dipisahkan menjadi regresi linear dan regresi non linear
Misalkan kita mempunyai sejumlah data berpasangan {(xi , yi), i = 1, 2, 3, . . .,
n} data itu dapat diplotkan atau digambarkan pada bidang Kartesius yang disebut
sebagai diagram pencar atau diagram hambur. Dari diagram pencar dapat
diperkirakan hubungan antara peubah-peubah itu apakah mempunyai hubungan linear
atau tidak linear.
13.1 Regresi Linear Sederhana
Regresi linear sederhana adalah persamaan regresi yang menggambarkan
hubungan antara satu peubah bebas (X) dan satu peubah tak bebas (Y), dimana
hubungan keduanya dapat digambarkan sebagai suatu garis lurus. Hubungan kedua
peubah tersebut dapat dituliskan dalam bentuk persamaan:
Yi = 0 + 1 + i............... (13.1)
Y = Peubah tak bebas, X = Peubah bebas, 0 = intersep/perpotongan dengan sumbu
tegak, 1 = Kemiringan/gradien, i error yang saling bebas dan menyebar normal
N(0,2) i = 1, 2, …, n.
Dalam kenyataan seringkali kita tidak dapat mengamati seluruh anggota
populasi, sehingga hanya mengambil sampel misalkan sampel itu berukuran n dan
ditulis sebagai {(xi , yi), i = 1, 2, 3, . . ., n}. Persamaan yang diperoleh adalah dugaan
dari persamaan (12.1) dan dapat dituliskan sebagai:
= b0 + b1 Xi
(13.2)
b0 adalah penduga untuk 0, dan b1 adalah penduga untuk 1.
Untuk peubah bebas xi nilai pengamatan yi tidak selalu tepat berada pada garis
= 0 + 1 (garis regresi populasi) atau = b0 + b1 Xi (garis regresi sampel)
yi = b0 + b1 Xi
ei
Gambar13.1 Garis penduga hubungan antara peubah X dan Y
Terdapat simpangan sebesar ei (untuk sampel) atau (untuk populasi), sehingga
Yi = + ei atau Yi = +
atau
Yi = b0 + b1 Xi + ei (model regresi sampel)
Yi =0 + 1 + (model regresi populasi)
iX
iYˆ
iY
~
iX iYˆ
iYˆ
i
iYˆ
iY
~
i
iX i
Y
X
Anggapan/asumsi dalam analisis regresi linear sederhana dengan model
Yi =o + 1 + adalah:.
1) merupakan galat acak yang menyebar normal dengan E( ) = 0 dan
Var( ) = untuk semua i
2) Yi menyebar normal dengan E(Yi) = o + 1 dan Var(Yi) = untuk semua i
Pendugaan Parameter 0 dan 1
Untuk menduga nilai parameter 0 dan 1 terdapat bermacam-macam metode,
misalnya metode kuadrat terkecil (least square method), metode kemungkinan
maksimum (maximum likelihood method), metode kuadrat terkecil terboboti
(weighted least square method), dsb.
Disini metode yang digunakan adalah metode kuadrat terkecil, karena mudah
dikerjakan secara manual. Prinsip dasar metode kuadrat terkecil adalah
meminimumkan jumlah kuadrat simpangan atau Jumlah Kuadrat Galat
(JKG)= =
Dengan menggunakan bantuan pelajaran kalkulus, diperoleh nilai dugaan parameter
regresi sebagai berikut:
Dengan demikian dapat diperoleh hubungan;
Contoh 13.1
Diketahui data percobaan
Subjek i 1 2 3 4 5 6 7 8 9
xi 1,5 1,8 2,4 3,0 3,5 3,9 4,4 4,8 5,0
yi 4,8 5,7 7,0 8,3 10,9 12,4 13,1 13,6 15,3
iX i
i i
i 2

iX 2

1
2
i
ie 

1
2
)ˆ(
i
ii YY
1 1 1
1 2
2
1 1
n n n
i i i i
i i i
n n
i i
i i
n X Y X Y
b
n X X
  
 


 
  
 
  
 
 0 1 1
1
i ib Y b X Y b X
n
    
2
1 1 1 1
0 2
2
1 1
n n n n
i i i i i
i i i i
n n
i i
i i
Y X X X Y
b
n X X
   
 


 
  
 
   
 
Tentukan persamaan regresi dugaan
Jawab
Dengan menggunakan kalkulator dapat dengan mudah dihitung
9
1
i
i
X

 = 30,3
9
1
i
i
Y

 = 91,1
9
1
i i
i
X Y

 = 345,09
9
2
1
i
i
X

 = 115,11 X = 3,3667 Y = 10, 1222
1
(9)(345,09) (30,3)(91,1)
2,9303
(9)(115,11) 30,3
b

 

bo = 10,1222 – (2,9303)(3,3667) = 0,2568
Jadi persamaan regresi dugaan ˆY = 0,26 + 2,93X
Pengujian terhadap Model Regresi
Proses selanjutnya setelah melakukan pendugaan parameter model regresi
sederhana adalah pengujian terhadap model regresi apakah signifikan atau tidak, yang
dapat dilakukan dengan dua cara yaitu ANAVA dengan uji F dan uji parsial dengan
uji t.
Uji bagi 1=0 lawan 10 melalui ANAVA
Hipotesis
H0 : 1=0 (Tidak ada hubungan linear antara X dan Y)
H1 : 1 0 (Ada hubungan linear antara X dan Y)
Tabel 13.1. Anava untuk pengujian pada model regresi linear sederhana
Sumber
Keragaman
db JK KT Fhit Ftabel
Regresi
Galat
1
n2
JKR
JKG
KTR=JKR/1
KTG=JKG/(n  2)
Fhit=KTR/KTG Fα(1,n2)
Total n1 JKT
Ho ditolak jika Fhit > Ftabel, yang berarti model regresi signifikan atau ada
hubungan liner anatara X dan Y
Keterangan
1. Uji bagi 1=0 lawan 10 melalui uji t
Hipotesis
H0 : 1=0 (Tidak ada hubungan linear antara X dan Y)
H1 : 1 0 (Ada hubungan linear antara X dan Y)
Statistik uji adalah :
dengan
Kriteria keputusan :
H0 ditolak jika |thit|> tα/2(n2)
2. Uji bagi 0=0 lawan 0 0 melalui uji t
Hipotesis
H0 : 0=0
H1 : 0 0
Statistik uji adalah :
dengan
Kriteria keputusan :
H0 ditolak jika |thit|> tα/2(n2)
 
1
1
hit
b
t
s b

 
 
2 2
2
0 1
2
2
2
2
2
i
i i i i
i i
i i
i
i
i
i
JKT Y nY
JKG Y b Y b X Y
X Y
X Y
Y n
Y
n X
X
n
JKR JKT JKG
 
  
 
  
     
 
  
 

  
 





 
 
2
1 2
2 i
i
KTG
s b
X
X
n




 
0
0
hit
b
t
s b

 
 
2
2
0 2
2
1
i
i
X
s b KTG
n X
X
n
 
 
   
   


Perhitungan untuk uji hipotesis menggunakan data Contoh 13.1.
Dari perhitungan sebelumnya telah diperoleh
9
1
i
i
X

 = 30,3
9
1
i
i
Y

 = 91,1
9
1
i i
i
X Y

 = 345,09
9
2
1
i
i
X

 = 115,11
9
2
1
1036,65i
i
Y

 X
= 3,3667 Y = 10, 1222
b0 = 0,2568 b1 = 2,9303
Dengan demikian diperoleh
JKT = 1036,65  9. (10,1222)2 = 114,52
JKG = 1036,65  (0,2568) 91,1 – (2,9303) 345,09 = 2,0383
JKR = 945,55 –2,0383 = 112,4813
Tabel anava untuk data tersebut disajikan dalam Tabel 13.2.
Tabel 13.2. Anava untuk data pada Contoh 13.1
Sumber
Keragaman
db JK KT Fhit Ftabel
Regresi
Galat
1
7
112,4813
2,0383
KTR=112,4813
KTG=0,2911
Fhit=386,2885 F0,05(1,7) =5,59
Total 8 114,52
Berdasarkan hasil pada Tabel 13.2 diperoleh nilai F hitung lebih besar daripada nilai F
tabel, sehingga H0 ditolak. Jadi ada hubungan linear antara variabel X dan Y.
Untuk uji parsial perlu dihitung terlebih dahulu nilai
dan
 
2
2
0
1 3,3667
0,2911
9 115,11 (30,3)(30,3)/9
s b
 
   
 
0,284
Jadi untuk uji signifikansi koefisien 1
 2
1
0,2911
0,0222
115,11 (30,3)(30,3) /9
s b  

thit =
2,9303
19,685
0,149

sedangkan untuk uji signifikansi konstanta diperoleh
thit =
0,2568
0,483
0,532

Karena t tabel adalah t0,025;7= 2,365 maka H0 ditolak untuk uji koefisien 1 dan H0
diterima untuk uji signifikansi konstanta.
Regresi Ganda
Regresi linear ganda adalah persamaan regresi yang menggambarkan
hubungan antara lebih dari satu peubah bebas (X) dan satu peubah tak bebas (Y)
Hubungan peubah-peubah tersebut dapat dituliskan dalam bentuk persamaan:
Y = Peubah tak bebas, X = Peubah bebas, 0 = intersep/perpotongan dengan sumbu
tegak, 1, 2, ...., p1 = parameter model regresi, i saling bebas dan menyebar normal
N(0,2) , i = 1, 2, …, n
Persamaan regresi dugaannya adalah
Hipotesis yang harus diuji dalam analisis regresi ganda adalah
H0 : 1 = 2 = … = p-1=0
H1 : Tidak semua k (k=1,2,…,p 1) sama dengan nol
Untuk melakukan pendugaan parameter model regresi ganda dan menguji
signifikansinya dapat dilakukan dengan program SPSS 16.
Asumsi yang harus dipenuhi dalam analisis regresi ganda adalah :
1. Tidak ada multikolinearitas (korelasi antara variabel independen)
0 1 1 2 2 1 , 1i i i p i p iY X X X           
0 1 1 2 2 1 , 1
ˆ
i i i p i pY b b X b X b X     
2. Heteroskedastisitas (variansi error konstan)
3. Normalitas (error berdistribusi normal)
4. Autokorelasi (error bersifat acak)
Multikolinearitas
1. Multikolinearitas atau kekolinearan ganda adalah terjadinya korelasi antar
peubah bebas.
2. Model regresi yang baik seharusnya tidak terjadi korelasi antar peubah bebas.
3. Metode yang banyak digunakan untuk mendeteksi adanya multikolinearitas
adalah faktor inflasi ragam (variance inflation factor/VIF)
4. Multikolinearitas terjadi jika nilai VIF > 10
Heteroskedastisitas
1. Ragam galat diasumsikan konstan dari satu pengamatan ke pengamatan lain,
hal ini disebut homoskedastisitas.
2. Jika ragam galat berbeda disebut heteroskedastisitas.
3. Model regresi yang baik adalah tidak terjadi heteroskedastisitas.
4. Untuk mendeteksi heteroskedastisitas adalah dengan membuat plot nilai
dugaan yang dibakukan (standardized predicted value) dengan sisaan yang
dibakukan (studentized residual).
5. Jika ada pola tertentu (bergelombang, melebar kemudian menyempit) maka
terjadi heteroskedastisitas.
6. Jika tidak ada pola jelas, serta titik-titik (sisaan) menyebar di atas dan di
bawah angka 0 pada sumbu Y, maka tidak terjadi heteroskedastisitas.
Normalitas (error berdistribusi normal)
1. Untuk mendeteksi normalitas digunakan normal p-p plot.
2. Jika titik-titik (sisaan) menyebar di sekitar garis diagonal dan mengikuti arah
garis diagonal, maka model regresi memenuhi asumsi normalitas.
3. Jika titik-titik (sisaan) menyebar jauh dari garis diagonal dan atau tidak
mengikuti arah garis diagonal, maka model regresi tidak memenuhi asumsi
normalitas
Autokorelasi.
1. Bila dalam model regresi linear ganda ada korelasi antara galat pada periode t
dengan galat pada periode t-1, maka dinamakan ada masalah autokorelasi.
2. Model regresi yang baik adalah model regresi yang bebas dari autokorelasi.
Contoh 13.2
Misalkan dipunyai data
Y 10 6 5 12 10 15 5 12 17 20
X1 1.3 2.0 1.7 1.5 1.6 1.2 1.6 1.4 1.0 1.1
X2 9 7 5 14 15 12 6 10 15 21
Akan dilakukan pendugaan dan pengujian parameter model regresi, serta uji asumsi
dengan menggunakan SPSS 16.
1. Cara memasukkan data dan melakukan analisis sama dengan pada regresi
sederhana.
2. Untuk memunculkan hasil uji asumsi pada kotak dialog statistics klik juga
collinearity diagnostics baru continue, sebagaimana terlihat pada gambar
berikut:
3. Untuk melakukan uji asumsi pada residual klik plots, sehingga akan muncul
kotak dialog :
4. Masukkan ZPRED pada kotak X dan ZRESID pada kotak Y, dan beri tanda
centang ( ) pada Normal probability plot, kemudian klik continue. Kembali
ke kotak dialog awal, dan klik OK.
Hasil analisis dengan ANAVA adalah sebagai berikut:
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 217.699 2 108.849 47.917 .000a
Residual 15.901 7 2.272
Total 233.600 9
a. Predictors:(Constant),VAR00003, VAR00002
b. DependentVariable:VAR00001
Terlihat bahwa nilai signifikansi 0,000 < 1%, sehingga H0 ditolak, yang berarti ada
hubungan linear antara variabel independen X1 dan X2 dengan variabel dependen Y.
Hasil uji parsial adalah sebagai berikut :
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.
Collinearity Statistics
B Std. Error Beta Tolerance VIF
1 (Constant) 16.406 4.343 3.778 .007
Karena nilai signifikansi 0,007 untuk konstanta dan VAR00002 dan 0,003 untuk
VAR00003, sehingga H0 ditolak untuk semua uji. Jadi konstanta 0 semua dan
koefisien regresi 1, dan 2 signifikan. Persamaan regresi dugaannya adalah :
i1 i2
ˆ 16.4068 8,248 X + 0,585 XiY  
Hasil uji asumsi multikolinearitas dapat dilihat pada nilai VIF, yaitu 1,749 < 10,
sehingga dapat disimpulkan tidak ada multikolinearitas antara variabel X1 dan X2.
Hasil uji normalitas dari error dapat dilihat pada output berikut
Karena plot mendekati garis diagonal, maka dapat disimpulkan error memenuhi
asumsi normalitas. Uji normalitas error juga dapat dilakukan dengan uji
Kolmogorov-Smirnov
Hasil plot berikut menunjukkan tidak ada pola yang jelas atau berpola acak, sehingga
dapat disimpulkan tidak terjadi heteroskedastisitas atau ragam galat konstan dan
galat bersifat acak atau tidak ada autokorelasi .
X1 -8.248 2.196 -.490 -3.756 .007 .572 1.749
X2 .585 .134 .571 4.377 .003 .572 1.749
a. DependentVariable:VAR00001
Latihan 13.
1. Suatu sampel acak terdiri atas 20 keluarga di suatu daerah, memberikan data
sbb.:
X 15 20 25 20 25 30 16 15 25 20
Y 10 15 20 16 22 25 15 14 10 18
X 16 18 20 25 30 25 19 10 20 20
Y 12 15 15 20 25 23 16 8 15 17
X = pendapatan keluarga perbulan dalam ratusan ribu rupiah
Y = pengeluaran keluarga perbulan dalam ratusan ribu rupiah
a) Jika diduga bahwa hubungan antara pendapatan keluarga dan pengeluaran
keluarga linear, tentukan persamaan regresi dugaannya
b) Bila dianggap asumsi-asumsi dalam analisis regresi linear terpenuhi, ujilah
apakah ada hubungan antara pendapatan keluarga perbulan dan pengeluaran
keluarga perbulan. Gunakan  = 0,05.
2. Suatu penelitian dilakukan terhadap 20 mahasiswa semester satu yang diambil
secara acak untuk menentukan apakah nilai mutu rata-rata (NMR) pada akhir
tahun pertama (Y) dapat diprediksi dari nilai ujian masuk (X). Data yang
diperoleh sbb.
X 5,5 4,8 4,7 3,9 4,5 6,2 6,0 5,2 4,7 4,3
Y 3,1 2,3 3,0 1,9 2,5 3,7 3,4 2,6 2,8 1,6
X 4,9 5,4 5,0 6,3 4,6 4,3 5,0 5,9 4,1 4,7
Y 2,0 2,9 2,3 3,2 1,8 1,4 2,0 3,8 2,2 1,5
a) Jika hubungan antar NMR dan nilai ujian masuk dapat dinyatakan dengan
garis linear, tentukan persamaan regresi linear dugaannya.
b) Bila dianggap asumsi-asumsi dalam analisis regresi linear terpenuhi, ujilah
apakah ada hubungan antara nilai ujian masuk dan nilai mutu rata-rata (NMR)
pada akhir tahun pertama. Gunakan  = 0,05.
c) Tentukan nilai dugaan untuk NMR jika nilai ujian masuk 6,0
3. Bagian kepegawaian suatu perusahaan menggunakan 12 orang dalam suatu
penelitian untuk menentukan hubungan antara nilai prestasi kerja (Y) dan nilai
empat tes, yaitu tes kemampuan di bidang IT (X1), kemampuan berbahasa Inggris
(X2), kemampuan bekerja sama (X3), dan kemampuan berkomunikasi (X4).
Datanya adalah sebagai berikut
Y X1 X2 X3 X4
11,2
14,5
17,2
17,8
19,3
24,5
21,2
16,9
14,8
20,0
13,2
22,5
56,5
59,5
69,2
74,5
81,2
88,0
78,2
69,0
58,1
80,5
58,3
84,0
71,0
72,5
76,0
79,5
84,0
86,2
80,0
72,0
68,0
85,0
71,0
87,2
38,5
38,2
42,5
43,5
47,5
47,4
44,5
41,8
42,1
48,1
37,5
51,0
43,0
44,8
49,0
56,3
60,2
62,0
58,1
48,1
46,0
60,3
47,1
65,2
a. Ujilah apakah ada hubungan linear antara nilai prestasi kerja (y) dan nilai
empat tes, yaitu tes kemampuan di bidang IT, kemampuan berbahasa Inggris,
dan kemampuan bekerja sama, kemampuan berkomunikasi. Gunakan  =
0,05.
b. Manakah diantara empat variable yang secara signifikan berpengaruh terhadap
prestasi kerja?
c. Berdasarkan hasil b) Tentukan persamaan regresi linear dugaannya.
d. Lakukan uji asumsi dalam analisis regresi linear dan simpulkan hasilnya.
4. Daya rentang produk fiber sintetis diperkirakan berhubungan dengan persentase
bahan katun dalam fiber, waktu pengeringan fiber. Hasil percobaan terhadap 10
potong fiber yang diproduksi dalam beberapa kondisi yang berbeda diberikan
pada Tabel berikut
Y X1 X2
213
220
216
225
235
218
239
243
233
240
13
15
14
18
19
20
22
17
16
18
2,1
2,3
2,2
2,5
3,2
2,4
3,4
4,0
4,
4.3
a. Lakukan analisis regresi untuk menguji apakah ada hubungan linear antara
persentase bahan katun dalam fiber dan waktu pengeringan dengan daya rentang
fiber sintetis.
b. Tentukan persaman regresi dugaannya.
Lakukan uji asumsi dalam analisis regresi linear dan simpulkan hasilnya.

Más contenido relacionado

La actualidad más candente(20)

Bab2 peubah-acak-dan-distribusi-peluangBab2 peubah-acak-dan-distribusi-peluang
Bab2 peubah-acak-dan-distribusi-peluang
Arif Windiargo134.9K vistas
Dasar dasar matematika teknik optimasi (matrix hessian)Dasar dasar matematika teknik optimasi (matrix hessian)
Dasar dasar matematika teknik optimasi (matrix hessian)
Muhammad Ali Subkhan Candra37.9K vistas
Integral Tak Wajar ( Kalkulus 2 )Integral Tak Wajar ( Kalkulus 2 )
Integral Tak Wajar ( Kalkulus 2 )
Kelinci Coklat29.4K vistas
Uji perbedaan uji z Uji perbedaan uji z
Uji perbedaan uji z
Universitas Negeri Makassar24.4K vistas
Kuliah 12-deret-taylor-maclaurinKuliah 12-deret-taylor-maclaurin
Kuliah 12-deret-taylor-maclaurin
Faisyal Rufenclonndrecturr12.2K vistas
Beberapa distribusi peluang kontinuBeberapa distribusi peluang kontinu
Beberapa distribusi peluang kontinu
Raden Maulana126.7K vistas
Uji Normalitas dan HomogenitasUji Normalitas dan Homogenitas
Uji Normalitas dan Homogenitas
Putri Handayani39.3K vistas
Integral Lipat TigaIntegral Lipat Tiga
Integral Lipat Tiga
Kelinci Coklat52.6K vistas
Materi P3_Distribusi NormalMateri P3_Distribusi Normal
Materi P3_Distribusi Normal
M. Jainuri, S.Pd., M.Pd191.5K vistas
Pengantar Statistika 2Pengantar Statistika 2
Pengantar Statistika 2
Universitas Islam Nahdlatul Ulama (UNISNU) Jepara163.7K vistas
Akt 2-tabel-mortalitasAkt 2-tabel-mortalitas
Akt 2-tabel-mortalitas
Faisyal Rufenclonndrecturr37.9K vistas
Metode stepping stoneMetode stepping stone
Metode stepping stone
UNIVERSITAS MUHAMMADIYAH BERAU6.1K vistas
ANALISIS REALANALISIS REAL
ANALISIS REAL
Sigit Rimba Atmojo45.1K vistas
Metode Dualitas (Primal-Dual)Metode Dualitas (Primal-Dual)
Metode Dualitas (Primal-Dual)
hazhiyah17.3K vistas
Nilai harapanNilai harapan
Nilai harapan
Welly Dian Astika2.1K vistas
uji hipotesis satu rata – rata bagian 2uji hipotesis satu rata – rata bagian 2
uji hipotesis satu rata – rata bagian 2
Ratih Ramadhani67.8K vistas
Statistika Dasar Pertemuan 10Statistika Dasar Pertemuan 10
Statistika Dasar Pertemuan 10
Amalia Indrawati Gunawan22.5K vistas

Similar a Bahan ajar analisis regresi

Analisis regresi-sederhanaAnalisis regresi-sederhana
Analisis regresi-sederhanaAchmad Alphianto
9.4K vistas26 diapositivas
Makalah analisis regresiMakalah analisis regresi
Makalah analisis regresirukmono budi utomo
15.1K vistas42 diapositivas
Regresi Sederhana.pptxRegresi Sederhana.pptx
Regresi Sederhana.pptxIndraZainun1
24 vistas54 diapositivas
Regresi Linear BergandaRegresi Linear Berganda
Regresi Linear BergandaDian Arisona
22.8K vistas15 diapositivas

Similar a Bahan ajar analisis regresi(20)

Analisis regresi-sederhanaAnalisis regresi-sederhana
Analisis regresi-sederhana
Achmad Alphianto9.4K vistas
Makalah analisis regresiMakalah analisis regresi
Makalah analisis regresi
rukmono budi utomo15.1K vistas
Regresi Sederhana.pptxRegresi Sederhana.pptx
Regresi Sederhana.pptx
IndraZainun124 vistas
Regresi Linear BergandaRegresi Linear Berganda
Regresi Linear Berganda
Dian Arisona22.8K vistas
MODUL 6 Regresi Linier SederhanaMODUL 6 Regresi Linier Sederhana
MODUL 6 Regresi Linier Sederhana
nur cendana sari27.7K vistas
3218126438990fa0771ddb555f70be42.docx3218126438990fa0771ddb555f70be42.docx
3218126438990fa0771ddb555f70be42.docx
AfaRanggitaPrasticas195 vistas
K3 k4 regresi gandaK3 k4 regresi ganda
K3 k4 regresi ganda
Supri yono, MM, Ak, CiPP, CA734 vistas
13.analisa korelasi13.analisa korelasi
13.analisa korelasi
Hafiza .h91K vistas
Regresi linearRegresi linear
Regresi linear
mery gita636 vistas
Analisis regresi dan korelasiAnalisis regresi dan korelasi
Analisis regresi dan korelasi
Operator Warnet Vast Raha 4.4K vistas
07 analisis frekuensi-kategori-107 analisis frekuensi-kategori-1
07 analisis frekuensi-kategori-1
budiyantoSilaban525 vistas
Rancangan acak lengkap (RAL)Rancangan acak lengkap (RAL)
Rancangan acak lengkap (RAL)
Muhammad Eko24K vistas
Analisis Regresi Linier SederhanaAnalisis Regresi Linier Sederhana
Analisis Regresi Linier Sederhana
Dwi Mardianti45.8K vistas
R5 g kel 2 statdas 2R5 g kel 2 statdas 2
R5 g kel 2 statdas 2
matematikaunindra1K vistas
Konsep distribusi peluang_kontinu(9)Konsep distribusi peluang_kontinu(9)
Konsep distribusi peluang_kontinu(9)
rizka_safa3.5K vistas
P5 Statistika.pptxP5 Statistika.pptx
P5 Statistika.pptx
MuhammadQoesAtieq2 vistas

Bahan ajar analisis regresi

  • 1. BAHAN AJAR ANALISIS REGRESI Oleh: ENDANG LISTYANI ANALISIS REGRESI Dalam kehidupan sehari-hari sering kali ingin diketahui hubungan antar peubah, misalnya hubungan antara : prestasi belajar dengan IQ, tingkat pendidikan ibu dengan gizi balita, dan sebagainya. Umumnya suatu peubah bersifat mempengaruhi peubah yang lainnya. Peubah yang mempengaruhi disebut peubah bebas sedangkan yang dipengaruhi disebut sebagai peubah tak bebas atau peubah terikat. Secara kuantitatif hubungan antara peubah bebas dan peubah terikat dapat dimodelkan dalam suatu persamaan matematik, sehingga dapat diduga nilai suatu peubah terikat bila diketahui nilai peubah bebasnya. Persamaan matematik yang menggambarkan hubungan antara peubah bebas dan terikat sering disebut persamaan regresi. Persamaan regresi dapat terdiri dari satu atau lebih peubah bebas dan satu peubah terikat. Persamaan yang terdiri dari satu peubah bebas dan satu peubah terikat disebut persamaan regresi sederhana, sedangkan yang terdiri dari satu peubah terikat dan beberapa peubah bebas disebut persamaan regresi berganda. Regresi dapat dipisahkan menjadi regresi linear dan regresi non linear Misalkan kita mempunyai sejumlah data berpasangan {(xi , yi), i = 1, 2, 3, . . ., n} data itu dapat diplotkan atau digambarkan pada bidang Kartesius yang disebut sebagai diagram pencar atau diagram hambur. Dari diagram pencar dapat diperkirakan hubungan antara peubah-peubah itu apakah mempunyai hubungan linear atau tidak linear. 13.1 Regresi Linear Sederhana Regresi linear sederhana adalah persamaan regresi yang menggambarkan hubungan antara satu peubah bebas (X) dan satu peubah tak bebas (Y), dimana hubungan keduanya dapat digambarkan sebagai suatu garis lurus. Hubungan kedua peubah tersebut dapat dituliskan dalam bentuk persamaan:
  • 2. Yi = 0 + 1 + i............... (13.1) Y = Peubah tak bebas, X = Peubah bebas, 0 = intersep/perpotongan dengan sumbu tegak, 1 = Kemiringan/gradien, i error yang saling bebas dan menyebar normal N(0,2) i = 1, 2, …, n. Dalam kenyataan seringkali kita tidak dapat mengamati seluruh anggota populasi, sehingga hanya mengambil sampel misalkan sampel itu berukuran n dan ditulis sebagai {(xi , yi), i = 1, 2, 3, . . ., n}. Persamaan yang diperoleh adalah dugaan dari persamaan (12.1) dan dapat dituliskan sebagai: = b0 + b1 Xi (13.2) b0 adalah penduga untuk 0, dan b1 adalah penduga untuk 1. Untuk peubah bebas xi nilai pengamatan yi tidak selalu tepat berada pada garis = 0 + 1 (garis regresi populasi) atau = b0 + b1 Xi (garis regresi sampel) yi = b0 + b1 Xi ei Gambar13.1 Garis penduga hubungan antara peubah X dan Y Terdapat simpangan sebesar ei (untuk sampel) atau (untuk populasi), sehingga Yi = + ei atau Yi = + atau Yi = b0 + b1 Xi + ei (model regresi sampel) Yi =0 + 1 + (model regresi populasi) iX iYˆ iY ~ iX iYˆ iYˆ i iYˆ iY ~ i iX i Y X
  • 3. Anggapan/asumsi dalam analisis regresi linear sederhana dengan model Yi =o + 1 + adalah:. 1) merupakan galat acak yang menyebar normal dengan E( ) = 0 dan Var( ) = untuk semua i 2) Yi menyebar normal dengan E(Yi) = o + 1 dan Var(Yi) = untuk semua i Pendugaan Parameter 0 dan 1 Untuk menduga nilai parameter 0 dan 1 terdapat bermacam-macam metode, misalnya metode kuadrat terkecil (least square method), metode kemungkinan maksimum (maximum likelihood method), metode kuadrat terkecil terboboti (weighted least square method), dsb. Disini metode yang digunakan adalah metode kuadrat terkecil, karena mudah dikerjakan secara manual. Prinsip dasar metode kuadrat terkecil adalah meminimumkan jumlah kuadrat simpangan atau Jumlah Kuadrat Galat (JKG)= = Dengan menggunakan bantuan pelajaran kalkulus, diperoleh nilai dugaan parameter regresi sebagai berikut: Dengan demikian dapat diperoleh hubungan; Contoh 13.1 Diketahui data percobaan Subjek i 1 2 3 4 5 6 7 8 9 xi 1,5 1,8 2,4 3,0 3,5 3,9 4,4 4,8 5,0 yi 4,8 5,7 7,0 8,3 10,9 12,4 13,1 13,6 15,3 iX i i i i 2  iX 2  1 2 i ie   1 2 )ˆ( i ii YY 1 1 1 1 2 2 1 1 n n n i i i i i i i n n i i i i n X Y X Y b n X X                     0 1 1 1 i ib Y b X Y b X n      2 1 1 1 1 0 2 2 1 1 n n n n i i i i i i i i i n n i i i i Y X X X Y b n X X                     
  • 4. Tentukan persamaan regresi dugaan Jawab Dengan menggunakan kalkulator dapat dengan mudah dihitung 9 1 i i X   = 30,3 9 1 i i Y   = 91,1 9 1 i i i X Y   = 345,09 9 2 1 i i X   = 115,11 X = 3,3667 Y = 10, 1222 1 (9)(345,09) (30,3)(91,1) 2,9303 (9)(115,11) 30,3 b     bo = 10,1222 – (2,9303)(3,3667) = 0,2568 Jadi persamaan regresi dugaan ˆY = 0,26 + 2,93X Pengujian terhadap Model Regresi Proses selanjutnya setelah melakukan pendugaan parameter model regresi sederhana adalah pengujian terhadap model regresi apakah signifikan atau tidak, yang dapat dilakukan dengan dua cara yaitu ANAVA dengan uji F dan uji parsial dengan uji t. Uji bagi 1=0 lawan 10 melalui ANAVA Hipotesis H0 : 1=0 (Tidak ada hubungan linear antara X dan Y) H1 : 1 0 (Ada hubungan linear antara X dan Y) Tabel 13.1. Anava untuk pengujian pada model regresi linear sederhana Sumber Keragaman db JK KT Fhit Ftabel Regresi Galat 1 n2 JKR JKG KTR=JKR/1 KTG=JKG/(n  2) Fhit=KTR/KTG Fα(1,n2) Total n1 JKT Ho ditolak jika Fhit > Ftabel, yang berarti model regresi signifikan atau ada hubungan liner anatara X dan Y
  • 5. Keterangan 1. Uji bagi 1=0 lawan 10 melalui uji t Hipotesis H0 : 1=0 (Tidak ada hubungan linear antara X dan Y) H1 : 1 0 (Ada hubungan linear antara X dan Y) Statistik uji adalah : dengan Kriteria keputusan : H0 ditolak jika |thit|> tα/2(n2) 2. Uji bagi 0=0 lawan 0 0 melalui uji t Hipotesis H0 : 0=0 H1 : 0 0 Statistik uji adalah : dengan Kriteria keputusan : H0 ditolak jika |thit|> tα/2(n2)   1 1 hit b t s b      2 2 2 0 1 2 2 2 2 2 i i i i i i i i i i i i i JKT Y nY JKG Y b Y b X Y X Y X Y Y n Y n X X n JKR JKT JKG                                       2 1 2 2 i i KTG s b X X n       0 0 hit b t s b      2 2 0 2 2 1 i i X s b KTG n X X n              
  • 6. Perhitungan untuk uji hipotesis menggunakan data Contoh 13.1. Dari perhitungan sebelumnya telah diperoleh 9 1 i i X   = 30,3 9 1 i i Y   = 91,1 9 1 i i i X Y   = 345,09 9 2 1 i i X   = 115,11 9 2 1 1036,65i i Y   X = 3,3667 Y = 10, 1222 b0 = 0,2568 b1 = 2,9303 Dengan demikian diperoleh JKT = 1036,65  9. (10,1222)2 = 114,52 JKG = 1036,65  (0,2568) 91,1 – (2,9303) 345,09 = 2,0383 JKR = 945,55 –2,0383 = 112,4813 Tabel anava untuk data tersebut disajikan dalam Tabel 13.2. Tabel 13.2. Anava untuk data pada Contoh 13.1 Sumber Keragaman db JK KT Fhit Ftabel Regresi Galat 1 7 112,4813 2,0383 KTR=112,4813 KTG=0,2911 Fhit=386,2885 F0,05(1,7) =5,59 Total 8 114,52 Berdasarkan hasil pada Tabel 13.2 diperoleh nilai F hitung lebih besar daripada nilai F tabel, sehingga H0 ditolak. Jadi ada hubungan linear antara variabel X dan Y. Untuk uji parsial perlu dihitung terlebih dahulu nilai dan   2 2 0 1 3,3667 0,2911 9 115,11 (30,3)(30,3)/9 s b         0,284 Jadi untuk uji signifikansi koefisien 1  2 1 0,2911 0,0222 115,11 (30,3)(30,3) /9 s b   
  • 7. thit = 2,9303 19,685 0,149  sedangkan untuk uji signifikansi konstanta diperoleh thit = 0,2568 0,483 0,532  Karena t tabel adalah t0,025;7= 2,365 maka H0 ditolak untuk uji koefisien 1 dan H0 diterima untuk uji signifikansi konstanta. Regresi Ganda Regresi linear ganda adalah persamaan regresi yang menggambarkan hubungan antara lebih dari satu peubah bebas (X) dan satu peubah tak bebas (Y) Hubungan peubah-peubah tersebut dapat dituliskan dalam bentuk persamaan: Y = Peubah tak bebas, X = Peubah bebas, 0 = intersep/perpotongan dengan sumbu tegak, 1, 2, ...., p1 = parameter model regresi, i saling bebas dan menyebar normal N(0,2) , i = 1, 2, …, n Persamaan regresi dugaannya adalah Hipotesis yang harus diuji dalam analisis regresi ganda adalah H0 : 1 = 2 = … = p-1=0 H1 : Tidak semua k (k=1,2,…,p 1) sama dengan nol Untuk melakukan pendugaan parameter model regresi ganda dan menguji signifikansinya dapat dilakukan dengan program SPSS 16. Asumsi yang harus dipenuhi dalam analisis regresi ganda adalah : 1. Tidak ada multikolinearitas (korelasi antara variabel independen) 0 1 1 2 2 1 , 1i i i p i p iY X X X            0 1 1 2 2 1 , 1 ˆ i i i p i pY b b X b X b X     
  • 8. 2. Heteroskedastisitas (variansi error konstan) 3. Normalitas (error berdistribusi normal) 4. Autokorelasi (error bersifat acak) Multikolinearitas 1. Multikolinearitas atau kekolinearan ganda adalah terjadinya korelasi antar peubah bebas. 2. Model regresi yang baik seharusnya tidak terjadi korelasi antar peubah bebas. 3. Metode yang banyak digunakan untuk mendeteksi adanya multikolinearitas adalah faktor inflasi ragam (variance inflation factor/VIF) 4. Multikolinearitas terjadi jika nilai VIF > 10 Heteroskedastisitas 1. Ragam galat diasumsikan konstan dari satu pengamatan ke pengamatan lain, hal ini disebut homoskedastisitas. 2. Jika ragam galat berbeda disebut heteroskedastisitas. 3. Model regresi yang baik adalah tidak terjadi heteroskedastisitas. 4. Untuk mendeteksi heteroskedastisitas adalah dengan membuat plot nilai dugaan yang dibakukan (standardized predicted value) dengan sisaan yang dibakukan (studentized residual). 5. Jika ada pola tertentu (bergelombang, melebar kemudian menyempit) maka terjadi heteroskedastisitas. 6. Jika tidak ada pola jelas, serta titik-titik (sisaan) menyebar di atas dan di bawah angka 0 pada sumbu Y, maka tidak terjadi heteroskedastisitas. Normalitas (error berdistribusi normal) 1. Untuk mendeteksi normalitas digunakan normal p-p plot. 2. Jika titik-titik (sisaan) menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi normalitas. 3. Jika titik-titik (sisaan) menyebar jauh dari garis diagonal dan atau tidak mengikuti arah garis diagonal, maka model regresi tidak memenuhi asumsi normalitas Autokorelasi.
  • 9. 1. Bila dalam model regresi linear ganda ada korelasi antara galat pada periode t dengan galat pada periode t-1, maka dinamakan ada masalah autokorelasi. 2. Model regresi yang baik adalah model regresi yang bebas dari autokorelasi. Contoh 13.2 Misalkan dipunyai data Y 10 6 5 12 10 15 5 12 17 20 X1 1.3 2.0 1.7 1.5 1.6 1.2 1.6 1.4 1.0 1.1 X2 9 7 5 14 15 12 6 10 15 21 Akan dilakukan pendugaan dan pengujian parameter model regresi, serta uji asumsi dengan menggunakan SPSS 16. 1. Cara memasukkan data dan melakukan analisis sama dengan pada regresi sederhana. 2. Untuk memunculkan hasil uji asumsi pada kotak dialog statistics klik juga collinearity diagnostics baru continue, sebagaimana terlihat pada gambar berikut: 3. Untuk melakukan uji asumsi pada residual klik plots, sehingga akan muncul kotak dialog :
  • 10. 4. Masukkan ZPRED pada kotak X dan ZRESID pada kotak Y, dan beri tanda centang ( ) pada Normal probability plot, kemudian klik continue. Kembali ke kotak dialog awal, dan klik OK. Hasil analisis dengan ANAVA adalah sebagai berikut: ANOVAb Model Sum of Squares df Mean Square F Sig. 1 Regression 217.699 2 108.849 47.917 .000a Residual 15.901 7 2.272 Total 233.600 9 a. Predictors:(Constant),VAR00003, VAR00002 b. DependentVariable:VAR00001 Terlihat bahwa nilai signifikansi 0,000 < 1%, sehingga H0 ditolak, yang berarti ada hubungan linear antara variabel independen X1 dan X2 dengan variabel dependen Y. Hasil uji parsial adalah sebagai berikut : Coefficientsa Model Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics B Std. Error Beta Tolerance VIF 1 (Constant) 16.406 4.343 3.778 .007
  • 11. Karena nilai signifikansi 0,007 untuk konstanta dan VAR00002 dan 0,003 untuk VAR00003, sehingga H0 ditolak untuk semua uji. Jadi konstanta 0 semua dan koefisien regresi 1, dan 2 signifikan. Persamaan regresi dugaannya adalah : i1 i2 ˆ 16.4068 8,248 X + 0,585 XiY   Hasil uji asumsi multikolinearitas dapat dilihat pada nilai VIF, yaitu 1,749 < 10, sehingga dapat disimpulkan tidak ada multikolinearitas antara variabel X1 dan X2. Hasil uji normalitas dari error dapat dilihat pada output berikut Karena plot mendekati garis diagonal, maka dapat disimpulkan error memenuhi asumsi normalitas. Uji normalitas error juga dapat dilakukan dengan uji Kolmogorov-Smirnov Hasil plot berikut menunjukkan tidak ada pola yang jelas atau berpola acak, sehingga dapat disimpulkan tidak terjadi heteroskedastisitas atau ragam galat konstan dan galat bersifat acak atau tidak ada autokorelasi . X1 -8.248 2.196 -.490 -3.756 .007 .572 1.749 X2 .585 .134 .571 4.377 .003 .572 1.749 a. DependentVariable:VAR00001
  • 12. Latihan 13. 1. Suatu sampel acak terdiri atas 20 keluarga di suatu daerah, memberikan data sbb.: X 15 20 25 20 25 30 16 15 25 20 Y 10 15 20 16 22 25 15 14 10 18 X 16 18 20 25 30 25 19 10 20 20 Y 12 15 15 20 25 23 16 8 15 17 X = pendapatan keluarga perbulan dalam ratusan ribu rupiah Y = pengeluaran keluarga perbulan dalam ratusan ribu rupiah a) Jika diduga bahwa hubungan antara pendapatan keluarga dan pengeluaran keluarga linear, tentukan persamaan regresi dugaannya b) Bila dianggap asumsi-asumsi dalam analisis regresi linear terpenuhi, ujilah apakah ada hubungan antara pendapatan keluarga perbulan dan pengeluaran keluarga perbulan. Gunakan  = 0,05.
  • 13. 2. Suatu penelitian dilakukan terhadap 20 mahasiswa semester satu yang diambil secara acak untuk menentukan apakah nilai mutu rata-rata (NMR) pada akhir tahun pertama (Y) dapat diprediksi dari nilai ujian masuk (X). Data yang diperoleh sbb. X 5,5 4,8 4,7 3,9 4,5 6,2 6,0 5,2 4,7 4,3 Y 3,1 2,3 3,0 1,9 2,5 3,7 3,4 2,6 2,8 1,6 X 4,9 5,4 5,0 6,3 4,6 4,3 5,0 5,9 4,1 4,7 Y 2,0 2,9 2,3 3,2 1,8 1,4 2,0 3,8 2,2 1,5 a) Jika hubungan antar NMR dan nilai ujian masuk dapat dinyatakan dengan garis linear, tentukan persamaan regresi linear dugaannya. b) Bila dianggap asumsi-asumsi dalam analisis regresi linear terpenuhi, ujilah apakah ada hubungan antara nilai ujian masuk dan nilai mutu rata-rata (NMR) pada akhir tahun pertama. Gunakan  = 0,05. c) Tentukan nilai dugaan untuk NMR jika nilai ujian masuk 6,0 3. Bagian kepegawaian suatu perusahaan menggunakan 12 orang dalam suatu penelitian untuk menentukan hubungan antara nilai prestasi kerja (Y) dan nilai empat tes, yaitu tes kemampuan di bidang IT (X1), kemampuan berbahasa Inggris (X2), kemampuan bekerja sama (X3), dan kemampuan berkomunikasi (X4). Datanya adalah sebagai berikut Y X1 X2 X3 X4 11,2 14,5 17,2 17,8 19,3 24,5 21,2 16,9 14,8 20,0 13,2 22,5 56,5 59,5 69,2 74,5 81,2 88,0 78,2 69,0 58,1 80,5 58,3 84,0 71,0 72,5 76,0 79,5 84,0 86,2 80,0 72,0 68,0 85,0 71,0 87,2 38,5 38,2 42,5 43,5 47,5 47,4 44,5 41,8 42,1 48,1 37,5 51,0 43,0 44,8 49,0 56,3 60,2 62,0 58,1 48,1 46,0 60,3 47,1 65,2 a. Ujilah apakah ada hubungan linear antara nilai prestasi kerja (y) dan nilai empat tes, yaitu tes kemampuan di bidang IT, kemampuan berbahasa Inggris,
  • 14. dan kemampuan bekerja sama, kemampuan berkomunikasi. Gunakan  = 0,05. b. Manakah diantara empat variable yang secara signifikan berpengaruh terhadap prestasi kerja? c. Berdasarkan hasil b) Tentukan persamaan regresi linear dugaannya. d. Lakukan uji asumsi dalam analisis regresi linear dan simpulkan hasilnya. 4. Daya rentang produk fiber sintetis diperkirakan berhubungan dengan persentase bahan katun dalam fiber, waktu pengeringan fiber. Hasil percobaan terhadap 10 potong fiber yang diproduksi dalam beberapa kondisi yang berbeda diberikan pada Tabel berikut Y X1 X2 213 220 216 225 235 218 239 243 233 240 13 15 14 18 19 20 22 17 16 18 2,1 2,3 2,2 2,5 3,2 2,4 3,4 4,0 4, 4.3 a. Lakukan analisis regresi untuk menguji apakah ada hubungan linear antara persentase bahan katun dalam fiber dan waktu pengeringan dengan daya rentang fiber sintetis. b. Tentukan persaman regresi dugaannya. Lakukan uji asumsi dalam analisis regresi linear dan simpulkan hasilnya.