2. ANALISIS REGRESI
PENGERTIAN
Jenis uji statistika yang dipakai untuk melihat daya prediksi
predictor variables atau independent variables atau variabel bebas
terhadap dependent variable atau criterion variable atau variabel
terikat.
TUJUAN REGRESI
Mengestimasi nilai rata-rata variabel tak bebas dan nilai rata-
rata variabel bebas
Menguji hipotesis mengenai sifat alamiah ketergantungan
(sesuai teori ekonomi)
Memprediksi atau meramalkan nilai rata-rata variabel tak
bebas dan nilai rata-rata variabel bebas tertentu
3. JENIS REGRESI
Regresi sederhana regresi yang terdiri dari 2 variabel
Regresi multiple regresi yang terdiri dari lebih dari 2 variabel
Regresi Linier Memprediksi peranan prediktor dalam persamaan
linier
Regresi Non Linier Memprediksi peranan prediktor dalam
persamaan non-linier yang dibuat oleh peneliti.
REGRESI
Sederhana
y = f (x)
Multiple
y = f (x1…xn)
Linear Non-Linear
4. ANALISIS REGRESI
Regresi Linear : hubungannya berbetuk garis lurus
y = a + bx
a
= b
x
y
a
= - b
x
y
y = a - bx
positif negatif
7. ANALISIS REGRESI
PRASYARAT ANALISIS REGRESI
Variabel dependent dan independent harus kuantitatif
Variabel independent dan dependent harus terdistribusi
normal
Nilai variabel prediktor (x) harus bervariasi
Tidak terjadi multikolinearitas, dan heterokedastis (multiple
regression)
Jumlah observasi n harus lebih besar dari jumlah parameter
yang diobservasi
Jika data prediktor bersifat katagori (jender, agama, dsb)
maka perlu ditransformasi menjadi variabel dummy
8. REGRESI SEDERHANA
Regresi yang terdiri dari 2 variabel, yaitu y sebagai
variabel dependent (terikat) dan satu variabel x
sebagai variabel independent (bebas).
Contoh :
Y (tudung/topi) = menunjukkan estimasi fungsi regresi
sampel untuk mengestimasi populasi,
b0 , b1 = parameter atau koefisien regresi ; b0 disebut juga
sebagai konstanta, b1 (slope) yaitu mengukur tingkat
perubahan rata-rata Y per unit akibat perubahan X.
ei = disturbance error = faktor pengganggu = faktor acak
i
i
i e
X
b
b
Y
1
0
ˆ
1
1
0
1)
( X
X
Y
E
9. REGRESI SEDERHANA
Dalam dunia nyata, tidak ada unsur kepastian maka
perlu ditambahkan faktor pengganggu atau faktor
acak tersebut, untuk mengakomodasi beberapa hal
antara lain :
1. Karena ketidakjelasan atau ketidaklengkapan teori
2. Ketidaktersediaan data
3. Kesalahan manusiawi
4. Kurangnya variabel pengganti
5. Prinsip Kesederhanaan
6. Kesalahan bentuk fungsi
10. Koefisien Regresi
2
2
2
atau
i
i
i
i
i
i
i
i
i
x
y
x
b
X
X
n
Y
X
Y
X
n
b
X
b
Y
a
Y
Y
X
X
xy
Y
Y
y
X
X
x
;
;
Y = a + bX
11. • Untuk melihat kearatan hubungan antar variabel
• Hubungan tersebut dapat positif atau negatif
• Contoh hubungan positif :
• X = pupuk Y = produksi padi
• X = biaya advertensi Y = hasil penjualan
• X = jumlah ransum Y = berat badan
• X = pendapatan Y = konsumsi
• X = investasi Y = pendapatan nasional
Koefisien Korelasi
12. • Contoh hubungan negatif :
• X = harga barang Y = permintaan
• X = luas tambak Y = luas hutan mangrove
• X = pendapatan masy Y = kejahatan ekonomi
• X = biaya produksi Y = keuntungan
Koefisien Korelasi
13. • Nilai r berkisar antara |0 dan 1|
• r = 1, hubungan X dan Y sempurna dan positif
• r = -1, hubungan X dan Y sempurna dan negatif
Koefisien Korelasi
y = a + bx
a
= b
x
y
a
= - b
x
y
positif negatif
14. Koefisien Korelasi
Y
Y
X
X
xy
Y
Y
y
X
X
x
;
;
2
1 1
2
2
1 1
2
1 1 1
n
i
n
i
i
i
n
i
n
i
i
i
n
i
n
i
n
i
i
i
i
i
Y
Y
n
X
X
n
Y
X
Y
X
n
r
n
i
i
n
i
i
n
i
i
i
y
x
y
x
r
1
2
1
2
1
atau
• Rumus untuk menghitung r adalah :
16. Karena nilai kecil (lebih kecil dari alpha,
misal 5%), maka disimpulkan tolak H0,
yang berarti ada X yang berpengaruh
terhadap Y.
Analysis of Variance
Source DF Sum of
Squares
Mean
Square
F Value Pr > F
Model 1 115.6488 115.6488 374.8417 1.23E-06
Error 6 1.851163 0.308527
Corrected Total 7 117.5
17. Karena nilai kecil (lebih kecil dari alpha,
misal 5%), maka disimpulkan tolak H0,
yang berarti ada X yang berpengaruh
terhadap Y.
Analysis of Variance
Source DF Sum of
Squares
Mean
Square
F Value Pr > F
Model 5 63.23 12.65 9.75 0.0001
Error 18 23.34 1.30
Corrected Total 23 86.57
18. KORELASI RANK (PERINGKAT)
Rumus Spearman digunakan untuk data peringkat
Jauh lebih sederhana dibandingkan dengan rumus
product moment dari Pearson (yang sdh dipelajari),
sebab menggunakan rank dengan angka-angka yang
kecil.
Hasilnya sama atau mendekati sama.
Nilai terendah diberi rank kecil dan sebaliknya
)
1
(
6
1 2
2
n
n
d
r i
rank contoh
19. KORELASI DATA KUALITATIF
Data katagori, seperti : tinggi ; sedang; rendah
Misal : Kita ingin meneliti apakah ada hub : (1) antara
selera konsumen dengan letak geografis, (2) antara
kedudukan orang tua dengan kedudukan anak?, (3)
antara selera dan pendidikan?, (4) antara pendidikan dan
pendapatan?, dsb…
Contingency Coefficient (Koefisien Bersyarat)
digunakan untuk mengukur kuatnya hubungan data
kualitatif dimana mempunyai arti sama dengan koefisien
korelasi.
Nilai Contingency Coefficient (Cc) antara 0 dan 1.
20. KORELASI DATA KUALITATIF
Rumusnya :
1
0
;
2
2
c
c C
n
C
frequency)
(expected
harapan
frekuensi
)
.
.)(
(
e
Kuadrat
Khi
atau
Skuer
Kai
dibaca
;
e
observasi
banyaknya
ij
2
1 1 ij
2
2
n
j
n
ni
e
n
n
p
i
q
j
ij
ij
contoh
22. REGRESI BERGANDA
(Multiple Regression)
Adalah untuk melihat hubungan lebih dari 2 variabel
(variabel independent, Xi, lebih dari 1).
Y = b1 + b2X2 + b3X3 … bnXn
Misal : Regresi Linear dengan 2 variabel bebas
Y = b1 + b2X2 + b3X3 b1, b2, dan b3 dihitung sbb:
b1 n + b2 X2 + b3 X3 = Y
b1 X2 + b2 X22 + b3 X2X3 = X2Y
b1 X3 + b2 X3X2 + b3 X32 = X3Y
23. REGRESI BERGANDA
(Multiple Regression)
Dalam bentuk matriks
A
dari
(inverse)
kebalikan
matrik
A
;
A
b 1
-
1
-
3
2
3
2
1
2
3
2
3
3
3
2
2
2
2
3
2
H
H
Ab
Y
X
Y
X
Y
b
b
b
X
X
X
X
X
X
X
X
X
X
n
H
b
A
25. REGRESI BERGANDA
(Multiple Regression)
Jika suatu matriks :
)
det(
)
3
det(
;
)
det(
)
2
det(
;
)
det(
)
1
det(
:
maka
3
2
1
3
2
1
3
2
1
33
32
31
23
22
21
13
12
11
A
A
b
A
A
b
A
A
b
h
h
h
b
b
b
a
a
a
a
a
a
a
a
a
H
b
A
26. REGRESI BERGANDA
(Multiple Regression)
Dimana :
3
32
31
2
22
21
1
12
11
33
3
31
23
2
21
13
1
11
33
32
3
23
22
2
13
12
1
3
;
2
;
1
h
a
a
h
a
a
h
a
a
A
a
h
a
a
h
a
a
h
a
A
a
a
h
a
a
h
a
a
h
A
contoh
27. KORELASI BERGANDA
Apabila kita mempunyai 3 variabel Y, X2, X3, maka r :
)
X
dan
X
(korelasi
Y)
dan
X
(korelasi
Y)
dan
X
(korelasi
3
2
2
3
2
2
3
2
23
3
2
3
2
2
3
3
3
3
2
2
2
2
2
2
2
i
i
i
i
x
x
i
i
i
i
y
y
x
i
i
i
i
y
y
x
x
x
x
x
r
r
y
x
y
x
r
r
y
x
y
x
r
r
28. KORELASI BERGANDA
1
2
2
23
23
3
2
2
3
2
2
23
.
r
r
r
r
r
r
R
KKLB
y
y
y
y
y
KKLB (Koefisien Korelasi Linear Berganda)
ion)
determinat
of
(coef.
Penentu
koefisien
;
2
23
.
y
R
KP
y
b
2
i
3
3
2
2
2
23
.
i
i
i
i
y
y
x
b
y
x
R
KP
KP mengukur besarnya sumbangan (share) dari beberapa
variabel X terhadap adanya variasi (naik turunnya) Y
contoh
29. Multikolinearitas
Dalam analisis regresi berganda, antar Xi tidak boleh
saling berkorelasi.
Korelasi antar X menyebabkan dugaan koefisien tidak
stabil (memiliki variasi yang besar).
Hal ini menyebabkan kesimpulan cenderung
menyatakan terima H0 atau pengaruh X tidak signifikan
meskipun nilai R2 sangat tinggi.
30. Mendeteksi Multikolinearitas
1. Nilai R2 yang dihasilkan sangat tinggi tetapi hasil uji
t-statistik sangat sedikit variabel bebas yang
signifikan secara statistik
2. Menggunakan korelasi parsial (oleh: Farrar dan
Glauber, 1967)dengan langkah-langkah berikut:
a. Estimasi model Y=f(X1t,X2t) dan dapatkan nilai
R2
1. dan lakukan estimasi model X1t=f(X2t) dan
X2t=f(X1t) dan dapatkan nilai R2
2 dan R2
3
b. Rule of thumb bila R2
1 lebih tinggi dari R2
2 dan R2
3
maka model empiris tidak ditemukan
multikolinearitas
31. Penyebab Multikolinearitas
1. Metode Pengumpulan data yang dipakai
2. Kendala dalam model atau populasi yang menjadi
sampel sehingga populasi yang dijadikan sampel
kurang realistis
3. Spesifikasi model yang memasukkan variabel penjelas
yang seharusnya dikeluarkan dari model empiris dan
sebaliknya
4. Model yang berlebihan dimana jumlah variabel
penjelas lebih banyak dibandingkan jumlah data atau
observasi
32. Parameter Estimates
Variab
le
Label DF Parameter
Estimate
Standard
Error
t Value Pr > |t|
Interc
ept
Intercept 1 15.04677 27.45957 0.55 0.5905
X1 Harga beli konsumen
merek A (Rp per
kemasan)
1 -0.02151 0.01225 -1.76 0.0960
X2 Harga beli konsumen
merek PESAING (Rp per
kemasan)
1 0.01866 0.00608 3.07 0.0066
X3 Tingkat inflasi (%) 1 -3.15022 0.66768 -4.72 0.0002
X4 Belanja iklan (miliar
rupiah)
1 0.21919 1.04179 0.21 0.8357
X5 TOM (persen) 1 0.08291 0.06415 1.29 0.2125
Harga Beli merek A, merek PESAING
dan inflasi berpengaruh terhadap
sales (penjualan)
belanja iklan dan TOM tidak
berpengaruh terhadap sales
(penjualan)
Merasa aneh, kenapa belanja iklan
tidak signifikan pengaruhnya?
33. Korelasi belanja iklan dan TOM
Pearson Correlation Coefficients,
N = 24
Prob > |r| under H0: Rho=0
X4 Belanja iklan (miliar
rupiah)
X5 TOM (persen) 0.81296
<.0001
Korelasinya tinggi
multikolinear problem
HINDARKAN :
penggunaan X yang saling
berkorelasi
34. Model tanpa TOM
Parameter Estimates
Variable Label DF Parameter
Estim
ate
Standard
Error
t Value Pr > |t|
Intercept Intercept 1 22.25156 27.35832 0.81 0.4261
X1 Harga beli konsumen merek A
(Rp per kemasan)
1 -0.02720 0.01163 -2.34 0.0304
X2 Harga beli konsumen merek
PESAING (Rp per kemasan)
1 0.02150 0.00577 3.73 0.0014
X3 Tingkat inflasi (%) 1 -3.13176 0.67920 -4.61 0.0002
X4 Belanja iklan (miliar rupiah) 1 1.38162 0.53506 2.58 0.0183
Pengaruh belanja iklan signifikan
35. REGRESI BERGANDA
(Non Linear)
Trend Parabola
Y = a + bX + cX2
an + b X + c X2 = Y
aX + b X2 + c X3 = XY
aX2 + b X3 + c X4 = X2Y
36. REGRESI BERGANDA
(Non Linear)
Dalam bentuk matriks
A
dari
(inverse)
kebalikan
matrik
A
;
A
b 1
-
1
-
2
4
3
2
3
2
2
H
H
Ab
Y
X
XY
Y
c
b
a
X
X
X
X
X
X
X
X
n
H
b
A
contoh
37. REGRESI BERGANDA
(Non Linear)
Fungsi Eksponensial (Logaritma)
Y = aXb log Y = log a + b logX (Sederhana)
Y = aX1
b1 X2
b2 … Xn
bn (Multiple)
Log Y = log a + b1logX1 + b2logX2 … bnlogXn
contoh
38. UJI CHI-KUADRAT
Untuk penelitian yang menggunakan ukuran nominal
untuk mengukur atribut-atribut dari fenomena
tertentu.
Atau untuk menguji apakah beberapa ukuran
nominal berhubungan satu sama lain atau tidak
Chi-Kuadrat bermanfaat untuk melakukan uji
hubungan antara variabel dan uji homogenitas antar
variabel.
Contoh apakah ada hubungan antara kepuasan dan
kinerja dosen??
contoh
39. UJI CHI-KUADRAT
Rumus statistik Chi-Kuadrat :
ij
ij
ij
e
e
O 2
2
)
(
frequency)
(expected
harapan
frekuensi
)
.
.)(
(
eij
n
j
n
ni
Dimana :
Oij = simbol observasi dari tiap sel
41. UJI CHI-KUADRAT
Langkah Proses :
memberi nilai ekspektasi tiap sel. Misalnya : (1,1)
yaitu titik temu antara variabel puas dan variabel
cara mengajar, cara hitung adalah:
e1 = (112 x 70)/207 = 37,87
e2 = (95 x 60)/207 = 32,13
e3 = (112 x 60)/207 = 32,46
e4 = (95 x 60)/207 = 27,54
e5 = (112 x 77)/207 = 41,66
e6 = (95 x 77)/207 = 35,34
42. UJI CHI-KUADRAT
Data hasil penelitian dengan masing-masing ekspektasinya
adalah :
= ((35-37,87)2/37,87) + … + ((95-35,39)2/35,34) = 0,91
dengan mengambil sebesar 1% dan dk sebesar 2 (df = k-
1) serta menggunakan tabel chi kuadrat, maka di dapat
statistik tabel = 9,210
Selanjutnya, nilai dari statistik hitung dibandingkan dengan
statistik tabel.
Jika hitung > tabel, maka terima Ha, tolak Ho. Jika
sebaliknya () maka terima Ho dan tolak Ha.
0,91 < 9,210, maka terima Ho dan tolak Ha, artinya : tidak
ada hubungan kepuasan dengan kinerja dosen.
contoh
44. UJI CHI-KUADRAT
Data hasil penelitian dengan masing-masing ekspektasinya
adalah :
= ((35-37,87)2/37,87) + … + ((95-35,39)2/35,34) = 0,91
dengan mengambil sebesar 1% dan dk sebesar 2 (df = k-
1) serta menggunakan tabel chi kuadrat, maka di dapat
statistik tabel = 9,210
Selanjutnya, nilai dari statistik hitung dibandingkan dengan
statistik tabel.
Jika hitung > tabel, maka terima Ha, tolak Ho. Jika
sebaliknya () maka terima Ho dan tolak Ha.
0,91 < 9,210, maka terima Ho dan tolak Ha, artinya : tidak
ada hubungan kepuasan dengan kinerja dosen.
contoh
45. KETENTUAN PEMAKAIAN CHI-KUADRAT
Untuk pemakaian frekuensi harapan yang kecil diberlakukan
ketentuan sbb :
Nilai eij tiap sel minimal 10
Untuk derajat bebas lebih dari satu, frekuensi minimum 1
diperbolehkan; bila frekuensi harapan kurang dari lima,
maka frekuensi minimum 20 persen saja.
Penggunaan tabel chi-kuadrat hanya sesuai untuk derajat
bebas yang kurang dari 30 dan frekuensi harapan
minimum 2.
Nilai observasi tidak bernilai nol.
Baris-baris atau kolom-kolom bersebelahan dalam suatu
tabel kontingensi boleh digabungkan guna mendapatkan
frekuensi-frekuensi sel harapan yang disyaratkan.
46. DATA KATEGORIK
Data yang dinyatakan dalam bentuk kategori.
Data kualitatif : data nominal (posisi data sama derajatnya sekedar
menunjukkan kode katagori yang berbeda) atau ordinal.
Contoh (1) :
Industri rumah tangga, TK 1 – 4 orang = 1
Industri kecil, TK 5 – 19 orang = 2
Industri menengah, TK 20 – 100 orang = 3
Industri besar, TK > 100 = 4
Contoh (2) : Variabel Dummy
Laba pada 2 type perusahaan bila ditinjau dari biaya iklan: swasta
asing dan swasta nasional.
Banyak variabel dummy = banyak kategori – 1 = 2 – 1 = 1
Swasta asing = 1 dan swasta nasional = 0
Model : Laba = b0 + b1 iklan + b2 type + error.
47. DATA KATEGORIK
Jika koefisien b2 signifikan secara statistika, maka rata-rata laba
perusahaan swasta asing yang melakukan pembiayaan iklan untuk
produknya berbeda secara nyata dengan perusahaan swasta nasional
yang juga melakukan pembiayaan untuk membuat iklan
Contoh (3) dummy prilaku petani:
Berani mengambil resiko = 1
Netral terhadap resiko = 0
Contoh (4) dummy alat trasportasi (becak, sepeda motor, mobil)
Banyaknya var dummy = 3 -1 = 2. Misal, observasi 1 adalah
becak, observasi 2 adalah mobil, sedangkan observasi 3 adalah
spdmotor, dan observasi 4 adalah mobil.
Penyusunan variabel dummy sbb:
Misal ‘becak’ dianggap sebagai kategori dasar
Dummy1 = D1 : bernilai 1 jika ’sepedamotor’, bernilai 0 jika bukan
’sepedamotor’
Dummy2 = D2 : bernilai 1 jika ‘mobil’, bernilai 0 jika bukan mobil
48. DATA KATEGORIK
Susunannya adalah:
No. D1 D2
1. 0 0
2. 0 1
3. 1 0
4. 0 1
Perhatikan bahwa observasi pertama berisi angka nol semua, karena observasi
pertama adalah becak. Tidak memiliki variabel dummy karena becak kita
anggap sebagai kategori dasar. Kategori dasar biasanya dilambangkan dengan
angka nol semua. Penentuan kategori mana yang dijadikan kategori dasar,
sepenuhnya tergantung peneliti.
Contoh (5), Katagori Jenis Kelamin (Lk dan Pr) pengaruh gaji thp jenis
kelamin.
No. D1
1. 1
2. 0
apabila responden 1 (baris1) berjenis kelamin laki-laki, beri angka 1 pada
kolom D baris ke-1, atau angka 0 untuk perempuan.
49. DATA KATEGORIK
Contoh (6) Umur :
Buat pengkategorian usia responden. Misal, usia 0-11th = anak-
anak, 11-19th = remaja, 19-27th=dewasa, 27-40th=matang, 40-
100th=tua
Banyak variabel dummy = 5 – 1 = 4
Buat 4 kolom, masing-masing dengan nama, contoh: USIA1,
USIA2, USIA3 dan USIA4. Misalkan, kategori dasar adalah
kategori usia anak-anak. USIA1 = kategori remaja, …, USIA4 =
kategori tua.
Misal, responden pertama (baris ke-1) adalah remaja (11-19th),
maka pada baris 1 kolom USIA1, beri angka 1. Sedangkan untuk
kolom yang lain pada baris 1, beri angka 0. Lanjutkan ke
responden dua, jika responden 2 adalah tua, maka pada kolom
USIA4 baris ke-2, beri angka 1. Baris ke-2 untuk kolom selain
USIA4 beri angka 0. Dst…
50. DATA KATEGORIK
Susunannya adalah:
No. USIA1 USIA2 USIA3 USIA4
1. 1 0 0 0
2. 0 0 0 1
3. 0 0 0 0
dst
Perhatikan bahwa untuk baris-baris, baik pada kolom USIA1,
USIA2, USIA3 dan USIA4 berisi angka 0 semua, maka baris tsb
merupakan responden yang termasuk pada kategori anak-anak.
Apabila proses diatas telah selesai dilakukan, maka lanjutkan
dengan analisis regresi seperti biasa.
51. DATA KATEGORIK
Data Kualitatif : Ordinal, yaitu data yang dinyatakan dalam bentuk
katagori, namun posisi data tidak sama derajatnya karena
dinyatakan dalam sakala peringkat (Tabachnick & Fidell, 1996).
Contoh : tingkat kepadatan penduduk suatu daerah dikategorikan :
Sangat rendah diberi kode 1
Rendah diberi kode 2
Moderat diberi kode 3
Tinggi diberi kode 4
Sangat tinggi diberi kode 5
52. CONTOH DUMMY VARIABLE
Y = 14,4805 X10,1073 X20,0398 X30,6109 X40,4904 X5 0,2413 X60,0043 D0,1848
Se (1,2178) (0,1265) (0,1614) (0,1349) (0,1290) (0,0866) (0,0441) (0,0842)
t 14,04* 2,86** 1,39 6,91** 3,94** 3,19 0,88 2,26**
F = 732,09**
R2 = 83,52
Y = produksi kopi (kg)
X1 = tenaga kerja manusia (HKP)
X2 = pupuk (kg)
X3 = luas lahan garapan (ha)
X4 = jumlah pohon kopi yang berproduksi (batang)
X5 = umur rata-rata pohon kopi (tahun)
X6 = pengalaman dalam berusahatani kopi (tahun)
D = peubah sandi (dummy) untuk keikutsertaan dalam pembinaan LTA-77,
dengan nilai satu untuk petani yang ikut proyek dan nol untuk petani yang
tidak ikut proyek.
53. SOAL UJIAN
(60 MENIT)
Suatu data penelitian (hipotetis) seperti tabel berikut, dimana Y = produksi kedelai (ton),
X2 = luas lahan (ha), X3 = jumlah urea (kg)
Y X2 X3
2,3 1,0 70
0,7 0,2 30
1,5 0,4 20
1,7 0,6 40
2,3 0,8 60
2,2 0,7 50
1,0 0,4 30
1,4 0,6 30
2,0 0,7 40
1,9 0,6 30
Pertanyaan : (Gunakan Microsoft Excel dan Word)
1. Hitung model produksi :
Y = aX2
b2 X3
b3
Dalam bentuk linear
Log Y = Log a + b2 log X2 + b3 log X3 + e
2. Apa arti dari persamaan di atas?
3. Uji secara serempak pengaruh X2 dan X3
terhadap Y?
4. Uji secara parsial X2 terhadap Y dan X3
terhadap Y?
5. Hitung koefisien determinasi (R2), dan apa arti
dari koefisien tersebut.
6. Buat matrik korelasi antar variabel untuk
mengetahui multikolinearitas (jika R23 80%,
maka dianggap terjadi multikolinearitas).