1. 1
BAB I
PENDAHULUAN
Pembahasan mengenai sebuah variable numeric bisa melalui penggunaan Statistic
Deskriptif dan Inferensia untuk membuat perkiraan dan kesimpulan tentang cariabel tersebut.
Jika yang akan dibahas adalah 2 variabel numeric atau lebih, termasuk hubungan di antara
keduanya, maka digunakan 2 teknik perhitungan, yaitu Regresi dan Korelasi.
Dalam analisis regresi, akan dikembangkan sebuah estimating equation (persamaan
regresi) yaitu suatu formula matematika yang mencari nilai variable dependent dari nilai
variable independent yang diketahui. Analisis regresi digunakan terutama untuk tujuan
peramalan, di mana dalam model tersebut ada sebuah variable dependent (tergantung) dan
variable independent (bebas). Sebagai contoh ada tiga variable, yaitu Penjualan, Biaya
Promosi dan Biaya Iklan. Dalam praktek, akan dibahas bagaimana hubungan antara Biaya
Promosi dan Biaya Iklan terhadap Penjualan. Di sini berarti ada variable dependent yaitu
Penjualan, sedangkan variable independentnya adalah Biaya Promosi dan Biaya Iklan.
Metode Korelasi akan membahas keeratan hubungan, dalam hal ini keeratan hubungan antara
Biaya Promosi dan biaya Iklan terhadap Penjualan. Sedang metode Regresi akan membahas
prediksi (peramalan), dalam hal ini apakah Penjualan di masa mendatang bisa diramalkan jika
Biaya Promosi dan Biaya Iklan diketahui.
Dalam praktek, regresi sering dibedakan antara regresi sederhana dan berganda.
Disebut regresi sederhana (Simple Regression) jika hanya ada satu variable independent,
sedangkan disebut regresi berganda (Multiple Regression) jika ada lebih dari satu variable
independent.(Nazir, 1983).
2. 2
BAB II
TINJAUAN PUSTAKA
Regresi merupakan sebuah alat yang dapat berguna untuk meramalkan sesuatu di masa
depan berdasarkan informasi masa lalu dan sekarang guna memperkecil kesalahan di masa
yang akan datang. Secara umum ada dua macam hubungan antara dua variabel atau lebih,
yaitu bentuk hubungan dan keeratan hubungan. Untuk mengetahui bentuk hubungan
digunakan analisis regresi. Untuk keeratan hubungan dapat diketahui dengan analisis korelasi.
Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau lebih,
terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan sempurna,
atau untuk mengetahui bagaimana variasi dari beberapa variabel bebas(prediktor X atau
independent variable) mempengaruhi variabel terikat (respon Y atau dependent variable)
dalam suatu fenomena yang kompleks. Jika X1, X2, … , Xi adalah variabel-variabel
independen dan Y adalah variabel dependen, maka terdapat hubungan fungsional antara X
dan Y, di mana variasi dari X akan diiringi pula oleh variasi dari Y. Secara matematika
hubungan di atas dapat dijabarkan sebagai berikut.
Y = f(X1, X2, …, Xi, e)
di mana Y adalah variabel terikat, X adalah variabel bebas dan e adalah variabel residual
(disturbance term). (Walpole, 1995)
Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang dapat
dilaksanakan dalam analisis regresi, diantaranya adalah sebagai berikut.
1. Mengadakan estimasi terhadap parameter berdasarkan data empiris.
2. Menguji berapa besar variasi variabel terikat dapat diterangkan oleh variasi variabel
bebas.
3. Menguji apakah estimasi parameter tersebut signifikan atau tidak.
4. Melihat apakah tanda dan magnitud dari estimasi parameter cocok dengan teori. (Nazir,
1983)
Uji Korelasi
Uji korelasi adalah metode pengujian yang digunakan untuk mengetahui hubungan antara
dua variabel yang datanya kuntitatif. Selain dapat mengetahui derajat keeratan hubungan
korelasi juga dapat digunakan untuk mengetahui arah hubungan dua variabel numerik,
misalnya apakah hubungan berat badan dan tinggi badan mempunyai derajat yang kuat atau
lemah dan juga apakah kedua variabel tersebut berpola positif atau negatif.(Armaidi, 2010)
3. 3
Langkah-langkah untuk menghitung korelasi adalah sebagai berikut.
1. Menentukan hipotesis
2. Menentukan batas penerimaan dan penolakan
3. Melakukan perhitungan korelasi antar variabel
4. Membandingkan perhitungan dengan tabel
5. Mengambil keputusan
6. Menarik kesimpulan (Hadi, 2000)
Koefisien Determinasi
Koefisien determinasi adalah proporsi keragaman atau variansi total nilai peubah Y yang
dapat dijelaskan oleh nilai peubah X melalui hubungan linier. (Draper, 1992). Koefisien
determinasi dilambangkan dengan R2
. Nilai ini menyatakan proporsi variasi keseluruhan
dalam nilai variabel dependen yang dapat diterangkan atau diakibatkan oleh hubungan linier
dengan nilai variabel independen, selain itu diterangkan oleh peubah yang lain (galat atau
peubah lainnya).
n
i
i
n
i
i
yy
yy
JKT
JKR
R
1
2
1
2
2
)(
)ˆ(
R2
= koefisien determinasi
Uji Serentak (Uji F)
Uji serentak (Uji F) adalah metode pengujian yang dilakukan untuk mengetahui pengaruh
variabel bebas secara bersama-sama terhadap variabel terikat (Ghozali, 2007). Langkah-
langkah untuk melakukan uji serentak (uji F) adalah sebagai berikut.
1. Menentukan hipotesis
H0 : βi = 0, artinya variabel bebas bukan merupakan penjelas yang signifikan terhadap
variabel terikat
H1 : βi ≠ 0, artinya variabel bebas merupakan penjelas yang signifikan terhadap variabel
terikat. Dengan i = 1,2,…,n.
2. Menentukan wilayah kritis (level of significance)
3. Menentukan daerah keputusan
H0 gagal ditolak apabila Fhitung ≤ Ftabel ( valueP ), artinya semua variabel bebas secara
bersama-sama bukan merupakan variabel penjelas yang signifikan terhadap variabel
terikat.
4. 4
H0 ditolak apabila Fhitung> Ftabel ( valueP ), artinya semua variabel bebas secara bersama-
sama merupakan penjelas yang signifikan terhadap variabel terikat.
4. Menentukan statistik uji
5. Mengambil keputusan (Gudjarat, 1995)
Uji serentak (uji F) juga sering disebut uji ANOVA. Tabel ANOVA untuk menguji
kelinieran regresi adalah sebagai berikut.
Tabel ANOVA untuk pengujian kelinieran regresi
Sumber
variasi
Derajat
bebas
Jumlah
kuadrat
Rataan kuadrat Fhitung
Regresi 1 JKR JKR RKR/RKS
Galat (sisa) n-2 JKS
Total n-1 JKT
(Sembiring, 2003)
2
1
)ˆ(
n
i
i yyJKR
2
1
)ˆ(
n
i
ii yyJKT
2
1
)(
n
i
ii yyJKS
JKGJKRJKT
regdb
JKR
RKR
sisadb
JKS
RKS
JKS
JKR
Fhitung
Uji Multikolinearitas
Multikolinearitas sering terjadi jika diantara variable bebas (x) saling berkorelasi
sehingga tingkat penelitian pemerkiraan semakin rendah. Di samping itu interval keyakinan
kesimpulan yang diambil keliru. Multikolinearitas yang berat dapat mengubah tanda koefisien
regresi yang seharusnya bertanda (+) berubah (-) atau sebaliknya. Uji multikolinearitas
diperoleh dengan beberapa langkah yaitu
5. 5
1. Melakukan regresi model lengkap Y = f (X1…Xn) sehingga kita mendapatkan R square.
2. Melakukan regresi X1 terhadap seluruh X lainnya, maka diperoleh nilai Ri square (regresi
ini disebut auxiliary regression); dan
3. Membandingkan nilai R dengan R square. Hipotesis yang dapat dipakai adalah Ho
diterima apabila R < R square model pertama berarti tidak terjadi multikolinearitas
dan H1 diterima apabila R > R square model pertama berarti terjadi masalah
multikolinearitas.
Uji Heteroskedastisitas
Heterokedastisitas adalah suatu kondisi dimana sebaran atau variable tidak konstan
sepanjang observasi. Jika harga X makin besar maka sebaran Y makin lebar atau makin
sempit. Untuk menguji heteroskedastisitas dapat dilakukan dengan uji white sebagai berikut:
1. Lakukan regresi model yang kita miliki dan kita dapatkan nilai residual untuk (estimasi
error);
2. Lakukan regresi auxiliary kita dapatkan nilai R² dari regresi ini kemudian kita hitung X²
dengan rumus n x X²
3. Dibandingkan X² dari regresi diatas dengan nilai chi square dengan derajad bebas 2 dan
alpha 1 %.
Jika R² x n lebih besar dari nilai 5aria chi square (alpha, df) berarti terjadi
heteroskedastisitas jika sebaliknya berarti tidak heteroskedastisitas.
Uji Autokorelasi
Autokorelasi dapat didefinisikan sebagai korelasi antara anggota serangkaian
observasi yang diurutkan menurut waktu atau ruang.
Jika terdapat autokorelasi maka nilai parameter b1 dan b2 yang diperoleh tetap linear
dan tidak bias. Akan tetapi, varians atau Sb1 dan Sb2 bias . Artinya parameter tidak efisien.
Akibatnya, uji signifikansi variable yang dilakukan dengan uji-t, di mana nilai t = b/S tidak
bisa ditentukan
6. 6
BAB III
PEMBAHASAN SOAL
Tabel Data Produktivitas Pertanian Padi di Sulawesi Selatan pada Tahun 2003-2012
Tahun Luas Panen (Ha) Produksi Padi ( Ton) Produktivitas (Ku/Ha)
2003 847305 4003079 47.24
2004 772773 3552835 45.98
2005 730611 3390397 46.4
2006 719846 3365509 46.75
2007 770733 3635139 47.16
2008 836298 4083356 48.83
2009 862017 4324178 50.16
2010 886354 4382443 49.44
2011 889232 4511705 50.74
2012 981164 5008143 51.04
(Sumber:website resmi BPS Pusat, tahun 2013)
8. 8
Membuat Model persamaan Regresi
Sehingga di peroleh model regresinya sebagai berikut:
Tabel 1:
Dari tabel diatas dapat dilihat bahwa rata-rata (Mean) untuk variabel dependent
(Produktivitas) adalah 48,3740 dan standar deviasinya adalah 1,89340. Rata-rata ( Mean)
untuk variabel bebas Produksi Padi adalah 4025678 dan standar deviasinya adalah
541313,93370. Sedangkan untuk variabel Luas Panen rata-ratanya adalah 829633,3 dan
standar deviasinya adalah 81443,37728. Kolom N menyatakan jumlah pengamatan. Dimana
ketiga variabel memiliki jumlah pengamatan yang sama yaitu sebanyak 10.
Menghitung Nilai Korelasi R
Dari perhitungan di atas dapat dilihat bahwa variabel Y memiliki hubungan yang kuat dengan
variabel yaitu sebesar 0.940. sehingga dapat dikatakan bahwa banyaknya jumlah Produksi
9. 9
Padi akan meningkatkan Produktivitas Pertanian Padi di Sulawesi Selatan pada tahun 2003-
2012.
Tabel 2:
Dari tabel di atas dapat dilihat korelasi antara ketiga variabel. Jika variabel tersebut
berkorelasi dengan dirinya sendiri maka nilai korelasinya adalah satu. Nilai korelasi Perason
tidak lebih dari harga .(Riduwan, 2010).
Dari tabel tersebut dapat dilihat bahwa Produktivitas berkorelasi positif terhadap Produksi
Panen, sebesar 0,940. Sementara korelasi Produktivitas terhadap Luas Panen, juga berkorelasi
positif sebesar 0,885. Karena Produktivitas berkorelasi positif terhada kedua variabel bebas (
Produksi Padi dan Luas Panen), hal ini berarti bahwa jika Produksi Padi dan Luas Panen
mengalami peningkatan, maka Produktivitas Padi juga akan ikut meningkat. Dan jika
Produksi Padi dan Luas panen mengalami penurunan, maka Produktivitas Padi juga akan
mengalami penurunan.
Menghitung nilai R-Square dan R:
Sehingga diperoleh nilai adalah
Sehingga diperoleh nilai adalah
10. 10
Tabel 3:
Dengan menggunakan tabel di atas dapat di ketahui apakah terjadi masalah multikolinearitas
atau tidak, yaitu dnegan membandingkan nilai R dengan R-square.
Jika nilai korelasi (R) > nilai koefisien determinasi (R-square), maka terjadi multikolinearitas.
Dan jika nilai korelasi (R)< nilai koefisien determinasi (R-square), maka tidak terjadi
multikolinearitas. Dari tabel dapat dilihat bahwa nilai R (0,997) > R-square (0,995), maka
terjadi multikolinearitas.
Kemudian untuk mengetahu ada atau tidaknya autokorelasi, dapat dilakukan dengan uji
Durbin Watson.
Tabel Uji Statistik Durbin-Watson
Nilai Statistik Durbin-Watson Hasil
Menolak hipotesis nol; ada autokorelasi positif
Daerah keraguan-raguan; tidak ada keputusan
Menerima hipotesis nol; tidak ada autokorelasi
positif/negatif
Daerah keragu-raguan; tidak ada keputusan
Menolak hipotesis nol; ada autokorelasi
positif
Nilai dan didapatkan dari tabel Durbin Watson( dengan dan
masing-masing sebagai berikut :
dan , sedangkan nilai Durbin Watson
Jadi, tidak ada keputusan.
Menghitung Tabel Anova:
a. Jumlah Kuadrat Regresi
11. 11
b. Jumlah Kuadrat Total
c. Jumlah Kuadrat Residual
d. Kuadrat Tengat Regresi
e. Kuadrat Tengah Residual
f. F hitung dan F Tabel
Dengan n = 10 dan k = 2, diperoleh nilai F tabel = 4.74
Tabel 4:
Tabel diatas digunakan untuk mencari nilai F-hitung, yang selanjutnya akan dibandingkan
dengan nilai F-tabel, dalam pengujian hipotesis.
Hipotesis:
, Luas Panen dan Produksi Padi tidak mempengaruhi Produktivitas Pertanian
Padi.
Luas Panen dan Produksi Padi mempengaruhi Produktivitas
Pertanian Padi.
12. 12
Kriteria Pengujian:
Jika maka ditolak, dan diterima.
Jika maka diterima, dan ditolak.
Karena , maka ditolak, dan diterima. sehingga
Luas Panen dan Produksi Padi mempengaruhi Produktivitas Pertanian Padi untuk Provinsi
Sulawesi Selatan pada tahun 2003-2012.
Menguji Autokorelasi dan Multikolinearitas
Tabel 5:
Tabel diatas dapat digunakan untuk mengetahui ada atau tidaknya autokorelasi, dengan
membandingkan nilai Lower Bound (dL) dan Upper Bound (dU) terhadap nilai Durbin-
Watson (d). serta menguji berat atau tidaknya multikolinearitas yang terjadi.
1. Menguji Autokorelasi
Hipotesis:
Þ = 0 (tidak ada autokorelasi)
: Þ ≠ 0 (ada autokorelasi)
Kriteria Pengujian:
Jika , tolak H0
Jika tolak H0
, terima H0
Untuk variabel X1, d(1.046) > dL (0.00), maka diterima. sehingga pada variabel Produksi
Padi tidak terdapat autokorelasi. Sementara untuk Luas Panen, d(1.046) > dL (0.00), maka
diterima. sehingga pada variabel Luas Panen tidak terdapat autokorelasi.
13. 13
2. Menguji Multikolinearitas
Untuk menguji berat atau tidaknya multikolinearitas yang terjadi dapat dilakukan dengan
melihat nilai VIF. Jika nilai VIF 10, maka multikolinearitas yang terjadi tidak berat. Jika
nilai VIF > 10, maka multikolinearitas yang terjadi berat. Karena nilai VIF (52.788) > 10,
maka multikolinearitas yang terjadi berat.
Menguji Heteroskedastisitas
Tabel 6:
Tabel ini dapat digunakan untuk mendeteksi terjadi atau tidaknya heterokedastisitas, dengan
memperhatikan nilai R-Square. Heteroskedastisitas terjadi bila hitung > tabel dengan
derajat bebas = 2. Dan selang keyakinan ( ) = 1%.
Uji Statistik
hitung = n x Ri square
= 10 x 0,981
= 9.81
tabel = X2
(0,01 , 2 )
= 0,0201
Keputusan :
Karena hitung (9,81)> tabel (0.021), maka terjadi heterokedastisitas.
14. 14
Grafik 1:
Grafik diatas menunjukkan garis regresi untuk variabel terikat adalah Produktifitas Padi dan
variabel bebasnya adalah Produksi Padi dan Luas Panen. Dari grafik dapat dilihat bahwa titik-
titiknya berada disekitar garis regresi. Hal itu berarti garis tersebut mewakili keseluruhan data
yang diambil. Sehingga model regresinya diterima.
Grafik 2:
Dari grafik diatas dapat dilihat bahwa semakin besar nilai dari Luas Panen dan semakin tinggi
Produksi Padi, maka Produktivitas Padi akan semakin meningkat juga. Hal ini berarti, bahwa
Luas Panen dan Produksi Padi memiliki korelasi positif terhadap Produktivitas Padi. Yang
paling besar pengaruhnya terhadap ProduktivitasPadi adalah variabel Produksi Padi.
Residual
Percent
0.40.30.20.10.0-0.1-0.2-0.3-0.4
99
95
90
80
70
60
50
40
30
20
10
5
1
Normal Probability Plot of the Residuals
(response is Produktivitas)
X-Data
Produktivitas
50000004000000300000020000001000000
51
50
49
48
47
46
Variable
Luas_Panen
Produksi
Scatterplot of Produktivitas vs Luas_Panen, Produksi