2. Analisis Hubungan
Dalam kehidupan sehari-hari, seringkali dijumpai hubungan antara
dua variabel atau lebih. Misal :
Hubungan curah hujan dan jumlah pasien di rumah sakit
Hubungan antara besar gaji yang diperoleh dengan taraf
pendidikan
Hubungan tarif bicara telepon seluler dan jumlah pelanggan
telepon seluler
Secara umum terdapat dua macam hubungan antara dua variabel
atau lebih :
Keeratan hubungan
Bentuk hubungan
Analisis Korelasi
Analisis Regresi
3. Analisis Hubungan
Alat yang biasa digunakan untuk menunjukkan
hubungan antara dua variabel adalah Scatter plot
(scatter diagram)
Analisa Korelasi digunakan untuk mengukur kekuatan
hubungan (hubungan linier) antara dua variabel
Hanya berhubungan dengan kekuatan hubungan
Bukan hubungan sebab-akibat
5. Analisis Regresi
Metode yg mempelajari hubungan antara dua variabel atau
lebih
Apakah variabel-variabel tersebut berhubungan (perlu
plotting data)
Seberapa kuat hubungan tersebut
Apakah suatu variabel dapat diprediksi dari variabel yang
lain
Suatu teknik Statistika untuk membuat model matematika
dan meneliti/memeriksa hubungan antara dua variabel atau
lebih.
6. Analisis Regresi
Analisis Regresi digunakan untuk:
Memprediksi nilai dari variabel dependen
berdasarkan pada variabel independent
Menerangkan pengaruh dari setiap perubahan dalam
variabel independen terhadap variabel dependent
8. Analisis Regresi
Variabel
Variabel tak bebas
Dependent Variable
Response Variable
Unknown Variable
Variabel Bebas
Explanatory Variable
Regressor Variable
Predictor Variable
Independent Variable
Known Variable
Y
X
10. Regresi Linier Sederhana
Hanya satu variabel independen, X
Hubungan X dan Y digambarkan dengan fungsi
linear
Perubahan Y diasumsikan dapat disebabkan karena
perubahan X
11. Regresi Liner Sederhana
Aplikasi yang mendasar dari Regresi Linier Sederhana dinyatakan
oleh garis lurus dengan persamaan :
Y = a + b X
Bagaimana cara menaksir nilai a dan b?
Garis lurus (linier) mana
yang paling cocok untuk
data tersebut?
x
y
x
y
a Run
Rise
b = Rise/Run
12. Linear Regresi Populasi
εxβy i ++=α
Komponen Linier
Model Regresi Populasi:
intercept
Koefisien
slope
Random
Error
(residual)
Variabel
Dependen
Variabel
dependen
Komponen Random
Error
13. Regresi Linier Sederhana
Error (ε) independen secara statistik
Distribusi probabilitas dari Error berdistribusi Normal
Distribusi probabilitas dari Error mempunyai variansi
yang konstan
Ada hubungan linier antara variabel X dan Y
Asumsi :
14. Regresi Linier Sederhana (lanjutan)
Random Error
for this x value
y
x
Observed Value
of y for xi
Predicted Value
of y for xi
εβxy ++= α
xi
Slope = β
Intercept = α
εi
Regresi Linier Populasi
15. Regresi Linier Sederhana
Ada 2 cara menentukan garis regresi :
1. Metoda tangan bebas (freehand method)
2. Metoda kuadrat terkecil (Least Square Method):
Menentukan suatu persamaan Regresi dengan
meminimumkan jumlah kuadrat jarak vertikal antara nilai
aktual Y dengan Nilai Prediksi Y
16. Least Squared Methods
3
3
Garis yang terbaik adalah garis yang meminimisasi Sum of Squared
difference antara titik data dan garis secara vertikal, yaitu error
41
1
4
(1,2)
2
2
(2,4)
(3,1.5)
Sum of squared differences = (2 - 1)2
+ (4 - 2)2
+(1.5 - 3)2
+
(4,3.2)
(3.2 - 4)2
= 6.89
Sum of squared differences = (2 -2.5)2
+(4 - 2.5)2
+(1.5 - 2.5)2
+(3.2 - 2.5)2
= 3.99
2.5
Mari kita bandingkan 2 buah garis
The smaller the sum of
squared differences
the better the fit of the
line to the data.
Garis kedua adalah garis
horizontal
17. Least Squared Methods
Tujuan dari MKT (LSM) adalah mencari nilai-nilai a dan b, sehingga jumlah error
kuadrat, sekecil mungkin.
Secara matematis, ditulis sebagai berikut :
)(
ˆ
ii
ii
bXaY
YYe
+−=
−=
Modal dasar dari metode kuadrat terkecil adalah nilai data
pengamatan { Xi, Yi }.
Nilai pengamatan Y dimodelkan dalam bentuk : Yi = Pola + Error
Dimana ibXaYPola +== ˆ
18. Metoda Kuadrat Terkecil (Least Squared Method)
bXaY
bXaYYYe
−−=
+−=−= )(ˆ
∑∑ −−== 22
)( bXaYeL
Nilai a dan b :
00 =
∂
∂
=
∂
∂
b
L
a
L
Least Squared Methods
19. ∑∑ −−== 22
)( bXaYeL
0)(2
0)1()(2
0
=−−−=
=−−−=
=
∂
∂
∑
∑
bXaY
bXaY
a
L
0
0)(
=−−
=−−
∑∑
∑
XbnaY
bXaY
∑∑ −= XbYna
XbY
n
X
b
n
Y
a
−=
−=
∑∑
Least Squared Methods
22. Contoh Regresi Linier Sederhana
Sebuah agen real estate ingin menguji hubungan antara
harga jual rumah dan ukuran rumah (diukur dalam
square feet)
Diambil sampel secara random sebanyak 10 rumah
Variabel tak bebas = Harga rumah dalam $1000
Variabel bebas = Luas rumah
23. Harga Rumah
(dlm $1000s)
Luas Rumah
(dlm Square Feet )
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
Sampel Data :
Contoh Regresi Linier Sederhana
25. a adalah estimasi nilai rata-rata Y pada saat x=0
Disini, tidak ada rumah yang mempunyai luas 0 square
foot, sehingga a = hanya
mengindikasikan bahwa, untuk rumah dengan ukuran
yang diobservasi biaya $98,248.33 adalah bagian dari
harga rumah yang tidak bisa dijelaskan oleh luas rumah
(dlm square feet)
98.24833
feet)(square0.1097798.24833rumahharga +=
Interpretasi Intercept (a)
Contoh Regresi Linier Sederhana
26. b diestimasi dari perubahan rata-rata nilai
Y sebagai hasil dari perubahan satu unit X
Disini, menunjukkan bahwa rata-rata
nilai rumah meningkat sebesar 0.10977($1000) =
$109.77, untuk setiap penambahan ukuran satu
square foot
b = .10977
feet)(square0.1097798.24833rumahharga +=
Interpretasi Slope (b)
Contoh Regresi Linier Sederhana
28. Regresi Non Linear Sederhana
Model Non Linear , antara lain :
1. Y = abX
2. Y = aebX
3. Y = aXb
29. Regresi Non Linear Sederhana
1. Y = abX
bXaY logloglog +=
n
X
b
n
Y
a
∑∑ −= )(log
log
log
( )22
loglog
log
∑∑
∑∑∑
−
−
=
XXn
YXYXn
b
30. Analisis Korelasi
Koefisien korelasi populasi ρ (rho) adalah
ukuran kekuatan hubungan linier antara dua
variabel dalam populasi
Koefisien Korelasi sampel r adalah estimasi
dari ρ dan digunakan untuk mengukur
kekuatan hubungan linier dalam sampel
observasi
33. Interpretasi Koefisien Korelasi
Interval Koefisien Tingkat Hubungan
0.00 – 0.199
0.20 – 0.399
0.40 – 0.599
0.60 – 0.799
0.80 – 1.000
Sangat rendah
Rendah
Cukup
Kuat
Sangat Kuat
36. Contoh Perhitungan
0
10
20
30
40
50
60
70
0 2 4 6 8 10 12 14
0.886
](321)][8(14111)(73)[8(713)
(73)(321)8(3142)
]y)()y][n(x)()x[n(
yxxyn
r
22
2222
=
−−
−
=
−−
−
=
∑ ∑ ∑ ∑
∑ ∑ ∑
Diameter Batang, x
Tinggi Pohon
y
(lanjutan)
r = 0.886 → menunjukkan hubungan
yang kuat (positif) antara x dan y
Notas del editor
Untuk mengukur besarnya pengaruh variabel bebas terhadap variabel tergantung dan memprediksi variabel tergantung dengan menggunakan variabel bebas. Gujarati (2006) mendefinisikan analisis regresi sebagai kajian terhadap hubungan satu variabel yang disebut sebagai variabel yang diterangkan (the explained variabel) dengan satu atau dua variabel yang menerangkan (the explanatory). Variabel pertama disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai variabel bebas. Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas akan dikenakan kepada variabel tergantung.