1. 1
Machine Learning
Latihan Pertemuan 4
Supervised Learning
Regresi Linear Sederhana
Regresi linear sederhana adalah Metode Statistik yang berfungsi untuk menguji sejauh
mana hubungan sebab akibat antara Variabel Faktor Penyebab (X) terhadap Variabel
Akibatnya (Y)
Faktor penyebab pada umumnya dilambangkan dengan X atau disebut juga dengan
Predictor sedangkan Variabel Akibat dilambangkan dengan Y atau disebut juga dengan
Response.
Regresi Linear Sederhana atau sering disingkat dengan SLR(Simple Linear
Regression) juga merupakan salah satu Metode Statistik yang dipergunakan dalam
produksi untk melakukan peramalan ataupun prediksi tentang karakteristik kualitas
maupun kuantitas.
Contoh penggunaan
Contoh penggunaan analisis regresi linear sederhana dalam kegiatan produksi, antara
lain:
Hubungan antara lamanya kerusakan mesin dengan kualitas produksi yang dihasilkan
Hubungan jumlah pekerja dengan output yang diproduksi
Hubungan suhu ruangan dengan cacat produksi yang dihasilkan
Model Persamaan Regresi
Y = a + bX
Keterangan:
Y = Variabel Response atau Variabel Vaktor Akibat (Dependen)
X = Variabel Prediktor atau Variabel Faktor Penyebab (Independent)
a = Konstanta, perporongan garis regresi dengan sumbu Y (nilai estimasi jika x = 0)
b = Koefisien regresi (kemiringan/slope): besaran Response yang ditimbulkan oleh
variabel.
Gambar 1. Model persamaan regresi linear sederhana
Besarnya konstanta a dan b dapat ditentukan dengan persamaan:
Y
X
Y = a + bX
a
2. 2
a =
(∑ 𝑌𝑖)(∑ 𝑋𝑖
2
)−(∑ 𝑋𝑖)(∑ 𝑋𝑖𝑌𝑖)
𝑛 ∑ 𝑋𝑖
2
− (∑ 𝑋𝑖)2
b =
𝑛 (∑ 𝑋𝑖𝑌𝑖)−(∑ 𝑋𝑖)(∑ 𝑌𝑖)
𝑛 ∑ 𝑋𝑖
2
−(∑ 𝑋𝑖)2
n = jumlah data
Langkah-langkah Analisis dan Uji Regresi Linear Sederhana
Adapun langkah-langkah yang perlu dilakukan untuk melakukan analisis dan uji regresi
linear sederhana adalah sebagai berikut:
1. Menentukan tujuan dari Analisis Regresi Linear Sederhana
2. Mengidentifikasi variabel Predictor dan variabel Response
3. Melakukan pengumpulan data dalam bentuk table
4. Menghitung 𝑋2
, 𝑌2
, dan XY dan total dari masing-masingnya
5. Mengghitung a dan b menggunakan rumus yang telah ditentukan
6. Membuat model Persamaan Regresi Linear
7. Melakukan prediksi terhadap variabel predictor atau response
8. Uji korelasi
Latihan
Bangunlah sebuah model regresi (Provokasi = b . Emosi + a) dengan menentukan
b dan a
Gunakanlah model regresi tersebut untuk memprediksi nilai Provokasi untuk Berita
B4 dan B6
Tabel 1. Pengaruh provokasi terhadap emosi
Terdapat suatu data penelitian tentang 8 berita provokasi yang diprediksi dipengaruhi oleh
emosi.
Bagaimana menganalisisnya?
1. Menentukan tujuan: “Apakah emosi mempengaruhi provokasi berita?
2. Mengidentifikasi variabel Predictor dan variabel Response:
Berita Emosi Provokasi
B1 8 7
B2 2 3
B3 6 7
B4 9
B5 4 2
B6 5
B7 7 8
B8 3 3
3. 3
X (Variabel bebas/prediktor) = emosi
Y (Variabel tak bebas/response) = provokasi
3. Melakukan pengumpulan data dalam bentuk tabel
Tabel 2. Contoh tabel
Berita Emosi
(X)
Provokasi
(Y)
B1 8 7
B2 2 3
B3 6 7
B4 9 0
B5 4 2
B6 5 0
B7 7 8
B8 3 3
4. Menghitung X2
, Y2
, XY dan total dari masing-masingnya.
Tabel 3. Tabel data bantu
X 𝐗𝟐 Y 𝐘𝟐 XY
8 64 7 49 56
2 4 3 9 6
6 36 7 49 42
9 81 0 0 0
4 16 2 4 8
5 25 0 0 0
7 49 8 64 56
3 9 3 9 9
Σ 44 284 30 184 177
5. Menghitung a dan b menggunakan rumus yang telah ditentukan.
a =
(∑ 𝑌𝑖)(∑ 𝑋𝑖
2
)−(∑ 𝑋𝑖)(∑ 𝑋𝑖𝑌𝑖)
𝑛 ∑ 𝑋𝑖
2
− (∑ 𝑋𝑖)2
=
(30)(284)−(44)(177)
8(284)− (44)2
=
732
336
= 2,1786
b =
𝑛 (∑ 𝑋𝑖𝑌𝑖)−(∑ 𝑋𝑖)(∑ 𝑌𝑖)
𝑛 ∑ 𝑋𝑖
2
−(∑ 𝑋𝑖)2
=
8(177)−(44)(30)
8(284)− (44)2
(2)
(1)
4. 4
=
96
336
= 0,2857
6. Membuat model Persamaan Garis Regresi
Gambar 2. Persamaan garis regresi
Setelah didapatkan koefisien a dan b, maka persamaan garisnya adalah:
Y = 2,1786 + 0,2857 X
7. Melakukan prediksi terhadap variabel prediktor atau response
Prediksikan provokasi jika emosi adalah 9: Y = 2,1786 + 0,2857 X
Prediksi Y = 2,1786 + (0,2857 * 9) = 4,7499 = 5
Jadi nilai provokasi untuk berita B4 = 5
Prediksikan provokasi jika emosi adalah 5: Y = 2,1786 + 0,2857 X
Prediksi Y = 2,1786 + (0,2857 * 5) = 3,6071 = 4
Jadi nilai provokasi untuk berita B6 = 4
Tabel 4. Hasil prediksi nilai provokasi untuk berita B4 dan B6
Berita Emosi Provokasi
B1 8 7
B2 2 3
B3 6 7
B4 9 5
B5 4 2
B6 5 4
B7 7 8
B8 3 3
y = 0.2857x + 2.1786
R² = 0.048
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10
Provokasi
Emosi
(3)
5. 5
8. Uji Korelasi
Untuk mengukur kekuatan hubungan antar variabel prediktor X dan response Y,
dilakukan analisis korelasi yang hasilnya dinyatakan oleh suatu bilangan yang dikenal
dengan koefisien korelasi.
Biasanya analisis regresi sering dilakukan bersama-sama dengan analisis korelasi.
Persamaan koefisien korelasi (r) diekspresikan oleh:
r =
𝑛 ∑ 𝑋𝑖 𝑌𝑖−(∑ 𝑋𝑖)(∑ 𝑌𝑖)
𝑛
𝑖=1
𝑛
𝑖=1
𝑛
𝑖=1
√[𝑛 ∑ 𝑋𝑖
2
−(∑ 𝑋𝑖
𝑛
𝑖=1 )
2
]
𝑛
𝑖=1 [𝑛 ∑ 𝑌𝑖
2
𝑛
𝑖=1 −(∑ 𝑌1
𝑛
𝑖=1 )2]
Berdasarkan data tabel, maka koefisien korelasinya adalah:
r =
𝑛 ∑ 𝑋𝑖 𝑌𝑖−(∑ 𝑋𝑖)(∑ 𝑌𝑖)
𝑛
𝑖=1
𝑛
𝑖=1
𝑛
𝑖=1
√[𝑛 ∑ 𝑋𝑖
2
−(∑ 𝑋𝑖
𝑛
𝑖=1 )
2
]
𝑛
𝑖=1 [𝑛 ∑ 𝑌𝑖
2
𝑛
𝑖=1 −(∑ 𝑌1
𝑛
𝑖=1 )2]
=
8(177)−(44)(30)
√[8(284)−(44)2 ] [8(184)−(30)2]
=
1.416−1.320
√[2.272−1.936 ] [1.472−900]
=
96
√[336 ] [572]
=
96
√192.192
=
96
438,3970
= 0,2190
Nilai ini memberi arti bahwa, hubungan variabel bebas/predictor X dengan variabel
terikat/response Y adalah rendah, persentasenya 21%.
Interval Koefisien Tingkat Hubungan
0,00 – 0,19 Sangat rendah
0,20 – 0,399 Rendah
0,40 – 0,599 Sedang
0,60 -0,799 Kuat
0,80 – 1,000 Sangat kuat
(4)
6. 6
Jadi, provokasi memang rendah pengaruhnya terhadap emosi dalam menanggapi
sebuah berita.
Koefisien Determinasi
Koefisien determinasi dapat ditentukan dengan mengkuadratkan koefisien korelasi.
Dari contoh kasus di atas, maka koefisien determinasinya adalah:
𝑟2
= 0,21902
= 0,0480 = 0,05
Nilai ini berarti bahwa, 5% variabel bebas/predictor X dapat
menerangkan/menjelaskan variabel tak bebas/response Y, sedangkan 95% lainnya
dijelaskan oleh variabel lainnya.
Referensi
Syahid Abdullah, S. M. (2023). Machine Learning. Dalam S. M. Syahid Abdullah, Regresi Linear
Sederhana (hal. 1 - 27). Jakarta: Informatika UNSIA.