Analisis Komponen Utama (1)

Rani Nooraeni
Rani Nooraenilecturer en Politeknik Statistika STIS
PRINCIPAL COMPONENTS ANALYSIS
(ANALISIS KOMPONEN UTAMA)
ALDI RIZQUL UMAM (13.7472) ,BELLA LOVENINDA (13.7533)
LEA SRI RIZKI AMINUR BATRALING (13.7689), LUH SITHA WISDANI (13.7698)
MARTHIN FERNANDES SINAGA (13.7713) , MUHAMMAD RAFIQO ARDI (13.7755)
NITA YUNIARSIH (13.7784) , RIZQI ADITYA NUR HIDAYAH (13.7852)
SUSANTI (13.7882) , WAWAN KURNIAWAN (13.7908)
Dosen Pengampu : Rani Nooraeni, S.ST., M.Stat.
DEFINISI (1)
• Analisi statistika yang berguna untuk mereduksi sejumlah p
variabel (𝑋 𝑝) asal menjadi r variabel baru (𝑌𝑟 ) dengan tetap
mempertahankan besarnya keragaman dari variabel asal. 𝑌𝑟
merupakan kombinasi linier dari variabel asal.
𝑌𝑟 ≤ 𝑋 𝑝
r ≤ p
DEFINISI (1)
• Analisis komponen utama digunakan sebagai input bagi analisis statistika lainnya :
• Analisis Regresi (jika terjadi multikolinieritas antara variabel independen).
• Analisis gerombol untuk mengelompokkan objek.
• Analisis diskriminan.
• Dalam analisis komponen utama, tidak ada asumsi mengenai sebaran variabel acaknya, tidak ada
hipotesis yang diuji, dan tidak ada model yang mendasarinya. (Note : apabila analisis lanjutannya
memerlukan asumsi mengenai variabelnya, maka harus diuji apakah komponen utama yang terpilih
memenuhi asumsi tersebut).
• Skala pada variabel asal (𝑋1, 𝑋2, ..., 𝑋 𝑝) adalah metrik.
CATATAN
• AKU tidak selalu berhasil mereduksi banyaknya peubah asal menjadi beberapa peubah baru yang dapat
menjelaskan dengan baik keragaman data asal.
• Bila tidak ada korelasi antara peubah asal, AKU tidak akan memberikan hasil yang diinginkan, karena
peubah baru yang diperoleh hanyalah peubah asal yang ditata berdasarkan besar keragamannya.
• Makin erat korelasi (baik positif maupun negatif) antar peubah, makin baik pula hasil yang diperoleh
dari AKU.
Variabel baru (𝑌𝑟) disebut dengan komponen utama yang mempunyai ciri :
1. 𝑌1, 𝑌2, … , 𝑌𝑟 adalah kombinasi linier dari peubah asal
𝑌1 =𝑎11 𝑋1 + 𝑎12 𝑋2 + … + 𝑎1𝑝 𝑋 𝑝 = 𝑎1
′
X
⋮
𝑌𝑟 =𝑎 𝑟1 𝑋1 + 𝑎 𝑟2 𝑋2 + … + 𝑎 𝑟𝑝 𝑋 𝑝 = 𝑎 𝑟
′ X
𝑌 =
𝑌1
…
𝑌𝑟
, 𝐴′ =
𝑎11 … 𝑎1𝑝
… … …
𝑎 𝑟1 … 𝑎 𝑟𝑝
, 𝑋 =
𝑋1
…
𝑋 𝑝
Y = A’X
CIRI KOMPONEN UTAMA (1)
CIRI KOMPONEN UTAMA (2)
2. 𝑌1, 𝑌2, ... , 𝑌𝑟 tidak saling berkorelasi / antar komponen utama saling orthogonal.
Corr (𝑌𝑖, 𝑌𝑗) = Cov (𝑌𝑖, 𝑌𝑗) = Cov (𝑎𝑖
′
X, 𝑎𝑗
′
X) = 0
3. 𝑌1, 𝑌2, ... , 𝑌𝑟 terurut dari komponen utama yang mempunyai ragam terbesar sampai terkecil (ragam terbesar
mempunyai informasi yang paling banyak).
Var(Y1) ≥ Var(Y2) ≥ … ≥ Var(Yr) ≥ 0 ; Var(𝑌𝑖) = λ𝑖
Sehingga : λ1 ≥ λ2 ≥ … ≥ λ 𝑟
4. Diharapkan sejumlah k komponen utama yang terpilih (dengan k sekecil mungkin) sudah mampu menjelaskan
sebagian besar keragaman data.
PENAMAAN KOMPONEN UTAMA
• Komponen utama yang terbentuk harus diberi nama berdasarkan kontribusi variabel asal yang paling
besar.
• Kontribusi variabel asal didasarkan pada nilai vektor aj, karena nilai ini berhubungan linear dengan
korelasi antara X dengan Komponen Utama.
• Informasi pada KU didominasi oleh informasi X yang memiliki koefisien(aj) besar .
• Semakin besar aj, semakin besar kontribusinya.
• Namun jika vektor aj pada suatu komponen utama memiliki nilai yang sama, maka penamaan harus
memuat informasi gabungan mengenai semua X.
Contoh :
X1= umur, X2= pendidikan, X3= jenis kelamin
Y1 = 0.893X1+0.654X2+0.234X3
Maka penamaan Y1 sesuai dengan nama X1 (karena memiliki koefisien terbesar), Y1= umur.
Y2 = 0.24X1+0.24X2+0.24X3
Maka penamaan Y2 sesuai dengan gabungan ketiga variabel diatas, Y2 = karakteristik sosio demografi.
KERAGAMAN TOTAL
Y = A’X
Var (Y) = Var (A’X) = A’ Var(X) A = A’𝛴A
Dimana : Var(Y) =
λ1 0 … 0
0 λ2 … 0
⋮
0
⋮
0
⋱ ⋮
… λ 𝑟
Total keragaman Y = |Var(Y)|= trace (𝑉𝑎𝑟(𝑌)) = 𝑖=0
𝑟
λ𝑖
Trace (𝑉𝑎𝑟(𝑌)) = trace (A’𝛴A) = trace (A’A𝛴) = trace (𝛴) = Total keragaman X
Sehingga :
Total keragaman X = Total keragaman Y
𝑖=0
𝑝
𝑉𝑎𝑟(𝑋𝑖) = 𝑖=0
𝑟
𝑉𝑎𝑟(𝑌𝑖)
𝜎11 + 𝜎22 + ⋯ + 𝜎 𝑝𝑝 = λ2 + λ2 + … + λ 𝑟
Nilai total varians Y merupakan informasi dari seluruh variabel asal yang dapat dijelaskan oleh komponen-
komponen utamanya
KORELASI KOMPONEN UTAMA DENGAN PEUBAH ASAL
Peubah Asal : 𝑋1, 𝑋1, … , 𝑋 𝑝
Komponen Utama : 𝑌1, 𝑌2, ... , 𝑌𝑟
Dimana : 𝑌1= 𝑎1
′
X = 𝑒1
′
X , ..., 𝑌𝑟 = 𝑒 𝑟
′
X
Korelasi : 𝜌 𝑌 𝑖, 𝑋 𝑘
=
𝑒 𝑖𝑘 λ 𝑖
𝜎 𝑘𝑘
; i, k = 1,2, … , p
CATATAN
1. Dugaan KU
• Σ diduga dari S, sehingga yang didapat dalam analisis adalah λ1, λ2, ..., λ 𝑟 dan 𝑎1, 𝑎2, ... , 𝑎 𝑟
• Tidak ada asumsi tentang X, sehingga sifat dari penduga tidak dapat diturunkan
• AKU dipandang sebagai suatu teksik statistika yang tidak didasarkan pada suatu model apapun, shg KU yang
diperoleh tetap dipandang sebagai KU, bukan hanya sekedar dugaan.
2. Akar karakteristik 0
• Terjadi jika terdapat keterkaitan linier antara peubah (jarang terjadi)
• KU yang dihasilkan tidak digunakan (karena hanya diambil k komponen utama)
3. Akar karakteristik kecil
• Terjadi jika terdapat korelasi yang kurang erat antar peubah.
• KU nya dapat diabaikan
UJI BARTLETT
Untuk melihat apakah Analisis Komponen Utama dapat dilakukan :
• 𝐻0: 𝜌 = 𝐿 𝑝
• 𝐻1: 𝜌 ≠ 𝐿 𝑝
• 𝛼 = 5%
• Statistik Uji : 𝜒2
= − 𝑛 − 1 −
1
6
2𝑝 + 5 ln | 𝑝|
• Wilayah kritis : Tolak 𝐻0 jika : 𝜒2
> 𝜒2
𝛼,
1
2𝑝(𝑝−1)
• Keputusan
• Kesimpulan : jika matriks korelasi bukan merupakan identitas maka penyusutan dimensi terhadap peubah
ganda tersebut bermakna untuk dilakukan analisis dengan Komponen Utama.
LANGKAH
PEMBENTUKAN
KOMPONEN UTAMA
𝑋1,𝑋2,..., 𝑋 𝑝
Ukuran sama
Cari matriks varians-covarians (Σ)
Cari nilai eigen dan vektor
eigen dari Σ
Tentukan k
Hitung skor komponen
Ukuran berbeda
Standarisasi Xi,...,Xp
Cari matriks korelasi (𝜌) dari Xi yang
terstandarisasi (Zi)
Cari nilai eigen dan vektor
eigen dari 𝜌
Tentukan k
Hitung skor komponen
𝑌𝑖 =𝑎𝑖1 𝑋1 + 𝑎𝑖2 𝑋2 + … + 𝑎𝑖𝑝 𝑋 𝑝 = 𝑎𝑖
′
X
𝑎𝑖 𝑎𝑑𝑎𝑙𝑎ℎ 𝑣𝑒𝑘𝑡𝑜𝑟 𝑒𝑖𝑔𝑒𝑛 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑠𝑒𝑠𝑢𝑎𝑖𝑎𝑛
𝑑𝑒𝑛𝑔𝑎𝑛 𝜆 𝑖
(𝑍𝑖𝑗 =
𝑋 𝑖𝑗 − 𝑋 𝑗
𝑆 𝑗
)
PENENTUAN BANYAKNYA K
• Metode 1 :
Kumulatif proporsi keragaman total yang mampu dijelaskan komponen utama.
• Cari proporsi λ𝑖 dari masing-masing komponen utama :
Jika menggunakan Σ : λ𝑖/ 𝑖=1
𝑟
λ𝑖
Jika menggunakan 𝜌 : λ𝑖/p
• Tentukan batas minimum keragaman yang mampu dijelaskan. Pada dasarnya tidak ada patokan
mengenai batas tersebut, namun batas yang sering digunakan adalah 70% atau 80%.
• Jika komponen utama yang pertama belum dapat mencapai 80%, maka cari nilai kumulatif sampai
komponen utama ke-k yang mempunyai nilai minimum 80%.
PENENTUAN BANYAKNYA K
• Metode 2 (hanya dapat diterapkan pada matriks korelasi) :
• Akar ciri (λ𝑖) ≥ 0.7
• Jika λ𝑖< 0.7 , maka komponen utama tersebut tidak digunakan.
PENENTUAN BANYAKNYA K
• Metode 3 :
Menggunakan plot scree.
• Sumbu x = 1,2, ..., r (Sebanyak komponen utama)
• Sumbu y = λ1,, λ2 ... , λ 𝑟
• Cara menentukan banyaknya k : titik dimana sebelah kiri mempunyai garis yang curam dan kanannya
mempunyai garis landai (komponen utama yang dipilih sedemikian rupa sehingga selisih antara akar ciri yang
berurutan sudah tidak besar lagi).
SOFTWARE UNTUK ANALISIS KOMPONEN UTAMA
Software yang bisa digunakan yaitu :
• R
• SPSS
• Minitab
• SAS
• ...
CONTOH (PADA REGRESI)
• Y X1 X2 X3 X4 X5 X6 X7
• 160 46 75 278 180 35 198 125
• 150 51 68 254 210 56 211 177
• 170 58 57 275 165 71 121 134
• 165 49 55 202 169 36 179 118
• 155 60 59 107 150 45 210 337
• 155 55 60 118 216 50 134 120
• 175 57 75 184 240 62 200 107
• 150 45 60 190 185 30 190 183
• 160 47 72 222 200 45 189 153
• 175 62 79 295 90 65 200 160
• 160 46 81 193 205 72 140 113
• 145 52 60 122 108 80 175 168
• 165 47 59 54 222 36 181 154
• 200 66 73 239 215 40 190 160
• Y X1 X2 X3 X4 X5 X6 X7
• 160 57 66 180 180 35 180 335
• 180 49 64 211 210 55 124 400
• 190 61 66 130 170 40 150 119
• 165 54 62 142 106 35 135 215
• 205 62 70 120 217 50 170 405
• 175 58 68 190 191 44 190 168
• 185 60 65 111 175 32 200 164
• 185 52 64 89 215 27 187 106
• 175 57 75 184 109 62 200 184
• 150 45 60 264 185 30 190 183
• 160 47 72 222 200 45 189 153
• 175 62 79 295 90 65 200 160
• 160 46 81 193 205 72 140 113
• 145 52 60 122 108 80 175 168
• 165 52 59 54 222 36 181 154
• 200 66 73 239 215 40 190 160
• 160 57 66 94 180 35 180 335
• 180 58 71 211 210 55 124 400
• 190 61 66 166 170 40 150 119
• 165 54 62 174 106 35 135 123
• 205 62 70 264 217 50 170 405
Variabel bebas :
• X1 = Usia
• X2 = Berat badan (kg)
• X3 = Kadar Glukosa (mg/dl)
• X4 = Kadar Kolesterol Total (mg/dl)
• X5 = Kadar Kolesterol HDL (mg/dl)
• X6 = Kadar Kolesterol LDL (mg/dl)
• X7 = Kadar Trigliserida (mg/dl)
Variabel Terikat : Y = Jumlah Tekanan Darah Tinggi (mmHg)
Karena satuan variabel X tidak sama, maka akan digunakan matriks korelasi >> Xi harus distandarisasi.
UJI ASUMSI NONMULTIKOLINEARITAS
Pada analisis regresi, harus terpenuhi asumsi nonmultikolinearitas (tidak ada hubungan antarvariabel
bebas), sehingga perlu diuji asumsi ini.
Terjadi multikolinearitas jika VIF>5.
Misalnya terjadi multikolinearitas, maka variabel X perlu ditransformasi. Salah satunya dengan
menggunakan analisis komponen utama.
STEP 1 : STANDARISASI
VARABEL X
(𝑍𝑖𝑗 =
𝑋 𝑖𝑗 − 𝑋 𝑗
𝑆 𝑗
)
Z1 Z2 Z3 Z4 Z5 Z6 Z7
-1.3689 0.1485 1.4198 0.0423 -0.8700 0.9039 -0.7148
-0.5783 0.0152 1.0629 0.7355 0.5171 1.3866 -0.1734
0.5286 -0.1942 1.3752 -0.3044 1.5079 -1.9552 -0.6211
-0.8945 -0.2323 0.2897 -0.2119 -0.8040 0.1984 -0.7877
0.8448 -0.1561 -1.1228 -0.6510 -0.2095 1.3495 1.4924
0.0542 -0.1371 -0.9593 0.8741 0.1208 -1.4725 -0.7669
0.3705 0.1485 0.0221 1.4287 0.9134 0.9782 -0.9022
-1.5270 -0.1371 0.1113 0.1578 -1.2003 0.6068 -0.1110
-1.2108 0.0914 0.5871 0.5044 -0.2095 0.5697 -0.4233
1.1611 0.2247 1.6726 -2.0375 1.1116 0.9782 -0.3504
-1.3689 0.2628 0.1559 0.6200 1.5739 -1.2497 -0.8398
-0.4201 -0.1371 -0.8998 -1.6215 2.1024 0.0499 -0.2671
-1.2108 -0.1561 -1.9109 1.0128 -0.8040 0.2727 -0.4129
1.7935 0.1104 0.8399 0.8510 -0.5397 0.6068 -0.3504
0.3705 -0.0228 -0.0374 0.0423 -0.8700 0.2355 1.4716
-0.8945 -0.0609 0.4236 0.7355 0.4510 -1.8439 2.1484
1.0029 -0.0228 -0.7809 -0.1888 -0.5397 -0.8784 -0.7773
-0.1039 -0.0990 -0.6024 -1.6677 -0.8700 -1.4354 0.2222
Z1 Z2 Z3 Z4 Z5 Z6 Z7
1.1611 0.0533 -0.9295 0.8972 0.1208 -0.1358 2.2004
0.5286 0.0152 0.1113 0.2964 -0.2755 0.6068 -0.2671
0.8448 -0.0419 -1.0634 -0.0733 -1.0682 0.9782 -0.3088
-0.4201 -0.0609 -1.3905 0.8510 -1.3984 0.4954 -0.9127
0.3705 0.1485 0.0221 -1.5984 0.9134 0.9782 -0.1005
-1.5270 -0.1371 1.2116 0.1578 -1.2003 0.6068 -0.1110
-1.2108 0.0914 0.5871 0.5044 -0.2095 0.5697 -0.4233
1.1611 0.2247 1.6726 -2.0375 1.1116 0.9782 -0.3504
-1.3689 0.2628 0.1559 0.6200 1.5739 -1.2497 -0.8398
-0.4201 -0.1371 -0.8998 -1.6215 2.1024 0.0499 -0.2671
-0.4201 -0.1561 -1.9109 1.0128 -0.8040 0.2727 -0.4129
1.7935 0.1104 0.8399 0.8510 -0.5397 0.6068 -0.3504
0.3705 -0.0228 -1.3161 0.0423 -0.8700 0.2355 1.4716
0.5286 0.0724 0.4236 0.7355 0.4510 -1.8439 2.1484
1.0029 -0.0228 -0.2456 -0.1888 -0.5397 -0.8784 -0.7773
-0.1039 -0.0990 -0.1266 -1.6677 -0.8700 -1.4354 -0.7357
1.1611 0.0533 1.2116 0.8972 0.1208 -0.1358 2.2004
STEP 2 : MATRIKS KORELASI Z
1
0.1709586 1
0.0672961 0.484253 1
-0.142279 0.0542824 -0.115814 1
0.0316574 0.3438867 0.232479 -0.284483 1
0.0792424 0.158295 0.0786964 -0.039796 -0.198659 1
0.255364 -0.055465 -0.031713 0.1275284 -0.03758 -0.123157 1
STEP 3 : EIGEN VALUE DAN EIGEN VEKTOR
STEP 4 : TENTUKAN K
STEP 5 : KOMPONEN UTAMA
Principal Component Analysis: Z1; Z2; Z3; Z4; Z5; Z6; Z7
Eigen analysis of the Correlation Matrix
Eigenvalue 1,8152 1,2605 1,2229 1,0819 0,6634 0,6059 0,3502
Proportion 0,259 0,180 0,175 0,155 0,095 0,087 0,050
Cumulative 0,259 0,439 0,614 0,769 0,863 0,950 1,000
• Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7
• Z1 0,219 -0,628 -0,044 0,410 -0,415 -0,405 0,227
• Z2 0,581 -0,056 -0,268 -0,293 -0,290 0,070 -0,643
• Z3 0,549 0,023 -0,165 -0,199 0,619 -0,369 0,334
• Z4 -0,261 -0,175 -0,369 -0,714 -0,311 -0,011 0,398
• Z5 0,482 0,110 0,489 -0,092 -0,283 0,481 0,444
• Z6 0,093 0,076 -0,711 0,412 0,042 0,510 0,222
• Z7 -0,069 -0,744 0,139 -0,134 0,426 0,451 -0,138
PC1=e1
PC2=e2
.
.
.
Digunakan batas = 70%
k=4 (4 komponen utama pertama)
Karena kumulatif proporsi yang
bernilai 70% pada variabel ke-4
Komponen Utama :
Y1 = 0.219 Z1 + 0.581 Z2 + 0.549 Z3 – 0.261 Z4 + 0.482 Z5 + 0.093 Z6 – 0.069 Z7
Y2 = -0.628 Z1 – 0.056 Z2 + 0.023 Z3 – 0.175 Z4 + 0.110 Z5 + 0.076 Z6 – 0.744 Z7
Y3 = -0.044 Z1 – 0.268 Z2 – 0.165 Z3 – 0.369 Z4 + 0.489 Z5 – 0.711 Z6 + 0.139 Z7
Y4 = 0.410 Z1 – 0.293 Z2 – 0.199 Z3 – 0.714 Z4 – 0.092 Z5 + 0.412 Z6 – 0.134 Z7
4
5
STEP 6 : SKOR KOMPONEN
UTAMA
Y11 = 0.219 (-1.3689) + 0.581 (0.1485) + 0.549(1.4198) – 0.261 (0.0423) + 0.482 (-0.8700) + 0.093 (0.9039)-0.069(-0.7148)
= 0,808733
Y21= -0.628 (-1.3689) – 0.056 (0.1485) + 0.023 (1.4198) – 0.175 (0.0423) + 0.110 (-0.8700 )+ 0.076 (0.9039) – 0.744(-0.7148)
= 1,32938
Y21 = Komponen utama kedua, observasi pertama
... dst
Komponen Utama :
Y1 = 0.219 Z1 + 0.581 Z2 + 0.549 Z3 – 0.261 Z4 + 0.482 Z5 + 0.093 Z6 – 0.069 Z7
Y2 = -0.628 Z1 – 0.056 Z2 + 0.023 Z3 – 0.175 Z4 + 0.110 Z5 + 0.076 Z6 – 0.744 Z7
Y3 = -0.044 Z1 – 0.268 Z2 – 0.165 Z3 – 0.369 Z4 + 0.489 Z5 – 0.711 Z6 + 0.139 Z7
Y4 = 0.410 Z1 – 0.293 Z2 – 0.199 Z3 – 0.714 Z4 – 0.092 Z5 + 0.412 Z6 – 0.134 Z7
Z1 Z2 Z3 Z4 Z5 Z6 Z7
-1.3689 0.1485 1.4198 0.0423 -0.8700 0.9039 -0.7148
-0.5783 0.0152 1.0629 0.7355 0.5171 1.3866 -0.1734
0.5286 -0.1942 1.3752 -0.3044 1.5079 -1.9552 -0.6211
-0.8945 -0.2323 0.2897 -0.2119 -0.8040 0.1984 -0.7877
0.8448 -0.1561 -1.1228 -0.6510 -0.2095 1.3495 1.4924
0.0542 -0.1371 -0.9593 0.8741 0.1208 -1.4725 -0.7669
0.3705 0.1485 0.0221 1.4287 0.9134 0.9782 -0.9022
-1.5270 -0.1371 0.1113 0.1578 -1.2003 0.6068 -0.1110
-1.2108 0.0914 0.5871 0.5044 -0.2095 0.5697 -0.4233
1.1611 0.2247 1.6726 -2.0375 1.1116 0.9782 -0.3504
-1.3689 0.2628 0.1559 0.6200 1.5739 -1.2497 -0.8398
-0.4201 -0.1371 -0.8998 -1.6215 2.1024 0.0499 -0.2671
-1.2108 -0.1561 -1.9109 1.0128 -0.8040 0.2727 -0.4129
1.7935 0.1104 0.8399 0.8510 -0.5397 0.6068 -0.3504
0.3705 -0.0228 -0.0374 0.0423 -0.8700 0.2355 1.4716
-0.8945 -0.0609 0.4236 0.7355 0.4510 -1.8439 2.1484
1.0029 -0.0228 -0.7809 -0.1888 -0.5397 -0.8784 -0.7773
-0.1039 -0.0990 -0.6024 -1.6677 -0.8700 -1.4354 0.2222
HASIL
STEP SPSS
Analyze >> dimension
reduction >> factor
STEP SPSS
Extraction :
- Correlation matrix
- Unrotated factor solution
- Secree plot
- Based eigenvalue (Bisa
0.7 atau 1, disini dipilih 1)
Continue
OK
HASIL OUTPUT
Eigenvalue :
1,8152
1,2605
1,2229
1,0819
0,6634
0,6059
0,3502
Eigen value samaa...
HASIL OUTPUT
HASIL OUTPUT Komponen Utama :
Y1 = 0.219 Z1 + 0.581 Z2 + 0.549 Z3 – 0.261 Z4 + 0.482 Z5 + 0.093 Z6 – 0.069 Z7
Y2 = -0.628 Z1 – 0.056 Z2 + 0.023 Z3 – 0.175 Z4 + 0.110 Z5 + 0.076 Z6 – 0.744 Z7
Y3 = -0.044 Z1 – 0.268 Z2 – 0.165 Z3 – 0.369 Z4 + 0.489 Z5 – 0.711 Z6 + 0.139 Z7
Y4 = 0.410 Z1 – 0.293 Z2 – 0.199 Z3 – 0.714 Z4 – 0.092 Z5 + 0.412 Z6 – 0.134 Z7
Hasil Bedaaa ????
Output R
AKU DENGAN MINITAB
AKU DENGAN MINITAB
AKU DENGAN MINITAB
1 de 32

Recomendados

Analisis Komponen Utama (2) por
Analisis Komponen Utama (2)Analisis Komponen Utama (2)
Analisis Komponen Utama (2)Rani Nooraeni
863 vistas51 diapositivas
APG Pertemuan 5 : Inferensia Vektor Rata-rata 1 Populasi por
APG Pertemuan 5 : Inferensia Vektor Rata-rata 1 PopulasiAPG Pertemuan 5 : Inferensia Vektor Rata-rata 1 Populasi
APG Pertemuan 5 : Inferensia Vektor Rata-rata 1 PopulasiRani Nooraeni
917 vistas27 diapositivas
APG Pertemuan 3 : SAMPLE GEOMETRI AND RANDOM SAMPLING (2) por
APG Pertemuan 3 : SAMPLE GEOMETRI  AND RANDOM SAMPLING (2)APG Pertemuan 3 : SAMPLE GEOMETRI  AND RANDOM SAMPLING (2)
APG Pertemuan 3 : SAMPLE GEOMETRI AND RANDOM SAMPLING (2)Rani Nooraeni
923 vistas29 diapositivas
APG Pertemuan 4 : Multivariate Normal Distribution por
APG Pertemuan 4 : Multivariate Normal DistributionAPG Pertemuan 4 : Multivariate Normal Distribution
APG Pertemuan 4 : Multivariate Normal DistributionRani Nooraeni
2.5K vistas31 diapositivas
APG Pertemuan 5 : Inferensia Vektor Rata-rata por
APG Pertemuan 5 : Inferensia Vektor Rata-rataAPG Pertemuan 5 : Inferensia Vektor Rata-rata
APG Pertemuan 5 : Inferensia Vektor Rata-rataRani Nooraeni
882 vistas29 diapositivas
APG Pertemuan 6 : Inferensia Dua Faktor Rata-rata por
APG Pertemuan 6 : Inferensia Dua Faktor Rata-rataAPG Pertemuan 6 : Inferensia Dua Faktor Rata-rata
APG Pertemuan 6 : Inferensia Dua Faktor Rata-rataRani Nooraeni
1.2K vistas21 diapositivas

Más contenido relacionado

La actualidad más candente

APG Pertemuan 5 : Inferensia Satu Vektor Rata-rata por
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rataAPG Pertemuan 5 : Inferensia Satu Vektor Rata-rata
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rataRani Nooraeni
856 vistas21 diapositivas
Analisis Korelasi Kanonik (2) por
Analisis Korelasi Kanonik (2)Analisis Korelasi Kanonik (2)
Analisis Korelasi Kanonik (2)Rani Nooraeni
2.3K vistas52 diapositivas
Analisis Klaster (2) por
Analisis Klaster (2)Analisis Klaster (2)
Analisis Klaster (2)Rani Nooraeni
393 vistas47 diapositivas
APG Pertemuan 6 : Mean Vectors From Two Populations por
APG Pertemuan 6 : Mean Vectors From Two PopulationsAPG Pertemuan 6 : Mean Vectors From Two Populations
APG Pertemuan 6 : Mean Vectors From Two PopulationsRani Nooraeni
479 vistas22 diapositivas
Analisis Faktor (2.1) por
Analisis Faktor (2.1)Analisis Faktor (2.1)
Analisis Faktor (2.1)Rani Nooraeni
995 vistas47 diapositivas
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu... por
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...Rani Nooraeni
893 vistas27 diapositivas

La actualidad más candente(20)

APG Pertemuan 5 : Inferensia Satu Vektor Rata-rata por Rani Nooraeni
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rataAPG Pertemuan 5 : Inferensia Satu Vektor Rata-rata
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rata
Rani Nooraeni856 vistas
Analisis Korelasi Kanonik (2) por Rani Nooraeni
Analisis Korelasi Kanonik (2)Analisis Korelasi Kanonik (2)
Analisis Korelasi Kanonik (2)
Rani Nooraeni2.3K vistas
APG Pertemuan 6 : Mean Vectors From Two Populations por Rani Nooraeni
APG Pertemuan 6 : Mean Vectors From Two PopulationsAPG Pertemuan 6 : Mean Vectors From Two Populations
APG Pertemuan 6 : Mean Vectors From Two Populations
Rani Nooraeni479 vistas
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu... por Rani Nooraeni
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
Rani Nooraeni893 vistas
APG Pertemuan 4 : Multivariate Normal Distribution (2) por Rani Nooraeni
APG Pertemuan 4 : Multivariate Normal Distribution (2)APG Pertemuan 4 : Multivariate Normal Distribution (2)
APG Pertemuan 4 : Multivariate Normal Distribution (2)
Rani Nooraeni1.6K vistas
Analisis Diskriminan (1) por Rani Nooraeni
Analisis Diskriminan (1)Analisis Diskriminan (1)
Analisis Diskriminan (1)
Rani Nooraeni1.3K vistas
APG Pertemuan 1 dan 2 (3) por Rani Nooraeni
APG Pertemuan 1 dan 2 (3)APG Pertemuan 1 dan 2 (3)
APG Pertemuan 1 dan 2 (3)
Rani Nooraeni1.4K vistas
ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL por Arning Susilawati
ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUALANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL
ANALISIS REGRESI LINIER BERGANDA DAN PENGUJIAN ASUMSI RESIDUAL
Arning Susilawati25.2K vistas
Analisis Faktor (2.2) por Rani Nooraeni
Analisis Faktor (2.2)Analisis Faktor (2.2)
Analisis Faktor (2.2)
Rani Nooraeni1.5K vistas
APG Pertemuan 1 dan 2 (2) por Rani Nooraeni
APG Pertemuan 1 dan 2 (2)APG Pertemuan 1 dan 2 (2)
APG Pertemuan 1 dan 2 (2)
Rani Nooraeni1.1K vistas
Analisis tabel-kontingensi por Dwi Mardiani
Analisis tabel-kontingensiAnalisis tabel-kontingensi
Analisis tabel-kontingensi
Dwi Mardiani13.6K vistas
APG Pertemuan 6 : Inferensia Dua Vektor Rata-rata por Rani Nooraeni
APG Pertemuan 6 : Inferensia Dua Vektor Rata-rataAPG Pertemuan 6 : Inferensia Dua Vektor Rata-rata
APG Pertemuan 6 : Inferensia Dua Vektor Rata-rata
Rani Nooraeni487 vistas
Uji Run ( Keacakan ) por Nur Sandy
Uji Run ( Keacakan )Uji Run ( Keacakan )
Uji Run ( Keacakan )
Nur Sandy17K vistas

Similar a Analisis Komponen Utama (1)

Normalitas & homogenitas por
Normalitas & homogenitasNormalitas & homogenitas
Normalitas & homogenitasAYU Hardiyanti
9.2K vistas15 diapositivas
bahan sidang por
bahan sidangbahan sidang
bahan sidangOscar Pratama
577 vistas28 diapositivas
Stat prob10 distribution_normal por
Stat prob10 distribution_normalStat prob10 distribution_normal
Stat prob10 distribution_normalArif Rahman
2.3K vistas42 diapositivas
tugas7b.pdf por
tugas7b.pdftugas7b.pdf
tugas7b.pdfRonalSihombing
4 vistas36 diapositivas
Konsep distribusi peluang_kontinu(9) por
Konsep distribusi peluang_kontinu(9)Konsep distribusi peluang_kontinu(9)
Konsep distribusi peluang_kontinu(9)rizka_safa
3.5K vistas7 diapositivas
3 regresi and-korelasi_berganda.ppt por
3 regresi and-korelasi_berganda.ppt3 regresi and-korelasi_berganda.ppt
3 regresi and-korelasi_berganda.pptaliff_aimann
814 vistas30 diapositivas

Similar a Analisis Komponen Utama (1)(20)

Normalitas & homogenitas por AYU Hardiyanti
Normalitas & homogenitasNormalitas & homogenitas
Normalitas & homogenitas
AYU Hardiyanti9.2K vistas
Stat prob10 distribution_normal por Arif Rahman
Stat prob10 distribution_normalStat prob10 distribution_normal
Stat prob10 distribution_normal
Arif Rahman2.3K vistas
Konsep distribusi peluang_kontinu(9) por rizka_safa
Konsep distribusi peluang_kontinu(9)Konsep distribusi peluang_kontinu(9)
Konsep distribusi peluang_kontinu(9)
rizka_safa3.5K vistas
3 regresi and-korelasi_berganda.ppt por aliff_aimann
3 regresi and-korelasi_berganda.ppt3 regresi and-korelasi_berganda.ppt
3 regresi and-korelasi_berganda.ppt
aliff_aimann814 vistas
Mengatasi multikolonieritas por Eka Siskawati
Mengatasi multikolonieritasMengatasi multikolonieritas
Mengatasi multikolonieritas
Eka Siskawati8.2K vistas
Uji Normalitas dan Homogenitas ppt- por Aisyah Turidho
Uji Normalitas dan Homogenitas ppt-Uji Normalitas dan Homogenitas ppt-
Uji Normalitas dan Homogenitas ppt-
Aisyah Turidho8.5K vistas
Ppt ekonometrika analisis regresi berganda por SOFIATUL JANNAH
Ppt ekonometrika analisis regresi bergandaPpt ekonometrika analisis regresi berganda
Ppt ekonometrika analisis regresi berganda
SOFIATUL JANNAH10.6K vistas
Slide-INF207-stk3-ukuran-dispersi.pptx por MellysaCaldera
Slide-INF207-stk3-ukuran-dispersi.pptxSlide-INF207-stk3-ukuran-dispersi.pptx
Slide-INF207-stk3-ukuran-dispersi.pptx
MellysaCaldera4 vistas
Uji asumsi-klasik por Ipma Zukemi
Uji asumsi-klasikUji asumsi-klasik
Uji asumsi-klasik
Ipma Zukemi27.9K vistas
Aminullah assagaf implementasi software statistik &amp; analisis 27 juni 2020 por Aminullah Assagaf
Aminullah assagaf implementasi software statistik &amp; analisis 27 juni 2020Aminullah assagaf implementasi software statistik &amp; analisis 27 juni 2020
Aminullah assagaf implementasi software statistik &amp; analisis 27 juni 2020
Aminullah Assagaf173 vistas
UJI_HOMOGENITAS_BARTLETTS_STATISTIKA.pptx por rahma346597
UJI_HOMOGENITAS_BARTLETTS_STATISTIKA.pptxUJI_HOMOGENITAS_BARTLETTS_STATISTIKA.pptx
UJI_HOMOGENITAS_BARTLETTS_STATISTIKA.pptx
rahma3465973 vistas
Makalah ipb por mutiahumi
Makalah ipbMakalah ipb
Makalah ipb
mutiahumi4.9K vistas
Aminullah Assagaf_PERBANDINGAN SPSS, PLS SEM, MANUAL_23 Juli.pptx por Aminullah Assagaf
Aminullah Assagaf_PERBANDINGAN SPSS, PLS SEM, MANUAL_23 Juli.pptxAminullah Assagaf_PERBANDINGAN SPSS, PLS SEM, MANUAL_23 Juli.pptx
Aminullah Assagaf_PERBANDINGAN SPSS, PLS SEM, MANUAL_23 Juli.pptx
Aminullah Assagaf_PERBANDINGAN SPSS, PLS SEM, MANUAL_23 Juli.pdf por Aminullah Assagaf
Aminullah Assagaf_PERBANDINGAN SPSS, PLS SEM, MANUAL_23 Juli.pdfAminullah Assagaf_PERBANDINGAN SPSS, PLS SEM, MANUAL_23 Juli.pdf
Aminullah Assagaf_PERBANDINGAN SPSS, PLS SEM, MANUAL_23 Juli.pdf

Analisis Komponen Utama (1)

  • 1. PRINCIPAL COMPONENTS ANALYSIS (ANALISIS KOMPONEN UTAMA) ALDI RIZQUL UMAM (13.7472) ,BELLA LOVENINDA (13.7533) LEA SRI RIZKI AMINUR BATRALING (13.7689), LUH SITHA WISDANI (13.7698) MARTHIN FERNANDES SINAGA (13.7713) , MUHAMMAD RAFIQO ARDI (13.7755) NITA YUNIARSIH (13.7784) , RIZQI ADITYA NUR HIDAYAH (13.7852) SUSANTI (13.7882) , WAWAN KURNIAWAN (13.7908) Dosen Pengampu : Rani Nooraeni, S.ST., M.Stat.
  • 2. DEFINISI (1) • Analisi statistika yang berguna untuk mereduksi sejumlah p variabel (𝑋 𝑝) asal menjadi r variabel baru (𝑌𝑟 ) dengan tetap mempertahankan besarnya keragaman dari variabel asal. 𝑌𝑟 merupakan kombinasi linier dari variabel asal. 𝑌𝑟 ≤ 𝑋 𝑝 r ≤ p
  • 3. DEFINISI (1) • Analisis komponen utama digunakan sebagai input bagi analisis statistika lainnya : • Analisis Regresi (jika terjadi multikolinieritas antara variabel independen). • Analisis gerombol untuk mengelompokkan objek. • Analisis diskriminan. • Dalam analisis komponen utama, tidak ada asumsi mengenai sebaran variabel acaknya, tidak ada hipotesis yang diuji, dan tidak ada model yang mendasarinya. (Note : apabila analisis lanjutannya memerlukan asumsi mengenai variabelnya, maka harus diuji apakah komponen utama yang terpilih memenuhi asumsi tersebut). • Skala pada variabel asal (𝑋1, 𝑋2, ..., 𝑋 𝑝) adalah metrik.
  • 4. CATATAN • AKU tidak selalu berhasil mereduksi banyaknya peubah asal menjadi beberapa peubah baru yang dapat menjelaskan dengan baik keragaman data asal. • Bila tidak ada korelasi antara peubah asal, AKU tidak akan memberikan hasil yang diinginkan, karena peubah baru yang diperoleh hanyalah peubah asal yang ditata berdasarkan besar keragamannya. • Makin erat korelasi (baik positif maupun negatif) antar peubah, makin baik pula hasil yang diperoleh dari AKU.
  • 5. Variabel baru (𝑌𝑟) disebut dengan komponen utama yang mempunyai ciri : 1. 𝑌1, 𝑌2, … , 𝑌𝑟 adalah kombinasi linier dari peubah asal 𝑌1 =𝑎11 𝑋1 + 𝑎12 𝑋2 + … + 𝑎1𝑝 𝑋 𝑝 = 𝑎1 ′ X ⋮ 𝑌𝑟 =𝑎 𝑟1 𝑋1 + 𝑎 𝑟2 𝑋2 + … + 𝑎 𝑟𝑝 𝑋 𝑝 = 𝑎 𝑟 ′ X 𝑌 = 𝑌1 … 𝑌𝑟 , 𝐴′ = 𝑎11 … 𝑎1𝑝 … … … 𝑎 𝑟1 … 𝑎 𝑟𝑝 , 𝑋 = 𝑋1 … 𝑋 𝑝 Y = A’X CIRI KOMPONEN UTAMA (1)
  • 6. CIRI KOMPONEN UTAMA (2) 2. 𝑌1, 𝑌2, ... , 𝑌𝑟 tidak saling berkorelasi / antar komponen utama saling orthogonal. Corr (𝑌𝑖, 𝑌𝑗) = Cov (𝑌𝑖, 𝑌𝑗) = Cov (𝑎𝑖 ′ X, 𝑎𝑗 ′ X) = 0 3. 𝑌1, 𝑌2, ... , 𝑌𝑟 terurut dari komponen utama yang mempunyai ragam terbesar sampai terkecil (ragam terbesar mempunyai informasi yang paling banyak). Var(Y1) ≥ Var(Y2) ≥ … ≥ Var(Yr) ≥ 0 ; Var(𝑌𝑖) = λ𝑖 Sehingga : λ1 ≥ λ2 ≥ … ≥ λ 𝑟 4. Diharapkan sejumlah k komponen utama yang terpilih (dengan k sekecil mungkin) sudah mampu menjelaskan sebagian besar keragaman data.
  • 7. PENAMAAN KOMPONEN UTAMA • Komponen utama yang terbentuk harus diberi nama berdasarkan kontribusi variabel asal yang paling besar. • Kontribusi variabel asal didasarkan pada nilai vektor aj, karena nilai ini berhubungan linear dengan korelasi antara X dengan Komponen Utama. • Informasi pada KU didominasi oleh informasi X yang memiliki koefisien(aj) besar . • Semakin besar aj, semakin besar kontribusinya. • Namun jika vektor aj pada suatu komponen utama memiliki nilai yang sama, maka penamaan harus memuat informasi gabungan mengenai semua X. Contoh : X1= umur, X2= pendidikan, X3= jenis kelamin Y1 = 0.893X1+0.654X2+0.234X3 Maka penamaan Y1 sesuai dengan nama X1 (karena memiliki koefisien terbesar), Y1= umur. Y2 = 0.24X1+0.24X2+0.24X3 Maka penamaan Y2 sesuai dengan gabungan ketiga variabel diatas, Y2 = karakteristik sosio demografi.
  • 8. KERAGAMAN TOTAL Y = A’X Var (Y) = Var (A’X) = A’ Var(X) A = A’𝛴A Dimana : Var(Y) = λ1 0 … 0 0 λ2 … 0 ⋮ 0 ⋮ 0 ⋱ ⋮ … λ 𝑟 Total keragaman Y = |Var(Y)|= trace (𝑉𝑎𝑟(𝑌)) = 𝑖=0 𝑟 λ𝑖 Trace (𝑉𝑎𝑟(𝑌)) = trace (A’𝛴A) = trace (A’A𝛴) = trace (𝛴) = Total keragaman X Sehingga : Total keragaman X = Total keragaman Y 𝑖=0 𝑝 𝑉𝑎𝑟(𝑋𝑖) = 𝑖=0 𝑟 𝑉𝑎𝑟(𝑌𝑖) 𝜎11 + 𝜎22 + ⋯ + 𝜎 𝑝𝑝 = λ2 + λ2 + … + λ 𝑟 Nilai total varians Y merupakan informasi dari seluruh variabel asal yang dapat dijelaskan oleh komponen- komponen utamanya
  • 9. KORELASI KOMPONEN UTAMA DENGAN PEUBAH ASAL Peubah Asal : 𝑋1, 𝑋1, … , 𝑋 𝑝 Komponen Utama : 𝑌1, 𝑌2, ... , 𝑌𝑟 Dimana : 𝑌1= 𝑎1 ′ X = 𝑒1 ′ X , ..., 𝑌𝑟 = 𝑒 𝑟 ′ X Korelasi : 𝜌 𝑌 𝑖, 𝑋 𝑘 = 𝑒 𝑖𝑘 λ 𝑖 𝜎 𝑘𝑘 ; i, k = 1,2, … , p
  • 10. CATATAN 1. Dugaan KU • Σ diduga dari S, sehingga yang didapat dalam analisis adalah λ1, λ2, ..., λ 𝑟 dan 𝑎1, 𝑎2, ... , 𝑎 𝑟 • Tidak ada asumsi tentang X, sehingga sifat dari penduga tidak dapat diturunkan • AKU dipandang sebagai suatu teksik statistika yang tidak didasarkan pada suatu model apapun, shg KU yang diperoleh tetap dipandang sebagai KU, bukan hanya sekedar dugaan. 2. Akar karakteristik 0 • Terjadi jika terdapat keterkaitan linier antara peubah (jarang terjadi) • KU yang dihasilkan tidak digunakan (karena hanya diambil k komponen utama) 3. Akar karakteristik kecil • Terjadi jika terdapat korelasi yang kurang erat antar peubah. • KU nya dapat diabaikan
  • 11. UJI BARTLETT Untuk melihat apakah Analisis Komponen Utama dapat dilakukan : • 𝐻0: 𝜌 = 𝐿 𝑝 • 𝐻1: 𝜌 ≠ 𝐿 𝑝 • 𝛼 = 5% • Statistik Uji : 𝜒2 = − 𝑛 − 1 − 1 6 2𝑝 + 5 ln | 𝑝| • Wilayah kritis : Tolak 𝐻0 jika : 𝜒2 > 𝜒2 𝛼, 1 2𝑝(𝑝−1) • Keputusan • Kesimpulan : jika matriks korelasi bukan merupakan identitas maka penyusutan dimensi terhadap peubah ganda tersebut bermakna untuk dilakukan analisis dengan Komponen Utama.
  • 12. LANGKAH PEMBENTUKAN KOMPONEN UTAMA 𝑋1,𝑋2,..., 𝑋 𝑝 Ukuran sama Cari matriks varians-covarians (Σ) Cari nilai eigen dan vektor eigen dari Σ Tentukan k Hitung skor komponen Ukuran berbeda Standarisasi Xi,...,Xp Cari matriks korelasi (𝜌) dari Xi yang terstandarisasi (Zi) Cari nilai eigen dan vektor eigen dari 𝜌 Tentukan k Hitung skor komponen 𝑌𝑖 =𝑎𝑖1 𝑋1 + 𝑎𝑖2 𝑋2 + … + 𝑎𝑖𝑝 𝑋 𝑝 = 𝑎𝑖 ′ X 𝑎𝑖 𝑎𝑑𝑎𝑙𝑎ℎ 𝑣𝑒𝑘𝑡𝑜𝑟 𝑒𝑖𝑔𝑒𝑛 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑠𝑒𝑠𝑢𝑎𝑖𝑎𝑛 𝑑𝑒𝑛𝑔𝑎𝑛 𝜆 𝑖 (𝑍𝑖𝑗 = 𝑋 𝑖𝑗 − 𝑋 𝑗 𝑆 𝑗 )
  • 13. PENENTUAN BANYAKNYA K • Metode 1 : Kumulatif proporsi keragaman total yang mampu dijelaskan komponen utama. • Cari proporsi λ𝑖 dari masing-masing komponen utama : Jika menggunakan Σ : λ𝑖/ 𝑖=1 𝑟 λ𝑖 Jika menggunakan 𝜌 : λ𝑖/p • Tentukan batas minimum keragaman yang mampu dijelaskan. Pada dasarnya tidak ada patokan mengenai batas tersebut, namun batas yang sering digunakan adalah 70% atau 80%. • Jika komponen utama yang pertama belum dapat mencapai 80%, maka cari nilai kumulatif sampai komponen utama ke-k yang mempunyai nilai minimum 80%.
  • 14. PENENTUAN BANYAKNYA K • Metode 2 (hanya dapat diterapkan pada matriks korelasi) : • Akar ciri (λ𝑖) ≥ 0.7 • Jika λ𝑖< 0.7 , maka komponen utama tersebut tidak digunakan.
  • 15. PENENTUAN BANYAKNYA K • Metode 3 : Menggunakan plot scree. • Sumbu x = 1,2, ..., r (Sebanyak komponen utama) • Sumbu y = λ1,, λ2 ... , λ 𝑟 • Cara menentukan banyaknya k : titik dimana sebelah kiri mempunyai garis yang curam dan kanannya mempunyai garis landai (komponen utama yang dipilih sedemikian rupa sehingga selisih antara akar ciri yang berurutan sudah tidak besar lagi).
  • 16. SOFTWARE UNTUK ANALISIS KOMPONEN UTAMA Software yang bisa digunakan yaitu : • R • SPSS • Minitab • SAS • ...
  • 17. CONTOH (PADA REGRESI) • Y X1 X2 X3 X4 X5 X6 X7 • 160 46 75 278 180 35 198 125 • 150 51 68 254 210 56 211 177 • 170 58 57 275 165 71 121 134 • 165 49 55 202 169 36 179 118 • 155 60 59 107 150 45 210 337 • 155 55 60 118 216 50 134 120 • 175 57 75 184 240 62 200 107 • 150 45 60 190 185 30 190 183 • 160 47 72 222 200 45 189 153 • 175 62 79 295 90 65 200 160 • 160 46 81 193 205 72 140 113 • 145 52 60 122 108 80 175 168 • 165 47 59 54 222 36 181 154 • 200 66 73 239 215 40 190 160 • Y X1 X2 X3 X4 X5 X6 X7 • 160 57 66 180 180 35 180 335 • 180 49 64 211 210 55 124 400 • 190 61 66 130 170 40 150 119 • 165 54 62 142 106 35 135 215 • 205 62 70 120 217 50 170 405 • 175 58 68 190 191 44 190 168 • 185 60 65 111 175 32 200 164 • 185 52 64 89 215 27 187 106 • 175 57 75 184 109 62 200 184 • 150 45 60 264 185 30 190 183 • 160 47 72 222 200 45 189 153 • 175 62 79 295 90 65 200 160 • 160 46 81 193 205 72 140 113 • 145 52 60 122 108 80 175 168 • 165 52 59 54 222 36 181 154 • 200 66 73 239 215 40 190 160 • 160 57 66 94 180 35 180 335 • 180 58 71 211 210 55 124 400 • 190 61 66 166 170 40 150 119 • 165 54 62 174 106 35 135 123 • 205 62 70 264 217 50 170 405
  • 18. Variabel bebas : • X1 = Usia • X2 = Berat badan (kg) • X3 = Kadar Glukosa (mg/dl) • X4 = Kadar Kolesterol Total (mg/dl) • X5 = Kadar Kolesterol HDL (mg/dl) • X6 = Kadar Kolesterol LDL (mg/dl) • X7 = Kadar Trigliserida (mg/dl) Variabel Terikat : Y = Jumlah Tekanan Darah Tinggi (mmHg) Karena satuan variabel X tidak sama, maka akan digunakan matriks korelasi >> Xi harus distandarisasi.
  • 19. UJI ASUMSI NONMULTIKOLINEARITAS Pada analisis regresi, harus terpenuhi asumsi nonmultikolinearitas (tidak ada hubungan antarvariabel bebas), sehingga perlu diuji asumsi ini. Terjadi multikolinearitas jika VIF>5. Misalnya terjadi multikolinearitas, maka variabel X perlu ditransformasi. Salah satunya dengan menggunakan analisis komponen utama.
  • 20. STEP 1 : STANDARISASI VARABEL X (𝑍𝑖𝑗 = 𝑋 𝑖𝑗 − 𝑋 𝑗 𝑆 𝑗 ) Z1 Z2 Z3 Z4 Z5 Z6 Z7 -1.3689 0.1485 1.4198 0.0423 -0.8700 0.9039 -0.7148 -0.5783 0.0152 1.0629 0.7355 0.5171 1.3866 -0.1734 0.5286 -0.1942 1.3752 -0.3044 1.5079 -1.9552 -0.6211 -0.8945 -0.2323 0.2897 -0.2119 -0.8040 0.1984 -0.7877 0.8448 -0.1561 -1.1228 -0.6510 -0.2095 1.3495 1.4924 0.0542 -0.1371 -0.9593 0.8741 0.1208 -1.4725 -0.7669 0.3705 0.1485 0.0221 1.4287 0.9134 0.9782 -0.9022 -1.5270 -0.1371 0.1113 0.1578 -1.2003 0.6068 -0.1110 -1.2108 0.0914 0.5871 0.5044 -0.2095 0.5697 -0.4233 1.1611 0.2247 1.6726 -2.0375 1.1116 0.9782 -0.3504 -1.3689 0.2628 0.1559 0.6200 1.5739 -1.2497 -0.8398 -0.4201 -0.1371 -0.8998 -1.6215 2.1024 0.0499 -0.2671 -1.2108 -0.1561 -1.9109 1.0128 -0.8040 0.2727 -0.4129 1.7935 0.1104 0.8399 0.8510 -0.5397 0.6068 -0.3504 0.3705 -0.0228 -0.0374 0.0423 -0.8700 0.2355 1.4716 -0.8945 -0.0609 0.4236 0.7355 0.4510 -1.8439 2.1484 1.0029 -0.0228 -0.7809 -0.1888 -0.5397 -0.8784 -0.7773 -0.1039 -0.0990 -0.6024 -1.6677 -0.8700 -1.4354 0.2222 Z1 Z2 Z3 Z4 Z5 Z6 Z7 1.1611 0.0533 -0.9295 0.8972 0.1208 -0.1358 2.2004 0.5286 0.0152 0.1113 0.2964 -0.2755 0.6068 -0.2671 0.8448 -0.0419 -1.0634 -0.0733 -1.0682 0.9782 -0.3088 -0.4201 -0.0609 -1.3905 0.8510 -1.3984 0.4954 -0.9127 0.3705 0.1485 0.0221 -1.5984 0.9134 0.9782 -0.1005 -1.5270 -0.1371 1.2116 0.1578 -1.2003 0.6068 -0.1110 -1.2108 0.0914 0.5871 0.5044 -0.2095 0.5697 -0.4233 1.1611 0.2247 1.6726 -2.0375 1.1116 0.9782 -0.3504 -1.3689 0.2628 0.1559 0.6200 1.5739 -1.2497 -0.8398 -0.4201 -0.1371 -0.8998 -1.6215 2.1024 0.0499 -0.2671 -0.4201 -0.1561 -1.9109 1.0128 -0.8040 0.2727 -0.4129 1.7935 0.1104 0.8399 0.8510 -0.5397 0.6068 -0.3504 0.3705 -0.0228 -1.3161 0.0423 -0.8700 0.2355 1.4716 0.5286 0.0724 0.4236 0.7355 0.4510 -1.8439 2.1484 1.0029 -0.0228 -0.2456 -0.1888 -0.5397 -0.8784 -0.7773 -0.1039 -0.0990 -0.1266 -1.6677 -0.8700 -1.4354 -0.7357 1.1611 0.0533 1.2116 0.8972 0.1208 -0.1358 2.2004
  • 21. STEP 2 : MATRIKS KORELASI Z 1 0.1709586 1 0.0672961 0.484253 1 -0.142279 0.0542824 -0.115814 1 0.0316574 0.3438867 0.232479 -0.284483 1 0.0792424 0.158295 0.0786964 -0.039796 -0.198659 1 0.255364 -0.055465 -0.031713 0.1275284 -0.03758 -0.123157 1
  • 22. STEP 3 : EIGEN VALUE DAN EIGEN VEKTOR STEP 4 : TENTUKAN K STEP 5 : KOMPONEN UTAMA Principal Component Analysis: Z1; Z2; Z3; Z4; Z5; Z6; Z7 Eigen analysis of the Correlation Matrix Eigenvalue 1,8152 1,2605 1,2229 1,0819 0,6634 0,6059 0,3502 Proportion 0,259 0,180 0,175 0,155 0,095 0,087 0,050 Cumulative 0,259 0,439 0,614 0,769 0,863 0,950 1,000 • Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7 • Z1 0,219 -0,628 -0,044 0,410 -0,415 -0,405 0,227 • Z2 0,581 -0,056 -0,268 -0,293 -0,290 0,070 -0,643 • Z3 0,549 0,023 -0,165 -0,199 0,619 -0,369 0,334 • Z4 -0,261 -0,175 -0,369 -0,714 -0,311 -0,011 0,398 • Z5 0,482 0,110 0,489 -0,092 -0,283 0,481 0,444 • Z6 0,093 0,076 -0,711 0,412 0,042 0,510 0,222 • Z7 -0,069 -0,744 0,139 -0,134 0,426 0,451 -0,138 PC1=e1 PC2=e2 . . . Digunakan batas = 70% k=4 (4 komponen utama pertama) Karena kumulatif proporsi yang bernilai 70% pada variabel ke-4 Komponen Utama : Y1 = 0.219 Z1 + 0.581 Z2 + 0.549 Z3 – 0.261 Z4 + 0.482 Z5 + 0.093 Z6 – 0.069 Z7 Y2 = -0.628 Z1 – 0.056 Z2 + 0.023 Z3 – 0.175 Z4 + 0.110 Z5 + 0.076 Z6 – 0.744 Z7 Y3 = -0.044 Z1 – 0.268 Z2 – 0.165 Z3 – 0.369 Z4 + 0.489 Z5 – 0.711 Z6 + 0.139 Z7 Y4 = 0.410 Z1 – 0.293 Z2 – 0.199 Z3 – 0.714 Z4 – 0.092 Z5 + 0.412 Z6 – 0.134 Z7 4 5
  • 23. STEP 6 : SKOR KOMPONEN UTAMA Y11 = 0.219 (-1.3689) + 0.581 (0.1485) + 0.549(1.4198) – 0.261 (0.0423) + 0.482 (-0.8700) + 0.093 (0.9039)-0.069(-0.7148) = 0,808733 Y21= -0.628 (-1.3689) – 0.056 (0.1485) + 0.023 (1.4198) – 0.175 (0.0423) + 0.110 (-0.8700 )+ 0.076 (0.9039) – 0.744(-0.7148) = 1,32938 Y21 = Komponen utama kedua, observasi pertama ... dst Komponen Utama : Y1 = 0.219 Z1 + 0.581 Z2 + 0.549 Z3 – 0.261 Z4 + 0.482 Z5 + 0.093 Z6 – 0.069 Z7 Y2 = -0.628 Z1 – 0.056 Z2 + 0.023 Z3 – 0.175 Z4 + 0.110 Z5 + 0.076 Z6 – 0.744 Z7 Y3 = -0.044 Z1 – 0.268 Z2 – 0.165 Z3 – 0.369 Z4 + 0.489 Z5 – 0.711 Z6 + 0.139 Z7 Y4 = 0.410 Z1 – 0.293 Z2 – 0.199 Z3 – 0.714 Z4 – 0.092 Z5 + 0.412 Z6 – 0.134 Z7 Z1 Z2 Z3 Z4 Z5 Z6 Z7 -1.3689 0.1485 1.4198 0.0423 -0.8700 0.9039 -0.7148 -0.5783 0.0152 1.0629 0.7355 0.5171 1.3866 -0.1734 0.5286 -0.1942 1.3752 -0.3044 1.5079 -1.9552 -0.6211 -0.8945 -0.2323 0.2897 -0.2119 -0.8040 0.1984 -0.7877 0.8448 -0.1561 -1.1228 -0.6510 -0.2095 1.3495 1.4924 0.0542 -0.1371 -0.9593 0.8741 0.1208 -1.4725 -0.7669 0.3705 0.1485 0.0221 1.4287 0.9134 0.9782 -0.9022 -1.5270 -0.1371 0.1113 0.1578 -1.2003 0.6068 -0.1110 -1.2108 0.0914 0.5871 0.5044 -0.2095 0.5697 -0.4233 1.1611 0.2247 1.6726 -2.0375 1.1116 0.9782 -0.3504 -1.3689 0.2628 0.1559 0.6200 1.5739 -1.2497 -0.8398 -0.4201 -0.1371 -0.8998 -1.6215 2.1024 0.0499 -0.2671 -1.2108 -0.1561 -1.9109 1.0128 -0.8040 0.2727 -0.4129 1.7935 0.1104 0.8399 0.8510 -0.5397 0.6068 -0.3504 0.3705 -0.0228 -0.0374 0.0423 -0.8700 0.2355 1.4716 -0.8945 -0.0609 0.4236 0.7355 0.4510 -1.8439 2.1484 1.0029 -0.0228 -0.7809 -0.1888 -0.5397 -0.8784 -0.7773 -0.1039 -0.0990 -0.6024 -1.6677 -0.8700 -1.4354 0.2222
  • 24. HASIL
  • 25. STEP SPSS Analyze >> dimension reduction >> factor
  • 26. STEP SPSS Extraction : - Correlation matrix - Unrotated factor solution - Secree plot - Based eigenvalue (Bisa 0.7 atau 1, disini dipilih 1) Continue OK
  • 29. HASIL OUTPUT Komponen Utama : Y1 = 0.219 Z1 + 0.581 Z2 + 0.549 Z3 – 0.261 Z4 + 0.482 Z5 + 0.093 Z6 – 0.069 Z7 Y2 = -0.628 Z1 – 0.056 Z2 + 0.023 Z3 – 0.175 Z4 + 0.110 Z5 + 0.076 Z6 – 0.744 Z7 Y3 = -0.044 Z1 – 0.268 Z2 – 0.165 Z3 – 0.369 Z4 + 0.489 Z5 – 0.711 Z6 + 0.139 Z7 Y4 = 0.410 Z1 – 0.293 Z2 – 0.199 Z3 – 0.714 Z4 – 0.092 Z5 + 0.412 Z6 – 0.134 Z7 Hasil Bedaaa ???? Output R