1. ANALISIS KOMPONEN UTAMA
Andi Dalfiah Mustafa (13.7487)
Cahyani Cenra Hasanah (13.7540)
Estiana Yesi Prastiwi (13.7604)
TUGAS ANALISIS PEUBAH GANDA – PERT 8
Dibuat Oleh : KELOMPOK 2
Fitri Puspitasari (13.7627)
Indra Gunawan (13.7664)
Minanur Rohman (13.7731)
Sri Astutiningsih (13.7876)
Wiena Hardian Pratama (13.7912)
Zaselina Pitaloka (13.7932
Dosen Pengampu : Rani Nooraeni, S.ST., M.Stat.
2. PENDAHULUAN
Pengertian, Tujuan, Ilustrasi
GRAPHING
Plot AKU untuk
pengecekan asumsi
POPULATION
Penghitungan AKU,
Standardized, struktur spesial
SAMPLE
Penentuan jumlah komponen
utama, interpretasi,
standarisasi sampel
LARGE SAMPLE INFERENCE
Penggunaan AKU untuk
infferensia sampel besar
MONITORING QUALITY
Penggunaan Analisis
Komponen Utama untuk
monitoring kualitas
OUTLINE PEMBAHASAN
Daftar pokok bahasan bab Analisis Komponen Utama (AKU)
3. PENDAHULUAN
Pengertian, Tujuan, Ilustrasi
GRAPHING
Plot AKU untuk
pengecekan asumsi
POPULATION
Penghitungan AKU,
Standardized, struktur spesial
SAMPLE
Penentuan jumlah komponen
utama, interpretasi,
standarisasi sampel
LARGE SAMPLE INFERENCE
Penggunaan AKU untuk
infferensia sampel besar
MONITORING QUALITY
Penggunaan Analisis
Komponen Utama untuk
monitoring kualitas
OUTLINE PEMBAHASAN
Daftar pokok bahasan bab Analisis Komponen Utama (AKU)
4. PENDAHULUAN
Ilustrasi
Untuk menceritakan bagaimana wajah pacar
kita waktu SMA, tidak perlu disebutkan
hidungnya mancung, kulitnya halus,
rambutnya indah tergerai dan sebagainya.
Tapi cukup katakan ‘Pacar saya waktu SMA
orangnya cantik’. Kata ‘cantik’ sudah mampu
menggambarkan uraian sebelumnya.
5. PENDAHULUAN
Pengertian & Tujuan
• Tujuan : Mereduksi dimensi peubah
yang saling berkorelasi menjadi peubah-
peubah baru yang tidak berkorelasi
dengan tetap mempertahankan sebanyak
mungkin keragaman data asal
• Pengertian: Mentransformasi himpunan variabel
asal kedalam himpunan kombinasi linier yang
lebih kecil yang memuat paling banyak variasi
dari himpunan variabel asal
6. PENDAHULUAN
Pengertian, Tujuan, Ilustrasi
GRAPHING
Plot AKU untuk
pengecekan asumsi
POPULATION
Penghitungan AKU,
Standardized pop , struktur
spesial
SAMPLE
Penentuan jumlah komponen
utama, interpretasi,
standarisasi sampel
LARGE SAMPLE INFERENCE
Penggunaan AKU untuk
infferensia sampel besar
MONITORING QUALITY
Penggunaan Komponen
Utama untuk monitoring
kualitas
OUTLINE PEMBAHASAN
Daftar pokok bahasan bab Analisis Komponen Utama (AKU)
7. POPULATION
Komponen Utama Populasi (1)
misalnya,
𝐗′ merupakan vektor p peubah acak, dengan:
𝑿′ = 𝑋1, 𝑋2, 𝑋3, … , 𝑋 𝑝
𝜇 = vektor rata − rata 𝐗
Σ = matriks ragam − peragam 𝐗
ρ = matriks korelasi 𝐗
nilai eigen 𝜆1 > 𝜆2 > 𝜆3 > ⋯ > 𝜆 𝑝
Komponen utama yang merupakan kombinasi linear dari p dapat ditulis:
𝐘 = 𝐀𝐗 , dengan
𝐘 =
Y1
⋯
Y 𝑝
; 𝐀 =
𝑎11 ⋯ 𝑎1𝑝
⋯ ⋯ ⋯
𝑎 𝑝1 ⋯ 𝑎 𝑝𝑝
; dan 𝐗 =
X1
⋯
X 𝑝
8. POPULATION
Komponen Utama Populasi (1)
Komponen utama yang merupakan kombinasi linear dari p dapat ditulis:
𝐘 = 𝐀𝐗 , dengan
𝐘 =
Y1
⋯
Y 𝑝
; 𝐀 =
𝑎11 ⋯ 𝑎1𝑝
⋯ ⋯ ⋯
𝑎 𝑝1 ⋯ 𝑎 𝑝𝑝
; dan 𝐗 =
X1
⋯
X 𝑝
𝑌1 = 𝑎′1 𝑋 = 𝑎11 𝑋1 + 𝑎12 𝑋2 + ⋯ + 𝑎1𝑝 𝑋 𝑝
𝑌2 = 𝑎′2 𝑋 = 𝑎21 𝑋1 + 𝑎22 𝑋2 + ⋯ + 𝑎2𝑝 𝑋 𝑝
…
𝑌𝑝 = 𝑎′ 𝑝 𝑋 = 𝑎 𝑝1 𝑋1 + 𝑎 𝑝2 𝑋2 + ⋯ + 𝑎 𝑝𝑝 𝑋 𝑝
9. POPULATION
Komponen Utama Populasi (2)
𝑉𝑎𝑟 𝑌𝑖 = 𝑎𝑖
,
Σ𝑎𝑖 i=1,2,…,p
C𝑜𝑣 𝑌𝑖, 𝑌𝑘 = 𝑎𝑖
,
Σ𝑎 𝑘 I,k= 1,2,…,p
Variance dan Covariance:
Proporsi total varian populasi :
Korelasi varian populasi :
11. POPULATION
Komponen Utama Populasi (3)
Contoh:
… Lanjutan …
Proporsi Total Variance Populasi 𝑌1 =
𝜆1
𝜆1+𝜆2+𝜆3
=
5.83
8
= 0.73
Proporsi Total Variance Populasi 𝑌2 =
𝜆1+𝜆2
𝜆1+𝜆2+𝜆3
=
5.83+2
8
= 0.98
.
Hitung Varians dan Kovarians Hitung Korelasi
Hitung Total Variance
12. • Apabila X berdistribusi Np (μ,Σ), maka densitas X konstan dan pusat ellips pada
μ.
Dengan axes :
Dimana (λ𝑖, 𝑒𝑖) 𝑛𝑖𝑙𝑎𝑖 𝑒𝑖𝑔𝑒𝑛 𝑑𝑎𝑛 𝑓𝑎𝑘𝑡𝑜𝑟 𝑒𝑖𝑔𝑒𝑛 𝑑𝑎𝑟𝑖 Σ.
A = Σ¯¹, sehingga
• untuk mereduksi dari variabel X menjadi komponen utama Y
POPULATION
Komponen Utama Populasi (5)
14. POPULATION
Analisis Komponen Utama pada Standardized Variabel Populasi (1)
Dalam matriks :
Karena E(Z) = 0, maka :
Analisis komponen utama juga bisa didapatkan dari variable yang terstandarisasi :
15. POPULATION
Analisis Komponen Utama pada Standardized Variabel Populasi (2)
Komponen Utama ke-i
dengan standardisasi Z’ dan cov (Z)=ρ
Sehingga,
Dimana,
&
16. POPULATION
Analisis Komponen Utama pada Standardized Variabel Populasi (3)
Contoh:
Known correlation matrix and derived correlation matrix :
(Principal components obtained from covariance and correlation matrices are different)
17. POPULATION
Analisis Komponen Utama pada Standardized Variabel Populasi (4)
Contoh:
Proporsi dari first principal component dari Σ Perhitungan untuk principal components dari ρ
Sehingga proporsinya menjadi :
HASIL BERBEDA
(yang distandardisasi)
(yang tidak distandardisasi)
… Lanjutan …
18. POPULATION
Analasis Komponen Utama pada Kovarians Matriks dengan Struktur special (1)
Misal matriks Σ adalah matriks diagonal :
Kemudian ei’ = [0, …, 0, 1, 0, …, 0] dengan 1 dalam posisi ke-i, sehingga didapatkan
Dapat disimpulkan bahwa (σii, ei) adalah pasangan eigenvalue-eigenvektor.
Karena kombinasi linier ei’X = Xi, maka himpunan komponen utama adalah himpunan asli dari
random variabel yang tidak berkorelasi.
Kasus 1
19. POPULATION
Analasis Komponen Utama pada Kovarians Matriks dengan Struktur special (2)
• Dengan bentuk matriks Σ seperti di atas maka standardisasi tidak diperlukan.
• Sehingga bentuk ρ = I (matriks pxp).
• ρei = 1ei, sehingga eigenvalue 1 sebanyak p
• ei’ = [0, …, 0, 1, 0, …, 0], i = 1, 2, …, p adalah pilihan yang tepat untuk eigenvektor.
• Karena eigenvaluenya sama, maka bentuk elips multivariat normalnya berbentuk bola /
lingkaran.
20. POPULATION
Analasis Komponen Utama pada Kovarians Matriks dengan Struktur special (3)
Misal matriks Σ berbentuk sebagai berikut :
Hasil matriks korelasi :
ρ ini juga sebagai matriks covarians dari variabel yang distandardisasi, dan menunjukkan
bahwa variabel X1, X2, …, Xp berkorelasi sama.
Kasus 2
21. POPULATION
Analasis Komponen Utama pada Kovarians Matriks dengan Struktur special (4)
• p eigenvalue dari matriks korelasi ρ dapat dibagi menjadi 2 kelompok:
1. Ketika ρ positif, eigenvalue terbesar adalah:
Dengan eigenvector:
2. Maka p-1 eigenvector yang tersisa adalah :
Dengan eigenvector :
• Sehingga komponen utama pertama :
• Dan mampu menjelaskan proporsi sebesar:
Kasus 2 (Lanjutan)
22. PENDAHULUAN
Pengertian, Tujuan, Ilustrasi
GRAPHING
Plot AKU untuk
pengecekan asumsi
POPULATION
Penghitungan AKU,
Standardized, struktur spesial
SAMPLE
Penentuan jumlah komponen
utama, interpretasi
LARGE SAMPLE INFERENCE
Penggunaan AKU untuk
infferensia sampel besar
MONITORING QUALITY
Penggunaan Komponen
Utama untuk monitoring
kualitas
OUTLINE PEMBAHASAN
Daftar pokok bahasan bab Analisis Komponen Utama (AKU)
23. SAMPLE
Summarizing Sample Variation by Principal Components (1)
• Kombinasi yang tidak berkorelasi dengan varians terbesar disebut sampel komponen utama.
• Ingat bahwa n value dari kombinasi linier :
• mempunyai rata-rata sampel a1’ 𝑥 dan varians sampel a1’Sa1, dengan rincian :
1. Komponen sampel utama pertama = kombinasi linier a1’xj yang memaksimalkan varians
sampel dari a1’xj dengan a1’a1 = 1
2. Komponen sampel utama kedua = kombinasi linier a2’xj yang memaksimalkan varians
sampel dari a2’xj dengan a2’a2 = 1 dan 0 covarians sampel untuk pasangan (a1’xj, a2’xj)
3. Komponen sampel utama ke-i = kombinasi linier ai’xj yang memaksimalkan varians
sampel dari ai’xj dengan ai’ai = 1 dan 0 covarians sampel untuk semua pasangan (ai’xj,
ak’xj), k<i
24. SAMPLE
Summarizing Sample Variation by Principal Components (2)
• Jika S = {sik} adalah matriks pxp, maka sampel komponen utama ke-i adalah
• Dengan:
25. SAMPLE
Summarizing Sample Variation by Principal Components (3)
Contoh:
• Komponen utama pertama menjelaskan 67,7% dari total varians sampel.
• Sedangkan dua komponen utama pertama mampu menjelaskan 92,8% dari total varians.
• Sehingga variasi sampel dapat dijelaskan dengan baik oleh dua komponen utama dan mengurangi data dari 61
observasi pada 5 variabel menjadi 61 observasi pada 2 komponen utama.
26. SAMPLE
Menentukan banyaknya komponen utama (1)
Komponen terkait dengan nilai eigen yang mendekati nol dianggap tidak penting karena
menunjukkan ketergantungan linear tak terduga di dalam data. Hal tersebut dapat terlihat pada
Scree Plot yang menunjukkan situasi dari 6 komponen utama dibawah ini:
Sudut terbentuk pada plot i = 3, yakni nilai eigen setelah lambda 2 tersebut memiliki ukuran yang
relatif kecil. Sehingga hanya ada 2 komponen utama.
27. SAMPLE
Menentukan banyaknya komponen utama (1)
Contoh:
Komponen utama pertama dapat menjelaskan 96,1 % dari
total sampel varians. Secara kolektif, dua komponen utama
pertama dapat menjelaskan 98,5 % dari total sampel varians.
28. SAMPLE
Analisis Komponen Utama pada Standardized Variabel Sampel (1)
Variabel yag diukur dengan skala yang berbeda atau diukur dengan skala yang sama tetapi memiliki
range yang lebar biasanya distandarisasi
• Untuk sampel, standarisasi dilakukan dengan membuat :
• Matrix n x p dari observasi terstandarisasi:
29. SAMPLE
Analisis Komponen Utama pada Standardized Variabel Sampel (2)
Variabel yag diukur dengan skala yang berbeda atau diukur dengan skala yang sama tetapi memiliki
range yang lebar biasanya distandarisasi
• Vektor Rata-rata sampel :
• Matriks kovarian sampel :
30. • Jika 𝒛 𝟏, 𝒛 𝟐, … , 𝒛 𝒏 adalah observasi terstandarisasi dengan matriks
kovarians R, komponen utama sampel ke-i adalah :
Proporsi dari total varians sampel yang dijelaskan oleh komponen utama sampel ke-i adalah :
Di mana ( 𝜆𝑖, 𝑒𝑖) adalah pasangan eigenvalue-eigenvektor ke-i dari R dengan 𝜆1 ≥ 𝜆2 ≥ … ≥ 𝜆 𝑝
SAMPLE
Analisis Komponen Utama pada Standardized Variabel Sampel (4)
• Sampel varians dan sampel kovarians adalah: • Total varians sampel adalah : • Korelasinya adalah :
32. SAMPLE
Analisis Komponen Utama pada Standardized Variabel Sampel (2)
Contoh:
Kita dapati rata-rata:
Dan matriks kovarians dari observasi terstandarisasi
(Johnson, Hal 451)
Eigenvalue dan normalized eigenvektor adalah sebagai
berikut:
Dengan menggunakan variabel terstandarisasi , kita
mendapatkan dua komponen utama sampel pertama :
33. SAMPLE
Analisis Komponen Utama pada Standardized Variabel Sampel (2)
Contoh:
(Johnson, Hal 451)
Komponen-komponen tersebut meliputi
Dari total varians sampel (terstandarisasi)
Komponen pertama dapat disebut sebagai market component sedangkan komponen kedua
adalah industry component.
Dengan demikian dapat dikatakan bahwa kebanyakan variasi stock merupakan hasil dari
aktivitas market dan aktivitas industry yang tidak berkorelasi.
34. PENDAHULUAN
Pengertian, Tujuan, Ilustrasi
GRAPHING
Plot AKU untuk
pengecekan asumsi
POPULATION
Penghitungan AKU,
Standardized, struktur spesial
SAMPLE
Penentuan jumlah komponen
utama, interpretasi
LARGE SAMPLE INFERENCE
Penggunaan AKU untuk
infferensia sampel besar
MONITORING QUALITY
Penggunaan Komponen
Utama untuk monitoring
kualitas
OUTLINE PEMBAHASAN
Daftar pokok bahasan bab Analisis Komponen Utama (AKU)
35. GRAPHING
Menggambar Komponen Utama
Plot digunakan untuk mengecek asumsi kenormalan. Karena komponen utama adalah kombinasi
linier dari variabelnya. Setiap observasi dapat di tulis sebagai kombinasi linier :
• Untuk mengecek asumsi kenormalan, gambarlah diagram scatter untuk pasangan dari
komponen utama yang pertama. Selain itu juga buat Q-Q plots dari nilai sampel yang
dihasilkan dari masing-masing komponen utama.
• Membentuk diagram scatter dan Q-Q plot untuk komponen utama yang terakhir. Ini
membantu mengidentifikasi observasi yang diduga.
36. GRAPHING
Menggambar Komponen Utama (2)
(Johnson, 454)
Cara mengeplot komponen utama dari turtle
data (ex. 8.4)
Ketiga komponen utamanya :
Contoh:
37. GRAPHING
Menggambar Komponen Utama (3)
• Untuk mengetahui fit atau tidak model dengan menentukan :
• Komponen utama diturunkan dari residual matrik kovarian
38. PENDAHULUAN
Pengertian, Tujuan, Ilustrasi
GRAPHING
Plot AKU untuk
pengecekan asumsi
POPULATION
Penghitungan AKU,
Standardized, struktur spesial
SAMPLE
Penentuan jumlah komponen
utama, interpretasi
LARGE SAMPLE INFERENCE
Penggunaan AKU untuk
infferensia sampel besar
MONITORING QUALITY
Penggunaan Komponen
Utama untuk monitoring
kualitas
OUTLINE PEMBAHASAN
Daftar pokok bahasan bab Analisis Komponen Utama (AKU)
39. LARGE SAMPLE INFERENCE
Inferensia untuk sampel besar (1)
Inferensia untuk Sampel Besar
• Kovarians/korelasi Eigen value dan eigen vector merupakan hal yang paling penting
dari komponen utama.
• Eigen vector untuk menunjukan arah dari variasi maksimumnya.
• Eigen value untuk menspesifikasi varians-variansnya.
• Ketika eigen value beberapa yang pertama lebih besar daripada yang sisanya, maka
total varians yang selanjutnya dapat dijelaskan dari beberapa yang pertama tadi.
• Sampel besar dari CI m engasumsikan bahwa X1, X2, ... , Xn adalah
random sampel dari populasi normal.
• Menggunakan asumsi Eigen value dari Σ adalah positive.
Oleh karrena itu
41. LARGE SAMPLE INFERENCE
Menguji Persamaan Struktur Korelasi (2)
Contoh:
(Johnson, 458)
Matriks korelasi dari sampel berat badan kelahiran
pada tikus betina dengan n=150 dan p =4 adalah:
Hipotesis
Statistik Uji
α = 0.05
Wilayah Kritis:
df=(p+1)(p-2)/2=(4+1)(4-2)/2=5
Tolak H0 jika T>
Keputusan :
Terdapat perbedaan kecil yang signifikan
dari struktur korelasi sama
42. PENDAHULUAN
Pengertian, Tujuan, Ilustrasi
GRAPHING
Plot AKU untuk
pengecekan asumsi
POPULATION
Penghitungan AKU,
Standardized, struktur spesial
SAMPLE
Penentuan jumlah komponen
utama, interpretasi
LARGE SAMPLE INFERENCE
Penggunaan AKU untuk
infferensia sampel besar
MONITORING QUALITY
Penggunaan Analisis
Komponen Utama untuk
monitoring kualitas
OUTLINE PEMBAHASAN
Daftar pokok bahasan bab Analisis Komponen Utama (AKU)
43. MONITORING QUALITY
Menguji Kualitas dengan analisis komponen Utama
• X1, X2, ... , Xn adalah sampel acak yang berdistribusi multivariate normal dengan mean μ dan
matriks varians kovarians
Komponen utamanya yaitu
• Untuk memonitor kualitas menggunakan komponen-komponen utama, dilakukan dengan
langkah:
1. Membentuk ellipse format chart untuk pasangan nilai ( 𝑦𝑗1, 𝑦𝑗2); j=1,2,...,n.
𝑦𝑗1 = λ1 𝑑𝑎𝑛 𝑦𝑗2 = λ2
Dua komponen utama tidak berkorelasi, sehingga :
2. Menggunakan T2 chart
45. MONITORING QUALITY
Menguji Kualitas dengan analisis komponen Utama (2)
Contoh:
Dibuat 95% ellipse format chart menggunakan
dua komponen utama dan plot 16 pasang
nilai komponen utama pada tabel 8.2.
Elipsnya menjadi
Satu titik keluar dari elips, karena komponen
utama kedua pada poin ini (poin 11)
mempunyai nilai yang besar.
46. MONITORING QUALITY
Menguji Kualitas dengan analisis komponen Utama
2. Menggunakan T2 Chart
dimana
Suatu vector deviasi 𝑋 − 𝜇 dengan asumsi 𝑥~𝑁 𝑃(𝜇, ) sehinnga
atau
adalah populasi ke i dari komponen utama dengan rata-rata 0.
Pendekatan komponen utama . Sehingga
49. Berdasarkan pengecekan dengan Q-Q plot pengamatan 11 merupakan outlier sehingga perlu
untuk dihilangkan sehingga pengamatan saat ini tinggal 15 pengamatan.
Selanjutnya dihitung kembali nilai eigen valur dan vektornya dengan hasil sebagai berikut
MONITORING QUALITY
Menguji Kualitas dengan analisis komponen Utama
Contoh:
Controlling Value Future