Tujuannya
mereduksi dimensi peubah yang saling berkorelasi menjadi peubah2 baru
yang tidak berkorelasi dengan tetap mempertahankan sebanyak mungkin
keragaman data asalnya. (patokan 80%)
Misal ada 1000 variable, apa kelebihan n kekurangannya..??
- Terlalu rumit
- Segi interpretasi sulit
Sehingga perlu dilakukan reduksi data. Syaratnya harus ada korelasi kuat antar variable.
Langkah langkah AKU / PCA:
Pengujian hipotesis matriks korelasi→ melihat ada tidaknya korelasi yang erat antar variable. dengan menggunakan uji bartlet:
H0 : ρ =Ip (Selain diagonal utama=0, Artinya korelasi antar peubah 0)
H1 : ρ≠ Ip (Selain diagonal utama=0, Artinya korelasi yang erat antar peubah
UJi Barlett:
n = jumlah observasi; p = jumlah variable ; R= matrik korelasi (estimasi) ; = determinan matrik korelasi
Tolak H0 jika
x2 hitung > x2 tabel
ð Karena
kita niatnya make AKU, yang kita harapkan Tolak H0. Artinya antar
variable awal ada korelasi sehingga tujuan reduksi/ penyusutan dimensi
data menjadi tercapai.
- Mencari akar ciri dari matriks kovarian (S) atau basis korelasi (R). Jika satuan variable sama pake kovarian, jika satuan berbeda pake korelasi.
- Mengurutkan akar ciri yang diperoleh dari terbesar ke terkecil (λ1≥λ2...≥ λp≥ 0)
- Membuat peubah baru (komponen utama) yang merupakan kombinasi linear dari peubah asalnya.
Membuat vector ciri yang dinormalisasi (dibuat orthonormal) dari masing2 akar ciri yang bersesuaian
Y1=e1’X=e11x1+…+e1pxp
Y2=e2’X=e21x1+…+e2pxp
…
Yp=ep’X=ep1x1+…+eppxp
*disini belum ada proses reduksi
Dimana, X’=[x1 … xp]
Sifat peubah baru: Tidak saling berkorelasi, dan berurutan dari ukuran kepentingannya. Y1 paling penting sampai Yp
- Melakukan proses reduksi KU yang terbentuk. Ada 3 cara :
- Dengan proporsi keragaman (bagi akar ciri per total akar ciri)
- Akar ciri >1
- Scree plot
Misal : proporsi keragamanY1=e1’X=e11x1+…+e1pxp à 76%Y2=e2’X=e21x1+…+e2pxp à 23%…Yp=ep’X=ep1x1+…+eppxpProporsi keragaman variable baru pertama belum cukup, sehingga ditambah dengan variable baru kedua. Jadi banyaknya KU yang terbentuk adalah 2.Akar ciri: Selama akar cirinya >1, itulah banyaknya KU.Scree plot : dilihat landau curamnya dan besarnya akar ciri. (scree plot tu plot antara jumlah variable dengan akar cirinya)
Melakukan penamaan pada KU yang digunakan setelah terjadi proses reduksi. Ada 2 cara:
- Korelasi antar KU dengan variable asalnya. Korelasi yang besar, tu yang mencirikan KU
- Dengan melihat penimbang (weighting)
Y1=e1’X=e11x1+…+e1pxpà penimbang tu e-nya. Penimbangnya yang paling besar. Kalo penimbangnya beda2 tipis, berarti KU dicirikan oleh variable2 tsb.
0 komentar:
Posting Komentar