Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila ada N buah individu atau objek yang mempunyai p peubah dan N objek tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang dimati sehingga individu atau objek yang terletak dalam satu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak dalam gerombol lain (Dillon & Goldstein, 1984).
Pengukuran jarak yang paling dikenal yaitu jarak Euclid yang digunakan jika tidak ada korelasi antar peubah yang diminati. Jika tejadi korelasi antar peubah maka perlu dilakukan Analisis Komponen Utama / Principle Component terlebih dahulu atau dapat juga menggunakan konsep jarak lain seperti jarak Mahalanobis, dll.
Teknik penggerombolan terdiri dari hirarki dan tidak berhirarki. Teknik hirarki digunakan untuk mencari struktur penggabungan dari objek-objek, sedangakan teknik tidak berhirarki digunakan apabila jumlah gerombol yang diinginkan diketahui.
Teknik hirarki terdiri atas dua yaitu secara agglomerative (penggabungan), dimana masing-masing objek dianggap satu kelompok kemudian antar kelompok yang jaraknya berdekatan bergabung menjadi satu kelompok, dan secara divise (pemecahan) yaitu pada awalnya semua objek berada dalam satu gerombol setelah itu sifat paling beda dipisahkan dan membentuk satu gerombol yang lain. Porses berlanjut sampai semua objek tersebut masing-masing membentuk satu gerombol.
Dalam proses penggabungan gerombol dengan metode hirarki selalu diikuti dengan perbaikan matriks jarak / matriks kesamaan. Metode perbaikan jarak antar lain :
Single Lingkage
Metode ini mengelompokkan dua objek yang mempunyai jarak terdekat terlebih dahulu.
Complete Lingkage
Metode ini justru akan mengelompokkan dua objek yang mempunyai jarak terjauh terlebih dahulu.
Average Lingkage
Metode ini akan mengelompokkan objek berdasar jarak rata-rata yang didapat dengan melakukan rata-rata semua jarak objek terlebih dahulu.
Ward’s Method
Pada metode ini, jarak antar dua cluster yang terbentuk adalah sum of squares di antara dua cluster tersebut.
Centroid Method
Pada metode ini, jarak antar dua cluster adalah jarak di antara centroid cluster-cluster tersebut. Centroid adalah rata-rata jarak yang ada pada sebuah cluster, yang didapat dengan melakukan rata-rata pada semua anggota suatu cluster tertentu. Dengan metode ini, setiap terjadi cluster baru, segera terjadi perhitungan ulang centroid, sampai terbentuk cluster tetap.
Hasil dari analisis disajikan dalam bentuk dendogram. Pemotongan dendogram dapat dilakukan pada selisih jarak pengabungan yang terbesar.
Asumsi dari analisis gerombol adalah :
1. Data bebas dari oulier/pencilan.
2. Tidak terjadi perbedaan satuan yang mencolok antar peubah.
Anda tertarik dengan Statistika?
Blog Winner Statisik adalah Blog mengenai informasi seputar statistika.
Mari kita berbagi informasi mengenai statistika...
Apabila Anda perlu bantuan, hubungi: (021)96927448
Selasa, 05 Februari 2008
Analisis Gerombol/Cluster Analysis
Langganan:
Posting Komentar (Atom)
Anda Perlu Bantuan Analisis Data Statistik?
Hubungi kami melalui:
- Telp. (021)96927448
- email. jihadbest36@yahoo.com
Analisis Data:
- Skripsi (S1): Rp 500.000
- Tesis (S2): Rp 1.000.000
- Disertasi (S3): Rp 2.500.000
Kursus Private Statistika
2 jam per pertemuan:
- S1: Rp 150.000 per pertemuan
- S2: Rp 300.000 per pertemuan
- S3: Rp 500.000 per pertemuan
Konsultasi Rp 100.000 per jam
ANALISIS YANG KAMI LAYANI
1. Analisis Deskriptif
Meringkas Data, statistika 5 serangkai, Ukuran pemusatan,
ukuran keragaman data, dll
2. Charting, grafik
Pembuatan chart dan grafik apapun sesuai keinginan Anda
3. Tabulasi
Pembuatan berbagai macam tabel sesuai keinginan Anda
4. Uji Signifikan
Melakukan uji hipotesis terhadap berbagai permasalahan
Uji satu sampel, uji dua sempel, uji dua atau lebih sampel
5. Korelasi
Metode untuk mengetahui hubungan antar dua variabel,
satu variabel dengan lebih dari satu veriabel, dan juga
banyak variabel dengan banyak variabel.
6. Regresi
Metode untuk membuat suatu modelhubungan antara
satu variabel terikat (dependent variable) dengan satu atau lebih variabel bebas (independent variable)
7. Multivariate Regression
Metode untuk membuat model hubungan antara banyak
variabel terikat (dependent variable) dan banyak variabel bebas
(independent variable)
8. Logit-Probit
Mirip dengan regresi namun dapat digunakan untuk variabel kategorik
(ordinal dan nominal), termasuk non parametrik
9. Experimental Design
10. Non-Parametrik Analysis
11. AKU (Analisis Komponen Utama) /Principal Component
12. Analisis Faktor
16. Biplot
17. Analisis Korespondency
18. Time Series Anlysis
19. Path Analysis
20. SEM (Seqential Equation Modeling)
21. CHAID
22. AMMI
23. Bootstrap
Meringkas Data, statistika 5 serangkai, Ukuran pemusatan,
ukuran keragaman data, dll
2. Charting, grafik
Pembuatan chart dan grafik apapun sesuai keinginan Anda
3. Tabulasi
Pembuatan berbagai macam tabel sesuai keinginan Anda
4. Uji Signifikan
Melakukan uji hipotesis terhadap berbagai permasalahan
Uji satu sampel, uji dua sempel, uji dua atau lebih sampel
5. Korelasi
Metode untuk mengetahui hubungan antar dua variabel,
satu variabel dengan lebih dari satu veriabel, dan juga
banyak variabel dengan banyak variabel.
6. Regresi
Metode untuk membuat suatu modelhubungan antara
satu variabel terikat (dependent variable) dengan satu atau lebih variabel bebas (independent variable)
7. Multivariate Regression
Metode untuk membuat model hubungan antara banyak
variabel terikat (dependent variable) dan banyak variabel bebas
(independent variable)
8. Logit-Probit
Mirip dengan regresi namun dapat digunakan untuk variabel kategorik
(ordinal dan nominal), termasuk non parametrik
9. Experimental Design
10. Non-Parametrik Analysis
11. AKU (Analisis Komponen Utama) /Principal Component
12. Analisis Faktor
13. Cluster Analysis
14. Analisis Diskriminan
16. Biplot
17. Analisis Korespondency
18. Time Series Anlysis
19. Path Analysis
20. SEM (Seqential Equation Modeling)
21. CHAID
22. AMMI
23. Bootstrap
artikel yang bagus, bisa minta tolong kasih gambaran secara teknisnya tentang analis cluster.makasi
BalasHapusBagaimana melihat homogenitas dan heterogenitas dalam cluster?
BalasHapus