Anda tertarik dengan Statistika?

Blog Winner Statisik adalah Blog mengenai informasi seputar statistika.

Mari kita berbagi informasi mengenai statistika...

Apabila Anda perlu bantuan, hubungi: (021)96927448


Selasa, 05 Februari 2008

Analisis Gerombol/Cluster Analysis

Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila ada N buah individu atau objek yang mempunyai p peubah dan N objek tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang dimati sehingga individu atau objek yang terletak dalam satu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak dalam gerombol lain (Dillon & Goldstein, 1984).

Pengukuran jarak yang paling dikenal yaitu jarak Euclid yang digunakan jika tidak ada korelasi antar peubah yang diminati. Jika tejadi korelasi antar peubah maka perlu dilakukan Analisis Komponen Utama / Principle Component terlebih dahulu atau dapat juga menggunakan konsep jarak lain seperti jarak Mahalanobis, dll.

Teknik penggerombolan terdiri dari hirarki dan tidak berhirarki. Teknik hirarki digunakan untuk mencari struktur penggabungan dari objek-objek, sedangakan teknik tidak berhirarki digunakan apabila jumlah gerombol yang diinginkan diketahui.

Teknik hirarki terdiri atas dua yaitu secara agglomerative (penggabungan), dimana masing-masing objek dianggap satu kelompok kemudian antar kelompok yang jaraknya berdekatan bergabung menjadi satu kelompok, dan secara divise (pemecahan) yaitu pada awalnya semua objek berada dalam satu gerombol setelah itu sifat paling beda dipisahkan dan membentuk satu gerombol yang lain. Porses berlanjut sampai semua objek tersebut masing-masing membentuk satu gerombol.

Dalam proses penggabungan gerombol dengan metode hirarki selalu diikuti dengan perbaikan matriks jarak / matriks kesamaan. Metode perbaikan jarak antar lain :

 Single Lingkage
Metode ini mengelompokkan dua objek yang mempunyai jarak terdekat terlebih dahulu.

 Complete Lingkage
Metode ini justru akan mengelompokkan dua objek yang mempunyai jarak terjauh terlebih dahulu.

 Average Lingkage
Metode ini akan mengelompokkan objek berdasar jarak rata-rata yang didapat dengan melakukan rata-rata semua jarak objek terlebih dahulu.

 Ward’s Method
Pada metode ini, jarak antar dua cluster yang terbentuk adalah sum of squares di antara dua cluster tersebut.

 Centroid Method
Pada metode ini, jarak antar dua cluster adalah jarak di antara centroid cluster-cluster tersebut. Centroid adalah rata-rata jarak yang ada pada sebuah cluster, yang didapat dengan melakukan rata-rata pada semua anggota suatu cluster tertentu. Dengan metode ini, setiap terjadi cluster baru, segera terjadi perhitungan ulang centroid, sampai terbentuk cluster tetap.

Hasil dari analisis disajikan dalam bentuk dendogram. Pemotongan dendogram dapat dilakukan pada selisih jarak pengabungan yang terbesar.

Asumsi dari analisis gerombol adalah :
1. Data bebas dari oulier/pencilan.
2. Tidak terjadi perbedaan satuan yang mencolok antar peubah.

2 komentar:

  1. artikel yang bagus, bisa minta tolong kasih gambaran secara teknisnya tentang analis cluster.makasi

    BalasHapus
  2. Bagaimana melihat homogenitas dan heterogenitas dalam cluster?

    BalasHapus

Apa komentar Anda terhadap tulisan saya?

Anda Perlu Bantuan Analisis Data Statistik?

Hubungi kami melalui:

  - Telp. (021)96927448

  - email. jihadbest36@yahoo.com

Analisis Data:

  - Skripsi (S1): Rp 500.000

  - Tesis (S2): Rp 1.000.000

  - Disertasi (S3): Rp 2.500.000

Kursus Private Statistika

2 jam per pertemuan:

  - S1: Rp 150.000 per pertemuan

  - S2: Rp 300.000 per pertemuan

  - S3: Rp 500.000 per pertemuan 



Konsultasi Rp 100.000 per jam

ANALISIS YANG KAMI LAYANI

1. Analisis Deskriptif
     Meringkas Data, statistika 5 serangkai, Ukuran pemusatan,
      ukuran  keragaman data, dll
2. Charting, grafik
     Pembuatan chart dan grafik apapun sesuai keinginan Anda
3. Tabulasi
     Pembuatan berbagai macam tabel sesuai keinginan Anda
4. Uji Signifikan
     Melakukan uji hipotesis terhadap berbagai permasalahan
     Uji satu sampel, uji dua sempel, uji dua atau lebih sampel
5. Korelasi
     Metode untuk mengetahui hubungan antar dua variabel,  
     satu variabel dengan lebih dari satu veriabel, dan juga 
     banyak variabel dengan banyak variabel. 
6. Regresi   
     Metode untuk membuat suatu modelhubungan antara 
     satu variabel terikat (dependent variable) dengan satu atau      lebih variabel bebas (independent variable)
7. Multivariate Regression
    Metode untuk membuat model hubungan antara banyak
    variabel terikat (dependent variable) dan banyak variabel bebas  
    (independent variable)
8. Logit-Probit
    Mirip dengan regresi namun dapat digunakan untuk variabel kategorik
    (ordinal dan nominal), termasuk non parametrik   
9. Experimental Design     
10. Non-Parametrik Analysis 
11. AKU (Analisis Komponen Utama) /Principal Component
12. Analisis Faktor 

13. Cluster Analysis

14. Analisis Diskriminan

15. Multidimensional Scaling 
16. Biplot 
17. Analisis Korespondency 
18. Time Series Anlysis 
19. Path Analysis 
20. SEM (Seqential Equation Modeling)
21. CHAID
22. AMMI
23. Bootstrap