Winner Statistik

Selasa, 05 Februari 2008

Asumsi Distribusi Normal

Mengapa banyak analisis statistik yang mengharuskan kita
untuk menguji distribusi Normal terlebih dahulu?

Distribusi normal itu distribusi data yang memiliki
grafik setangkup (seimbang antara kanan dan kiri/Xmin
dan Xmaks), dimana rata-rata (mean) sama dengan modus
(nilai yg sering muncul) dan sama dengan median (nilai
yang berada di tengah), tidak ada outlier. Ada rumus
dari distribusi tersebut namun sulit untuk menuliskan
di sini.

Banyak analisis mengasumsikan distribusi normal karena
turunan rumus dari analisis tersebut berasal dari
rumus distribusi normal, seperti distribusi z (normal
baku, rata-rata=0, variance(s)=1) dan ada juga
dsitribusi t, F, Chi-Square, dll yang merupakan
turunan dari distribusi normal.

Ada teori yg bernama "teorima limit pusat" yang
menyatakan, semakin banyak data yang diambil akan
semakin mendekati ditribusi normal.

Untuk itu perlu adanya pengujian distribusi normal
atau tidak sebelum menggunakan metode statistika
parametrik. Apabila tidak memenuhi distribusi normal,
maka bisa ditambah datanya, dilakukan transformasi,
atau dapat menggunakan alternative metode statistika
non-parametrik.

Analysis of Variance (ANOVA) Analisis Sidik Ragam

Analisis of Variance (ANOVA) atau analisis sidik ragam adalah suatu metode untuk menguraikan keragaman total data menjadi komponen-komponen yang mengukur berbagai sumber keragaman. Teknik analisis sidik ragam dapat digunakan untuk menguji kesamaan beberapa nilai tengah secara sekaligus. (Walpole, 1982)

Intinya, ANOVA dapat digunakan untuk menguji hipotesis dengan 2 variabel atau lebih.

Asumsi dari ANOVA adalah:
1. Data minimal memiliki skala pengukuran numerik (interval dan rasio) bukan kategorik;
2. Data harus memiliki sebaran/distribusi Normal.

Analisis Gerombol/Cluster Analysis

Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila ada N buah individu atau objek yang mempunyai p peubah dan N objek tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang dimati sehingga individu atau objek yang terletak dalam satu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak dalam gerombol lain (Dillon & Goldstein, 1984).

Pengukuran jarak yang paling dikenal yaitu jarak Euclid yang digunakan jika tidak ada korelasi antar peubah yang diminati. Jika tejadi korelasi antar peubah maka perlu dilakukan Analisis Komponen Utama / Principle Component terlebih dahulu atau dapat juga menggunakan konsep jarak lain seperti jarak Mahalanobis, dll.

Teknik penggerombolan terdiri dari hirarki dan tidak berhirarki. Teknik hirarki digunakan untuk mencari struktur penggabungan dari objek-objek, sedangakan teknik tidak berhirarki digunakan apabila jumlah gerombol yang diinginkan diketahui.

Teknik hirarki terdiri atas dua yaitu secara agglomerative (penggabungan), dimana masing-masing objek dianggap satu kelompok kemudian antar kelompok yang jaraknya berdekatan bergabung menjadi satu kelompok, dan secara divise (pemecahan) yaitu pada awalnya semua objek berada dalam satu gerombol setelah itu sifat paling beda dipisahkan dan membentuk satu gerombol yang lain. Porses berlanjut sampai semua objek tersebut masing-masing membentuk satu gerombol.

Dalam proses penggabungan gerombol dengan metode hirarki selalu diikuti dengan perbaikan matriks jarak / matriks kesamaan. Metode perbaikan jarak antar lain :

 Single Lingkage
Metode ini mengelompokkan dua objek yang mempunyai jarak terdekat terlebih dahulu.

 Complete Lingkage
Metode ini justru akan mengelompokkan dua objek yang mempunyai jarak terjauh terlebih dahulu.

 Average Lingkage
Metode ini akan mengelompokkan objek berdasar jarak rata-rata yang didapat dengan melakukan rata-rata semua jarak objek terlebih dahulu.

 Ward’s Method
Pada metode ini, jarak antar dua cluster yang terbentuk adalah sum of squares di antara dua cluster tersebut.

 Centroid Method
Pada metode ini, jarak antar dua cluster adalah jarak di antara centroid cluster-cluster tersebut. Centroid adalah rata-rata jarak yang ada pada sebuah cluster, yang didapat dengan melakukan rata-rata pada semua anggota suatu cluster tertentu. Dengan metode ini, setiap terjadi cluster baru, segera terjadi perhitungan ulang centroid, sampai terbentuk cluster tetap.

Hasil dari analisis disajikan dalam bentuk dendogram. Pemotongan dendogram dapat dilakukan pada selisih jarak pengabungan yang terbesar.

Asumsi dari analisis gerombol adalah :
1. Data bebas dari oulier/pencilan.
2. Tidak terjadi perbedaan satuan yang mencolok antar peubah.

ANALISIS YANG KAMI LAYANI

1. Analisis Deskriptif
     Meringkas Data, statistika 5 serangkai, Ukuran pemusatan,
      ukuran keragaman data, dll
2. Charting, grafik
     Pembuatan chart dan grafik apapun sesuai keinginan Anda
3. Tabulasi
     Pembuatan berbagai macam tabel sesuai keinginan Anda
4. Uji Signifikan
     Melakukan uji hipotesis terhadap berbagai permasalahan
     Uji satu sampel, uji dua sempel, uji dua atau lebih sampel
5. Korelasi
     Metode untuk mengetahui hubungan antar dua variabel,
     satu variabel dengan lebih dari satu veriabel, dan juga
     banyak variabel dengan banyak variabel.
6. Regresi
     Metode untuk membuat suatu modelhubungan antara
     satu variabel terikat (dependent variable) dengan satu atau      lebih variabel bebas (independent variable)
7. Multivariate Regression
    Metode untuk membuat model hubungan antara banyak
    variabel terikat (dependent variable) dan banyak variabel bebas
    (independent variable)
8. Logit-Probit
    Mirip dengan regresi namun dapat digunakan untuk variabel kategorik
    (ordinal dan nominal), termasuk non parametrik
9. Experimental Design
10. Non-Parametrik Analysis
11. AKU (Analisis Komponen Utama) /Principal Component
12. Analisis Faktor

13. Cluster Analysis

14. Analisis Diskriminan

15. Multidimensional Scaling
16. Biplot
17. Analisis Korespondency
18. Time Series Anlysis
19. Path Analysis
20. SEM (Seqential Equation Modeling)
21. CHAID
22. AMMI
23. Bootstrap

Metode Statistika yang Diketahui