Anda tertarik dengan Statistika?

Blog Winner Statisik adalah Blog mengenai informasi seputar statistika.

Mari kita berbagi informasi mengenai statistika...

Apabila Anda perlu bantuan, hubungi: (021)96927448


Selasa, 22 Desember 2009

Statistik dengan Excel

Melakukan analisis Statistika dengan menggunakan MS Excel sangatlah mudah. Berikut saya jelaskan langkah-langkah melakukan analisis statistik dengan menggunakan MS Excel.

1. Buka Aplikasi Ms Excel Anda misalnya Ms Excel 2003 atau Ms Excel 2007

2. Ms Excel 2003: Klik Tools - Add-Ins
    Ms Excel 2007: Klik Office Button (pojok kiri atas) 
    lalu klik Excel Option - add-Ins

3. Pilih Analysis ToolPak

4. Kemudian akan tersedia menu Data Analysis

    Ms Office 2003 terletak di Tools - Data Analysis
    Ms Office 2007 terletak di menu ribbon "Data" - "Data Analysis"

5. Klik Data Analysis dan kemudian pilih analisis statistik apa yang akan Anda gunakan


untuk selanjutnya, Anda tinggal melakukan langkah no. 5 saja.

Selamat mencoba!!!

Rabu, 27 Mei 2009

Penggunaan Mean, Median, dan Modus (2)

Bingung mau pilih mean, median, atau modus?

Kalau kita menyebut kata rata-rata atau rerata, kemungkinan besar kita lebih condong untuk mempergunakan mean. Kalau kita ingin nilai tengah, maka kita berbicara median. sedangkan apabila kita ingin nilai yang paling sering muncul, kita menggunakan modus.

Mean adalah total semua data dibagi jumlah data. Mean digunakan ketika data yang kita miliki memiliki sebaran normal atau mendekati normal (berbentuk setangkup, nilai yang paling banyak berada ditengah dan makin besar semakin sedikit, makin kecil makin sedikit pula, nilai-nilai ekstrim yang besar maupun yang kecil hampir tidak ada).

Median adalah nilai yang berada ditengah-tengah data setelah diurutkan dari yang terkecil sampai terbesar. Median cocok digunakan bila data yang kita miliki tidak menyebar normal atau memiliki nilai yang berbeda-beda secara signifikan.

Misalnya ada yang 10.000 ada yang hanya 2, sedangkan distribusi nilai yang besar dan yang kecil tidak sama atau berat sebelah. Lebih banyak yang besar dan sedikit yang kecil atau sebaliknya. Selain itu juga memiliki banyak pencilan (outlier) yang nilainya sangat jauh dari nilai data yang lain. Median sangat cocok digunakan pada data seperti ini karena tidak terpengaruh oleh perbedaan data yang besar, karena median memilih nilai yang paling tengah setelah diurutkan, sehingga tidak tertarik ke atas jika ada data yang sangat besar.

Modus adalah nilai yang sering muncul. Jika kita tertarik pada data frekuensi, jumlah dari suatu nilai dari kumpulan data, maka kita menggunakan modus. Modus sangat baik bila digunakan untuk data yang memiliki sekala kategorik yaitu nominal atau ordinal.

Skala kategorik adalah data yang bukan angka. Data berskala nominal artinya tidak ada urutan yang lebih tinggi antara satu denga nyang lainnya. misalnya warna: merah, kuning, hijau. Merah diberi nilai 1, kuning 2, hijau 3. 1 tidak lebih kecil dari 2, sedangkan 3 tida lebih besar dari dua. Yang kita inginkan adalah data berapa banyak yang bernilai 1 (merah), berapa banyak bernilai 2 (kuning), dan berapa banyak yang bernilai 3 (hijau). Apabila yang paling banyak muncul adalah 2, maka modusnya 2 atau kuning.

Sedangkan data ordinal adalah data kategorik yang bisa diurutkan, misalnya kita menanyakan kepada 100 orang tentang kebiasaan untuk mencuci kaki sebelum tidur, dengan pilihan jawaban: selalu (5), sering (4), kadang-kadang(3), jarang (2), tidak pernah (1). Apabila kita ingin melihat ukuran pemusatannya lebih baik menggunakan modus yaitu yaitu jawaban yang paling banyak dipilih, misalnya sering (2). Berarti sebagian besar orang dari 100 orang yang ditanyakan menjawab sering mencuci kaki sebelum tidur.

Sudah jelas kan........

Kesimpulan:

Mean: Data yang normal

Median: Data tidak normal, banyak /pencilan outlier, data sangat besar/kecil

Modus: Data kategorik: Nominal or Ordinal

Senin, 25 Mei 2009

Penggunaan Mean, Median, dan Modus (1)

Mean, Median, Modus sama-sama merupakan ukuran pemusatan data yang termasuk kedalam analisis statistika deskriptif. Namun, ketiganya memiliki kelebihan dan kekurangannya masing-masing dalam menerangkan suatu ukuran pemusatan data. Untuk tahu kegunaannya masing-masing dan kapan kita mempergunakannya, perlu diketahui terlebih dahulu pengertian analisis statistika deskriptif dan ukuran pemusatan data.

Analisis Statistika deskriptif merupakan metode yang berkaitan dengan penyajian data sehingga memberikan informasi yang berguna. Upaya penyajian ini dimaksudkan untuk mengungkapkan informasi penting yang terdapat dalam data ke dalam berntuk yang lebih ringkas dan sederhana yang pada akhirnya mengarah pada keperluan adanya penjelasan dan penafsiran (Aunudin, 1989)

Deskripsi data yang dilakukan meliputi ukuran pemusatan dan penyebaran data. Ukuran pemusatan data meliputi nilai rata-rata (median), modus, dan median. Sedangkan ukuran penyebaran data meliputi ragam (variance) dan simpangan baku (standard deviation).

Ukuran pemusatan data adalah suatu ukuran yang menggambarkan pusat dari kumpulan data yang bisa mewakilinya.

Misalnya kita ingin mengetahui tingkat usia dari Tim Sepak Bola AC Milan tahun 2009 yang dianggap beberapa kalangan merupakan skuad yang terlalu tua. Kita membutuhkan satu angka untuk menggambarkan keseluruhan usia pemain di Tim Ac Milan yang terdiri dari puluhan orang.
Angka apa yang kita akan pergunakan???
Angka salah satu pemain, misalnya maldini yang sudah usia 40 tahun?
atau Alesandro Pato yang masih berusia 19 tahun?
atau rata-rata usia seluruh pemain?
atau nilai yang paling tengah dari seluruh usia pemain?
atau usia yang paling banyak dari pemain (jumlah pemain yang terbanyak memiliki usia sama?

hhmmm....

bingung?

bersambung...

Selasa, 12 Februari 2008

SIGNIFICANT TEST PARAMETRIK

Bagaimanakah melakukan ujihipotesis mengenai signifikansi perbedaan?
Apakah parametrik test atau non-parametrik test yang kita pilih?
Lalu metode statistik apa yang kita gunakan?

Masalah Significant Test Paramaterik atau Uji Hipotesis
mengenai signifikansi perbedaan memang masih membuat
banyak kalangan bingung. Biasanya, metode statistika
yang digunakan adalah statistika parametrik. Statistika 
Parametrik adalah statistika yang memiliki beberapa
asumsi yang harus diuji sebelum digunakan.
Misalnya asumsi distribusi normal, tipe data interval 
dan rasio, kehomogenan variance, dan jumlah data yang besar. 
Apabila asumsi-asumsi tersebut tidak dipenuhi maka 
statistika parametrik tidak bisa digunakan. 
Namun jangan kawatir, karena masih ada statistika 
non paramaterik.  Saya coba tampilkan flowchart
mengenai uji hipotesis beserta metode statistika
yang digunakan.



(gambar disarikan dari Buku Latihan SPSS, Singgih Santoso)

SIGNIFICANT TEST NON PARAMETRIK

Apabila data Anda tidak memenuhi asumsi distribusi normal, 
tipe data interval atau rasio, kehomogenan variance, dan 
besarnya jumlah data maka jangan dipaksakan untuk menggunakan 
Parametrik Test. Anda dapat menggunakan statistik non-parametrik.
Banyak Statistik Non-Parametrik yang dapat digunakan untuk
melakukan uji hipotesis sebagai berikut:



(gambar disarikan dari Buku Latihan SPSS, Singgih Santoso)
Keterangan :

1. Non-Parametrik Test Dengan Satu Grup Sample
☻ Binomial Test
Uji Binomial digunakan untuk menguji sebuah grup sample, apakah ciri tertentu dari grup tersebut bisa dianggap sama dengan ciri populasinya. Sedangkan ‘binomial’ menyatakan bahwa data akan dibagi menjadi dua kategori saja (seperti, Ya atau Tidak, Pria atau Wanita, dsb.). Uji ini baik digunakan untuk pengujian angka ataupun proporsi.
☻ Run Test (Randomness Test)
Digunakan untuk menguji apakah sample yang diambil dari suatu populasi tersebut acak atau tidak.
☻ Cox-Stuart Test
Digunakan untuk menguji apakah terdapat suatu kecenderungan (trend) dari suatu grup data.

2. Goodness of Fit Test
☻ Kolmogorov-Smirnov Test (Normality Test)
Uji ini digunakan untuk menguji sebuah data apakah bisa dianggap menyebar normal ataukah tidak

☻ Chi-Square Test
Uji ini bertujuan untuk mengetahui sebuah distribusi data dari sample mengikuti sebuah distribusi teoritis tertentu ataukah tidak  Distribution Test
Note  Selain digunakan untuk menguji distribusi dari sebuah grup sample, Chi-square Test juga dapat digunakan untuk menguji Kehomogenan dan Independensi dari dua buah grup sample.
 Homogenity Test
Uji digunakan untuk mengetahui apakah kedua populasi asal dari dua grup sample homogen ataukah tidak.
 Uji Independensi
Uji digunakan untuk memeriksa kebebasan/independensi dari dua variabel, sehingga kita dapat menyimpulkan apakah kedua variabel tersebut saling bebas (tidak saling mempengaruhi) ataukah keduanya saling bertalian (saling mempengaruhi).

3. Non-Parametrik Test Dengan Dua Grup Sample Independent
☻ Mann-Whitney Test
Digunakan apakah dua grup data (bertipe ordinal, interval atau rasio) yang independent berasal dari populasi yang sama ataukah tidak. Statistik Uji dari Mann-Whitney Test menggunakan pendekatan jumlah peringkat/rank dari data.
☻ Kolmogorov-Smirnov Test
Digunakan apakah dua grup data yang bertipe numeric (Interval, Rasio) yang independent berasal dari populasi yang sama ataukah tidak. Uji ini menggunakan pendekatan median data.
☻ Moses Test
Menguji perbedan Variance dari dua sample yang independent.
☻ Wald-Wolfowitz Test
Hampir sama dengan Kolmogorov-Smirnov Test yaitu untuk menguji signifikansi antara dua sample yang independent. Uji wald menggunakan pendekatan frekuensi data, sedangkan Kolmogorov-Smirnov Test menggunakan pendekatan median.

4. Non-Parametrik Test Dengan Dua Grup Sample Dependent
☻ Sign Test
Digunakan untuk menguji apakah dua grup sample (bertipe ordinal, interval atau rasio) yang berpasangan (dependent) berasal dari populasi yang sama. Statistik uji dari Sign Test menggunakan pendekatan tanda (+/-) dari selisih tiap pasangan data. Uji ini khususnya bermanfaat bagi data yang berskala ordinal, apabila data berskala interval atau rasio, dianjurkan menggunakan uji yang lebih powerful seperti Wilcoxon Test.
☻ Wilcoxon Test
Digunakan untuk menguji apakah dua grup sample (bertipe interval, rasio) yang berpasangan (dependent) berasal dari populasi yang sama. Statistik uji dari Wilcoxon Test menggunakan pendekatan peringkat dan tanda dari selisih pasangan data.
☻ McNemar Test
Digunakan untuk menguji apakah dua grup sample (bertipe kategorik, khususnya data dikotom) yang berpasangan (dependent) berasal dari populasi yang sama. Uji ini menggunakan pendekatan selisih proporsi dari dua grup sample.
☻ Marginal Homogenity
Digunakan untuk menguji apakah dua grup sample (bertipe kategorik : ordinal atau multinomial) yang berpasangan (dependent) berasal dari populasi yang sama.

5. Non-Parametrik Test Dengan Tiga Atau Lebih Grup Sample Independent
☻ Median Test
Digunakan untuk menguji lebih dari dua grup sample independent (bertipe ordinal, interval dan rasio) apakah berasal dari populasi yang sama ataukah tidak. Uji ini menggunakan pendekatan nilai median.
☻ Kruskal-Wallis Test
Digunakan untuk menguji lebih dari dua grup sample independent (bertipe ordinal, interval dan rasio) apakah berasal dari populasi yang sama ataukah tidak. Uji ini menggunakan pendekatan rata-rata peringkat/rank. Kruskal-Wallis Test digunakan sebagai alternative pengganti bagi prosedur One-Way ANOVA dalam Parametrik Test apabila datanya tidak memenuhi asumsi (bertipe ordinal, atau interval/rasio yang tidak menyebar normal).
☻ Jonckheere-Terpstra Test
Digunakan untuk menguji lebih dari dua grup sample independent (bertipe ordinal, interval dan rasio) apakah berasal dari populasi yang sama ataukah tidak, dimana grup-grup yang dibandingkan mempunyai urutan sehingga memerlukan hipotesis tandingan berturut (ordered alternatives), misalnya: Ingin menguji apakah kelompok social ekonomi rendah, sedang atau tinggi berturut-turut memiliki pengetahuan yang rendah, sedang ataukah tinggi tentang sesuatu hal.

6. Non-Parametrik Test Dengan Tiga Atau Lebih Grup Sample Dependent
☻ Friedman Test
Digunakan untuk menguji lebih dari dua grup sample Dependent apakah berasal dari populasi yang sama ataukah tidak. Uji ini digunakan sebagai alternative bagi prosedur Two-Way ANOVA pada Parametrik Test apabila datanya tidak memenuhi asumsi (bertipe ordinal, atau interval/rasio yang tidak menyebar normal). Statistik Ujinya menggunakan pendekatan peringkat/rank.
☻ Page Test
Sama dengan kondisi pada Friedman Test, hanya saja Page Test digunakan apabila menggunakan hipotesis tandingan berturut (ordered alternatives).
☻ Durbin Test
Sama dengan kondisi pada Friedman Test, hanya saja Durbin Test digunakan apabila menggunakan rancangan-rancangan blok tidak lengkap (Incomplete Block Design) dalam experimental design.
☻ Uji Konkordansi Kendall
Digunakan untuk menguji apakah ada keselarasan dari sekelompok subjek dalam menilai objek tertentu. Nilainya berkisar antara 0-1, jika 1 berarti semua sangat selaras dan jika 0 berarti tidak selaras.
☻ Cochran Test
Digunakan untuk menguji lebih dari dua grup sample dependent (bertipe kategorik, khususnya dikotom) apakah berasal dari populasi yang sama ataukah tidak.

Selasa, 05 Februari 2008

Validitas dan Realibilitas Alat Ukur

Sebelum alat ukur (biasanya berbentuk quisioner) digunakan, maka harus dilakukan pengujian atas validitas dan reliabilitasnya. Berikut penjelasan mengenai validitas dan reliabilitas:

A. VALIDITAS

Masalah validitas berhubungan dengan sejauh mana suatu alat mampu mengukur apa yang dianggap orang seharusnya diukur oleh alat tersebut. Definisi yang paling lazim mengenai validitas tercerminkan dalam pertanyaan: Apakah kita benar-benar mengukur apa yang ingin kita ukur? Dalam pertanyaan ini yang ditekankan adalah apa yang sedang diukur (Kerlinger, 1986).

Berdasarkan Standards for Educational and Psychological Tests (Washington D.C: American Psychological Association, 1974), terdapat tiga tipe validitas, yaitu validitas isi/muatan/content, validitas kriteria yang berhubungan (criterion related) dan validitas konstrak (construct).

1. Validitas Isi/Muatan (Content)

Validitas isi/muatan adalah kerepresentatifan sampling yang terdapat dalam isi/muatan suatu instrumen pengukur. Sedangkan kata ‘muatan’ itu menyiratkan pengertian, substansi, bahan, topik. Mengenai validasi muatan dapat dibimbing dengan pertanyaan : Apakah isi/muatan/substansi dari suatu alat ukur mewakili semua kemungkinan isi/muatan/substansi yang berupa sifat yang hendak diukur?
Pertanyaan tersebut dapat dijawab dengan membahas satu demi satu butir pertanyaan dalam suatu alat ukur terhadap suatu isi/muatan/substansi dari apa yang hedak kita ukur. Pekerjaan ini jelas sangat sulit apabila dikerjakan oleh seorang diri. Diperlukan beberapa orang yang ahli dalam bidang-bidang yang bersangkutan untuk menilai, mempertimbangkan, dan memutuskan kerepresentatifan satu demi satu butir pertanyaan dalam suatu alat ukur tersebut.
Dengan demikian pengujian validitas muatan pada dasarnya merupakan kerja menilai dan memutuskan suatu butir pertanyaan apakah valid secara isi/muatan/substansi ataukah tidak.

2. Validitas Relasi-Kriteria (Criterion Related)

Validitsa relasi-kruteria dikaji dengan cara membandingkan skor tes atau skala dengan atu atau lebih peubah ekstra (Variabel eksternal) atau kriteria yang diketahui (atau diyakini) merupakan pengukur atribut yang sedang dikaji. Yang lebih diperhatikan dalam validasi relasi-kriteria adalah bukan apa yang diukur oleh tes tersebut melainkan kemampuan test tersebut dalam membuat prediksi.
Pengujian validitas relasi-kriteria dapat dilakukan dengan mengkorelasikan suatu alat ukur dengan kriteria lain yang dianggap (atau diyakini) merupakan pengukur atribut yang sedang dikaji. Semakin tinggi korelasinya, maka makin baiklah validitasnya. Kesulitan terbesar dalam hal validasi ini adalah bagaimana mendapatkan ktiteria yang digunakan sebagai pembanding.

3. Validitas Konstrak (Construct)

Jika peneliti mengajukan pertanyaan : “Apakah yang sebenarnya diukur oleh tes ini?”, maka ia mepersoalkan validitas kontsrak tes tesebut. Validitas konstrak menunjuk kepada sebarapa jauh suatu tes mengukur sifat atau bangunan-pengertian (construct) tertentu. Validitas ini menghubungkan gagasan dan praktek psikometri dengan gagasan teoritisnya. Suatu alat ukur yang berisi beberapa pertanyaan untuk mengukur suatu hal (suatu konstrak tertentu), dikatakan valid (construct validity) jika setiap butir pertanyaan yang menyusun kuisioner tersebut memiliki keterkaitan yang tinggi. Ukuran keterkaitan antar butir pertanyaan ini umumnya dicerminkan oleh korelasi jawaban antar pertanyaan. Pertanyaan yang memiliki korelasi rendah dengan butir pertanyaan yang lain, dinyatakan sebagai pertanyaan yang tidak valid. Metode yang sering digunakan untuk memberikan penilaian terhadap validitas konstrak adalah korelasi produk momen (Moment product correlation/pearson correlation) antara skor setiap butir pertanyaan dengan skor total, sehingga sering disebut inter item-total correlation. Formula yang digunakan untuk itu adalah :
#maaf belum bisa menampilkan rumus-rumus#

B. RELIABILITAS

Reliabilitas atau keterandalan merupakan suatu ukuran yang digunakan untuk menilai apakah alat ukur yang digunakan mampu memberikan nilai pengukuran yang konsisten, atau dengan kata lain reliabilitas merupakan peluang mendapatkan hasil yang sama pada pengukuran yang dilakukan berulangkali. Alat ukur terandal jika indeks keterandalannya lebih besar dari 0.70.

Pendekatan Yang Digunakan :

1. Pendekatan Eksternal
a. Test-retest
Respon diambil dua kali dalam waktu yang dekat (kondisi responden relatif sama)
b. Alternative Form
Respon dimabil dua kali pada waktu bersamaan dengan menggunakan alat ukur yang berbeda
Indeks Reliabilitas untuk pendekatan eksternal:
- Teknik Kesesuaian : P = Jumlah jawaban sama / Jumlah responden X 100%
- Teknik Korelasi : #maaf belum bisa menampilkan rumus-rumus#

2. Pendekatan Internal
a. Cronbach Aplha #maaf belum bisa menampilkan rumus-rumus#
b. Uji Belah dua (Split Half)
- Indeks Sperman-Brown #maaf belum bisa menampilkan rumus-rumus#
- Indeks Guttman #maaf belum bisa menampilkan rumus-rumus#

Analisis Tabel Kontingensi (Crosstab)

Analisis data kategorik untuk peubah ganda (Multivariate) diawali dengan tabel kontingensi. Perhitungan persentase kolom, baris, atau persentase total akan mempermudah interpretasi hasil analisis.

Persentase kategorik menunujukkan kecenderungan masing-masing kategori dalam satu peubah/variabel. Semakin tinggi persentase suatu kategori maka semakin tinggi pula kecenderungan kategori tersebut sebagai ciri peubah yang bersangkutan. Dalam peubah ganda, persentasi sel-sel dalam tabel kontingensi dapat secara langsung menunjukkan asosiasi peubah-peubah yang menyusun tabel tersebut.

Peubah-peubah dalam suatu tabel kontingensi dikatakan tidak berasosiasi atau saling bebas jika sebaran persentasenya sama atau mendekati sama di masing-masing kolom (pada persentase kolom). Sebaliknya jika sebaran persentase tidak sama maka peubah-peubah berasosiasi dengan tingkat asosiasi tertentu (Agung, 2001).

Korelasi

Korelasi adalah metode untuk mengetahui tingkat keeratan hubungan dua peubah atau lebih yang digambarkan oleh besarnya koefisien korelasi.
Koefisien korelasi adalah koefisien yang menggambarkan tingkat keeratan hubungan antar dua peubah atau lebih. Besaran dari koefisien korelasi tidak menggambarkan hubungan sebab akibat antara dua peubah atau lebih, tetapi semata-mata menggambarkan keterkaitan linier antar peubah. (Mattjik & Sumertajaya, 2000)
Nilai dari Koefisien korelasi berkisar antara -1 sampai dengan 1.
-1 berarti terdapat hubungan negatif (berkebalikan) yang sempurna
0 berarti tidak terdapat hubungan sama sekali
1 berarti terdapat hubungan positif yang sempurna

Banyak metode statistika untuk mengukur korelasi. Salah satu yang paling sering digunakanadalah Korelasi Pearson. Ini merupakan Metode Parametrik sehingga memerlukan pengujian asumsi, yaitu:
1. Data memiliki skala pengukuran interval atau rasio (harus numerik bukan kategorik)
2. Mengikuti Distribusi Normal
3. Memiliki hubungan linier

Apabila data Anda tidak memenuhi asumsi di atas maka gunakan korelasi yang lain, yaitu:
1. Tau Kendall
2. Spearman

Uji Kebebasan Chi-Square

Uji Kebebasan Chi-Square digunakan untuk memeriksa kebebasan/independensi dari dua peubah kategorik sehingga kita dapat menyimpulkan apakah kedua peubah tersebut saling bebas (tidak berpengaruh) ataukah keduanya saling bertalian (berpengaruh).

H0 : kedua peubah saling bebas
H1 : kedua peubah tidak saling bebas

Dalam tabel kontingensi 2 x 2 :

Y/X X=1 X=2
Y=1 a b
Y=2 c d
#maaf belum bisa menampilkan tabel yang baik#

Chi-Square (x2) = {(a+b+c+d)x(ad-bc)kuadrat}/{(a+b)(c+d)(a+c)(b+d)}
#maaf belum bisa menampilkan rumus-rumus rumit#

Bila X2 > X2tabel dengan derajat bebas (r-1)(c-1) maka tolak H0
Artinya: kedua peubah saling bertalian atau tidak saling bebas.

Asumsi Distribusi Normal

Mengapa banyak analisis statistik yang mengharuskan kita
untuk menguji distribusi Normal terlebih dahulu?

Distribusi normal itu distribusi data yang memiliki
grafik setangkup (seimbang antara kanan dan kiri/Xmin
dan Xmaks), dimana rata-rata (mean) sama dengan modus
(nilai yg sering muncul) dan sama dengan median (nilai
yang berada di tengah), tidak ada outlier. Ada rumus
dari distribusi tersebut namun sulit untuk menuliskan
di sini.

Banyak analisis mengasumsikan distribusi normal karena
turunan rumus dari analisis tersebut berasal dari
rumus distribusi normal, seperti distribusi z (normal
baku, rata-rata=0, variance(s)=1) dan ada juga
dsitribusi t, F, Chi-Square, dll yang merupakan
turunan dari distribusi normal.

Ada teori yg bernama "teorima limit pusat" yang
menyatakan, semakin banyak data yang diambil akan
semakin mendekati ditribusi normal.

Untuk itu perlu adanya pengujian distribusi normal
atau tidak sebelum menggunakan metode statistika
parametrik. Apabila tidak memenuhi distribusi normal,
maka bisa ditambah datanya, dilakukan transformasi,
atau dapat menggunakan alternative metode statistika
non-parametrik.

Analysis of Variance (ANOVA) Analisis Sidik Ragam

Analisis of Variance (ANOVA) atau analisis sidik ragam adalah suatu metode untuk menguraikan keragaman total data menjadi komponen-komponen yang mengukur berbagai sumber keragaman. Teknik analisis sidik ragam dapat digunakan untuk menguji kesamaan beberapa nilai tengah secara sekaligus. (Walpole, 1982)

Intinya, ANOVA dapat digunakan untuk menguji hipotesis dengan 2 variabel atau lebih.

Asumsi dari ANOVA adalah:
1. Data minimal memiliki skala pengukuran numerik (interval dan rasio) bukan kategorik;
2. Data harus memiliki sebaran/distribusi Normal.

Analisis Gerombol/Cluster Analysis

Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila ada N buah individu atau objek yang mempunyai p peubah dan N objek tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang dimati sehingga individu atau objek yang terletak dalam satu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak dalam gerombol lain (Dillon & Goldstein, 1984).

Pengukuran jarak yang paling dikenal yaitu jarak Euclid yang digunakan jika tidak ada korelasi antar peubah yang diminati. Jika tejadi korelasi antar peubah maka perlu dilakukan Analisis Komponen Utama / Principle Component terlebih dahulu atau dapat juga menggunakan konsep jarak lain seperti jarak Mahalanobis, dll.

Teknik penggerombolan terdiri dari hirarki dan tidak berhirarki. Teknik hirarki digunakan untuk mencari struktur penggabungan dari objek-objek, sedangakan teknik tidak berhirarki digunakan apabila jumlah gerombol yang diinginkan diketahui.

Teknik hirarki terdiri atas dua yaitu secara agglomerative (penggabungan), dimana masing-masing objek dianggap satu kelompok kemudian antar kelompok yang jaraknya berdekatan bergabung menjadi satu kelompok, dan secara divise (pemecahan) yaitu pada awalnya semua objek berada dalam satu gerombol setelah itu sifat paling beda dipisahkan dan membentuk satu gerombol yang lain. Porses berlanjut sampai semua objek tersebut masing-masing membentuk satu gerombol.

Dalam proses penggabungan gerombol dengan metode hirarki selalu diikuti dengan perbaikan matriks jarak / matriks kesamaan. Metode perbaikan jarak antar lain :

 Single Lingkage
Metode ini mengelompokkan dua objek yang mempunyai jarak terdekat terlebih dahulu.

 Complete Lingkage
Metode ini justru akan mengelompokkan dua objek yang mempunyai jarak terjauh terlebih dahulu.

 Average Lingkage
Metode ini akan mengelompokkan objek berdasar jarak rata-rata yang didapat dengan melakukan rata-rata semua jarak objek terlebih dahulu.

 Ward’s Method
Pada metode ini, jarak antar dua cluster yang terbentuk adalah sum of squares di antara dua cluster tersebut.

 Centroid Method
Pada metode ini, jarak antar dua cluster adalah jarak di antara centroid cluster-cluster tersebut. Centroid adalah rata-rata jarak yang ada pada sebuah cluster, yang didapat dengan melakukan rata-rata pada semua anggota suatu cluster tertentu. Dengan metode ini, setiap terjadi cluster baru, segera terjadi perhitungan ulang centroid, sampai terbentuk cluster tetap.

Hasil dari analisis disajikan dalam bentuk dendogram. Pemotongan dendogram dapat dilakukan pada selisih jarak pengabungan yang terbesar.

Asumsi dari analisis gerombol adalah :
1. Data bebas dari oulier/pencilan.
2. Tidak terjadi perbedaan satuan yang mencolok antar peubah.

Senin, 04 Februari 2008

Hipotesis 1 arah vs 2 arah (one-tail vs 2-tail Hypothesis)

Apa sih bedanya Hipotesis 1 arah dan 2 arah???

Perbedaanya terletak pada masalah apa yang mau diuji.
Hipotesis 1 arah digunakan untuk menguji suatu hal yang sudah jelas akan lebih besar atau lebih kecil dari hipotesis awal. Sedangkan Hipotesis 2 arah digunakan untuk menguji suatu hal (hipotesis awal) pada suatu titik tertentu, dimana kemungkinan hipotesis tandingannya bisa lebih besar maupun lebih kecil dari titik tersebut.

Untuk memperjelas saya ingin memberikan suatu contoh
kasus hipotesis yang mudah.

Misalnya kita ingin menguji suatu kadar emisi
kendaraan apakah mencapai batas tertentu atau tidak.
Maka, yang menjadi perhatian kita adalah melebihi batas
emisi ataukah tidak. Bila kadar emisi lebih
kecil dari batas emisi dianggap masih menjadi hipotesis awal karena semakin kecil semakin
baik. Dalam hal ini hipotesis yang digunakan adalah 1
arah.

Misalnya kita ingin menguji kadar racun dalam tubuh
manusia misalhnya kreatinin dan ureum. Maka kita
konsen pada dua arah. Apabila kadar kreatinin dan
ureum melebihi batas normal sangat berbahaya.
sedangkan apabila lebih kecil dari batas normal juga
berbahaya. Yang bagus adalah kadarnya pas dengan batas
normal. Oleh karena itu lebih cocok menggunakan
hipotesis 2 arah.

Senin, 07 Januari 2008

Konsep Do'a dalam Statistika

Apa yaaa hubungannya Do'a dan Statistika???

Untuk menjawabnya, mungkin kita perlu membahas mengenai hubungan sebab-akibat terlebih dahulu.

Masalah hubungan sebab akibat memang sangat menarik untuk dibahas. 
Misalnya, bila kita ingin  mendapat nilai yang baik dalam ujian kita harus belajar, membaca buku, latihan soal, dll. Dalam hal ini yang menjadi akibat adalah nilai ujian, sedangkan yang menjadi  sebab adalah frekuensi lamanya belajar, jumlah halaman buku yang dibaca, banyaknya latihan soal, dll. 

Mungkin banyak perdebatan mengenai hubungan sebab akibat seperti ini. 
Apakah benar suatu hal menyebabkan hal lain atau sebaliknya.
Untuk menghindari berbagai perdebatan tersebut, Statistika mentransformasikan sebab-akibat menjadi independen dan dependen variabel.

Metode yang mempelajari hubungan antara independen dan dependen variabel salah satunya adalah Regresi.

Dalam model regresi, terdapat 3 komponen penting yaitu:
1. dependen variabel, 
2. independen variabel 
3. komponen error.

Dependen variabel adalah variabel yang nilainya tergantung pada independen variabel. sedangkan independen variabel merupakan variabel bebas yang bisa dikendalikan nilainya serta bisa mempengaruhi nilai dependen variabel. 
Sedangkan error merupakan variabel acak yang tidak bisa diukur dan atau tidak bisa dikendalikan. 
Komponen ini merupakan nilai perbedaan antara nilai yang ditentukan dari besarnya independen variabel dalam model dengan nilai dependen variabel sebenarnya.


Bila dituliskan persamaan regresinya adalah

y = a + b1x1 + b2x2 + b3x3 + . . . + bixi + e

misalnya dalam contoh di atas:
y adalah nilai ujian,
x1 adalah frekuensi belajar,
x2 adalah jumlah halaman buku yang dibaca, 
x3 adalah banyaknya latihan soal yang telah dibahas.

nilai a merupakan nilai konstan apabila seseorang tidak melakukan apa-apa dia akan mendapat nilai ujian a. Sedangkan b merupakan nilai koefisien dari variabel independen yang merupakan bobot dari variabel independen tersebut dalam menentukan nilai dependen variabel.

Model Regresi yang baik adalah model yang memiliki error terkecil. Namun hampir tidak munkin mendapatkan nilai error = 0. Sebaik apapun usaha seseorang dalam mendapatkan nilai ujian yang baik (x1, x2, x3, ..., xi), belum tentu mendapatkan nilai yang baik (y). Pasti selalu ada variabel lain yang tidak bisa dikendalikan dan tidak masuk dalam model regresi. Itulah yang dimaksud dengan komponen error. Seperti kemungkinan sakit pada saat ujian, kemungkinan adanya kecelakaan pada saat ujian, dll.

Konsep Regresi ini merupakan konsep falsafah di dunia ini. Dependen variabel (y) merupakan sesuatu yang ingin kita raih, sedangkan (x) merupakan usaha kita untuk dapat meraih y. sedangkan e adalah komponen lain yang tidak bisa diukur dan tidak bisa kendalikan yang juga dapat menentukan hasil yang ingin kita raih. Untuk itu bagaimanapun baiknya model regresi kita, betapa kerasnya usaha kita, tetap ada faktor lain yang tidak bisa kita kendalikan.

Dalam hal adanya komponen error inilah kita perlu senantiasa berdoa untuk meminimalisir faktor error tersebut.

Dalam Model Regresi:

y= a + bx + e

dapat berarti:

Hasil = Usaha + Do'a

setujukah Anda dengan dengan model tersebut???

Jumat, 09 November 2007

Kisah Korek Api dan Statistika

Pada suatu hari, ada seorang ibu menyuruh anaknya untuk membeli sekotakkorek api. Sang ibu mengingatkan pada anaknya agar tidak tertipu dengan korek api yang jelek, dan si anak harus memastikan bahwa korek api yang dibelinya berkualitas bagus.

Kemudian si anak pergi membeli sekotak korek api sesuai dengan kemauan ibunya....

Tak lama kemudian si anak membawa sekotak korek api dengan wajah yang berseri-seri. Si anak memberikan kepada sang ibu sekotak korek api yang kosong seraya berkata:
"Bu, saya yakin bahwa korek api ini sangat bagus kualitasnya, karena sudah saya coba menyalakan semua batang korek api ini, dan ternyata semuanya menyala..."

Hehehe...

Itulah akibatnya kalau kita melakukan segala sesuatu tanpa menggunakan prinsip dasar Statistika, yaitu 'sampling'.

Untuk memastikan bahwa sekota korek api berkualitas bagus tidak perlu mencoba menyalakan semua batang korek api, namun hanya cukup beberapa saja. Inilah yang dimaksud dengan sampling...

Yup, sampling sangatlah dibutuhkan di berbagai bidang kehidupan. Dalam membuat suatu kesimpulan dari suatu hal, kita tidak harus menggali seluruh informasi dari hal tersebut. Namun hanya memerlukan sedikit saja informasi yang telah dianggap mewakili seluruhnya sesuai dengan tingkat keragamannya...

Perlu diingat bahwa dalam melakukan sampling diperlukan suatu teknik khusus yang telah disediakan dalam ilmu statistik. Teknik Sampling tersebut dapat menjamin tingkat akurasi, validasi, keandalan, dan keterwakilan dari data yang diambil. Selain itu, teknik sampling juga memperhatikan tingkat efisiensi dari berbagai hal, misalnya dana, waktu, tingkat kesulitan, dan lain-lain.

Untuk itu, saya menyerukan kepada semua kalangan untuk menggunakan sampling dengan menggunakan teknik sampling yang benar dalam melakukan berbagai pembuatan kesimpulan.
Khusunya saya menyerukan kepada:
1. Hakim dan Jaksa di pengadilan untuk dapat mempertimbangkan hasil analisis dengan menggunakan data sampling sesuai metode statistika;
2. Kepada birokrat-birokrat Pemerintah Indonesia agar lebih pertimbangan data sampling daripada persepsi dirinya pribadi dalam setiap melakukan pembuatan keputusan;
3. Semua akademisi yang sedang melakukan penelitian agar menggunakan teknik sampling yang diakui secara bernar dalam statistika;
4. Bidang-bidang lain yang relevan...

Minggu, 05 Agustus 2007

Ada Orang Tenggelam di Danau yang Kedalaman Rata-Ratanya 15 Cm?

Pernah denger cerita aneh???

Ada orang tenggelam di danau yang kedalaman rata-ratanya 15 cm??!!!???

Jangan gak percaya dulu... Ini sangat mungkin lhoo...

Pada bagian pinggir danau kedalaman danau hanya 2 cm, 5 cm sampai 10 cm.. tapi ada bagian danau yang berada di tengah mencapai 5 meter. Kalo dirata-ratakan kedalaman danau cuma 15 cm, karena bagian yang dalam cuma sedikit...

Kalau hanya melihat dari rata-rata yang merupakan suatu nilai pemusatan memang bisa menyesatkan. Tapi kalau melihat standar deviasi yang tinggi, menandakan rata-rata perbedaan kedalaman danau dengan rata-ratanya sangat tinggi. Atau bisa dikatakan sangat bervariasi tingkat kedalamannya.   

Makanya jangan menilai sesuatu hanya dengan nilai pemusatan data, tapi juga harus melihat nilai penyebaran data...

Jumat, 03 Agustus 2007

Kenapa yaah Mata Kuliah Statistik jadi Momok??

Berdasarkan pengalaman dan hasil curhat teman-teman yang bukan jurusan statistik, mata kuliah statistik seakan menjadi momok yang sangat menakutkan... Kenapa yaa bisa begitu...
Banyak yang beralasan terlalu banyak rumus. Ada juga yang bilang klo sering gak nyambung karena terlalu cepet berganti bab dan tidak bisa nyambung antar bab. Dan ada juga yang bilang dosennya nyebelin, killer dll.

Menurut saya, sebagai lulusan statistik, berpendapat kalo statistik itu.....

Yaa emang rumit siiih........................

Tapi, semakin saya dalami, ternyata yang dipelajari yaa itu-itu aja. Intinya memahami logika dan prinsipnya. Kata pak Profesor: "yang penting filosofinya" heheeee.

Seperti matematika, statistika melibatkan angka-angka, logika matematika, dan juga memiliki keterkaitan kuat antara satu materi dengan materi yang lain... Untuk itu ada tahapan-tahapan untuk mempelajarinya.

Bagi orang yang tidak suka logika dan angka-angka, memang kemungkinan besar akan mengalami kesulitan. Tapi menurut saya, asal mau mempelajarinya dengan tekun tahap demi tahap, materi demi materi, pasti akan lancar memahaminya... Kuncinya adalah banyak latihan soal dan banyak menyelesaikan kasus-kasus riil.

Yang terjadi selama ini adalah...mata kuliah statistika yang diberikan kepada mahasiswa bukan jurusan statistika terlalu padat. Di jurusan statistika, satu materi dipelajari satu semester, sedangkan di jurusan lain dipelajari satu bab yang diberikan hanya selama 2 jam.

Apalagi target materi yang harus diberikan sangat banyak. Oleh karena itu, Dosen lebih terkesan mengejar materi agar habis disampaikan, tidak terlalu melihat apakah mahasiswa mengerti atau tidak...

Saya pernah memberikan private Mata Kuliah Statistika kepada beberapa Mahasiswa non statistik. Saya mencoba memberikan penjelasan logika satu demi satu materi dengan perlahan-lahan. Selain itu mencoba banyak melakukan latihan soal dan menyelesaikan kasus-kasus. Ternyata Mahasiswa Non-Statistik tersebut dapat memahami tanpa mengalami banyak hambatan....

So, buang semua mitos kalo statistika itu mata kuliah yang sulit....
Pelajari aja satu demi satu...

Selamat Belajar!!!

Buang Saja Outliernya

Di dalam organisasi Pemerintah Indonesia saat ini dipenuhi oleh orang-orang yang tidak berkompeten. Ada orang yang tepat pada posisi yang tidak tepat (the right person in the wrong place) atau orang yang tidak tepat pada posisi yang tepat (the wrong person in the right place) atau lebih gila lagi orang yang salah pada tempat yang salah pula (the wrong person in the wrong place)...

Saya tidak mengatakan tidak ada orang yang tepat di dalam posisi yang tepat (ther right think in the right palce). Memang ada beberapa orang yang berkompeten didalam suatu organisasi Pemerintah, namun mereka itu tidak bisa berbuat apa-apa. Hal ini disebabkan karena organisasi Pemerintah Indonesia sangat berkomitmen dalam menerapkan prinsip Statistika...

Lhok kok yang disalahkan prinsip statistika??? apa hubungannya???

Yaa sangat berhubungan... Mereka yang berkompeten itu khan hanya beberapa saja. Nah dalam ilmu statistik orang-orang tersebut dikatakan sebagai outlier/pencilan, sesuatu yang menyimpang, berada jauh dari kumpulan amatan. Dalam proses pembuatan keputusan, pencilan tersebut harus disingkirkan terlebih dahulu sebelum dilakukan analisis lebih lanjut ...

Begitu juga orang-orang yang berkompeten itu... tidak akan diikutkan atau disingkirkan dalam proses pembuatan keputusan, hehehehehe....

Hmm emang ruwet jadinya....
Any comment???

DEFINISI DEFINISI DALAM STATISTIKA

Statistika : Suatu disiplin ilmu yang mempelajari metode pengumpulan, peringkasan dan penyajian data, menganalisis (termasuk pendugaan parametrik) dan menarik kesimpulan dari data tersebut.

Parameter : Sembarang nilai yang menjelaskan ciri suatu populasi.
Statistik : Sembarang nilai yang menjelaskan ciri suatu sample/contoh

Populasi : Keseluruhan pengamatan yang menjadi perhatian kita dalam penelitian.
Sample/contoh : Subset/himpunan bagian dari populasi yang kita ambil/ukur/amati/hitung

SUMBER DATA
1. Data Primer : data yang diperoleh dari sumber asli dan dikumpuilkan secara khusus untuk menjawab pertanyaan penelitian kita.
2. Data Sekunder : data yang berasal dar survei pihak lain.

Contoh Acak / Random Sampling :
Sample/contoh yang dipilih sedemikian rupa sehingga setiap himpunan bagian / seubset dari populasi tersebut mempunyai peluang yang sama untuk terpilih.

UKURAN PEMUSATAN DATA
Mean : Rata-rata = Jumlah nilai semua data dibagi jumlah data.
Median : Nilai tengah = nilai yang tepat berada ditengah-tengah barisan data yang terurut.
Modus : Nilai dari suatu data yang memiliki frekuensi tertinggi atau paling sering muncul.
Kuartil (Q1, Q2, Q3)  3 nilai yang membagi data yang menjadi 4 baigan yang sama setelah data tersebut diurutkan.
Statistika 5 Serangkai  Xmin Q1, Q2, Q3, dan Xmax

UKURAN PENYEBARAN DATA
Jangkauan = Wilayah = Xmax – Xmin
Jangkauan antar kuartil = Hamparan = H = Q3 – Q1
Jangkauan Semi antar kuartil = simpangan kuartil = Qd = ½H = ½(Q3-Q1)
Langkah = L = 1½H = 1½ (Q3-Q1)
Pagar Dalam = Q1 – L Pagar Luar = Q3 + L
Simpangan rata-rata, Variance/Ragam, dan Standard Deviasi/Simpangan Baku tidak bisa dipaparkan dalam tulisan ini karena memerlukan penulisan yang agak rumit.

Dalil Chebyshev :
“Sekurang-kurangnya 1 – 1/k2 bagian data terletak dalam k simpangan baku dari nilai tengahnya.”

METODE STATISTIKA
Metode Statistika: Prosedur-prosedur yang digunakan dalam pengumpulan, penyajian, analisis dan penafsiran data.
Pengelompokkan Metode Statistika :
1. Statistika deskriptif : metode-metode yang berkaitan dengan pengumpulan, peringkasan dan penyajian suatu data sehingga memberikan informasi yang berguna dan juga menatanya ke dalam bentuk yang siap untuk dianalisis.
2. Statistika inferensia : Mencakup semua metode yang berhubungan dengan analisis sebagian data kemudian sampai pada peramalan atau penarikan kesimpulan mengenai keseluruhan himpunan data induknya.

Kamis, 02 Agustus 2007

Metode Statistik yang dapat Kami Layani

1. Analisis Deskriptif
     Meringkas Data, statistika 5 serangkai, Ukuran pemusatan,
      ukuran  keragaman data, dll
2. Charting, grafik
     Pembuatan chart dan grafik apapun sesuai keinginan Anda
3. Tabulasi
     Pembuatan berbagai macam tabel sesuai keinginan Anda
4. Uji Signifikan
     Melakukan uji hipotesis terhadap berbagai permasalahan
     Uji satu sampel, uji dua sempel, uji dua atau lebih sampel
5. Korelasi
     Metode untuk mengetahui hubungan antar dua variabel,  
     satu variabel dengan lebih dari satu veriabel, dan juga 
     banyak variabel dengan banyak variabel. 
6. Regresi   
     Metode untuk membuat suatu modelhubungan antara 
     satu variabel terikat (dependent variable) dengan satu atau      lebih variabel bebas (independent variable)
7. Multivariate Regression
    Metode untuk membuat model hubungan antara banyak
    variabel terikat (dependent variable) dan banyak variabel bebas  
    (independent variable)
8. Logit-Probit
    Mirip dengan regresi namun dapat digunakan untuk variabel kategorik
    (ordinal dan nominal), termasuk non parametrik   
9. Experimental Design     :  keterangan menyusul
10. Non-Parametrik Analysis : keterangan menyusul
11. AKU : keterangan menyusul
12. Analisis Faktor : keterangan menyusul
13. Cluster Analysis : keterangan menyusul
14. Analisis Diskriminan : keterangan menyusul
15. Multidimensional Scaling : keterangan menyusul
16. Biplot : keterangan menyusul
17. Analisis Korespondency : keterangan menyusul
18. Time Series Anlysis : keterangan menyusul
19. Path Analysis : keterangan menyusul
20. SEM (Seqential Equation Modeling) : keterangan menyusul
21. CHAID : keterangan menyusul
22. AMMI : keterangan menyusul
23. Bootstrap : keterangan menyusul

Anda Perlu Bantuan Analisis Data Statistik?

Hubungi kami melalui:

  - Telp. (021)96927448

  - email. jihadbest36@yahoo.com

Analisis Data:

  - Skripsi (S1): Rp 500.000

  - Tesis (S2): Rp 1.000.000

  - Disertasi (S3): Rp 2.500.000

Kursus Private Statistika

2 jam per pertemuan:

  - S1: Rp 150.000 per pertemuan

  - S2: Rp 300.000 per pertemuan

  - S3: Rp 500.000 per pertemuan 



Konsultasi Rp 100.000 per jam

ANALISIS YANG KAMI LAYANI

1. Analisis Deskriptif
     Meringkas Data, statistika 5 serangkai, Ukuran pemusatan,
      ukuran  keragaman data, dll
2. Charting, grafik
     Pembuatan chart dan grafik apapun sesuai keinginan Anda
3. Tabulasi
     Pembuatan berbagai macam tabel sesuai keinginan Anda
4. Uji Signifikan
     Melakukan uji hipotesis terhadap berbagai permasalahan
     Uji satu sampel, uji dua sempel, uji dua atau lebih sampel
5. Korelasi
     Metode untuk mengetahui hubungan antar dua variabel,  
     satu variabel dengan lebih dari satu veriabel, dan juga 
     banyak variabel dengan banyak variabel. 
6. Regresi   
     Metode untuk membuat suatu modelhubungan antara 
     satu variabel terikat (dependent variable) dengan satu atau      lebih variabel bebas (independent variable)
7. Multivariate Regression
    Metode untuk membuat model hubungan antara banyak
    variabel terikat (dependent variable) dan banyak variabel bebas  
    (independent variable)
8. Logit-Probit
    Mirip dengan regresi namun dapat digunakan untuk variabel kategorik
    (ordinal dan nominal), termasuk non parametrik   
9. Experimental Design     
10. Non-Parametrik Analysis 
11. AKU (Analisis Komponen Utama) /Principal Component
12. Analisis Faktor 

13. Cluster Analysis

14. Analisis Diskriminan

15. Multidimensional Scaling 
16. Biplot 
17. Analisis Korespondency 
18. Time Series Anlysis 
19. Path Analysis 
20. SEM (Seqential Equation Modeling)
21. CHAID
22. AMMI
23. Bootstrap