Posted by: tonyteaching | September 24, 2010

Convidence Interval

Convidence Interval adalah salah satu parameter lain untuk mengukur seberapa akurat Mean sebuah sample mewakili (mencakup) nilai Mean Populasi sesungguhnya.

Dalam posting tentang Standard Error sebelumnya, sudah saya sampaikan bahwa: Standard Error (SE) dapat digunakan sebagai suatu parameter seberapa akurat sample-sample yang kita ukur mewakili Population Mean ( ). Semakin Besar SE semakin Gemuk diagram Sampling Distribution-nya semakin Tidak Akurat sample-sample kita mewakili Populasi (dalam hal ini diwakili Population Mean), semakin Kecil SE semakin Kurus diagram Sampling Distribution-nya (nilai-nilai Samples Mean mengumpul sekitar Population Mean) semakin Akurat sample-sample kita mewakili Populasi.

Nah, cara ke dua untuk mengukur seberapa akurat sebuah Sample Mean terhadap Mean Populasi (dalam hal ini karena populasinya sangat besar sehingga kita Tidak Dapat mengakses dan mengukur semua item, sehingga kita ingin mengambil kesimpulan Mean Populasi dengan satu buah Sample Mean): yakni dengan menggunakan Confidence Interval.

Confidence Interval adalah rentang antara dua nilai di mana nilai suatu Sample Mean tepat berada di tengah-tengahnya.
Nilai sebuah confidence interval dapat dinyatakan dengan Kemungkinan (Probability) berapa sample dalam 100 kali pengambilan samples nilai Population Mean sesungguhnya akan masuk dalam sebuah rentang sample mean.
Contoh: 95% of confidence interval artinya jika saya mengambil 100 samples maka kemungkinan 95 sample saya akan mencakup nilai Population Mean sesungguhnya.

Bagaimana menghitung Batas Rentang sebuah Sample Mean untuk % confidence interval tertentu?

Untuk menghitungnya, kembali kita ke konsep perhitungan nilai z yakni hubungan antara nilai sebenarnya dalam distribusi frequency dengan nilai z dalam distribusi normal.
Dalam statistics, telah ditemukan jika sample kita besar, yakni lebih dari 30 samples, maka ditemukan distribusi samples nya “pasti” NORMAL, sehingga kita dapat menggunakan rumus perhitungan z dan tabel distribusi normal. Jika 30 samples atau kurang maka menggunakan t-distribution.

Anggap samples kita lebih dari 30, maka kita telah tahu bahwa

z adalah perbandingan antara {selisih nilai x (yang akan dicari probabilitas kemunculannya) dan Mean } dengan standard deviation-nya

z = (X – SampleMean)/s

Question: saya pengin mengetahui interval sebuah Sample Mean agar Confidence Intervalnya mencapai 95%

maka agar area dibawah kurva normal sebesar 95% atau 0.095 maka dua batas vertical are tersebut adalah 5%/2 = 2,5% (0.025) smaller area atas dan 2,5% (0.025) smaller area bawah, atau dari Table conversi luas area (probabilitas) dan nilai z diketahui nilai z dari probabilitas 0.025 adalah 1.96.

Jadi ada dua nilai batas z, nilai batas z bawah – 1.96, nilai batas z atas 1.96.

jadi untuk mencari nilai rentang (X) batas bawah dan atas:

– 1.96 = (X – SampleMean)/s

1.96 = (X – SampleMean)/s

sehingga nilai X dapat diketahui:

X batas bawah = Sample Mean – 1.96s

X batas atas = Sample Mean + 1.96s

Ketemu dech nilai rentangnya (antara X batas bawah sampai dengan X batas atas), disini pasti Sample Mean berada tepat di tengah-tengah rentang ini!. Di mana s adalah Standard Deviation dalam hal ini adalah Standard Error (SE)

Jika rumus perhitungan batas rentang tadi digeneralisasi untuk penelitian dengan lebih dari 30 samples:

X batas bawah = Sample Mean – (z dari {(1-probabilitas yang dicari)/2}) s

X batas atas = Sample Mean + (z dari {(1-probabilitas yang dicari)/2}) s

ingat luas seluruh area di bawah kurva normal=1

****

Contoh question: jika saya punya Sample Mean=10 dengan standard error=2, maka berapa rentang untuk nilai Sample Mean saya ini agar Confidence Intervalnya mencapai 99%.

Jawab:

X batas bawah = Sample Mean – (z dari {(1-probabilitas yang dicari)/2}) s

X batas bawah = 10 – ( z dari (1-99%)/2)s

= 10 – ( z dari (0.01/2))s  = 10 – ( z dari 0.005)s = 10 – 2.58*2 = 10 – 5.16 = 4.84

X batas atas = 10 + ( z dari (1-99%)/2)s

= 10 + 5.16 = 15.16

Jadi agar nilai Sample Mean 10 kemungkinan 95% mencakup Population Mean sebenarnya maka harus diberi rentang antara 4.84 – 15.16

—–

Bagaimana jika banyaknya sample 30 atau kurang dari 30 samples??

Ahli statistics telah menemukan bahwa sampling distribution-nya akan Tidak Normal sehingga tidak bisa memakai nilai z dan kurva normal, namun sebagai gantinya memakai t-distribution, dengan rumus mencari nilai X batas bawah & X batas atas:

X batas bawah = Sample Mean – (t dari n-1) s

X batas bawah = Sample Mean + (t dari n-1) s

—————————————————————–

Nah point lain yang penting dari Confidence Interval kaitannya dengan ukuran keakuratannya terhadap nilai Population Mean sesunggunya adalah:

Semakin LEBAR rentang suatu nilai Sample Mean –> Semakin TIDAK AKURAT nilai Sample Mean itu mewakili/mencakup Population Mean sesungguhnya.
Semakin SEMPIT rentang suatu nilai Sample Mean –> Semakin AKURAT nilai Sample Mean itu mewakili/mencakup Population Mean sesungguhnya.

Naaah..Alhamdulillaah sekarang kita paham, kita sudah bisa menggunakan 2 parameter untuk mengukur keakuratan sebuah Sample Mean terhadap Population Mean, yakni dengan melihat
* Standard Error nya?
* Rentang Confidence Intervalnya?

! SALAH KAPRAH:
95% of Confidence Interval dari suatu Sample Mean JANGAN DIARTIKAN bahwa kita percaya 95% nilai Sample Mean itu benar, tetapi
musti diartikan Rentang nilai untuk suatu Sample Mean di mana Kemungkinan Population Mean masuk dalam rentang itu sebesar 95% (jika ada 100 samples maka kemungkinan 95 samples mencakup nilai Population Mean)


Responses

  1. Thank you for the post… it’s very useful


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Categories

%d bloggers like this: