Kamis, 27 Juli 2017

Kenapa Varians Sampel Dibagi dengan (n - 1)?


                                                  Rumus varians (ragam), sumber: dokpri.

Suatu ketika saya ditanya demikian oleh seseorang. Jadi begini, andaikan kita mau menebak 1 di antara 4 kotak. Salah satu kotak berisi kelereng, kita nggak tahu nih kotak yang mana. Kelereng itu kita misalkan parameter sebenarnya.

Maka, untuk mengetahui pada kotak mana kelereng berada, kita harus membuka 3 kotak, kita bebas membuka kotak mana saja. Kita menyakini bahwa satu kotak terakhir itulah parameter populasi berada. n nya berjumlah 4, kita sisakan 1 kotak, (n - 1) = 3 kotaknya merupakan derajat kebebasan kita mendapatkan kotak berisi kelereng. Tingkat keyakinan kita pada 1 kotak tersisa itulah yang perlu tingkat kepercayaan. Biasanya 95% atau 90% dan lainnya.

Lantas, kenapa pada saat menghitung varians sampel kok harus kita bagi dulu dengan (n - 1)?. Sebelum menghitung varians, kita perlu menghitung 1 estimator, apa itu? Ya, dia adalah rata-rata (mean). Estimator inilah yang menjadi bekal menemukan kelereng itu.

Awalnya kita menghitung mean dengan membagi jumlah nilai amatan dengan jumlah amatan, ketemulah mean. 1 estimator ketemu dari sampel berukuran n, maka selanjutnya kita bisa mencari estimator berikutnya dari sebanyak (n - 1) sampel.

Hal ini mengartikan bahwa, untuk mendapatkan penduga populasi berikutnya, kita perlu mendapatkan penduga sebelumnya. Dan penduga yang paling sederhana dan mudah ditemukan dalam sebuah sampel adalah rata-rata. Derajat kebebasan kita untuk menghitung penduga populasi berikutnya tentu berkurang 1 dan oleh karenanya, secara umum penyebut penduga populasi kemudian dibagi dengan (n - p), dengan n adalah jumlah amatan sampel dan p adalah jumlah penduga parameter populasi yang sudah kita temukan nilainya.