Rabu, 12 September 2018

Pemahaman Sederhana dan Mendasar Statistik

Populasi
Substansi sebuah statistik 

Statistik

Statistik adalah karakteristik dari sebuah sampel yang telah didata dan dihitung. Statistik pasti mengandung sebuah kesalahan tak berdosa atau yang disebut dengan error. Statistik didapatkan dari pengambilan sampek yang acak sebuah populasi yang menjadi target.

Acak berbeda dengan sembarang. Acak dalam pengertian statistika menunjukkan bahwa setiap elemen dari populasi memiliki peluang yang sama untuk terpilih sebagai sampel atau contoh. Kalau sembarang bermakna tanpa menggunakan kaidah peluang dan boleh jadi dilakukan secara subyektif.

Statistik itu sederhananya bisa kita contohkan dengan kasus berikut:

Nilai ulangan A, B, C, dan D masing-masing 7, 8, 9, dan 6. Apabila 4 orang tersebut kita pandang sebagai sebuah populasi, maka rata-ratanya disimbolkan sebagai u (baca: miu).

u = (7 + 8 + 9 + 6)/4 = 7,5

7,5 inilah yang kemudian kita sebut sebagai parameter populasi.

Dengan kaidah sampling, ternyata kita mendapatkan sampel A dan D saja. Maka, rata-ratanya dapat dihitung sebagai x bar yang menandakan sebagai statistik dr sampel kita.

x bar = (7 + 6)/2 = 6,5

Pada survei yang lain, dengan sampling kita mendapatkan bahwa yang terpilih sampel adalah B dan C sehingga rata-ratanya:

x bar = (8 + 9)/2 = 8,5

nilai u = 7,5
nilai x bar pertama = 6,5
nilai x bar kedua = 8,5

Masing-masing mendekati nilai u. Lantas, sampel yang mana yang benar?

Dalam statistika, nilai statistik pasti mengandung error tadi. Dalam realita, kita tidak akan mengetahui u sebenarnya. Untuk itu, kita menggunakan sebuah tingkat kepercayaan dan selang interval dengan sejumlah sampel tertentu dengan harapan bahwa di dalam selang interval kita, kita yakin mengandung nilai u sebenarnya.

Dalam statistika, hal yang terpenting bukan berapa nilai statistik yang didapatkan dari hasil kalkulasi, melainkan bagaimana proses pelaksaan survei untuk mendapatkan angka statistik itu. Statistik boleh salah, tapi statistik tidak boleh bohong. Sebesar apapun eror dan bias statistik yang dihasilkan, selama kita lakukan secara jujur dan dapat dipertanggungjawabkan, maka boleh-boleh saja kita berbekal metodologi dalam menyampaikan hasil kegiatan statistik.

Lebih mudahnya, coba kita ambil contoh kegiatan quick count alias hitung cepat. Setiap lembaga survei bisa saja memberikan hasil yang berbeda, bahkan dengan hasil perhitungan real count.

Posisi ini secara awam mungkin membandingkan sekaligus mempertentangkan soal mana hasil survei yang hendak dipegang dan tepercaya. Padahal, substansinya terdapat pada bagaimana metodologi yang digunakan masing-masing lembaga survei. Selama setiap mereka memberikan kejelasan soal bagaimana teknik sampling hingga teknik analisis datanya secara terbuka, maka kaidah ilmiah membenarkannya. Meski tidak termasuk ada atau tidaknya human eror atau moral hazard.

Menanggapi Perbedaan Data

Statistika memberikan ruang seluas-luasnya bagi sebuah data untuk berbeda. Dan itu merupakan suatu hal yang normal. Ketika data antara instansi satu dan yang lain berbeda, sebenarnya itu bukanlah masalah. Selama konsep dan definisi yang terkandung pada masing-masing data dapat diterima secara ilmiah dan kredibel.

Data berbeda? Kita tak perlu risau, sebab data yang berbeda bisa kita gunakan sebagai bahan pembanding atau bahan sharing metodologi. Keragaman suatu data ada konsekuensi logis di dalam statistika. Terlebih lagi, sumber daya untuk memotret data berbeda-beda pula. Keragaman data pun bukan untuk dihindari melainkan untuk dicakup. Sebab, keragaman data mengandung sebuah fenomena, bahkan memunculkan sebuah analisis baru.

Fanatik Data?

Acapkali, insan statistika terlalu fanatik terhadap hasil penelitiannya. Dengan teknik sampling yang canggih dan analisis data demikian rumit, ia justru terjebak dalam sebuah kefanatikan. Fanatik dalam statistika sesungguhnya tidaklah patut dilakukan. Karena, sebagaimana di awal tadi kita bahas, bahwa *statistik pasti ada salahnya*.

Apakah dengan rilisan angka kemiskinan nasional satu digit membuat kita fanatik? Boleh jadi ada. Namun, sebaiknya kita renungkan saja angka yang kita rilis kepada publik itu.

Seperti yang kita ketahui bersama bahwa angka kemiskinan berasal dari data survei sosial ekonomi nasional atau yang biasa disingkat Susenas. Di dalam pelaksanaan Susenas, rumah tangga sampel se-Indonesia meliputi 300.000 ruta yang tersebar di semua provinsi. Padahal, populasi Indonesia saat ini telah mencapai 262 juta jiwa. Bila 1 ruta sekitar 5 orang, maka ada sekitar 52,4 juta ruta. Dengan demikian, sampel nasional bila dihitung adalah 0,57 persen. Ini dari segi ukuran sampel. Belum lagi bila dihitung biasnya, variabel errornya, serta human errornya. Jadi, bukan soal hasilnya berapa, melainkan soal apakah metodologinya sudah benar atau tidak. Lantas, buat apa kita fanatik data?