Jumat, 27 April 2018

Keragaman Data Selalu Muncul? Inilah Penyebabnya

Munculnya keragaman data, dokpri.

Sekumpulan data memiliki sifat atau karakter sendiri. Saat kita dihadapkan pada populasi dengan ukuran tertentu, terdapat banyak hal yang harus kita potret. Tujuannya, mendapatkan gambaran utuh mengenai kondisi populasi tersebut. Namun, adanya kendala waktu, tenaga, dan biaya menyebabkan kita harus mengambil sebagian populasi yang menjadi target.

Mengambil sebagian atau contoh dari sebuah populasi menjadi penting, sebab bila mendata seluruh elemen dari populasi, ujung-ujungnya adalah pemborosan. Ya, pemborosan waktu, biaya, dan tenaga tentunya. Bila hanya dengan mengambil sebagian, kita telah mendapatkan kesimpulan mengenai kondisi populasi, mengapa kita harus bersusah payah melakukan pendataan populasi secara lengkap?

Setelah data diambil dari populasi, langkah selanjutnya adalah menghitung ukuran pemusatan terhadap data sebagai dasar kesimpulan seluruh populasi. Pada posisi inilah keragaman dalam sebuah data itu muncul. Kita mendapatkan data dari unit observasi kita di lapangan, sedikit banyak pastilah ada harapan dalam benak kita, bahwa pemusatan data terletak pada satu nilai. Inilah yang kemudian kita sebut sebagai rata-rata data.

Kendati demikian, harapan itu tak persis dengan kenyataan. Sekumpulan data contoh kita perkirakan memiliki rata-rata sebesar 5, misalnya, tetapi kenyataannya ada saja nilai data (amatan) yang lebih kecil atau lebih besar dari 5. Kita telah memperkiraan pusat data sebesar 5, tentu dengan nilai peluang tertentu dan tingkat keyakinan tertentu pula.

Dengan adanya nilai amatan yang "meleset" dari pusat data, justru kemudian menimbulkan sebuah ketidakpastian. Ketidakpastian membentuk sebuah selisih atau jarak antara pusat data dengan kenyataan nilai amatan. Ketidakpastian inilah yang kemudian dipandang sebagai keragaman itu.

Sekumpulan data yang memiliki keragaman besar dinamakan data yang heterogen. Artinya, nilai amatan data terhadap pusat data begitu timpang, ketidakpastiannya pun juga lebih besar. Ketidakpastian ini berdampak kekurangakuratan kita dalam menyakini di mana letak pusat data sebenarnya.

Kita ambil contoh saja, pusat data perkiraan kita sebesar 5, namun nilai amatan sangat menyebar, bahkan terdapat nilai amatan sebesar 0,5 dan 20. Sangat jauh menyimpang dari angka 5. Hal ini menyebabkan kita ragu untuk menyakini bahwa pusat data--rata-ratanya--itu sebesar 5. Oleh karena itu, kita harus memperbesar selang kepercayaan kita sebagai bahan dukungan bahwa pusat data sebesar 5.(*)