Selasa, 12 November 2019

Tabel Distribusi Frekuensi, Cara Membuat, dan Kelemahannya

distribusi data
Menguak kelemahan tabel distribusi frekuensi
Data menjadi bagian penting dalam kehidupan. Kebijakan publik juga selalu berdasarkan pada data lho teman-teman. Sebab, tanpa data, biaya untuk pembangunan akan sangat mahal. Tidak hanya itu, pembangunan tanpa data memiliki kemungkinan buruk lebih besar. Data menjadi dasar bagi pemerintah dan kita semua dalam perencanaan juga sebagai bahan baku analisis. Tepat tidaknya dalam menganalisis data inilah penentu apakah kesimpulan yang terjadi sudah tepat atau justru sebaliknya.

Setelah sebelumnya kita sedikit mengulas perbedaan data dan informasi, kali ini kita coba ngobrol mengenai jenis data. Secara garis besar, data terbagi menjadi dua, yaitu data tunggal dan data majemuk atau biasa kita sebut data berkelompok. Data tunggal merupakan suatu set barisan acak  angka-angka, benda, simbol, gambar, atau entitas nyata. Sedangkan data majemuk atau data berkelompok adalah data tunggal yang dikelompokkan atau suatu data yang dikelompokkan menurut kolom dan baris sejumlah tertentu dengan kelas dan panjang kelas interval tertentu dan masing-masing kelas memiliki frekuensi sehingga bisa disebut juga tabel distribusi frekuensi.


Arah dari diskusi kita adalah melihat kelebihan dan kekurangan antara data tunggal dan data majemuk atau berkelompok. Untuk itu, supaya memudahkan, kita coba membangun suatu data tunggal fiktif yang kita namai data nilai Try Out USM Polstat STIS 2019 (TONAS) yang secara berurutan kita sajikan dalam Excel berikut ini:

Informasi
Data nilai Try Out USM Polstat STIS 2019 (fiktif)
Data tersebut kita bangun secara sederhana, meski pada kenyataannya, suatu data bisa jadi sangat acak dan tidak berurutan sebagaimana yang kita contohkan. Hal ini hanyalah untuk memudahkan kita untuk membuat tabel frekuensinya dan tabel frekuensi kumulatifnya.

Dalam membentuk jumlah kelas yang terbentuk, secara teori kita bisa menggunakan Rumus Sturges, namun karena cuma untuk latihan memahami data berkelompok dan data tunggal, kita tidak menggunakan dasar pengelompokan Sturges untuk data kita. Hasilnya sebagaimana pada gambar di bawah ini teman-teman. Dari data tunggal, kita kelompokkan dalam 9 kelas interval berikut frekuensi kelas masing-masing dengan total ada 40 siswa yang ikut TONAS USM Polstat STIS 2019.
Tabel Distribusi Data
Tabel distribusi nilai TO USM Polstat STIS 2019 (fiktif)
Berdasarkan tabel frekuensi di atas, kita lihat ada sebanyak 10 siswa yang mendapatkan nilai dengan interval 75-79. Dari hasil tabulasi data tunggal menjadi berkelompok tadi, kita akan menghitung rata-rata atau mean dari data berkelompoknya menggunakan rumus berikut:
rata-rata
Rata-rata (mean) data teknik nilai tengah
Dari hasil penghitungan dengan rumus di atas, kita dapatkan bahwa mean dari data berkelompok dengan teknik nilai tengah masing-masing kelas bisa ditampilkan sebagai berikut:
rata-rata nilai
Teknik mencari rata-rata dengan nilai tengah kelas
Sehingga rata-rata nilai 40 siswa yang mengikuti TONAS USM Polstat STIS 2019 adalah 3.170 : 40 = 79,250. Tetapi, jika kita menghitung mean dengan menggunakan data tunggal, hasilnya 78,825. Lah, kok bisa beda ya? Padahal data yang kita gunakan sama lho.

Baiklah, kita coba lupakan sejenak tentang hasil penghitungan angka rata-rata tadi. Mungkin otak kita mulai berputar-putar mencari tahu penyebab dari perbedaan. Sudahlah, kita lanjut saja untuk mencoba menghitung statistik lainnya dari data tersebut. Berikutnya kita akan menghitung median atau nilai tengah dari data tersebut dengan menggunakan rumus berikut:
median modus range kelas lebar
Rumus median data berkelompok
Rumus di atas ini biasa digunakan untuk menentukan median dari data berkelompok. Kalau untuk mendapatkan median dari data tunggal, kita cukup mengurutkan data tunggal tersebut dari yang paling kecil sampai yang terbesar kemudian kita cari mediannya dengan mencari titik tengah data. Kalau ada 40 unit data, berarti median data tunggal terdapat pada data ke-20 dan ke-21 kemudian dibagi dua.

Sedangkan untuk menentukan median data berkelompok, kita masih memerlukan beberapa elemen datanya, yaitu kelas bawah yang mengandung median, panjang kelas, frekuensi kelas yang mengandung median, serta frekuensi kumulatif sebelum kelas yang mengandung median data tersebut.
statistik
Rumus modus data berkelompok
Selanjutnya, untuk menghitung nilai modus data berkelompok, kita perlu pahami rumus di atas. tentu berbeda dengan mendapatkan modus data tunggal yang kita lakukan secara manual dengan mencari data yang paling banyak keluar atau nilai data yang sama paling banyak dalam se-set data tunggal, tanpa mengurutkan pun tidak apa-apa.
data statistik
Mencari median dan modus data berkelompok
Dengan menggunakan kedua rumus tadi, untuk median data tunggal kita dapatkan nilai 79,500. Ternyata, setelah kita hitung, median untuk data berkelompoknya juga sama, yaitu sebesar 79,500. Sedangkan nilai modus untuk data tunggalnya kita dapatkan nilai 76,000, sedangkan modus setelah kita tabulasikan menjadi data berkelompok sebesar 77,577.

Kedua hasil perhitungan mean, median, dan modus antara data tunggal dan data tunggal yang sudah dikelompokkan ternyata ada yang berbeda. Nilai mean dan modus data berkelompok cenderung lebih besar ketimbang data tunggal, sedangkan nilai median antara data tunggal dan berkelompok sama besar.

Berdasarkan contoh sederhana ini, dapat kita simpulkan bahwa kelebihan dari tabel distribusi frekuensi atau data berkelompok adalah lebih ringkas dan lebih memudahkan kita untuk mendapatkan informasi. Tapi kelemahannya, tabel distribusi frekuensi mengandung informasi yang hilang sehingga hasil perhitungan cenderung over estimate. Sedangkan untuk perhitungan mediannya yang kebetulan sama karena dalam menghitung median, kita menghilangkan unsur rata-rata dan interval kelas, kita hanya memerhatikan frekuensinya saja sehingga tidak dipengaruhi oleh pencilan atau outlier data.

Pertanyaan selanjutnya adalah: angka mana yang kita menangkan?

Karena kita mengetahui betul data tunggalnya, maka angka yang kita menangkan adalah dari data tunggalnya. Sebab, hilangnya informasi mengenai angka nyata dalam setiap interval kelasnya, menjadikan tabel distribusi frekuensi atau data berkelompok mempunyai kesalahan. Bukankah justru makna statistiknya ada pada angka data berkelompok? Memang, tetapi informasi yang ada pada data tunggal lebih utuh. Oke, demikian sedikit pembahasan kita terkait data tunggal dan data berkelompok.