Senin, 28 Agustus 2017

Variansnya Data

Varians sebuah data, sumber foto: dokpri.

Varians merupakan salah satu ukuran penyebaran sebuah data. Dengan mengetahui varians, kita akan tahu seberapa besar tingkat penyebaran sekaligus sebesar apa penyimpangan unit atau amatan data terhadap rata-rata.

Kalau kita definisikan berdasarkan rumusnya, varians adalah rata-rata kuadrat simpangan unit atau amatan satu set data terhadap rata-rata. Rata-rata apa? Rata-rata populasi atau sampel? Lebih jauh nanti akan kita ulas secara tersendiri pada bagian selanjutnya. Yang jelas, rata-rata dalam hal ini baik rata-rata populasi (miu) maupun rata-rata sampel (x bar atau miu topi).

Varians kita ketahui terbagi dalam dua jenis, yaitu varians populasi dan varians sampel. Untuk pengertian populasi dan sampel sendiri bisa dibaca kembali pada ulasan sebelumnya. Varians populasi adalah rata-rata kuadrat simpangan unit atau amatan satu set data terhadap rata-rata populasi (miu). Secara matematis bisa dituliskan sebagai berikut:
Rumus varians untuk populasi, sumber foto: dokpri.

Sedangkan varians sampel adalah rata-rata kuadrat simpangan unit atau amatan satu set data sampel terhadap rata-rata sampel itu sendiri. Secara matematis bisa dituliskan sebagai berikut:
Rumus varians untuk data sampel, sumber foto: dokpri.

Dari kedua bentuk rumus tersebut, kita bisa amati terdapat perbedaan di sisi penyebut (pembagi) antara varians untuk data populasi dan varians untuk data sampel. Varians data populasi penyebutnya adalah N sedangkan varians data sampel penyebutnya adalah (N - 1). Mengapa penyebut varians data sampel (N - 1)? Anda bisa cari tahu alasannya pada bagian sebelumnya (Klik di sini ya).

Mengapa Varians Pakai Rata-rata Kuadratik?

Seperti yang telah kita pelajari pada bagian sebelumnya, salah satu metode mencari rata-rata adalah dengan rata-rata kuadratik. Sebetulnya, rata-rata kuadratik ini adalah jenis rata-rata tertimbang, ia tertimbang dengan nilai setiap unit atau amatan satu set data. Mengapa pakai penimbang nilai unit atau amatan dalam data itu sendiri? Ya, karena nilai penyimpangan mengandung nilai negatif dan positif yang saling menghilangkan.

Alasan lain mengapa harus dikuadratkan, bukan dimutlakkan atau dengan penimbang lainnya? Baik, sekarang kita coba simulasi sederhana untuk menjawab keingintahuan kita ini.
Ilustrasi perhitungan, sumber foto: dokpri.

Sekarang coba kita rata-ratakan simpangan amatan terhadap garis biru tersebut:

Rata-rata = (5 + 5 + (-5) + (-5))/4
Rata-rata = 0

Bagaimana jika kita mutlakkan nilai setiap simpangan amatan terhadap garis biru, lalu kita rata-ratakan?

Rata-rata = (|5| + |5| + |-5| + |-5|)/4

Rata-rata = 5

Wah, ternyata kalau dimutlakkan nampakknya baik. Tapi, kita coba kasus lain berikut:
Ilustrasi perhitungan, sumber foto: dokpri.

Dari ilustrasi itu, kita rata-ratakan dengan terlebih dulu kita mutlakkan masing-masing simpangan amatan terhadap garis birunya.

Rata-rata = (|6| + |4| + |-8| + |-2|)/4

Rata-rata = 5

Ternyata, rata-rata dengan cara memutlakkan menghasilkan nilai yang sama dengan simpangan amatan yang berbeda. Ini menunjukkan rata-rata mutlak memiliki kelemahan sekaligus tidak mampu memperlihatkan varians itu sendiri. Padahal, datanya lebih menyebar (heterogen) dibandingkan data sebelumnya (homogen).

Coba kita lanjut dengan menggunakan rata-rata kuadrat data simpangan kedua ilustrasi di atas.

Rata-rata 1 = (5^2 + 5^2 + (-5)^2 + (-5)^2)/4

Rata-rata 1 = 25

Sedangkan:

Rata-rata 2 = (6^2 + 4^2 + (-8)^2 + (-2)^2)/4

Rata-rata 2 = 30

Nah, kita amati hasilnya, bahwa dengan menggunakan rata-rata kuadratik, kedua data simpangan menunjukkan hasil yang berbeda. Data yang lebih menyebar (lebih timpang) memiliki rata-rata kuadratik relatif lebih besar dibandingkan data yang tidak menyebar (homogen).

Telah kita ketahui, bahwa terdapat dua jenis varians, yakni untuk data populasi dan data sampel. Terkait hal ini, kita juga perlu membedakan cara perhitungan varians lebih khusus apabila dalam kasus kita datanya merupakan data berkelompok, baik populasi ataupun sampel. Secara matematis, rumus yang bisa kita gunakan untuk menghitung varians data berkelompok adalah sebagai berikut:
Varians data populasi berkelompok, sumber foto: dokpri.

Varians data sampel berkelompok, sumber foto: dokpri.

Keterangan:

N adalah jumlah unit atau amatan populasi
n adalah jumlah unit atau amatan sampel
sigma adalah varians data populasi
s kuadrat adalah varians data sampel
fi adalah frekuensi kelas ke-i, i adalah banyaknya kelas data
miu-i adalah nilai tengah data kelas ke-i (bukan rata-rata populasi ke-i) data populasi
xi adalah nilai tengah kelas ke-i data sampel

Demikian obrolan singkat kita mengenai varians, dan untuk lebih memahami perhitungan matematisnya, kita coba beberapa contoh berikut.

Contoh 1

Diberikan data populasi sebagai berikut:

1 3 4 7 11

Tentukan besarnya variansnya!...

Pembahasan:

Rata - rata = (1 + 3 + 4 + 7 + 11)/5

Rata-rata = 5,2

(1 - 5,2)^2 = 17,64
(3 - 5,2)^2 = 8,44
(4 - 5,2)^2 = 2,24
(7 - 5,2)^2 = 2,36
(11 - 5,2)^2 = 19,16

Jumlah = 17,64 + 8,44 + 2,24 + 2,36 + 19,16 = 49,84

Varians = 49,84/5 = 9,968

Jadi, varians data populasi tersebut adalah 9,968.

Contoh 2

Data nilai ulangan Aljabar Linier sebanyak 10 (populasi) mahasiswa STIS diberikan dalam tabel berikut:

Nilai         Jumlah (orang)
60 - 79              3
80 - 99              7
Jumlah            10

Berdasarkan data tersebut, variansnya adalah sebesar?...

Pembahasan:

Datanya adalah populasi sehingga kita gunakan jumlah N = 10.

Nilai tengah 60 - 79 = (60 + 79)/2 = 69,5
Nilai tngah 80 - 99 = (80 + 99)/2 = 89,5

Sehingga:

Rata-rata populasi (miu) = [(3 x 69,5) + (7 x 89,5)]/10
Rata-rata populasi (miu) = 83,5

Dengan perhitungan didapatkan hasil


Dan:

Dengan demikian:

Varians = 7.056,25 - 6.972,25
Varians = 84

Jadi, varians nilai ulangan Aljabar Linier 10 mahasiswa STIS adalah sebesar 84.