Belajar Mengenai Ukuran Letak Data

Ukuran persebaran memperlihatkan bagaimana suatu ukuran pusat dapat mewakili suatu kumpulan data tersebut. Ukuran persebaran bertujuan untuk menjawab seberapa menyimpang suatu data terhadap pusatnya atau dengan kata lain memberikan gambaran seberapa besar data menyebar dalam suatu kumpulan. Ukuran penyebaran data terdiri dari range(jangkauan) dan interquartile range (IQR), varians (ragam), standar deviasi (simpangan baku), dan koefisien variasi. Pada kesempatan kali ini, kita akan membahas range dan IQR.

1. Range (Jangkauan)

Range (jangkauan atau rentang) adalah selisih antara data nilai yang terbesar dengan data nilai terkecil. Semakin kecil nilai range maka kualitas data semakin baik. Ukuran ini cukup baik digunakan untuk mengukur penyebaran data yang simetrik dan nilai pengamatannya menyebar merata. Tetapi ukuran ini akan menjadi tidak relevan jika nilai pengamatan maksimum dan minimum merupakan data-data ekstrem. Range dinotasikan dengan R dan dapat ditulis sebagai berikut :

R= xmax-xmin

Keterangan :

R= Range atau jangkauan

xmax= nilai data terbesar

xmin= nilai data terkecil

2. Quartile (Kuartil)

Selanjutnya ada yang disebut dengan kuartil, kuartil ini adalah nilai-nilai yang membagi data terurut menjadi 4 bagian yang sama, kuartil dinotasikan dengan Q yang terdiri dari:

  1. Q1 (dibaca kuartil 1 atau kuartil bawah) merupakan nilai yang membagi 25% data di kiri dan 75% data di kanan
  2. Q2 (dibaca kuartil 2 atau kuartil tengah) yang biasa disebut juga dengan median, membagi data menjadi 50%
  3. Q3 (dibaca kuartil 3 atau kuartil atas) merupakan nilai yang membagi data 75% data di kiri dan 25% data disebelah kanan

Nilai Q1, Q2, dan Q3 ini tahan (robust) terhadap pencilan (outlier) yaitu  pengamatan yang tidak mengikuti sebagian besar pola dan terletak jauh dari pusat data.

Cara perhitungan :

  • Urutkan data dari kecil ke besar
  • Menghitung letak kuartil dan menghitung nilai kuartil

Qi=data ke- i (n+1)/ 4, dimana i (n+1)/ 4 

Jika nilai i (n+1)/ 4 berada diantara dua bilangan bulat a dan b (a< i(n+1)/4 < b), maka nilai kuartil dapat ditentukan dengan rumus:

Qi=xa+i/4(xb-xa), dimana a<i.i( n+1)/4 < b, dan a,b 

Keterangan :

Qi= Kuartil ke-i

i= 1, 2, 3

n= banyaknya data

Nilai kuartil 2 (Q2) ditentukan sama seperti mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri sedangkan kuartil tiga dihitung dari kanan.

Berikut letak kuartil-kuartil dan statistik ekstrim pada data yang telah diurutkan atau biasa disebut dengan statistik lima serangkai karena memuat lima nilai statistik untuk suatu data:

Visualisasi yang biasa digunakan untuk statistik lima serangkai adalah box plotBox plot  digunakan untuk memperoleh persebaran dari data dan menunjukkan ukuran-ukuran pemusatan dan persebaran seperti nilai minimum, kuartil bawah (Q1), kuartil tengah (median atau Q2), kuartil atas (Q3), dan nilai maksimum. Garis diluar box disebut sebagai whisker dan digunakan untuk menunjukkan data di luar  range. Data yang berada di luar garis minimum dan maksimum (apabila ada, dan divisualisasikan dengan simbol dot) akan dianggap sebagai outlier atau nilai ekstrim.

Contoh :

Terdapat sebuah data yang telah diurutkan  yaitu x1,x2, …, xn

Berdasarkan data tersebut diperoleh,

Q1= data ke – 3 = 3

Q2=xa+2/4(xb-xa) = 5+ 2/4 (6-5) = 5.5 

atau

Q2= (6+5)/2=5.5

Q3= data ke – 8 = 7

R= xmax-xmin = 8 – 1 = 7

Rumus kuartil data berkelompok :

Keterangan: 

3. Interquartile Range (IQR)

Interquartile range (IQR) atau dapat disebut jangkauan kuartil (hamparan) didefinisikan sebagai selisih antara Q1 (kuartil bawah/kuartil pertama) dengan Q3 (kuartil atas/kuartil ketiga). Ukuran ini sangat baik digunakan jika data yang dikumpulkan banyak mengandung data pencilan atau outlier karena IQR kekar (robust) terhadap adanya nilai-nilai yang ekstrem.

IQR= Q3– Q1