Alibaba #68: Outlier Dalam Statistik

Wednesday 19th of March 2025 12:00:00 AM

[dirangkum oleh Diskominsta Kota Magelang]
Sahabat Data,


Dalam analisis statistik, sering kali kita menemukan data yang terlihat berbeda jauh dari nilai lainnya. Data ini disebut outlier atau pencilan. Outlier dapat memberikan informasi penting, tetapi juga bisa menyebabkan hasil analisis menjadi bias. Yuk, kita bahas lebih dalam tentang outlier dan bagaimana cara mengatasinya!


Apa Itu Outlier?

Menurut Hawkins (1980), outlier adalah data yang memiliki nilai yang sangat menyimpang dari kumpulan data lainnya. Badan Pusat Statistik (BPS) juga mendefinisikan outlier sebagai nilai data yang berada jauh dari distribusi umum data lainnya dan dapat memengaruhi kesimpulan statistik (Sihombing et al., 2022).


Dampak Outlier dalam Analisis Statistik
  • Membuat hasil analisis menjadi bias – Jika tidak ditangani dengan benar, outlier bisa menyebabkan kesimpulan yang keliru. 
  • Mengganggu asumsi distribusi normal – Banyak metode statistik, seperti uji t dan regresi linear, mengasumsikan data berdistribusi normal. Kehadiran outlier bisa melanggar asumsi ini. 
  •  Mempengaruhi estimasi parameter – Rata-rata dan standar deviasi sangat sensitif terhadap outlier, sehingga bisa menjadi tidak representatif terhadap data sebenarnya.

Contoh: Dalam data persentase kemiskinan di Indonesia tahun 2022 yang dirilis oleh BPS, ditemukan bahwa Provinsi Papua memiliki nilai kemiskinan yang jauh lebih tinggi dibandingkan provinsi lainnya, sehingga dianggap sebagai outlier (Sihombing et al., 2022).


Cara Mendeteksi Outlier
  • Boxplot – Visualisasi sederhana yang menunjukkan data di luar batas normal (whisker). Jika ada titik jauh di luar batas, maka data tersebut kemungkinan adalah outlier.
  • Z-Score – Data dikatakan sebagai outlier jika memiliki nilai Z lebih kecil dari -3 atau lebih besar dari 3. 
  • Interquartile Range (IQR) – Suatu data dianggap outlier jika berada di luar rentang Q1 - 1.5 × IQR atau Q3 + 1.5 × IQR. 
  • Uji Grubbs – Metode statistik yang menguji apakah data tertentu adalah outlier berdasarkan distribusi normal.


Cara Menangani Outlier
  • Transformasi Data – Menggunakan teknik Box-Cox Transformation untuk mengubah data menjadi lebih normal. 
  • Winsorizing – Mengganti nilai outlier dengan nilai yang lebih dekat dengan data lainnya. 
  • Trimming – Menghapus outlier agar tidak memengaruhi hasil analisis. 
  • Model Robust Statistik – Menggunakan metode statistik yang lebih tahan terhadap outlier, seperti regresi robust.