Alibaba #100 Paradoks Simpson

Friday 30th of January 2026 12:00:00 AM

[dirangkum oleh Diskominsta Magelang]
Sahabat Data,


Menurut Wikipedia Paradoks Simpson adalah kejadian dalam probalitas dan statistk dimana suatu tren muncul dalam beberapa kelompok data tetapi menghilang atau berbalik kketika kelompok-kelompok tersebut digabungkan. Hal ini sering ditemui dalam statistik ilmu sosial dan kedokteran. Paradoks ini dapat diselesaikan ketika variabel yang mempengaruhi dan hubungan kausalitasnya ditangani misalnya menggunakan analisis klaster.

Contoh Paradoks Simpson dalam dunia medis seperti membandingkan tingkat keberhasilan dua pengobatan untuk batu ginjal. Pengobatan A melalui prosedur bedah terbuka dan Pengobatan B melalui prosedur bedah tertutup. Diketahui secara agregat, Pengobatan B lebih unggul dengan tingkat keberhasilan 83% dan mengungguli Pengobatan A yang hanya mencapai 78 %.

Namun, ketika data tersebut dibedah berdasarkan tingkat keparahan (ukuran batu), fakta menunjukkan keterbalikan. Pengobatan A terbukti lebih efektif secara konsisten di setiap kategori:

  1. Pada kasus batu kecil, Pengobatan A unggul dengan keberhasilan 93% (dibandingkan B sebesar 87%).

  2. Pada kasus batu besar, Pengobatan A juga tetap unggul dengan 73% (dibandingkan B sebesar 69%).

Paradoks ini terjadi akibat ketimpangan distribusi sampel. Pengobatan A lebih sering dibebani tugas menangani kasus sulit (batu besar), sehingga rata-rata totalnya terseret turun. Sebaliknya, statistik Pengobatan B terdongkrak naik karena mayoritas pasiennya hanya memiliki batu kecil yang lebih mudah disembuhkan.

CHATBOT AI BANGDATA
Ke chatbot ai bangdata