Alibaba #95 Missing Value

Friday 23rd of January 2026 12:00:00 AM

[dirangkum oleh Diskominsta Magelang]
Sahabat Data,


Missing Value (data hilang//kosong) atau yang dikenal dengan NaN adalah kondisi ketika informasi tidak tercatat dalam dataset. Hal ini bisa terjadi karena kesalahan input, data tidak tersedia, atau bahkan rekponden yang tidak mau menjawab. Menurut Robin, Missing value dapat digolongkan menjadi 3 jenis yaitu:

  1. Missing at Random (MAR) : Data hilang berkaitan dengan variabel lain yang teramati, tetapi tidak pada nilai yang hilang itu sendiri. contohnya anak dibawah 17 tahun biasanya belum bekerja sehingga tidak mengisi kolom pekerjaan( pola bergantung pada usia).

  2. Missing completely at random (MCAR) : Data yang hilang secara acak tidak berhubungan dengan data lain. Contohnya responden yang melewatkan 1 halaman kuisioner.

  3. Missing Not at Random (MNAR) : Data hilang karena nilai data itu sendiri. Contohnya orang yang memiliki hutang yang tinggi biasanya enggan mengisi kolom "jumlah hutang".

    Apakah Missing Value Berbahaya ?

    Dalam dunia statistika, missing value sangat berbahaya karena dapat memicu bias sistematis yang merusak validitas hasil analisis dan kesimpulan akhir. Secara teknis, keberadaan nilai kosong ini mengurangi kekuatan uji statistik dan seringkali menyebabkan error pada algoritma machine learning yang memerlukan input data yang utuh. Oleh karena itu, penanganan yang tepat menjadi keharusan untuk menjamin bahwa model yang dihasilkan benar-benar merepresentasikan data asli di lapangan.

CHATBOT AI BANGDATA
Ke chatbot ai bangdata