Setelah data terkumpul, tahap selanjutnya adalah
preprocessing data. Tujuan dari preprocessing data adalah untuk membersihkan
data dari noise, outlier, atau kesalahan pengumpulan data. Data yang tidak
valid atau tidak relevan dapat mempengaruhi hasil analisis dan mengarah pada
kesimpulan yang tidak akurat.
Selain membersihkan data, preprocessing juga melibatkan
transformasi data jika diperlukan. Misalnya, melakukan normalisasi atau scaling
pada data untuk memastikan keseragaman dan kesamaan skala antar variabel.
C. Eksplorasi Data