Eksplorasi data merupakan langkah untuk memahami data sebelum dilakukan praproses. Pemahaman terhadap data yang akan di-mining dapat membantu dalam menentukan teknik-teknik pra-proses dan analisis data terhadap data sebelum dilakukan data mining. Dalam eksplorasi data, hal yang perlu kita ketahui pertama kali adalah tipe data.
Tipe data
1. Kategorik / Kualitatif:
a. Nominal ("=", "!=")
b. Ordinal ("=", "!=", "<",">")
2. Numerik / Kuantitatif:
a. Interval ("=", "!=", "<",">","+","-")
b. Rasio ("=", "!=", "<",">","+","-","*","/")
Eksplorasi data:
1. statistika ringkasan:
a. tipe data kategorik -> count, frekuensi dan modus,
b. data numerik -> rataan, frekuensi, median, modus, standar deviasi, range, minimum, maksimum, lower25% quartile, dan upper 25% quartile.
2. visualisasi data dalam bentuk grafik
-> membantu mengetahui karakteristik dan hubungan antar atribut dari data.
No comments:
Post a Comment