Friday, May 17, 2013

Data Mining dan KDD


Dengan semakin berkembangnya bidang-bidang yang menerapkan konsep data mining, membuat semakin banyak kebutuhan akan informasi-informasi. Hal ini kemudian melahirkan konsep tentang Knowledge Discovery in Database (KDD). Penggunaan istilah data mining dan Knowledge Discovery in Database (KDD) seringkali digunakan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Dimana salah satu tahapan dalam keseluruhan proses KDD adalah data mining. Sebagai suatu bagian dari rangkaian proses KDD, data mining merupakan suatu bagian yang penting karena berkaitan dengan ekstraksi dan perhitungan pola-pola dari data yang ditelaah. Berikut ini penjelasan dari tahap-tahap tersebut :

1. Data cleaning
 Tahapan ini bertujuan untuk membuang noise dan data yang tidak konsisten atau relevan dengan tujuan akhir dari proses.
2. Data integration
Tahapan ini bertujuan untuk menggabungkan atau mengkombinasikan data yang berasal dari berbagai sumber data.
3. Data selection
Tahapan ini bertujuan untuk memilih atau menyeleksi data apa saja yang relevan dan diperlukan dari database.
4. Data transformation
Tahapan ini bertujuan untuk menentukan kualitas dari hasil data mining, sehingga di tahap ini data diubah menjadi bentuk yang sesuai untuk di-mining.
5. Data mining
Pada tahapan ini dilakukan p roses mining untuk mengekstrak data sehingga dihasilkan data pattern.
6. Pattern evaluation
Pada tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada telah tercapai.
7. Knowledge presentation
Tahapan presentasi pola yang ditemukan dari proses data mining kepada pengguna.

No comments:

Post a Comment