Daftar Isi:
- Definisi - Apa yang dimaksud dengan Penemuan Pengetahuan dalam Basis Data (KDD)?
- Techopedia menjelaskan Knowledge Discovery in Databases (KDD)
Definisi - Apa yang dimaksud dengan Penemuan Pengetahuan dalam Basis Data (KDD)?
Penemuan pengetahuan dalam basis data (KDD) adalah proses menemukan pengetahuan yang berguna dari kumpulan data. Teknik penambangan data yang banyak digunakan ini adalah proses yang mencakup persiapan dan pemilihan data, pembersihan data, menggabungkan pengetahuan sebelumnya tentang set data dan menafsirkan solusi akurat dari hasil yang diamati.
Area aplikasi utama KDD meliputi pemasaran, deteksi penipuan, telekomunikasi dan manufaktur.
Techopedia menjelaskan Knowledge Discovery in Databases (KDD)
Secara tradisional, penambangan data dan penemuan pengetahuan dilakukan secara manual. Seiring berjalannya waktu, jumlah data di banyak sistem tumbuh menjadi lebih besar dari ukuran terabyte, dan tidak bisa lagi dipertahankan secara manual. Selain itu, untuk keberhasilan keberadaan bisnis apa pun, menemukan pola yang mendasari data dianggap penting. Akibatnya, beberapa alat perangkat lunak dikembangkan untuk menemukan data tersembunyi dan membuat asumsi, yang membentuk bagian dari kecerdasan buatan.
Proses KDD telah mencapai puncaknya dalam 10 tahun terakhir. Saat ini terdapat banyak pendekatan berbeda untuk penemuan, yang meliputi pembelajaran induktif, statistik Bayesian, optimisasi permintaan semantik, akuisisi pengetahuan untuk sistem pakar dan teori informasi. Tujuan utamanya adalah untuk mengekstraksi pengetahuan tingkat tinggi dari data tingkat rendah.
KDD mencakup kegiatan multidisiplin. Ini mencakup penyimpanan dan akses data, penskalaan algoritma untuk kumpulan data yang sangat besar dan hasil interpretasi. Proses pembersihan data dan akses data yang termasuk dalam pergudangan data memfasilitasi proses KDD. Kecerdasan buatan juga mendukung KDD dengan menemukan hukum empiris dari eksperimen dan pengamatan. Pola yang diakui dalam data harus valid pada data baru, dan memiliki tingkat kepastian tertentu. Pola-pola ini dianggap sebagai pengetahuan baru. Langkah-langkah yang terlibat dalam keseluruhan proses KDD adalah:
- Identifikasi tujuan proses KDD dari perspektif pelanggan.
- Memahami domain aplikasi yang terlibat dan pengetahuan yang diperlukan
- Pilih kumpulan data target atau subkumpulan sampel data tempat penemuan dilakukan.
- Membersihkan dan memproses data dengan memutuskan strategi untuk menangani bidang yang hilang dan mengubah data sesuai persyaratan.
- Sederhanakan kumpulan data dengan menghapus variabel yang tidak diinginkan. Kemudian, menganalisis fitur berguna yang dapat digunakan untuk mewakili data, tergantung pada tujuan atau tugas.
- Cocokkan sasaran KDD dengan metode penambangan data untuk menyarankan pola tersembunyi.
- Pilih algoritma penambangan data untuk menemukan pola tersembunyi. Proses ini termasuk memutuskan model dan parameter mana yang mungkin sesuai untuk keseluruhan proses KDD.
- Cari pola yang menarik dalam bentuk representasi tertentu, yang mencakup aturan klasifikasi atau pohon, regresi dan pengelompokan.
- Menafsirkan pengetahuan penting dari pola yang ditambang.
- Gunakan pengetahuan dan gabungkan ke dalam sistem lain untuk tindakan lebih lanjut.
- Dokumentasikan dan buat laporan untuk pihak yang berkepentingan.
