Q:
Mengapa manajer harus waspada terhadap redundansi database?
SEBUAH:Manajer basis data dan profesional TI lainnya harus waspada terhadap “redundansi basis data” atau “redundansi data” karena semua dampak negatif yang dimiliki redundansi dalam sistem atau lingkungan basis data. Di mana pun bagian data tertentu diduplikasi, baik dalam dua bidang dalam basis data, atau dalam dua lingkungan basis data yang berbeda, ia dapat memiliki konsekuensi untuk pengambilan data.
Salah satu alasan pertama untuk menghindari redundansi data adalah bahwa hal itu mungkin boros atau berlebihan.
Penting untuk menunjukkan bahwa beberapa jenis redundansi data direncanakan, untuk melindungi dan membuat cadangan data. Namun, yang lain muncul dari pengkodean yang buruk atau tidak efisien, atau kurangnya perhatian pada praktik terbaik. Dalam banyak kasus, sejumlah besar redundansi data menyebabkan database cepat tumbuh melampaui ukuran yang wajar. Dengan pemikiran ini, banyak upaya untuk memerangi redundansi data dilakukan untuk menghemat ruang dalam database, dan akibatnya, untuk mengurangi biaya dan upaya pemeliharaan. Namun, ini harus dilakukan dengan mata kepraktisan - insinyur dapat mempraktekkan sesuatu yang disebut deduplikasi data, tetapi harus dilakukan dengan cara yang efisien.
Misalnya, manajer basis data mungkin mengeksplorasi sesuatu seperti mengambil string dari bidang yang berulang, seperti pelanggan bersama atau nama perusahaan, dan menggantinya dengan referensi variabel sederhana di mana string disimpan di tempat lain. Ini dapat menghemat ruang pada basis data - tetapi juga membutuhkan lebih banyak aktivitas server untuk melakukan kueri yang diberikan, sehingga mungkin tidak seefisien kelihatannya.
Alasan besar lain untuk mendeduplikasi data atau menghindari redundansi data adalah karena kebingungan yang dapat terjadi. Data yang berlebihan dalam suatu database dapat menyebabkan berbagai jenis anomali. Salah satunya disebut anomali pembaruan - anomali pembaruan terjadi ketika catatan dimasukkan kembali dengan informasi yang diperbarui, tetapi pembaruan tidak membuatnya kembali ke catatan asli. Dalam situasi seperti itu, mungkin ada tiga catatan berbeda untuk karyawan perusahaan tertentu, dengan tiga jabatan yang berbeda dan tiga alamat yang berbeda, karena informasi orang tersebut tidak diperbarui di seluruh basis data, tetapi hanya pada catatan yang terakhir dimasukkan.
Seperti yang disarankan oleh para ahli, administrator database dapat menghindari redundansi data dengan desain. Mereka juga dapat terlibat dalam praktik normalisasi data yang dapat memperbaiki anomali pembaruan dan jenis anomali lainnya dengan menstandarkan cara penyimpanan catatan tabel database. Administrator database juga dapat melakukan upaya deduplikasi data yang membersihkan dan membakukan data dengan cara lain. Semua ini bertujuan menciptakan tabel database yang lebih bersih, membuat catatan basis data lebih konsisten dan mencegah semua sakit kepala dan masalah kompleks yang terkait dengan redundansi data yang tidak direncanakan.