Daftar Isi:
Definisi - Apa yang dimaksud dengan Perselisihan Data?
Perselisihan data adalah jenis khusus pengelolaan data yang muncul dari kemampuan perangkat lunak baru yang memperkenalkan kumpulan data yang besar, berantakan, dan beragam yang perlu dimasukkan ke arsitektur berorientasi layanan (SOA) untuk keperluan analisis dan penggunaan. Perselisihan data umumnya melibatkan berbagai teknik canggih untuk menangani data yang tidak teratur atau beragam dan memanipulasinya untuk kasus penggunaan bisnis.
Techopedia menjelaskan Perselisihan Data
Ini mungkin terdengar seperti istilah informal, tetapi perselisihan data sebenarnya menempati ruang tertentu dalam manajemen data. Salah satu cara yang bermanfaat untuk memahami perselisihan data adalah membandingkannya dengan metodologi ekstrak, transformasi, dan pemuatan (ETL) yang lebih formal. Perselisihan data memiliki aspek dan kasus penggunaan yang berbeda dari ETL. Ini sering dilakukan oleh para ilmuwan data ahli atau orang lain yang dekat dengan pipa. Dalam beberapa hal, perselisihan data dapat disebut tipe "open source" ETL di mana para insinyur yang menangani data mungkin lebih "langsung" atau menggunakan metode ekstraksi yang lebih manual.
Bagi mereka yang benar-benar memahami proses yang disempurnakan di mana beragam data diambil, diurutkan dan dimasukkan ke dalam arsitektur perusahaan, perselisihan data sebenarnya merupakan topik yang sangat penting. Para profesional TI melihat beragam alat, sumber daya, dan teknik untuk memberikan nilai dari data yang berantakan, mentah, atau tidak terstruktur.
