Daftar Isi:
Definisi - Apa yang dimaksud dengan Data Lake?
Danau data adalah repositori massif, mudah diakses, dan terpusat dari volume besar data terstruktur dan tidak terstruktur.Techopedia menjelaskan Danau Data
Arsitektur data lake adalah pendekatan store-everything untuk data besar. Data tidak diklasifikasikan ketika disimpan dalam repositori, karena nilai data tidak jelas pada awalnya. Akibatnya, persiapan data dihilangkan. Danau data dengan demikian kurang terstruktur dibandingkan dengan data warehouse konvensional. Ketika data diakses, barulah mereka diklasifikasikan, diorganisir atau dianalisis.
Hadoop, kerangka kerja open-source untuk memproses dan menganalisis data besar, dapat digunakan untuk menyaring data dalam repositori.