Daftar Isi:
Definisi - Apa yang dimaksud dengan Apache Avro?
Apache Avro adalah kerangka serialisasi data dan panggilan prosedur jarak jauh yang dikembangkan dalam proyek Apache Hadoop di mana ia menyediakan baik format serialisasi untuk mendapatkan data persisten dan format kawat untuk menyediakan komunikasi antara node Hadoop, serta menghubungkan program klien ke Hadoop jasa.
Avro menggunakan format JSON untuk mendefinisikan protokol dan tipe data, serta membuat serialisasi data menjadi format biner yang ringkas.
Techopedia menjelaskan Apache Avro
Apache Avro adalah kerangka serialisasi data besar yang menghasilkan data dalam format biner ringkas yang tidak memerlukan pembuatan kode atau objek proxy.
Ini digunakan sebagai komponen serialisasi data untuk Apache Hadoop. Avro bekerja pada konsep skema. Ketika data Avro sedang dibaca, skema yang digunakan selama penulisan data spesifik selalu ada.
Hal ini memungkinkan setiap kumpulan data tanpa overhead per nilai, yang membuat serialisasi menjadi cepat dan relatif kecil. Dan karena data dan skema mereka sepenuhnya menggambarkan diri sendiri, ini membuatnya mudah digunakan dengan bahasa skrip dinamis.
Ketika data Avro disimpan dalam file tertentu, skema juga disimpan dengannya untuk kemudian diproses oleh program lain. Jadi jika suatu program membaca data mengharapkan skema lain, maka ini dapat dengan mudah diselesaikan karena kedua skema hadir.
Avro menyediakan:
Format data biner yang ringkas dan cepat
Struktur data yang kaya
File kontainer untuk menyimpan data persisten
Panggilan prosedur jarak jauh (RPC)
Integrasi dengan bahasa dinamis
Pembuatan kode bukan merupakan persyaratan untuk membaca atau menulis file data atau untuk menggunakan atau mengimplementasikan protokol RPC.