Q:
Apa yang lebih baik, platform atau algoritme pembelajaran mesin bawa-sendiri di AWS?
SEBUAH:Saat ini, banyak perusahaan mengintegrasikan solusi pembelajaran alat berat ke dalam alat analitik mereka untuk meningkatkan manajemen merek, meningkatkan pengalaman pelanggan, dan meningkatkan efisiensi operasional. Model pembelajaran mesin adalah komponen inti dari solusi pembelajaran mesin. Model dilatih menggunakan algoritma matematika dan kumpulan data besar untuk membuat prediksi yang andal. Dua contoh umum dari prediksi adalah (1) menentukan apakah satu set transaksi keuangan menunjukkan penipuan atau (2) menilai sentimen konsumen di sekitar suatu produk, berdasarkan input yang dikumpulkan dari media sosial.
Amazon SageMaker adalah layanan yang dikelola sepenuhnya yang memungkinkan pengembang dan ilmuwan data membangun, melatih, dan menggunakan model pembelajaran mesin. Di SageMaker, Anda dapat menggunakan algoritme out-of-the-box atau menjalankan jalur send-your-own untuk solusi yang lebih khusus. Kedua pilihan tersebut valid dan berfungsi sama baiknya sebagai dasar untuk solusi pembelajaran mesin yang sukses.
(Catatan Editor: Anda dapat melihat alternatif lain untuk SageMaker di sini.)
Algoritma out-of-the-box SageMaker termasuk contoh populer, sangat dioptimalkan untuk klasifikasi gambar, pemrosesan bahasa alami, dll. Daftar lengkap dapat ditemukan di sini .
- Keuntungan Out-of-the-Box: Algoritma ini telah dioptimalkan sebelumnya (dan sedang mengalami perbaikan terus-menerus). Anda bisa bangun, berlari, dan digunakan dengan cepat. Plus, penyetelan hyper-parameter otomatis AWS tersedia.
- Pertimbangan Out-of-the-Box: Peningkatan berkelanjutan yang disebutkan di atas mungkin tidak menghasilkan hasil yang dapat diprediksi seolah-olah Anda memiliki kontrol penuh atas implementasi algoritma Anda.
Jika algoritme ini tidak cocok untuk proyek Anda, Anda memiliki tiga pilihan lain: (1) Perpustakaan Apache Spark Amazon, (2) kode Python khusus (yang menggunakan TensorFLow atau Apache MXNet) atau (3) “bawa sendiri” di mana Anda pada dasarnya tidak dibatasi, tetapi perlu membuat gambar Docker untuk melatih dan melayani model Anda (Anda dapat melakukannya dengan menggunakan instruksi di sini ).
Pendekatan bawa-Anda sendiri menawarkan Anda kebebasan penuh. Ini mungkin terbukti menarik bagi para ilmuwan data yang telah membangun perpustakaan kode algoritme khusus dan / atau kepemilikan yang mungkin tidak terwakili dalam rangkaian out-of-the box saat ini.
- Membawa Keuntungan Anda Sendiri: Memungkinkan kontrol penuh atas seluruh pipa ilmu data bersama dengan penggunaan IP eksklusif.
- Bawa Pertimbangan Anda Sendiri: Dockerisasi diperlukan untuk melatih dan melayani model yang dihasilkan. Memasukkan peningkatan algoritmik adalah tanggung jawab Anda.
Terlepas dari pilihan algoritme Anda, SageMaker pada AWS adalah pendekatan yang layak dipertimbangkan, mengingat seberapa banyak fokus telah ditempatkan pada kemudahan penggunaan dari perspektif ilmu data. Jika Anda pernah mencoba untuk bermigrasi proyek pembelajaran mesin dari lingkungan lokal Anda ke yang di-host, Anda akan terkejut melihat betapa mulusnya SageMaker membuatnya. Dan jika Anda mulai dari awal, Anda sudah beberapa langkah lebih dekat ke tujuan Anda, mengingat berapa banyak yang sudah ada di ujung jari Anda.