Rumah Audio Apa perbedaan antara bicara dengan teks dan chatbots?

Apa perbedaan antara bicara dengan teks dan chatbots?

Anonim

Q:

Apa perbedaan antara bicara dengan teks dan chatbots?

SEBUAH:

Banyaknya perbedaan signifikan antara teknologi bicara-ke-teks dan chatbots adalah bagian dari apa yang sedang dikaji dalam evolusi cepat proyek chatbot dan voicebot.

Teknologi ucapan-ke-teks hanyalah teknologi yang mengubah ucapan verbal menjadi teks pada halaman digital. Itu fungsinya yang lengkap, tetapi bukan yang mudah untuk dirancang. Untuk mengubah ucapan verbal menjadi teks, teknologi harus memecah kata dan kalimat menjadi fonem individual dan bekerja dengannya sesuai dengan algoritma yang kompleks untuk membuat teks yang akurat dan mewakili apa yang dikatakan pembicara.

Chatbots, di sisi lain, adalah teknologi yang mencapai tujuan berkomunikasi dengan manusia. Ada dua jenis obrolan: obrolan teks dan obrolan suara. Chatbot teks telah ada lebih lama, karena mereka tidak memerlukan elemen speech-to-text yang digunakan voicebots.

Perbedaan utama antara teknologi bicara-ke-teks dan chatbots adalah ruang lingkup. Seperti yang disebutkan, semua teknologi bicara-ke-teks yang perlu dilakukan adalah menuliskan pidato verbal. Chatbot, di sisi lain, perlu mengambil pidato dalam bentuk apa pun yang dibuat untuk itu, memahaminya, dan memberikan tanggapan yang berusaha untuk lulus tes Turing - tes apakah suatu teknologi dapat membodohi manusia untuk berpikir bahwa ia adalah manusia. berbicara dengan orang lain.

Dengan mengingat hal itu, chatbots jauh lebih mudah dibuat daripada voicebots. Chatbot mengambil teks manusia dan memberikan respons teks. Bahkan obrolan yang relatif sederhana telah mampu memberikan hasil yang menarik dan menyenangkan bagi manusia sejak akhir 1980-an dan awal 1990-an.

Voicebot, di sisi lain, harus menerima ucapan verbal, mengubahnya menjadi teks, memeriksa keakuratannya, menghasilkan respons, dan membangun respons itu dari bahasa mesin menjadi ucapan yang terdengar. Sejumlah besar tugas yang cukup signifikan ini berarti bahwa voicebot membutuhkan banyak daya komputasi dan banyak desain untuk dibangun.

Proyek seperti Siri, Cortana dan Alexa menunjukkan bagian dari pelopor teknologi voicebot. Mereka juga menggambarkan bahwa teknologi ini masih dalam masa pertumbuhan. Meskipun Alexa dan teknologi lainnya dapat merespons secara lisan terhadap ucapan manusia, mereka tidak terlalu cakap dalam arti bahwa kita bergaul dengan ucapan manusia lisan secara umum. Dengan kata lain, ada sedikit batasan pada tanggapan yang dapat diberikan teknologi ini. Bahkan ada kemampuan terbatas generasi asisten pribadi saat ini untuk benar-benar menghasilkan ucapan ke teks, misalnya, untuk keperluan menyalin email atau membantu seseorang menulis esai tanpa menggunakan tangan mereka. Beberapa program bicara-ke-teks tertentu di pasar melakukan ini lebih baik daripada Siri atau Cortana, mungkin karena alokasi sumber daya. Namun, ada tanda-tanda bahwa kemajuan voicebot akan segera lepas landas - seperti platform Amazon Lex yang memungkinkan lingkungan studio untuk membangun jenis teknologi ini.

Dalam esai yang cerdik dan instruktif tentang masalah ini, Tobias Goebel berbicara tentang perbedaan antara teknologi-teknologi ini, kontras dengan proses "transkrip, " yang dilakukan pidato ke teks, dengan pekerjaan pemahaman, yang seharusnya dilakukan chatbot.

“Sementara menghilangkan kebutuhan akan pengenalan suara memang membuat segalanya lebih mudah untuk chatbot, tantangan utama untuk membangun bot yang berfungsi terletak pada pemahaman bahasa alami, ” tulis Goebel.

Goebel juga mengidentifikasi banyak pemain saat ini di industri:

Pemimpin pasar untuk pengenalan suara adalah Nuance, yang berada di belakang sistem terkenal seperti Dragon NaturallySpeaking untuk dikte pada PC, yang telah ada sejak tahun sembilan puluhan, tetapi juga Siri: tugas pengenalan suara / transkripsi yang dilakukan dalam penggunaan cloud Apple Teknologi nuansa di belakang layar. Lainnya adalah LumenVox, Verbio, atau Interaksi, tetapi pengenalan ucapan sekarang juga ditawarkan sebagai layanan cloud melalui API oleh orang-orang seperti Amazon, Google, Microsoft, dan IBM.

Saat chatbots berkembang, diasumsikan bahwa pemahaman mereka akan terus meningkat pada beberapa lintasan - dan sebagian besar juga diasumsikan bahwa lebih banyak teknologi bot akan beralih dari antarmuka teks ke antarmuka verbal, yang membutuhkan daya komputasi dalam jumlah tambahan.

Apa perbedaan antara bicara dengan teks dan chatbots?