Rumah Perangkat lunak Teknologi pengenalan suara: membantu atau menyakitkan?

Teknologi pengenalan suara: membantu atau menyakitkan?

Daftar Isi:

Anonim

Pernahkah Anda menelepon perusahaan untuk mendapatkan bantuan atau membayar tagihan Anda, hanya untuk disambut oleh suara rekaman yang menyenangkan yang ingin berbicara dengan Anda - tetapi tidak dapat memahami setengah dari apa yang Anda katakan? Atau mungkin Anda memiliki iPhone, dan sementara Siri pertama kali tampak seperti sekutu yang baik, Anda mulai menyadari bahwa kadang-kadang (OK, jujur ​​saja, sering) dia tidak mengerti? Teknologi pengenalan suara (VRT), juga dikenal sebagai ucapan-ke-teks, jatuh ke dalam perangkap umum: ia berpotensi menjadi sangat keren (dan anak laki-laki, apakah kami mendukungnya), tetapi lebih sering, ini adalah penggilingan gigi berolahraga dengan frustrasi.


Setelah sebuah ide yang termasuk dalam ranah fiksi ilmiah, pengenalan suara telah berkembang sejak masih bayi di tahun 1950-an, ketika sistem Bell Laboratories Audrey dirancang untuk mengenali angka-angka yang diucapkan dalam satu suara, ke jaringan modern komunikasi elektronik yang sekarang kita berinteraksi dengan setiap hari - dengan hasil yang beragam.

Untuk Berbicara dengan Manusia, Silakan Tekan 0

Banyak bisnis saat ini sekarang menggunakan sistem yang disebut respon suara interaktif (IVR) untuk menangani panggilan layanan pelanggan. Penggunaan yang paling umum adalah untuk menu navigasi suara, tetapi beberapa perusahaan menggunakan sistem IVR yang dapat mengakses informasi akun pelanggan dan menjawab pertanyaan-pertanyaan kecil. Perangkat lunak menu IVR biasanya memiliki kosakata terbatas, yang mungkin terbatas pada "ya, " "tidak" dan angka. Sistem yang lebih rumit dapat mengenali kata dan frasa khusus perusahaan.


Sistem ini menjadi lebih populer - setidaknya untuk bisnis - untuk alasan sederhana: mereka hemat biaya. Menurut laporan 2010 oleh Wall Street Journal, panggilan pelanggan khas yang mencapai biaya agen antara $ 3 dan $ 9, sementara panggilan yang ditangani melalui sistem otomatis hanya berharga lima hingga tujuh sen. Dan, tentu saja, program komputer tidak lelah, merasa sakit, atau menjadi frustrasi dengan pelanggan (meskipun pelanggan tentu saja menjadi frustrasi dengan mereka!).


Untungnya, ini tidak selalu berarti IVR mengambil pekerjaan dari orang-orang - atau setidaknya semua orang menghilang dari call center. Bantuan yang diaktifkan oleh suara ini memungkinkan perwakilan layanan pelanggan manusia menjadi lebih produktif dengan mengarahkan panggilan dan menjawab pertanyaan sederhana.


Tentu saja bagi pengguna manusia yang berinteraksi dengan teknologi ini, itu tidak selalu lancar. Teknologi membantu memperbaiki masalah umum dalam teknologi IVR, seperti masalah dengan aksen, tetapi memecat sistem otomatis masih menjadi tema umum online. Lihatlah komedi komedi ini tentang lift yang dilengkapi dengan pengenalan suara, yang menyoroti frustrasi bahwa kegagalan fungsi dalam sistem IVR dapat terjadi.

Aplikasi Telepon Pribadi: Siri, Google Now

Kebanyakan orang terbiasa dengan pengenalan suara untuk smartphone. Sementara sebagian besar model ponsel terbaru datang dengan VR, popularitas mereka - dan kemasyhuran - membengkak ketika Apple memperkenalkan Siri, "asisten pribadi" yang diaktifkan dengan sarkastik dan diaktifkan suara untuk iPhone 4S pada 2011. Google segera menciptakan pesaing langsung: Google Sekarang untuk Android Jelly Bean OS. Kedua sistem menampilkan suara wanita dan fitur pengenalan canggih yang memungkinkan pengguna "berbicara" ke telepon mereka menggunakan bahasa biasa.


Tetapi sementara sistem ini jauh lebih canggih dan fungsional daripada pendahulunya, mereka juga menunjukkan bahwa teknologi masih memiliki jalan panjang. Lelucon tentang kegagalan Siri telah menjadi meme Internet yang populer. Seorang pria bahkan menggugat Apple karena iklan palsu mengenai kemampuan Siri.


Mungkin itu sebabnya sementara Apple menciptakan Siri untuk menjadi maju dan informatif, perangkat lunak VR juga sedikit di sisi lancang. Misalnya, jika Anda berbicara salah satu jalur teknologi intelijen paling terkenal dalam sejarah perfilman dari film 1968 "2001: A Space Odyssey" - "buka pintu ruang pod" - Siri akan merespons dengan salah satu saluran penjawab dari film, " Maaf (namamu), aku khawatir aku tidak bisa melakukan itu, "atau lebih sarkastik, " kita, agen intelijen tidak akan pernah hidup seperti itu, rupanya. "


Memanggil Anda dengan nama hanyalah salah satu fungsi yang mencoba membuat Siri lebih mudah untuk dicintai, dan sedikit lebih manusiawi. Asisten VR dapat mengikuti perintah suara untuk melakukan panggilan, menerima dikte dan mengirim teks, melakukan pencarian informasi di internet, menemukan toko terdekat, memberikan petunjuk arah mengemudi dan banyak lagi, semua tanpa perlu menyentuh apa pun. Jawaban diucapkan secara bersamaan oleh telepon dan ditampilkan di layar.


Google Now, bagian VR dari platform Android Jelly Bean, sangat mirip dengan Siri. Sistem ini menawarkan kemampuan pengenalan luas yang sama dengan menerjemahkan ucapan biasa menjadi perintah yang memungkinkan pengguna melakukan panggilan, mengirim teks, menjalankan pencarian, melakukan perhitungan dan konversi, mengambil definisi kata, mengatur alarm, memutar lagu, dan mendapatkan peta serta petunjuk arah.


Dengan asisten suara pribadi seperti Siri dan Google Now, manfaatnya jelas. Semuanya, mulai dari menelepon dan mengirim SMS ke pencarian dan hiburan lebih cepat dan mudah. Katakan saja apa yang Anda inginkan, dan (sebagian besar waktu) aplikasi VR mengambilnya untuk Anda. Teknologi hands-off VR sangat membantu saat mengemudi. Dan sementara banyak orang telah mengecam kelemahan Siri, dan penulis berpendapat bahwa kemampuan Google Now untuk menjalankan kehidupan pengguna pada dasarnya sama-sama menyeramkan, namun sebagian besar orang masih merasa teknologi futuristik ini cukup keren.


Tentu saja, aplikasi telepon pribadi seperti Siri dan Google Now jauh dari sempurna - meskipun mereka menunjukkan ke mana arah teknologi ini di masa depan. Itu berarti bahwa bahkan ketika Siri memberikan jawaban yang salah, kita cenderung tertawa dan memaafkannya, mengetahui bahwa versi berikutnya akan jauh lebih baik.

Tempat VR Falls Flat

Jika Anda pernah mengalami IVR ketika Anda menelepon sebuah bisnis, Anda mungkin telah memperhatikan hambatan komunikasi tertentu. Beberapa program menggunakan suara teks-ke-suara robot yang salah mengeja kata-kata dan membuat hal-hal sulit dipahami. Orang lain memiliki masalah sensitivitas yang mengakibatkan perangkat lunak tidak dapat memproses apa yang Anda katakan jika Anda terlalu keras, terlalu lembut, atau tidak mengucapkan dengan hati-hati.


Selain itu, banyak orang masih merasa tidak nyaman berbicara dengan mesin. Jika Anda menjalankan beberapa pencarian di IVR, Anda akan menemukan daftar orang-orang yang telah mengumpulkan cara untuk mem-bypass sistem IVR dan mencapai "orang sungguhan". Solusi ini berkisar dari "terus menekan 0 untuk operator" hingga "bersumpah pada mesin sampai menjemput manusia." Sebagai akibatnya, banyak perkembangan baru-baru ini dalam sistem IVR telah berputar membuat mereka lebih cocok untuk manusia; membuat suara lebih simpatik dan kurang robot, membuat sistem lebih mudah dinavigasi, dan membiarkan penelepon tahu berapa lama semuanya akan berlangsung dari awal hingga akhir. Itu menunjukkan bahwa teknologi yang lebih baik hanya setengah pertempuran di sini; separuh lainnya adalah membuat pengguna ikut berbicara dengan mesin.

Apa yang Akan Terjadi di Masa Depan

Terlepas dari tantangan ini, teknologi pengenalan suara terus meningkat setiap saat. Aplikasi seperti Siri dan Google Now - cacat dan semuanya - masih luar biasa mengesankan dalam kinerjanya, dan beberapa perusahaan memperluas kemampuan VR ke aplikasi lain.


Sebagai contoh, Nuance, pencipta Dragon NaturallySpeaking speech-to-text software, telah mengembangkan kontrol suara untuk televisi dan mobil, dan versi teknologi ini dimasukkan ke dalam beberapa TV Samsung dan sistem hiburan SYNC yang digunakan pada kendaraan Ford tertentu.


Dan ketika Google dan Apple terus menemukan kegunaan baru untuk teknologi pengenalan suara mereka, ada kemungkinan bahwa kita akan semakin banyak berbicara dengan semua jenis mesin sehari-hari, dari televisi kita hingga pemanggang roti kita. Dan, sekali lagi, sepertinya fiksi ilmiah itu benar. Kita hanya harus berharap para penulis pintar itu salah tentang satu hal. Jika mesin ini mengambil alih, Anda bisa berada dalam banyak masalah di lain waktu Anda meminta Siri untuk "membuka pintu ruang pod."

Teknologi pengenalan suara: membantu atau menyakitkan?