Rumah Pengembangan Apa itu text to speech (tts)? - definisi dari techopedia

Apa itu text to speech (tts)? - definisi dari techopedia

Daftar Isi:

Anonim

Definisi - Apa yang dimaksud dengan Text to Speech (TTS)?

Text to speech (TTS) adalah proses pemodelan bahasa alami yang membutuhkan perubahan satuan teks menjadi satuan suara untuk presentasi audio. Ini adalah kebalikan dari ucapan ke teks, di mana teknologi mengambil kata-kata yang diucapkan dan mencoba untuk merekamnya secara akurat sebagai teks. Text to speech sekarang umum dalam teknologi yang berupaya membuat output audio dari teks digital untuk membantu mereka yang tidak dapat membaca, atau untuk jenis penggunaan lainnya.

Techopedia menjelaskan Text to Speech (TTS)

Mengembangkan kemampuan text-to-speech mencakup beberapa tantangan unik. Khususnya dalam bahasa Inggris, di mana sejumlah besar homonim memiliki pelafalan yang bervariasi, program komputer mengandalkan pemodelan probabilitas untuk menebak pengucapan kata yang diinginkan dalam teks digital. Program ini juga harus mengubah satuan teks menjadi fonem, satuan terkecil pengucapan ucapan. Hasilnya adalah bahwa banyak teknologi text-to-speech kurang sempurna, meskipun pengembang telah membuat kemajuan besar pada teknologi ini selama beberapa tahun.


Seiring waktu, para ahli telah mengamati beberapa praktik terbaik untuk pengembangan TTS. Ini termasuk basis-basis fonem dan pendekatan-pendekatan gabungan dengan analitik prediktif. Program-program terbaik juga dapat bekerja dengan persyaratan memori minimal dan mudah diatur. Pengembang terus bekerja pada sumber daya TTS untuk bahasa apa pun, bekerja melalui tantangan ambiguitas utama dan hambatan lain untuk rendering yang lebih akurat.

Apa itu text to speech (tts)? - definisi dari techopedia