Speech Synthesis

Speech Synthesis atau sintesis pidato adalah kemampuan sebuah komputer untuk menghasilkan suara yang menyerupai suara manusia. Meskipun mereka tidak bisa meniru spektrum penuh irama manusia dan intonasi. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut synthesizer pidato, dan dapat diimplementasikan dalam perangkat lunak atau hardware. Speech Synthesis adalah termasuk sebuah teks-to-speech (TTS), yaitu sistem mengkonversi teks ke dalam pidato bahasa normal. Kebanyakan perangkat lunak text-to-speech dapat membaca file berbasis teks dengan suara-suara alam dengan menggunakan mesin berbagai suara.

Ada beberapa masalah yang terdapat pada pemaduan suara, yaitu:

  1. User sangat sensitif terhadap variasi dan informasi suara. Oleh sebab itu, mereka tidak dapat memberikan toleransi atas ketidaksempurnaan pemadu suara.
  2. Output dalam bentuk suara tidak dapat diulang atau dicari dengan mudah.
  3. Meningkatkan keberisikan pada lingkungan kantor atau jika menggunakan handphone, maka akan meningkatkan biaya pengeluaran.

Lingkungan dari aplikasi pemadu suara adalah:

  • Bagi tunanetra, pemadu suara menawarkan media komunkasi dimana mereka dapat memiliki akses yang tidak terbatas.
  • Lingkungan dimana visual dan haptic skill user berfokus pada hal lain. Contohnya: sinyal bahaya pada kokpit pesawat udara.

Aplikasi

Pidato sintesis telah lama menjadi alat bantu teknologi vital dan penerapannya sangat signifikan dan luas. Hal ini memungkinkan hambatan lingkungan harus dikeluarkan untuk orang dengan berbagai cacat. Aplikasi terpanjang telah menggunakan pembaca layar untuk orang dengan gangguan penglihatan, tetapi teks-to-speech sistem yang sekarang umum digunakan oleh orang-orang dengan disleksia dan kesulitan membaca lainnya serta anak-anak pra-melek. Mereka juga sering digunakan untuk membantu mereka dengan gangguan berbicara parah biasanya melalui bantuan output komunikasi suara khusus.

Situs seperti Ananova dan YAKiToMe! sintesis suara yang digunakan untuk mengkonversi berita yang ditulis untuk konten audio, yang dapat digunakan untuk aplikasi mobile. Teknik sintesis Pidato digunakan juga dalam produksi hiburan seperti game, anime dan serupa. Pada tahun 2007, Animo Limited mengumumkan pengembangan paket aplikasi perangkat lunak berdasarkan sintesis pidato FineSpeech software-nya, secara eksplisit diarahkan terhadap pelanggan dalam industri hiburan, mampu menghasilkan narasi dan baris dialog sesuai dengan spesifikasi pengguna aplikasi tercapai. Jatuh tempo pada tahun 2008, ketika NEC Biglobe mengumumkan sebuah layanan web yang memungkinkan pengguna untuk membuat frase dari suara Code Geass: Lelouch R2 karakter Pemberontakan.

TTS aplikasi seperti YAKiToMe! dan Speakonia sering digunakan untuk menambahkan suara sintetis untuk video YouTube untuk efek komedi, seperti dalam video Barney Bunch. YAKiToMe! juga digunakan untuk mengkonversi seluruh buku-buku untuk keperluan pribadi Podcasting, RSS feed dan halaman web untuk berita, dan pendidikan teks untuk belajar ditingkatkan. Software seperti Vocaloid dapat menghasilkan menyanyikan suara melalui lirik dan melodi. Ini juga merupakan tujuan dari proyek Komputer Bernyanyi (yang menggunakan GNU LilyPond dan Festival) untuk membantu orang buta periksa input lirik mereka.

Aplikasi speech synthesizer yang paling sederhana sebenarnya ada pada setiap PC ber-OS Windows. Bila anda menekan tuts Winkey + U di keyboard, Windows akan mengaktifkan Utility Manager, yang di dalamnya terdapat aplikasi Microsoft Narrator. Aplikasi ini akan membaca setiap jendela yang anda aktifkan, termasuk tombol-tombol di dalamnya. Atau, mungkin anda pernah menginstal aplikasi microsoft reader di PC. Aplikasi yang diperuntukkan bagi file >LTT ini pun dilengkapi dengan kemampuan menerjemahkan teks menjadi suara (text to speech) yang merupakan contoh teknologi speech sybthesizer.

Daftar Pustaka

http://hidanfirdaus.blogspot.co.id/2010/11/definisi-speech-synthesis.html

http://bintangprasetyo.blogspot.co.id/2014/11/pengertian-speech-synthesis.html

https://freezcha.wordpress.com/2010/11/16/speech-synthesis/

http://achonkattack.blogspot.co.id/2010/11/speech-synthesis.html

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s