Khamis, 17 April 2014

Text to Speech (TTS) dan Speech to Text (STT)

Sistem Text to Speech (TTS) merupakan suatu sistem yang dapat melakukan konversi dari teks menjadi ucapan. Saat ini terdapat berbagai sistem yang dapat melakukan fungsi seperti itu, misalkan dengan menggunakan teknologi Diphone. Pembentukan ucapan pada pensintesa ucapan menggunakan metoda diphone concatenation pada prinsipnya dilakukan dengan cara menyusun sejumlah diphone yang bersesuaian sehingga diperoleh ucapan yang diinginkan. Sebagai contoh, pada gambar diperlihatkan pembentukan kata atau ucapan "komputer" yang disusun dari diphone-diphone /_k/, /ko/, /om/ dan seterusnya.
Sistem pensintesa ucapan memiliki dua buah subsistem :

  • Subsistem konverter teks ke fonem 
Subsistem konverter teks ke fonem berfungsi untuk mengolah kalimat masukan dalam suatu bahasa tertentu yang terbentuk teks menjadi urutan kode-kode bunyi yang direpresentasikan dengan kode fonem, durasi serta nadanya. Kode-kode fonem adalah kode yang merepresentasikan unit bunyi yang ingin diucapkan.
  • Subsistem konverter fonem ke ucapan
Bagian konverter fonem ke ucapan akan menerima masukan kode-kode fonem serta pitch dan durasi yang telah dihasilkan oleh bagian sebelumnya. Berdasarkan kode-kode tersebut bagian ini akan menghasilkan bunyi atau sinyal ucapan yang sesuai dengan kalimat yang ingin diucapkan.


 Sesuai dengan artikel yang saya baca, artikel ini berbicara tentang seorang mahasiswa yang telah membuat aplikasi berbasis Text to Speech yang digunakan untuk membantu para tuna netra membaca tulisan yang ada di dalam komputer. Aplikasi ini juga menggunakan teknologi Diphone, dengan menggunakan komputer dan speaker sebagai output nya, aplikasi ini dirancang agar dapat membacakan tulisan untuk tuna netra. Sehingga tuna netra cukup hanya mendengarkan pembacaan kata-kata yang dilakukan oleh aplikasi tanpa perlu meraba-raba lagi tiap huruf.





Sumber :
http://apindonesia.com/new/index.php?option=com_content&task=view&id=2105

Tiada ulasan:

Catat Ulasan