Speech recognition adalah proses identifikasi yang dilakukan komputer untuk mengenali kata yang diucapkan oleh seseorang tanpa mempedulikan identitas orang terkait dengan melakukan konversi sebuah sinyal akustik, yang ditangkap oleh audio device (perangkat input suara). Pola kerja Pengenalan Ujaran (speech recognition) adalah mencocokkan sinyal akustik yang diterima dengan data yang tersimpan dalam template ataupun database. Proses pencocokan memiliki dua model utama yaitu Model Akustik yang terdiri dari fonem yang memiliki nilai tertentu yang diambil dari sinyal akustik dan Model Bahasa berupa metode yang mengestimasikan satu kata diikuti oleh serangkaian kata lainnya.
Speech Recognition juga merupakan sistem yang digunakan untuk mengenali perintah kata dari suara manusia dan kemudian diterjemahkan menjadi suatu data yang dimengerti oleh komputer. Algoritma yang akan diimplementasikan pada bahasan mengenai proses speech recognition ini adalah algoritma FFT (Fast Fourier Transform), yaitu algoritma yang cukup efisien dalam pemrosesan sinyal digital (dalam hal ini suara) dalam bentuk diskrit. Algoritma ini mengimplementasikan algoritma Divide and Conquer untuk pemrosesannya. Konsep utama algoritma ini adalah mengubah sinyal suara yang berbasis waktu menjadi berbasis frekuensi.
Penerapan Teknologi speech recognation yang akan dibahas adalah penggunaannya dibidang Kesehatan.
Alat pengenal ucapan (speech recognation) banyak digunakan dalam bidang kesehatan untuk
membantu para penyandang cacat dalam beraktivitas. Contohnya pada
aplikasi Antarmuka Suara Pengguna atau Voice User Interface (VUI) yang
menggunakan teknologi pengenal ucapan dimana pengendalian saklar lampu
misalnya, tidak perlu dilakukan secara manual dengan menggerakkan saklar
tetapi cukup dengan mengeluarkan perintah dalam bentuk ucapan sebagai
saklarnya. Metode ini membantu manusia yang secara fisik tidak dapat
menggerakkan saklar karena cacat pada tangan misalnya. Penerapan VUI ini
tidak hanya untuk lampu saja tapi bisa juga untuk aplikasi-aplikasi
kontrol yang lain.
Contoh penggunaan lain speech recognition adalah Perawatan kesehatan.
Dalam perawatan kesehatan domain, bahkan di bangun meningkatkan
teknologi pengenalan suara, transcriptionists medis (MTs) belum menjadi
usang. Layanan yang diberikan dapat didistribusikan daripada
diganti. Pengenalan pembicaraan dapat diimplementasikan di front-end
atau back-end dari proses dokumentasi medis. Front-End SR adalah salah
satu alat untuk mengidentifikasi kata-kata yang ucapkan dan ditampilkan
tepat setelah mereka berbicara Back-End SR atau SR tangguhan adalah di
mana penyedia menentukan menjadi sebuah sistem dikte digital, dan suara
yang diarahkan melalui pidato-mesin pengakuan dan draft dokumen diakui
dirutekan bersama dengan file suara yang asli ke MT / editor, yang
mengedit draft dan memfinalisasi laporan. Ditangguhkan SR sedang banyak
digunakan dalam industri saat ini.
sumber :
1. http://tatararadunk.blogspot.com/2012/10/speech-recognition.html
2. http://faiq-fst09.web.unair.ac.id/artikel_detail-.html
2. http://faiq-fst09.web.unair.ac.id/artikel_detail-.html