記者/張 萱
想像在一些描述未來世界的科幻電影中,人們不再需要自己動手,只要開個金口透過音訊就能夠使電腦執行命令,這樣的光景正一步步地實現當中!
早在2008年Google推出語音搜尋服務(Google Voice Search),用語音取代打字,只要對著電腦或手機講話,就能讓其進行搜尋。這項功能同時能辨識英國、澳洲與印度不同地方的口音。
2009年Google進一步開發世界使用人口最多的中文語音服務,然而中文的技術顯然不如英語成熟,官方承認無法辨識濃厚口音的普通話,但會隨著蒐集更多資料而提昇精準度。一年後Google更將同樣也有廣大使用人口的粵語納入,專門為香港用戶推出廣東話語音搜尋服務。
Google不斷地將旗下的相關服務與語音系統作結合。例如2011年初Google推出英語與西班牙語的即時語音翻譯功能,而在下半年更將翻譯語言擴增至包含中文、日語、韓語等14種語言。
Apple於2011年開賣的iPhone 4S,其語音助手Siri更將語音功能推向一個前所未有的熱潮。 該系統目前只聽的懂英、法、德語,而地圖天氣等也只支援美國本地。更有趣的是這位Siri小姐除了提供資訊還會回答問題,只是有些莫名其妙的問題她可能不會如實回答就是了。
語音辨識系統的迷人讓不想等待的蘋果迷自行開創相關App或系統,例如有套名為 Dragon Dictation 的免費 App,無論是普通話或粵語都能辨識。有台灣的達人開創中文版Siri,將Siri的功能中文化,在官方發佈前一解蘋果迷的饞。
Android系統的使用者不想讓Apple專美於前,Dexetra.com開發了名叫「Iris」的Android語音系統,它會搜尋維基百科的內容來回答專業知識,也會學Siri回答使用者的問題。
而未被Siri納入第一波服務範圍的日本,由於先天英語能力較差,在使用Siri時雞同鴨講的情況層出不窮。科技工業發達的日本等不及了,搶在Apple前由日本三大電信之一的NTT DoCoMo推出Shabette Concier語音服務。這項服務支援Android手機,以雲端科技為用戶提供維基百科的資料以及生活服務諸如餐廳、地圖查詢等等。由於DoCoMo是日本在地的業者,想必比起Google或Apple更能掌握日本人的需求。
即使語音系統截至今日仍未臻成熟,撇開中文等後期開發的語言不說,英語若不是由native speaker發音亦可能讓Siri霧煞煞。但要讓科幻電影場面重現日常生活中的日子相信不遠矣。