幫助聽力損傷患者深入其境 YouTube自動字幕再進化

記者/陳俊宇

美國知名影片分享網站YouTube,23日在官方網站宣布了一項創新功能。在未來,影片當中自動字幕功能也能夠顯示情緒性和聲音效果的字詞。更明確來說,舉凡像是「音樂」、「拍手」、「笑聲」等效果,未來都能夠以字幕來呈現,而最大的受惠者莫過於是全球3.6億的聽力損傷患者。

一直以來,Youtube其實都有提供使用者自動字幕的功能,不過也僅止於轉換口語的部分,較細微的聲音是沒辦法捕捉到的。因此對於少部分聽力損傷的使用者,並不能真實感受到影片中的情緒字詞或是聲音效果。不過,歸功於Google近年來在機器學習領域的技術成果,使得YouTube有能力針對這一些較弱的音訊進行研究,自動字幕功能上才能有創新性的突破。

 

■ 點擊右下角自動字幕即能體驗YouTube的新功能。(影片來源自/YouTube)

另外,YouTube工程開發人員在其部落格文章也表示,觀看視頻過程中,有更多的享受是來自於音效並不只是言語而已,這些音效也為視頻體驗增添了色彩。而且,若我們站在聽力損傷患者的立場,想像在觀看影片時聽不到音樂、笑聲,抑或是人群的咆哮聲時,或許就會深刻體會到,這項功能的問世是切身相關的。

■ YouTube新功能讓聽力損傷患者也能感受影片的情境。(截圖自/YouTube)

不過,部落格文章也提到了一點,當自動字幕功能遇到一些錯誤時,僅有50%的用戶會提出反饋,因為那些可以聽到聲音的使用者較容易忽略字幕的錯誤。而若是聽力損傷的使用者,則會將錯誤解釋為存在的聲音,以為他們沒有錯過關鍵的訊息,使得開發人員無法準確、即時地蒐集使用者的意見。若未來能夠以相關的資訊技術來克服,相信YouTube還能做到更好。

最後,若對於YouTube自動音效字幕系統的相關技術有興趣的讀者,您可以在Google Research Blog了解到更多。

分享此新聞: