「會聽話」的機器,是人類科技發展以來的長久夢想,光是從李麥克與霹靂車深植人心的鮮明形象,就可以看出人類多想用說的與機器溝通。聲控或語音辨識技術最早可以追溯至1920年代,比電腦的發展還早。在21世紀以前,我們已經有拍手就可以開啟和關閉的檯燈、糾正發音的語言訓練系統、取代鍵盤的語音聽寫軟體、電話語音撥號技術等等。進入21世紀後,語音辨識系統也講究起「智慧」來了,不管你是台灣國語還是大舌頭,只要多聽幾次,機器也會記得你個人的發音特徵,下次你再下指令的時候,機器就可以使命必達。聲控技術目前最新的發展趨勢是語音辨識結合人工智慧,發展出可以與使用者自然對話的應用軟體,像是Nuance的Dragon和Apple的Siri,這些軟體可以從對話內容理解指令然後予以執行,簡直就跟真人一樣,難怪2011年iPhone 4S推出Siri語音助理時,會引起市場如此大的轟動。
圖片來源:apple.com
我們分析語音辨識及語音操控的專利主要是由哪些公司申請的資訊時發現,這些公司的產業分佈相當多元,以電腦、手機設計等高科技業最多(IBM, Microsoft, Siemens),家電產業也不少(Koninkl Philips, Samsung, Sony),幾家汽車大廠也堂堂入列(Volkswagen, Honda)。說話是最自然最方便的人際溝通方式,看來各大產業都很有興趣將說話變成最直覺的人機溝通方式。