
導語:國外媒體周三發表分析文章稱,除了開發蘋果語音助手Siri外,語音識別軟件開發商Nuance Communications還推出了智能機語音應用Dragon,支持多種語言。由于中國的普通話使用聲調區分發音,這為Dragon的語音識別帶來了難度,雖然不能達到完全準確,但基本上還算不錯。
以下是文章全文:
在期待蘋果今年推出中文版Siri的同時,我決定嘗試一下Nuance的另一款智能機應用Dragon,它支持多種語言,其中就包括中國普通話。
雖然中文版Dragon和其它多數語音識別軟件一樣不能達到百分之百準確,但從基本層面來說,還是非常不錯的。首先,對于語音識別來說,中文極具挑戰性,因為普通話只有400個單音節聲音,根據聲調予以區別。
比如,媽媽的“媽”這個字讀一聲“mā”,讀四聲就成了“罵”(mà),三聲在就成了“馬”(mǎ),所有這些字讀起來都像“ma”,但是聲調不同開發一款能夠識別“媽媽罵馬”(māmā mà mǎ)句子的軟件實在不是一件容易事。
盡管普通話是中國的國語,但是中國還擁有很多種方言和數不盡的地方口音。Nuance下屬Dragon研發副總裁吉姆·吳(Jim Wu)表示:“在中國大陸,每個人都有不同的口音,其中的一項挑戰就是確保系統能夠用于口音較輕的普通話用戶。”
Nuance總部位于美國馬薩諸塞州伯靈頓市,2011財年的營收為14億美元,他們在2011年3月推出了兩款免費中國普通話版Dragon應用,稍晚于Dragon英文版應用。Nuance還在2011年6月推出了廣東話和臺灣話版Dragon應用。 Dragon口述(Dragon Dictation)應用可以轉錄文本、電郵、Facebook或Twitter信息。Dragon搜索(Dragon Search)則用于互聯網搜索,但不像Siri一樣,Dragon無法向用戶進行反饋。
要想使用Dragon,用戶需要點擊“虛擬按鈕”來開始和停止錄音。所有過程都在服務器端處理。Nuance首席營銷官皮特·馬宏(Peter Mahoney)稱,Dragon口述過程將上傳至服務器中,由后者進行傾聽、錄制,然后將文本發回至設備上。
我口述了一些基本語句,比如“最近的星巴克店在哪里”,“我要去市場”等,這些對于Dragon應用來說都沒問題。但是對于大部分用戶來說,真正的樂趣在于測試設備的認知限制,看看它究竟能夠多少匹配人類的語言和想法。
所以我用中國式繞口令來挑戰Dragon的極限,“媽媽騎馬,馬慢,媽媽罵馬”,該句的發音就是“Māmā qí mǎ, mǎ màn, māmā mà mǎ”。Dragon能夠捕捉大部分語音,但并不總是準確。Dragon顯示的結果是“媽媽起碼,媽媽,媽媽嗎嗎”,這里存在的一個基本問題就是無法準確識別“ma”。
盡管還不是完全準確,但馬宏表示,Dragon應用還可以自主學習并提高。由于所有語音處理發生在服務器端,所以Dragon收集用戶語音數據來學習語言,找到合適的組合詞匯。Dragon還可以適應每一位用戶的地方口音,適應的越好,語音識別就越準確。馬宏還表示:“這些錄音將保存下來,這樣我們就可以使用自動化工具來分析結果。有時,你需要讓人使用錄音來看看他們怎樣才能做的更好。”(曉明)
推薦閱讀
新浪科技訊 3月21日下午消息,針對書生公司侵犯著作權的指責,盛大文學(微博)發表聲明稱正在對涉及的作品進行核查。聲明中同時指出,書生公司曾經多次侵犯盛大文學作品的著作權。 北京書生網絡技術有限公司今日發布律>>>詳細閱讀
地址:http://m.sdlzkt.com/a/kandian/20120321/42990.html