機器翻譯的嶄新方法:將語言變成向量空間

作者:樂購科技 來源: 2013-10-08 19:02:45 閱讀 我要評論 直達商品

機器翻譯(簡稱“機譯”)一直是科技領域的一大難題。目前基于統計機譯方法的在線工具如谷歌翻譯、必應翻譯、臉譜翻譯、寶貝魚翻譯、巴比倫翻譯等,其翻譯結果勉強可用,但離完美還相去甚遠。為提高在線翻譯質量,美國谷歌(Google)公司的三名工程師最近提出一種嶄新的機譯方法:將語言翻譯變成向量空間數學問題,利用數據挖掘技術建模一種語言的結構,然后與另一種語言的結構進行對比,從而擴充和完善現有的雙語語料庫。該研究成果的論文預印本于9月17日在著名網站arXiv.org公開后,引起了學術界的廣泛關注。


機器翻譯示意圖

新的方法依賴于一個概念,即每一種語言都有一套相似的想法,因而使用單詞的方式也存在相似性。例如,大多數語言中都有描述相同動物的單詞,如“狗”、“貓”和“!,這些單詞很可能以相同的方式在句子中使用,如“貓是一種比狗小的動物”。

英語與西班牙語的數字向量空間圖

數字也一樣;上圖顯示了在英語和西班牙語中數字(一至五)的向量表示法以及它們是如何相似的。

語言中單詞之間的關系集合被稱為“語言空間”(language space),可類比為一個點到另一個點的向量集合,能以數學的方式進行處理,例如“國王”減去“男性”加上“女性”等于“女王”(“king”–“man”+“woman”=“queen”)。

在向量空間中,許多語言都有共通之處,可以利用向量空間線性變換將一種語言翻譯成另一種語言。工程師們說,“盡管它很簡單,我們的方法出奇有效;在翻譯英語和西班牙語之間的單詞和短語時,準確率可以達到幾乎90%!

中國數學家和語言學家周海中認為,這種基于線性代數的機譯方法很有新意也有實效。不過,他對不同語系的自然語言(如英語和漢語)在線翻譯是否也有那么高的準確率表示懷疑。他強調:不管用什么方法來提高機譯質量,首先要解決的是自然語言的本身問題,尤其是語義表達和語用功能,而不是計算機編程問題或數學建模問題!霸谌祟惿形疵髁舜竽X是如何進行自然語言的模糊識別和邏輯判斷的情況下,機譯質量要想達到‘信、達、雅’的程度是不可能的。”周海中說。


  推薦閱讀

  微軟辟謠:Xbox One不會窺探用戶隱私

微軟下一代游戲機Xbox src="http://static.cnbetacdn.com/newsimg/20>>>詳細閱讀


本文標題:機器翻譯的嶄新方法:將語言變成向量空間

地址:http://m.sdlzkt.com/a/05/20131008/289775.html

樂購科技部分新聞及文章轉載自互聯網,供讀者交流和學習,若有涉及作者版權等問題請及時與我們聯系,以便更正、刪除或按規定辦理。感謝所有提供資訊的網站,歡迎各類媒體與樂購科技進行文章共享合作。

網友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網友評論(點擊查看更多條評論)
友情提示: 登錄后發表評論,可以直接從評論中的用戶名進入您的個人空間,讓更多網友認識您。
自媒體專欄

評論

熱度

主站蜘蛛池模板: 亚洲国产精品成人久久久| 成人爱做日本视频免费| 国产成人亚综合91精品首页| 国产亚洲综合成人91精品| 精品久久久久成人码免费动漫| 成人免费一区二区三区| 国产成人一区二区三区精品久久 | 国产成人精品综合在线| 伊人色院成人蜜桃视频| 成人午夜视频在线播放| 亚洲免费成人网| 国产成人片无码视频在线观看 | 国产成人无码av在线播放不卡| 97成人碰碰久久人人超级碰OO| 婷婷国产成人精品视频| 7878成人国产在线观看| 亚洲精品成人区在线观看| 成人免费看www网址入口| china成人快色| 久久亚洲国产成人亚| 亚洲国产成人久久一区久久 | 国产成人无码av| 成人毛片手机版免费看| 羞羞漫画在线成人漫画阅读免费| 国产成人av在线免播放观看| 成人中文字幕在线观看| 欧美成人三级一区二区在线观看| 亚洲国产成人久久一区www| 免费成人黄色大片| 四虎精品成人免费影视| 国产成人精品AA毛片| 国产成人无码一区二区三区| 国产精品成人va在线播放| 小明天天看成人免费看 | 亚洲国产成人久久综合区| 亚洲国产成人精品无码区在线秒播| 国产成人精选视频69堂| 国产成人亚洲精品无码车a| 国产成人av一区二区三区在线| 国产成人久久777777| 中文字幕无线码欧美成人|