
半個(gè)世紀(jì)以來(lái),語(yǔ)言學(xué)家和計(jì)算機(jī)科學(xué)家們?cè)噲D通過(guò)語(yǔ)義學(xué)編程來(lái)實(shí)現(xiàn)計(jì)算機(jī)語(yǔ)言與人類(lèi)語(yǔ)言間的溝通。據(jù)印度報(bào)業(yè)托拉斯(PTI)8月26日?qǐng)?bào)道,有研究人員日前發(fā)明了全新的方法,來(lái)幫助計(jì)算機(jī)更好地識(shí)別人類(lèi)語(yǔ)言。
科學(xué)家發(fā)明新方法 幫助計(jì)算機(jī)識(shí)別人類(lèi)語(yǔ)言(資料圖)
美國(guó)德州大學(xué)奧斯汀分校的語(yǔ)言學(xué)教授 Katrin Erk 正在使用超級(jí)計(jì)算機(jī)聯(lián)合開(kāi)發(fā)有助于計(jì)算機(jī)學(xué)習(xí)人類(lèi)語(yǔ)言的新模式。與傳統(tǒng)的硬編碼人類(lèi)邏輯或者破譯詞典不同的是,Erk采用了全新的方法來(lái)幫助計(jì)算機(jī)識(shí)別人類(lèi)語(yǔ)言:向計(jì)算機(jī)輸入大量反映人類(lèi)知識(shí)的文本,然后通過(guò)詞匯之間的隱式連接建立起一個(gè)映射關(guān)系圖。
該研究在德克薩斯高級(jí)計(jì)算中心進(jìn)行。Erk說(shuō)道:“詞匯的不同含義可以轉(zhuǎn)化為空間中的不同點(diǎn)。在這個(gè)巨大的萬(wàn)維空間中,每一個(gè)點(diǎn)都對(duì)應(yīng)一個(gè)詞的釋義!比欢?jiǎng)?chuàng)建一個(gè)能夠精確區(qū)別詞匯意義的模型需要大量的文本以及在此基礎(chǔ)上進(jìn)行的大量分析。她指出,該研究至少需要1億字的文本集。
利用優(yōu)化的Hadoop子系統(tǒng)開(kāi)發(fā)分布式程序,擴(kuò)大了Erk及其同事的研究范圍。Hadoop是一個(gè)軟件構(gòu)架,適用于各種文本分析,而且可以對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,從而充分發(fā)揮大型計(jì)算機(jī)簇的優(yōu)勢(shì)。
推薦閱讀
太原富士康因產(chǎn)iPhone5S大量招工填補(bǔ)用工缺口
太原富士康項(xiàng)目管理處一名高管向中新社記者證實(shí),該廠生產(chǎn)線已經(jīng)開(kāi)始>>>詳細(xì)閱讀
本文標(biāo)題:科學(xué)家發(fā)明新方法 幫助計(jì)算機(jī)識(shí)別人類(lèi)語(yǔ)言
地址:http://m.sdlzkt.com/a/05/20130828/285272.html