本周Google和多倫多大學(xué)公布的一項(xiàng)研究結(jié)果表明,DRAM內(nèi)存模塊的數(shù)據(jù)錯(cuò)誤率要遠(yuǎn)遠(yuǎn)高于人們的預(yù)想,而且更有可能成為系統(tǒng)宕機(jī)和服務(wù)中斷的罪魁禍?zhǔn)?這項(xiàng)研究采用了上百萬(wàn)臺(tái)Google服務(wù)器,結(jié)果表明所有DIMM中有大約8.2%受到了可修正錯(cuò)誤的影響,平均一個(gè)DIMM每年要發(fā)生3700次可修正錯(cuò)誤.
這項(xiàng)報(bào)告指出:“我們首次發(fā)現(xiàn)內(nèi)存錯(cuò)誤普遍存在.所有在用設(shè)備中大約1/3每年至少遇到一次內(nèi)存錯(cuò)誤,平均每年發(fā)生的可修正錯(cuò)誤為22000次.在不同平臺(tái)上得出的數(shù)據(jù)不同,有些平臺(tái)大約有50%的設(shè)備受到可修正錯(cuò)誤的影響,有的僅為12%~27%.”
至少發(fā)生過(guò)一次錯(cuò)誤的Google服務(wù)器每年發(fā)生錯(cuò)誤的平均數(shù)從25到611不等.內(nèi)存錯(cuò)誤可能是由電磁干擾或者硬件故障所導(dǎo)致.
內(nèi)存錯(cuò)誤可分為軟錯(cuò)誤和硬錯(cuò)誤兩種,軟錯(cuò)誤很少損壞字位,但是并不會(huì)避免物理?yè)p壞,這是可修正的;硬錯(cuò)誤會(huì)損壞DRAM中的字位而成為物理缺陷,從而造成數(shù)據(jù)錯(cuò)誤的反復(fù)發(fā)生.
Google和多倫多大學(xué)進(jìn)行的這項(xiàng)研究涉及來(lái)自多家廠商的內(nèi)存已經(jīng)多種類型的內(nèi)存,例如DDR1、DDR2和FB-DIMM.
這項(xiàng)研究覆蓋了Google數(shù)據(jù)中心內(nèi)的絕大多數(shù)服務(wù)器,歷時(shí)兩年半時(shí)間,從2006年1月持續(xù)到2008年6月.
雖然這項(xiàng)研究主要針對(duì)的是服務(wù)器,而且采用最新更高密度DRAM不會(huì)使錯(cuò)誤率提高,但是隨著內(nèi)存芯片的密度越來(lái)越高,PC也最終需要糾錯(cuò)代碼技術(shù).
在特定芯片上的糾錯(cuò)代碼被用于檢測(cè)和糾正數(shù)據(jù)存儲(chǔ)或者數(shù)據(jù)傳輸過(guò)長(zhǎng)中發(fā)生的錯(cuò)誤.
目前,DRAM采用50nm制程技術(shù),并將遷移到40nm上.字位越來(lái)越小,DRAM就越容易發(fā)生軟錯(cuò)誤.
例如,當(dāng)一臺(tái)具有糾錯(cuò)技術(shù)的服務(wù)器在發(fā)生軟錯(cuò)誤之后仍能正常運(yùn)行,而PC就需要重新啟動(dòng).每次處理器嘗試從服務(wù)器卡中的一個(gè)字位進(jìn)行讀取的時(shí)候也需要糾正硬錯(cuò)誤,但是PC中的DRAM因?yàn)闆](méi)有糾錯(cuò)功能而需要被替換掉,否則可能會(huì)導(dǎo)致采用這個(gè)內(nèi)存的系統(tǒng)或者應(yīng)用發(fā)生崩潰.
Handy表示:“研究表明,硬錯(cuò)誤要比軟錯(cuò)誤更加常見.這意味著模塊運(yùn)行在服務(wù)器上,每次遇到發(fā)生硬錯(cuò)誤的字位,它就會(huì)進(jìn)行修正這樣內(nèi)存模塊不需要被替換.如果是PC用戶的話,那么設(shè)備可能就會(huì)中斷運(yùn)行.”如果錯(cuò)誤是可修正的,例如多個(gè)字位超出了糾錯(cuò)代碼可修正范圍的話,服務(wù)器就會(huì)停止運(yùn)轉(zhuǎn).
研究表明,考慮到這其中可能涉及到的系統(tǒng)故障和修復(fù)成本,內(nèi)存錯(cuò)誤的成本其實(shí)是很高的,另外它還可能引發(fā)安全問(wèn)題.
報(bào)告指出:“在運(yùn)行大規(guī)模系統(tǒng)的生產(chǎn)站點(diǎn)中,內(nèi)存模塊更換等級(jí)接近模塊更換等級(jí)的上限,內(nèi)存錯(cuò)誤是導(dǎo)致硬件崩潰的最常見硬件問(wèn)題.另外,最近的研究工作表明內(nèi)存錯(cuò)誤可能導(dǎo)致安全漏洞.”
進(jìn)入論壇>>聲明:IT商業(yè)新聞網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其描述。文章內(nèi)容僅供參考。新聞咨詢:(010)68023640.推薦閱讀
新標(biāo)準(zhǔn)要求MP3廠商對(duì)其播放器進(jìn)行技術(shù)上的調(diào)整,在默認(rèn)情況下以安全的音量播放音樂(lè)。此外,播放器還要具備健康提醒功能,確保以高音量聽音樂(lè)的用戶知道其中的風(fēng)險(xiǎn)。 北京時(shí)間9月29日上午消息,據(jù)國(guó)外媒體報(bào)道,為了保>>>詳細(xì)閱讀
本文標(biāo)題:Google:DRAM錯(cuò)誤率超出人們預(yù)想
地址:http://m.sdlzkt.com/a/xie/20111230/199719.html