據美國科技博客網站ReadWriteWeb報道,谷歌正開發一套新系統,使任何規模的網絡發布者在發布新內容后,都能夠在數秒鐘內將內容自動提交給谷歌搜索索引目錄。
美國搜索引擎技術網站SearchEngineLand主編丹尼·蘇利文(Danny Sullivan)認為,谷歌這項新系統投入使用后,無疑將使該公司“翻開新篇章”。
谷歌PubSubHubbub(以下簡稱“PuSH”)實時同步協議開發主管布雷特·斯拉特金(Brett Slatkin)去年秋季曾表示,他希望谷歌今后能夠使用PuSH協議來為網絡內容建立索引,而放棄各大搜索引擎商多年來使用的網絡爬蟲技術。
谷歌高級產品經理迪倫·凱西(Dylan Casey)周二在美國加州圣克拉拉市舉行的搜索營銷大會(Search Marketing Expo)上表示,谷歌計劃不久后為網站所有者提供相關技術標準,使這些網站能夠參與諸如PuSH之類的技術協議。
工作原理
據悉,PuSH是一種基于ATOM格式的同步系統。內容發布者使用該系統過程中,將對外公布一個Hub,該Hub將負責通知每次新發布的內容。注冊用戶則相當于告訴該Hub:“該內容發布者每次發布新內容時,請立即發送給我。”如此一來,注冊用戶無需再訪問內容發布者的初始網站是否有內容更新,而只需等待來自Hub的通知。換句話說,每次內容發布者發布了新內容,就會自動通知Hub,Hub再將所有內容發送給所有注冊用戶。整個過程僅需數秒鐘時間。
如果谷歌利用PuSH協議來建立網絡內容索引,便可要求所有網站使用該技術,同時要求這些網站報明各自所使用的Hub。然后谷歌再利用這些PuSH所投遞的信息,來隨時查找各網站上每次發布的新內容。這種作法同傳統RSS新聞聚合服務頗為相似。
ReadWriteWeb認為,PuSH協議不大可能完全替代當前使用的爬蟲技術。事實上,要獲取PuSH所投遞的信息,首先需借助爬蟲技術。盡管如此,如果谷歌使用PuSH協議,無疑將使該公司現有索引技術變得更為強大。
SearchEngineLand的蘇利文表示,谷歌今后必須考慮采取一種垃圾信息的控制機制,而不是不加選擇地讓所有信息都收錄于索引當中。他指出,在搜索引擎技術初期開發階段,就曾出現過這種抓取內容過濫現象,從而給各大搜索引擎服務帶來了“大麻煩”。
產品優勢
從運算角度看,PuSH協議的效率更高。谷歌的斯拉特金稱,更為重要的是,如果使用PuSH協議,將給小型網站帶來更為積極的影響。就目前而言,谷歌爬蟲對大量小型網站的抓取頻率僅為每周一次。而使用PuSH協議后,這些小型網站可隨時將新發布內容提交給谷歌。
互聯網內容更豐富、發布更及時、運行效率更高后,無疑將使所有人都受益,而不僅僅限于谷歌一家。PuSH是一種開放協議,雅虎和微軟必應(Bing)也可以訪問。斯拉特金說:“我的技術主管表示,即便是競爭對手,我們也要對這一協議采取開放的推廣方式。”
進入論壇>>聲明:IT商業新聞網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考。新聞咨詢:(010)68023640.推薦閱讀
現在不少正規網吧無論在硬件條件還是軟件條件上都已經達到了很高的標準,特別是在“北上廣”這樣中國比較發達的城市中尤其突出。網吧所涉獵的范圍已經大大超過了其本身字面上的意義。假設取締這些有正規牌照的網吧,>>>詳細閱讀
地址:http://m.sdlzkt.com/a/01/20111231/249873.html