很多人認為Google已經(jīng)解決了搜索的問題,但是在Google看來搜索的發(fā)展才剛剛起步。如果說搜索是一本書,那Google才剛寫完了開篇。10多年來,Google搜索一直在不斷改進,通過數(shù)據(jù)驅動和實驗評估等科學的方法不斷完善搜索引擎。日前,Google工程總監(jiān)斯科特o霍夫曼(Scott Huffman)介紹了Google算法改進背后的數(shù)字:Google已解決超過45000億次搜索請求;在2011年進行了41931次必要性評估、9250次小規(guī)模試驗、7363項在線實時實驗,最終完成了520多項改進。
當通過Google搜索信息時,用戶并不是在對網(wǎng)頁執(zhí)行操作,而是在Google的網(wǎng)頁索引中進行查找。Google旗下龐大的計算機群統(tǒng)稱“Google機器人”,它由算法控制,抓取、瀏覽網(wǎng)絡中的幾十億網(wǎng)頁,并為其中的每一個詞編寫索引。當用戶輸入搜索請求后,機器便會在索引中搜索匹配網(wǎng)頁,并將關聯(lián)度最高的搜索結果呈現(xiàn)給用戶。
Google致力于在最短的時間內為用戶提供最為相關的搜索結果,這也是其對搜索算法不斷改進的動力。Google對算法的改進通常有三個步驟,首先對每項改進做必要性評估,然后在全球不同地區(qū)進行小規(guī)模實驗,之后隨機挑選用戶進行在線實時實驗。在特定時間,Google針對搜索功能會進行50-200個在線實驗。借助這些精準有序的科學方法,一個好的改進方案從構思到在Google.com上實施操作,最多只需24小時。2011年,Google進行了58000多項實驗,并對搜索系統(tǒng)做出520多處改進。 通過這些實驗,Google可以不斷提升用戶的搜索體驗,諸如: 在搜索結果中剔除垃圾信息;根據(jù)用戶需求改變搜索界面呈現(xiàn)的結果數(shù)量;相同詞在不同地域搜索,呈現(xiàn)的結果不同。
同時,Google搜索算法進行了一系列重大改進,比如:
● 新鮮度算法調整:在某些情況下,Google需要為用戶提供最新搜索結果,比如即時新聞、定期發(fā)生的重大事件以及內容頻繁更新的話題等。如果搜索“奧運會”,用戶會得到與即將舉辦的倫敦奧運會相關的最新搜索結果,而非關于1984年奧運會的陳舊信息。
● 優(yōu)質網(wǎng)站算法調整:它對包含原始信息、研究調查、深度報道、精準分析等內容的高質量網(wǎng)站十分有利,提高了它們在搜索結果中的排名。
● 頁面布局算法調整:這一改進關注用戶在點擊搜索結果后所看到的網(wǎng)頁布局,提升網(wǎng)頁信息的豐富程度 ,提高信息容易被搜索到的網(wǎng)頁的排名。
Google搜索背后的數(shù)字
● Google通常只需0.25秒便可對搜索請求做出回應,而人平均每眨一次眼睛需要0.1秒
● 自2003年到現(xiàn)在,Google搜索已解決4500億個搜索請求
● 用戶每天搜索的
推薦閱讀
iPad新品引入500萬像素iSight攝像頭,加強型的IR濾鏡,支持自動對焦、白平衡功能以及人像識別,;另外f/2.4的大光圈設計可以引入更多的光,這樣我們就可以通過更快的快門來保證圖像質量。 iPad新品采用Retina顯示屏 >>>詳細閱讀
地址:http://m.sdlzkt.com/a/xie/20111230/157775.html