<b>搜索引擎的HITS算法原理分析</b>

作者:caiji 來源:未知 2013-04-22 23:14:28 閱讀 我要評論 直達商品

  3、 HITS算法對網(wǎng)頁集結(jié)的拓展也會導(dǎo)致新的問題呈現(xiàn),因為是對搜索結(jié)不美觀進行再次生成,所以在對換集進行擴展的時辰不成避免的要增添良多頁面,有時這些頁面是和搜索結(jié)不美觀中網(wǎng)頁有著些許的關(guān)系,只不外是被集結(jié)中的網(wǎng)頁引用了,所以一旦搜索結(jié)不美觀中存在年夜量的這樣網(wǎng)頁的話,那么經(jīng)由過程HITS算法的來的結(jié)不美觀就會使得我們基于主題的發(fā)芽變寬泛了,也就是說我們可能得不到切確的搜索結(jié)不美觀了。

  1、 T中都是和集結(jié)中網(wǎng)頁相關(guān)的頁面

  首先,我們知道HITS算法是基于主題發(fā)芽的搜索引擎算法,所以當(dāng)用戶向搜索引擎提交主題發(fā)芽時,搜索引擎按照用戶的檢索詞進行關(guān)頭詞匹配發(fā)芽,同時返回若干項與主題高度相關(guān)的網(wǎng)頁集結(jié)S,在這些相關(guān)性的網(wǎng)頁集結(jié)中,網(wǎng)頁之間會有年夜量和網(wǎng)頁相關(guān)的鏈接,所以此時搜索引擎算法HITS算法就按照網(wǎng)頁上鏈接的特點將網(wǎng)頁集結(jié)S進行拓展,即將集結(jié)網(wǎng)頁上的鏈接,網(wǎng)頁引用的鏈接,和被其他頁面的引用的鏈接都插手到該集結(jié)中,形成一個新的集結(jié)T,同時我們對換集T的要求是:

  剖析鏈接是常見的搜索引擎剖析網(wǎng)頁結(jié)構(gòu)的一種體例,一般是搜索引擎按攝影關(guān)的鏈接剖析算法,然后對與網(wǎng)頁相關(guān)的外鏈和內(nèi)鏈進行具體的數(shù)據(jù)清算和剖析,而且按照這些鏈接的特點,再對網(wǎng)頁進行一個評分和排序,當(dāng)就用戶搜索某個關(guān)頭辭書時辰,搜索引擎就會對與該關(guān)頭詞相關(guān)主題的網(wǎng)頁中的這些鏈接進行一個合理剖析,然后排序,最后就獲得了排名的結(jié)構(gòu),在本文中,筆者要跟凱旅談判的主題是HITS,而HITS算法是鏈接剖析算法中斗勁有代表性的一種。

  2、 T中的集結(jié)頁面都要于主題高度相關(guān)

  3、 T中要包含年夜量的HUB頁面和Authority頁面

I 操作: 搜索引擎算法hits算法淺析(1) O操作:hits算法剖析(2)

 

  在體味了HITS算法的焦點思惟之后,我們需要體味的就是若何按照該算法所給出的思惟進行計較網(wǎng)頁集結(jié)中的網(wǎng)頁的權(quán)重來對搜索結(jié)不美觀進行排序,那么下面筆者經(jīng)由過程http://www.gscpp.net這個網(wǎng)站的操作體例對HITS算法進行進一步的剖解:我們可以將拓展出來的網(wǎng)頁集結(jié)T看做一個集結(jié)矩陣,同時將中的所有HUB網(wǎng)頁看做為極點集A,將集結(jié)中包含的所有權(quán)威型的網(wǎng)頁看做是極點集B,其中A中的網(wǎng)頁到B中的網(wǎng)頁的超鏈接為邊集E,形成一個二分有向圖SG=(A,B,E)。對HUB集結(jié)A中的任一個極點a,用h(a)暗示網(wǎng)頁a的Hub值,對B中的極點b,用a(b)暗示網(wǎng)頁的Authority值。起頭時h(a)=a(b)=1,對b執(zhí)行I操作改削它的a(b),對a執(zhí)行O操作改削它的h(a),然后規(guī)范化a(b),h(a),如斯不竭的一再計較下面的操作I,O,直到a(b),h(a)收斂。(證實此算神通斂可見 )

  剖析:年夜以上算法思惟中我們可以切磋出良多問題,

  HITS算法在應(yīng)用中,一般都是操作HUB頁(網(wǎng)頁中良多鏈接,而且都是指向權(quán)威的頁面,一般都是導(dǎo)航或者目錄網(wǎng)頁)和Authority(就是被年夜量鏈接指向的網(wǎng)頁,也就是權(quán)威型的網(wǎng)頁)頁面之間指向鏈接的互相增強關(guān)系來對網(wǎng)頁給以分值計較,也就是說該算法的實施過程中是將搜索引擎年夜互聯(lián)網(wǎng)上抓去到全數(shù)網(wǎng)頁分為HUB頁面和Authority頁面,在搜索引擎看來,好的Hub網(wǎng)頁應(yīng)該是指向良多的權(quán)威型的網(wǎng)頁,而權(quán)威值高的網(wǎng)頁應(yīng)該是擁有良多指向Hub網(wǎng)頁的鏈接,所以我們由此而得出了HITS算法的焦點思惟:

  1、 好比如不美觀用戶向搜索引擎提交發(fā)芽主題之后,搜索引擎要想為用戶供給精準(zhǔn)的搜索結(jié)不美觀時就必需對搜索結(jié)不美觀進行拓展,而巨匠單的搜索結(jié)不美觀進行豐碩拓展時需要年夜量的時刻去剖析,延遲了用戶請求的響應(yīng)時刻,所以對搜索引擎來說不能在最短的時刻內(nèi)為用戶供給搜索結(jié)不美觀就證實該算法是失蹤敗的、不科學(xué)的。

  2、 一個網(wǎng)頁中包含了良多鏈接,好比導(dǎo)航鏈接、廣告鏈接、以及軌范自動生成的鏈接,而這些鏈接的存在勢必會對搜索結(jié)不美觀發(fā)生影響,在HITS算法中將搜索結(jié)不美觀中呈現(xiàn)的網(wǎng)頁鏈接都進行了剖析,所以在搜索結(jié)不美觀中可能會呈現(xiàn)這些無效鏈接引用的網(wǎng)頁。

  4、 HITS算法是基于主題發(fā)芽的,也就是說返回的結(jié)不美觀是按照關(guān)頭詞完全匹配的,注重的是與主題高度相關(guān)的主社區(qū),而對于那些有著不太相關(guān)的鏈接是很少能夠顧及到的,所以很輕易在搜索結(jié)不美觀中導(dǎo)致主題漂移問題,然而這個問題該算法且則也無法解決,這點事最年夜的不足。文章來自廣州網(wǎng)站培植,網(wǎng)站培植流程:http://www.gscpp.net/site/2.html轉(zhuǎn)載必需保留鏈接!


  推薦閱讀

  <b>優(yōu)化如何有效的提升網(wǎng)站粘度的三大技巧詳解</b>

第一,尋找精準(zhǔn)的方針人群也就是方針客戶 。這一點很是了然,也很是輕易理解,我的網(wǎng)站目的是什么,想要獲得哪些客戶的信賴和撐持,想吸引哪些高質(zhì)量的訪客都是我們要思考和考慮的問題,一般對于人群定向方面筆者建議>>>詳細閱讀


本文標(biāo)題:<b>搜索引擎的HITS算法原理分析</b>

地址:http://m.sdlzkt.com/a/34/20130422/266534.html

頂一下

樂購科技部分新聞及文章轉(zhuǎn)載自互聯(lián)網(wǎng),供讀者交流和學(xué)習(xí),若有涉及作者版權(quán)等問題請及時與我們聯(lián)系,以便更正、刪除或按規(guī)定辦理。感謝所有提供資訊的網(wǎng)站,歡迎各類媒體與樂購科技進行文章共享合作。

網(wǎng)友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網(wǎng)友評論(點擊查看更多條評論)
友情提示: 登錄后發(fā)表評論,可以直接從評論中的用戶名進入您的個人空間,讓更多網(wǎng)友認(rèn)識您。
自媒體專欄

評論

熱度

主站蜘蛛池模板: 麻豆国产成人AV在线| 欧美成人免费网站| 亚洲国产成人久久99精品| 伊人久久大香线蕉AV成人| 午夜成人免费视频| 亚洲av成人无码久久精品老人| 亚洲人成人一区二区三区| 69国产成人精品午夜福中文| 欧美成人一区二区三区在线电影| 欧美成人鲁丝片在线观看| 国产成人精品免费视频大全可播放的| 国产成人AV三级在线观看按摩| 青青草成人免费| 国产成人片无码视频在线观看| 69国产成人精品视频软件| 国产成人污污网站在线观看| 欧美成人在线视频| 国产成人无码一区二区三区在线 | 成人H动漫精品一区二区| 免费国产成人午夜私人影视| 成人国产精品999视频| 久久亚洲AV成人无码| 国产成人久久91网站下载| 欧美成人性动漫在线观看| 四虎亚洲国产成人久久精品 | 亚洲精品无码乱码成人| 成人午夜视频精品一区| 欧美成人看片黄a免费看| 亚洲成人在线免费观看| 人碰人碰人成人免费视频| 国产成人无码aa精品一区| 影音先锋成人资源| 成人乱码一区二区三区AV| 色综合天天综合网国产成人网| 亚洲国产成人久久综合碰| 国产成人av免费观看| 国产成人av三级在线观看| 国产成人无码一区二区三区| 成人免费一区二区三区| 成人免费播放视频777777| 国外成人免费高清激情视频|