淺談網(wǎng)站優(yōu)化robots.txt文件的寫法

作者:樂購科技 來源: 2012-02-24 09:18:04 閱讀 我要評論 直達商品

  robots.txt文件,相比朋友們都或多或少的聽說過,也可能自己已經(jīng)寫過了。其實到目前為止我本人還沒寫過robots.txt文件,不是不會寫,只是感覺博客中沒什么內(nèi)容需要阻止蜘蛛抓取的。而且想必大家也知道一個個人獨立博客中出現(xiàn)死鏈接的概率應該是非常小的,不需要過多的進行死鏈接處理所以我感覺沒什么必要。但是robots.txt文件寫法作為個人站長的必須掌握的技能之一,其用處還是很廣泛的。這里就詳細介紹下,也算是自己溫習溫習。

  什么是robots.txt文件

  我們從這個文件名來看,它是.txt后綴名的,大家也應該知道這是一個文本文件,也就是記事本。robots,懂點英語的人應該都人士,是機器人的意思,對我們而言這個機器人代表的就是搜索引擎機器人,從名字上就可以猜到這個文件是我們專門寫給蜘蛛看的。它的作用就是告訴蜘蛛,那些欄目或者是那些頁面不需要抓取,當然也可以直接屏蔽掉某個蜘蛛的訪問。注意,這個文件是放在網(wǎng)站根目錄下的,這樣才能保證蜘蛛可以在第一時間讀取文件內(nèi)容。

  robots文件的作用

  其實robots文件最常被我們用到的就是屏蔽網(wǎng)站內(nèi)的死鏈接。大家應該知道一個網(wǎng)站死鏈接多了會影響網(wǎng)站的權重。但是網(wǎng)站死鏈接清理雖然說不上是麻煩,還是需要花上不少時間的,特別是如果站內(nèi)死鏈接較多的情況下,清理起來很費勁,這時候robots文件的用處就體現(xiàn)出來了,我們可以直接將這些死鏈接按照格式寫入文件中阻止蜘蛛抓取,想清理的或以后在慢慢清理。有些網(wǎng)站內(nèi)容中包含一些站長不想讓蜘蛛抓取的url或文件,也可以直接屏蔽。對于屏蔽蜘蛛,用到的一般都比較少。

  robots文件的寫法

  這一點應該是比較重要的了。如果寫錯了想屏蔽的沒成功,想被抓取的卻寫進去自己不能及時發(fā)現(xiàn)可就虧大了。首先我們要知道兩個標簽,Allow和Disallow,一個是允許,一個是不允許,它的作用相比大家也都能理解。

  User-agent: *

  Disallow:

  或者

  User-agent: *

  Allow:

  這兩段內(nèi)容表示的都是允許抓取所有,實際上屏蔽url和文件用到的是Disallow標簽,除非你的網(wǎng)站只有幾條想要被抓取采用Allow標簽。這個User-agent:后面跟的就是蜘蛛名稱,大家對主流的搜索引擎蜘蛛名稱應該比較熟悉。下面以搜搜蜘蛛為例:Sosospider。

  當我們想屏蔽搜搜蜘蛛的時候:

  User-agent: sosospider

  Disallow: /

  大家可以發(fā)現(xiàn)這個屏蔽蜘蛛跟上面允許相比只是多了一個“/”,其含義就起了翻天覆地的變化,所以在書寫的時候要千萬注意,可不能因為多寫個斜杠屏蔽了蜘蛛自己卻不知道。還有就是在user-agent:后邊不屑固定蜘蛛名稱跟的如果是“*”表示是針對所有蜘蛛的。

  禁止某個目錄被搜索引擎蜘蛛抓取,設置代碼如下:

  User-agent: *

  Disallow: /目錄/

  注意,這里如果是阻止抓取某目錄的話目錄名字一定要注意“/”,不帶“/”表示的是阻止訪問這個目錄頁面和目錄下的頁面,而帶上“/”則表示進阻止目錄下的內(nèi)容頁面,這兩點要分清楚。如果是想屏蔽多個目錄就需要采用

  User-agent: *

  Disallow: /目錄1/

  Disallow: /目錄2/

  這樣的形式,不能采用 /目錄1/目錄2/ 這樣的形式。

  如果是阻止蜘蛛訪問某一類型的文件,例如阻止抓取.jpg格式的圖片可以設置成:

  User-agent: *

  Disallow: .jpg$

  以上是上海seo小馬針對整個網(wǎng)站的robots文件的寫法,只是講的robots寫法的類型和注意事項,像針對性屏蔽蜘蛛或者是其他的具體寫法描述的少了點,但是知道allow和disallow的含義進行思考可以衍生出不少其他的寫法含義。還有針對具體網(wǎng)頁的robots meta網(wǎng)頁標簽寫法,不過一般情況下用的不是很多。

  以上由上海seo小馬http://www.mjlseo.com/整理,轉(zhuǎn)載請注明,謝謝


  推薦閱讀

  淡定面對網(wǎng)站快照回檔帶來的不利影響(一)

我們在網(wǎng)站優(yōu)化過程中,或多或少都會遇到快照回檔的問題。通常,網(wǎng)站的快照是衡量一個網(wǎng)站權重高低的標準,但這并不是決定性的因素。影響網(wǎng)站好壞的還有網(wǎng)站收錄量和PR值。人們在尋找友情鏈接的時候通常都是看網(wǎng)站的>>>詳細閱讀


本文標題:淺談網(wǎng)站優(yōu)化robots.txt文件的寫法

地址:http://m.sdlzkt.com/a/34/20120224/33996.html

樂購科技部分新聞及文章轉(zhuǎn)載自互聯(lián)網(wǎng),供讀者交流和學習,若有涉及作者版權等問題請及時與我們聯(lián)系,以便更正、刪除或按規(guī)定辦理。感謝所有提供資訊的網(wǎng)站,歡迎各類媒體與樂購科技進行文章共享合作。

網(wǎng)友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網(wǎng)友評論(點擊查看更多條評論)
友情提示: 登錄后發(fā)表評論,可以直接從評論中的用戶名進入您的個人空間,讓更多網(wǎng)友認識您。
自媒體專欄

評論

熱度

主站蜘蛛池模板: 国产成人精品午夜视频'| 最新国产成人ab网站| 青青青国产成人久久111网站| 亚洲国产成人久久综合一区| 亚洲精品天堂成人片AV在线播放| 亚洲欧美一区二区成人片| 韩国免费一级成人毛片| 国产精品成人va在线观看入口| 亚洲精品国产成人| 成人免费福利视频| 国产成人av在线影院| 欧美成人看片一区二区三区| 四虎成人免费观看在线网址| 成人午夜精品久久久久久久小说| 四虎高清成人永久免费影院| 成人精品一区二区三区中文字幕 | 欧美成人片一区二区三区| 国产成人高清精品免费鸭子| 欧美成人秋霞久久AA片| 四虎成人精品在永久免费| 91成人午夜在线精品| 亚洲国产精品成人久久| 国产成人综合久久| 成人久久精品一区二区三区| 欧美成人午夜视频在线观看| 国产成人a人亚洲精品无码| 成人中文字幕一区二区三区 | 国产成人亚洲综合欧美一部| 成人理论电影在线观看| 欧美成人久久久| 欧美激情一区二区三区成人| 久久久成人影院| 青春草国产成人精品久久| 亚洲AV成人无码网站| 亚洲国产成人久久综合一区| 亚洲欧美成人综合久久久| 免费在线观看成人| a级成人毛片免费图片| 777精品成人影院| 成人网在线免费观看| 在线观看欧洲成人免费视频|