淺談網(wǎng)站優(yōu)化robots.txt文件的寫法

作者:樂購科技 來源: 2012-02-24 09:18:04 閱讀 我要評論 直達商品

  robots.txt文件,相比朋友們都或多或少的聽說過,也可能自己已經(jīng)寫過了。其實到目前為止我本人還沒寫過robots.txt文件,不是不會寫,只是感覺博客中沒什么內(nèi)容需要阻止蜘蛛抓取的。而且想必大家也知道一個個人獨立博客中出現(xiàn)死鏈接的概率應(yīng)該是非常小的,不需要過多的進行死鏈接處理所以我感覺沒什么必要。但是robots.txt文件寫法作為個人站長的必須掌握的技能之一,其用處還是很廣泛的。這里就詳細介紹下,也算是自己溫習(xí)溫習(xí)。

  什么是robots.txt文件

  我們從這個文件名來看,它是.txt后綴名的,大家也應(yīng)該知道這是一個文本文件,也就是記事本。robots,懂點英語的人應(yīng)該都人士,是機器人的意思,對我們而言這個機器人代表的就是搜索引擎機器人,從名字上就可以猜到這個文件是我們專門寫給蜘蛛看的。它的作用就是告訴蜘蛛,那些欄目或者是那些頁面不需要抓取,當然也可以直接屏蔽掉某個蜘蛛的訪問。注意,這個文件是放在網(wǎng)站根目錄下的,這樣才能保證蜘蛛可以在第一時間讀取文件內(nèi)容。

  robots文件的作用

  其實robots文件最常被我們用到的就是屏蔽網(wǎng)站內(nèi)的死鏈接。大家應(yīng)該知道一個網(wǎng)站死鏈接多了會影響網(wǎng)站的權(quán)重。但是網(wǎng)站死鏈接清理雖然說不上是麻煩,還是需要花上不少時間的,特別是如果站內(nèi)死鏈接較多的情況下,清理起來很費勁,這時候robots文件的用處就體現(xiàn)出來了,我們可以直接將這些死鏈接按照格式寫入文件中阻止蜘蛛抓取,想清理的或以后在慢慢清理。有些網(wǎng)站內(nèi)容中包含一些站長不想讓蜘蛛抓取的url或文件,也可以直接屏蔽。對于屏蔽蜘蛛,用到的一般都比較少。

  robots文件的寫法

  這一點應(yīng)該是比較重要的了。如果寫錯了想屏蔽的沒成功,想被抓取的卻寫進去自己不能及時發(fā)現(xiàn)可就虧大了。首先我們要知道兩個標簽,Allow和Disallow,一個是允許,一個是不允許,它的作用相比大家也都能理解。

  User-agent: *

  Disallow:

  或者

  User-agent: *

  Allow:

  這兩段內(nèi)容表示的都是允許抓取所有,實際上屏蔽url和文件用到的是Disallow標簽,除非你的網(wǎng)站只有幾條想要被抓取采用Allow標簽。這個User-agent:后面跟的就是蜘蛛名稱,大家對主流的搜索引擎蜘蛛名稱應(yīng)該比較熟悉。下面以搜搜蜘蛛為例:Sosospider。

  當我們想屏蔽搜搜蜘蛛的時候:

  User-agent: sosospider

  Disallow: /

  大家可以發(fā)現(xiàn)這個屏蔽蜘蛛跟上面允許相比只是多了一個“/”,其含義就起了翻天覆地的變化,所以在書寫的時候要千萬注意,可不能因為多寫個斜杠屏蔽了蜘蛛自己卻不知道。還有就是在user-agent:后邊不屑固定蜘蛛名稱跟的如果是“*”表示是針對所有蜘蛛的。

  禁止某個目錄被搜索引擎蜘蛛抓取,設(shè)置代碼如下:

  User-agent: *

  Disallow: /目錄/

  注意,這里如果是阻止抓取某目錄的話目錄名字一定要注意“/”,不帶“/”表示的是阻止訪問這個目錄頁面和目錄下的頁面,而帶上“/”則表示進阻止目錄下的內(nèi)容頁面,這兩點要分清楚。如果是想屏蔽多個目錄就需要采用

  User-agent: *

  Disallow: /目錄1/

  Disallow: /目錄2/

  這樣的形式,不能采用 /目錄1/目錄2/ 這樣的形式。

  如果是阻止蜘蛛訪問某一類型的文件,例如阻止抓取.jpg格式的圖片可以設(shè)置成:

  User-agent: *

  Disallow: .jpg$

  以上是上海seo小馬針對整個網(wǎng)站的robots文件的寫法,只是講的robots寫法的類型和注意事項,像針對性屏蔽蜘蛛或者是其他的具體寫法描述的少了點,但是知道allow和disallow的含義進行思考可以衍生出不少其他的寫法含義。還有針對具體網(wǎng)頁的robots meta網(wǎng)頁標簽寫法,不過一般情況下用的不是很多。

  以上由上海seo小馬http://www.mjlseo.com/整理,轉(zhuǎn)載請注明,謝謝


  推薦閱讀

  淡定面對網(wǎng)站快照回檔帶來的不利影響(一)

我們在網(wǎng)站優(yōu)化過程中,或多或少都會遇到快照回檔的問題。通常,網(wǎng)站的快照是衡量一個網(wǎng)站權(quán)重高低的標準,但這并不是決定性的因素。影響網(wǎng)站好壞的還有網(wǎng)站收錄量和PR值。人們在尋找友情鏈接的時候通常都是看網(wǎng)站的>>>詳細閱讀


本文標題:淺談網(wǎng)站優(yōu)化robots.txt文件的寫法

地址:http://m.sdlzkt.com/a/34/20120224/33996.html

樂購科技部分新聞及文章轉(zhuǎn)載自互聯(lián)網(wǎng),供讀者交流和學(xué)習(xí),若有涉及作者版權(quán)等問題請及時與我們聯(lián)系,以便更正、刪除或按規(guī)定辦理。感謝所有提供資訊的網(wǎng)站,歡迎各類媒體與樂購科技進行文章共享合作。

網(wǎng)友點評
我的評論: 人參與評論
驗證碼: 匿名回答
網(wǎng)友評論(點擊查看更多條評論)
友情提示: 登錄后發(fā)表評論,可以直接從評論中的用戶名進入您的個人空間,讓更多網(wǎng)友認識您。
自媒體專欄

評論

熱度

主站蜘蛛池模板: 2021国产成人午夜精品| 成人国产激情福利久久精品| 久久成人免费电影| 国产成人av乱码在线观看| 国内一级毛片成人七仙女| 国产精品香蕉成人网在线观看| 最新69国产成人精品视频69| 成人性生交大片免费看| 国产成人精品亚洲| 老司机成人精品视频lsj| 欧美成人在线视频| 成人午夜18免费看| 亚洲国产成人高清在线观看| 国产成人永久免费视频| 亚洲天堂成人网| 成人a视频片在线观看免费| 国产成人免费a在线视频app | 久久亚洲国产成人精品无码区| 欧美成人片在线观看| 亚洲av无码成人网站在线观看| 成人性生交视频免费观看| 久久久久免费看成人影片| 国产成人亚洲精品大帝| 成人嗯啊视频在线观看| 久久久99精品成人片中文字幕 | 成人欧美一区二区三区在线观看 | 国产成人精品免费久久久久| 欧美成人精品第一区首页| 国产v片成人影院在线观看 | 国产成人三级视频在线观看播放| 91成人精品视频| 国产成人无码精品久久二区三区| 成人国产在线24小时播放视频| 中文国产成人精品久久96| 免费看的成人yellow视频| 亚洲色成人网一二三区| 国产精品成人久久久久久久| 国产成人青青热久免费精品| 国产成人愉拍精品| 国产婷婷成人久久av免费高清| 国产成人一区二区三区高清|