比來擔任一個年夜中型英文網(wǎng)站的第三方seo參謀,因為某些原因,網(wǎng)站某部門的URL需要更改,呈現(xiàn)幾十萬頁面級此外301和404。若何才能統(tǒng)計到新頁面被Google索引了沒?其實可以操作Google打點員工具,就可以統(tǒng)計到這些新頁面被Google索引了若干好多,而且還可以斗勁切確地獲得網(wǎng)站整體在Google里的索引量。
以我的博客為例,直接site我的博客找到486條結(jié)不美觀,而我的博客今朝只有72篇文章,加上分類頁面也相差好幾百。原因是早段時刻改換主機,自己 年夜頭哈健忘上傳robots.txt,導致一些一再內(nèi)容頁面也收錄了,后來才上傳了robots.txt。此刻Google “site:yihuiblog.com”就會呈現(xiàn)如下的收錄,只有網(wǎng)址沒有內(nèi)容(過一段時刻才會刪除)。

網(wǎng)站會呈現(xiàn)良多的問題,造成搜索引擎索引一些站長不想索引的頁面,搜羅常見的一再內(nèi)容頁面、無限輪回頁面(日常平常我們還要盡量找出這些鏈接屏障失蹤和到Google打點員工具里刪除),年夜中型網(wǎng)站就加倍普遍。但這些索引數(shù)據(jù)對seo剖析生發(fā)火用年夜么?不年夜,甚至等于0。
其實可以在Google打點員工具Sitemap模塊里獲得“真實”的收錄數(shù)據(jù),這個“真實”取決于你想讓哪些頁面被Google索引。此刻我想知 道我博客分袂有若干好多文章和分類頁面被索引,首先我建造兩個網(wǎng)站地圖文件,一個包含所有文章地址(URL),一個包含所有分類地址,然后在打點員工具提交 sitemap地址。
Google打點員工具后臺直接提交比robots.txt寫入地圖地址要好,一方面加倍矯捷,一方面可以防止競爭對手獲取站點數(shù)據(jù)進行研究。
因為演示,追求簡單,這里我只建造了文當?shù)貓D文件,主流搜索引擎撐持RSS、Atom、XML和文本等多種名目的地圖文件,Google撐持一個站點地圖文件最多包含 5 萬個網(wǎng)址,壓縮前體積不得跨越 50MB。

上圖顯示Google索引了一灰博客的72個文章頁面和22個分類頁面。按照需求拆分網(wǎng)站地圖文件,可以便利獲得你想要的索引數(shù)據(jù),而且可以提交重疊的網(wǎng)址,例如同時提交網(wǎng)站最新更新產(chǎn)物的網(wǎng)頁地址和某分類下產(chǎn)物的網(wǎng)頁地址(存在重疊網(wǎng)址)。獲得收錄數(shù)據(jù),就可以有針對性地進行優(yōu)化。例如優(yōu)化持久不索引的頁面,等Google蜘蛛下次爬行后進行索引,也可以與同期其他seo數(shù)據(jù)進行融合,獲得更多對seo有輔佐的數(shù)據(jù)。其實Google在site的時辰已經(jīng)明晰Google打點員工具這一功能,只是良多人沒有進一步操作。
操作好Google打點員工具,可以抽離出更多對seo有用的數(shù)據(jù),往后再慢慢切磋。Bing打點員工具也有良多適用的數(shù)據(jù),同樣不要錯過哦。
原文地址:http://yihuiblog.com/a/299.html