网址日志是做SEO时系统管理员和百度搜索引擎会话沟通交流的方式。根据日志,掌握百度搜索引擎搜索引擎蜘蛛的浏览状况。在许多 時间,大家必须查询网址日志。以得到 掌握百度搜索引擎怎样抓取我们的网址。
怎么下载日志
根据FTP浏览网址的网站根目录。能够见到一个包括log的文件夹名称,它是储放日志的地区。
怎么查看日志
免费下载、缓解压力、开启日志文件,日志文件內容如:
61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度搜索,这些为文中加上)
203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)
202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:yahoo)
65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)
日志文件样版全篇免费下载:
https://www.yunsites.com/
怎样剖析日志
搜索引擎蜘蛛名字:百度搜索->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider。在日志文件里,检索之上搜索引擎蜘蛛名字。就可以见到搜索引擎蜘蛛爬取的印痕。
大家剖析的关键点是,HTTP状态码,如之上的200和301。
" 200 5162 " 意味着一切正常爬取,此次爬取了516两个字节数。
不一样的网络服务器或云虚拟主机设定的日志纪录內容不一样。
有的如:200 0 33834 237 953 大家根据多看看几个纪录,观查规律性,能够分辨第三个数字意思字节。
有的如:200 0 0或200 0 64 它是沒有纪录爬取字节。留意:200 0 0和200 0 64 没代表什么意思难题。说白了200 0 64意味着要被K的观点沒有依据,一般的网址都是有64编码。
在日志里,发觉比较多的HTTP状态码是,200(一切正常)、304(没转变)、404(不正确连接)。
304意味着,自打之前爬取后,该內容沒有升级。一般状况下,网址的照片常常会回到该值。
404意味着,浏览的这一连接是不正确连接。这一不正确连接,一方面来源于本来存有之后删除了网页页面,另一方面很有可能来源于原本就不会有,但别人外部链接了那么个网站死链。
阅读文章文中的人还阅读文章了:
首选域代表什么意思
外链资源是啥
系列产品1:群站是啥?公司做群站实际效果为何那么好?
标签内容: 0800 日志文件 04 02 日志 2009