今天分析研究了两个网站的Apache日志,分析日志虽然很无聊,但却是很有意义的事情,比如跟踪spam的user agent。顺便整理出一些搜索引擎爬虫的user agent,在这里分享一下。
微软
"msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)"
msnbot,大多数已经被bingbot替代了,现在偶尔还可以看到。
"Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"
bing,必应
搜搜
"Sosospider+(+http://help.soso.com/webspider.htm)"
腾讯搜搜
"Sosoimagespider+(+http://help.soso.com/soso-image-spider.htm)"
搜搜图片

