010-56250565
 
对页面抓取异常的原因及分析
2016-5-4 浏览:1660次
1,效劳器衔接反常
效劳器衔接反常会有两种状况:一种是站点不稳定,Baiduspider测验衔接您网站的效劳器时呈现暂时无法衔接的状况;一种是Baiduspider一向无法衔接上您网站的效劳器。

形成效劳器衔接反常的因素通常是您的网站效劳器过大,超负荷运转。也有也许是您的网站运转不正常,请查看网站的web效劳器(如apache、iis)是不是装置且正常运转,并运用浏览器查看首要页面能否正常拜访。您的网站和主机还也许阻挠了Baiduspider的拜访,您需求查看网站和主机的防火墙。

2,网络运营商反常:网络运营商分电信和联通两种,Baiduspider经过电信或网通无法拜访您的网站。假如呈现这种状况,您需求与网络效劳运营商进行联络,或许采购具有双线效劳的空间或许采购cdn效劳。

3,DNS反常:当Baiduspider无法解析您网站的IP时,会呈现DNS反常。也许是您的网站IP地址过错,或许域名效劳商把Baiduspider封禁。请运用WHOIS或许host查询自己网站IP地址是不是准确且可解析,假如不准确或无法解析,请与域名注册商联络,更新您的IP地址。

4,IP封禁:IP封禁为:限制网络的出口IP地址,制止该IP段的运用者进行内容拜访,在这里特指封禁了BaiduspiderIP。当您的网站不期望Baiduspider拜访时,才需求该设置,假如您期望Baiduspider拜访您的网站,请查看有关设置中是不是误添加了BaiduspiderIP。也有也许是您网站地点的空间效劳商把baiduIP进行了封禁,这时您需求联络效劳商更改设置。

5,UA封禁:UA即为用户署理(User-Agent),效劳器经过UA辨认拜访者的身份。当网站关于指定UA的拜访,回来反常页面(如403,500)或跳转到别的页面的状况,即为UA封禁。当您的网站不期望Baiduspider拜访时,才需求该设置,假如您期望Baiduspider拜访您的网站,useragent有关的设置中是不是有Baiduspider UA,并及时修正。

6,死链:页面现已无效,无法对用户供给任何有价值信息的页面即是死连接,包含协议死链和内容死链两种形式:

协议死链:页面的TCP协议状况/HTTP协议状况清晰表明的死链,多见的如404、403、503状况等。

内容死链:效劳器回来状况是正常的,但内容现已变更为不存在、已删去或需求权限等与原内容无关的信息页面。
关于死链,我们主张站点运用协议死链,并经过baidu站长平台–死链东西向baidu提交,以便baidu更快地发现死链,削减死链对用户以及查找引擎形成的负面影响。

7,反常跳转:将网络恳求重新指向别的方位即为跳转。反常跳转指的是以下几种状况:
1)当前该页面为无效页面(内容已删去、死链等),直接跳转到前一目录或许主页,baidu主张站长将该无效页面的进口超连接删去掉
2)跳转到犯错或许无效页面
留意:关于长期跳转到别的域名的状况,如网站替换域名,baidu主张运用301跳转协议进行设置。

8,别的反常:
1)关于baidurefer的反常:页面关于来自baidu的refer回来不同于正常内容的做法。
2)关于baiduua的反常:页面对baiduUA回来不同于页面原内容的做法。
3)JS跳转反常:页面加载了baidu无法辨认的JS跳转代码,使得用户经过查找成果进入页面后发生了跳转的状况。
4)压力过大导致的偶尔封禁:baidu会依据站点的规划、拜访量等信息,自动设定一个合理的抓取压力。但是在反常状况下,如压力操控异常时,效劳器会依据自身负荷进行保护性的偶尔封禁。这种状况下,请在回来码中回来503(其意义是“Service Unavailable”),这样Baiduspider会过段时间再来测验抓取这个连接,假如网站已闲暇,则会被成功抓取。

大多数网站都是由于沙盒效应,一诺互联网站建设公司提示我们,要进步执行力,不要急。SEO是急不来的,由于主动权在查找引擎那里,你只能墨守成规的去做。
 
阅读下一篇
网站制作的流程及细节问题
 
 
延伸阅读
签约北京也趣国际传媒广告有限公司网站建设项目
网站建设 你不知道的灰色地带!
网站建设公司 签约诺美品牌设计网站改版项目
网站建设明细报价表 要建站的朋友列一些注意事项
网站制作公司 签约北京凯达桑泰电热设备有限责任公司网站建设项目
网站建设公司 签约北京辉腾保温材料有限公司网站制作项目
论访客体验设计师 网页设计师 甲方的重要性
 
准备开展业务?
联系专业的商务顾问,诊查网站现状及关键词、分析竞争对手的流量、一对一咨询、及其报价详情