相信很多站长都遇到过这种问题,一般情况下,这种问题多存在于一个网站的内页。而且内页处理起来确实比较头疼。现在分享以下几种方法来帮大家解决这个头疼的问题:
【描述问题现状】
1、百度抓取面包屑导航内容作为网页的描述。
2、site语法下的默认描述都是采用面包屑内容描述,搜索相关词的时候,有的会产生正确的描述,大部分还是错误的描述。
3、之前收录的描述正常的网页,在更新的时候也会发生描述错误的问题(采用面包屑导航的内容)
【针对调整措施】
1、外链描述问题
关于更新的内容值钱是没有发过任何外部链接的,所以应该不会出现外链描述的问题。但是为了确认下,自己对于最近更新的内容,也发了一些发布的链接,描述跟原版描述一致,结果还是没有任何效果。
2、随机抓取问题
关于随机的抓取问题,发现所有的描述错误的页面都是抓取的左侧的分类+面包屑导航和页面的底部信息,所以应该不是随机抓取的内容。
3、降权问题
目前首页出现了降权的现象,但是仅仅针对的是首页,内容页的展示和排名没有受到影响,仅仅是收录时间可能不是很及时的。但是之前发现问题的时候,网站本身没有降权现象,所以这个因素应该也可以pass掉。
4、百度数据库问题
以前遇到过由于百度大更新的时候,会造成页面描述发生错误的问题,开始等了大概有半个月都没有更新过来,而且之后更新的页面也发生大范围的错误出现的情况,因此这个问题也可以忽略。
5、搜索词匹配问题
这个目前还不能完全保证不受影响,因为确实有些页面在搜索词的时候会发生描述展现正确的情况,不过大体上还是错误的居多。
6、页面权值代码的结构问题
这个从上面的例子就可以看出,如果是权值代码(H1、title)出现问题的话,就不可能会出现正常的描述标签,抓取的内容应该不会出现问题。这个之前用过一些外国网站的抓取工具模拟过,抓取的内容是没有问题的。
【现存问题】
唯一一个可以作为合理解释的原因就是由于页面代码的问题,导致的对于页面的描述标签的不信任,因此百度会自定义默认的描述内容。这个问题,由于网站是外包的,所以自己没法考证。
这个是在详情内容模块的下方采用的js控制显示样式,为显示。
由于百度快照里面无法加载JS代码,因此在网页的百度快照的内容,该模块为空。但是抓取的时候是抓取的源码,因此源码里面是包含有具体的内容的。如果真是这方面的原因的话,就能解释通为什么抓取的描述是面包屑导航和页面底部的内容,就是由于中间内容为空。