有时候我们在检查网站日志时发现搜索引擎的蜘蛛来访正常就是不收录,很多人没有想到这很有可能只是蜘蛛来访问了,但是没有抓取,让人毫无头绪不知如何解决不收录的问题。
如果除去网站内容质量价值的原因外,我们就要马上诊断分析是不是蜘蛛抓取失败了,是什么原因导致的。
一、网站存在死循环结构
如果网站整个全局结构是个死胡同,链接之间是循环堵塞,这会极大的浪费蜘蛛的抓取配额资源,也就是说蜘蛛都在一些根本不会收录的内容页面之间来回抓取。
二、网站存在渲染问题
网站的渲染如果存在无法让蜘蛛理解,那对蜘蛛来说这个网站就是个天书,内容页面都不知道哪里是内容,去看看为什么比较大型的渲染网站都放在前端进行,不会用JS文件全部处理。
三、网站URL链接通信问题
网站页面URL地址如果存在不稳定性和异常缓慢,蜘蛛是不太可能去抓取的,因为抓取本身就需要对象页面足够稳定快速响应,如果是存在异常问题会直接出现50X错误,就算是链接缓慢也会导致中断情况。
四、网站URL权限问题
不要忽略网站URL访问权限问题,比如:访问频率限制、流量限制、打开限制等等,尤其是目录链接和需要调取程序文件资源的。
五、网站内容问题
内容页面需要仔细检查是否存在不合理的因素,比如标签、排版、相关性、内链等等,都需要围绕当前内容页面主题布置。
六、网站死链问题
网站如果存在死链除了会影响权重外,也会导致蜘蛛抓取其他页面失败,因为死链本身的属性就是不可信的,而且有可能存在跳转丢失的问题。
SEO私馆结束语:排除搜索引擎因为规则算法的原因不收录网站外,以上五点值得需要去诊断解决自身的问题。