SEO私馆
问题咨询、疑难诊断、优化运营、培训教学

搜索引擎蜘蛛不抓取网站页面的原因

搜索引擎蜘蛛不抓取网站页面的原因

我们分析网站日志时会发现搜索引擎的蜘蛛有时候来访很频繁,但是就不抓取内容页面,如果没有经验的SEO人员会一头雾水,甚至会觉得是搜索引擎的问题。

其实有一大半还是网站自身存在问题,如果蜘蛛来访频率不低,那肯定就是内容页面有以下这八点问题。

一、网站结构混乱堵塞。

网站结构如果是比较混乱,会造成搜索引擎的蜘蛛爬取消耗过大而放弃,尤其是内容页面中有动态URL调用就会制造网络堵塞的现象。

比如:网站层级过深、页面重复率高、网站需要重复调用多级文件、动态读取太频繁且过深,等等。

二、内容文章太口水话。

不要为了原创而口水原创,这是没有意义的,如果文章大多数都是没有丝毫价值的内容,很容易造成搜索引擎负面印象,不去碰指定的URL特征链接。

比如:小几百字的原创文章,从头到尾就是个类似简单的介绍,甚至题不对文,有的甚至连图片都是盗取的。

三、网站没有ICP备案。

如果网站没有备案,那在国内所有搜索引擎当中都很难被抓取收录,百度好点,这是国内政策原因,也是网络生态的趋势。

比如:企业网站就算是正规的,有实体公司地址,也每天保持原创更新,那也是照样很难抓取。

四、网站访问速度比较慢。

网站的打开访问速度如果不理想,蜘蛛是无法完全分析页面内容的,而且也会直接影响爬取频率和准确性。

比如:网站打开速度需要3秒以上,页面打开了但是资源读取缓慢。

五、网站存在多级域名使用。

如果网站不是大品牌,而用了多个二级域名使用,这会较大的稀释掉权重,也很容易给搜索引擎一种不靠谱和不稳定的感觉。

比如:不同静态文件用不同的二级域名区分读取,动态页面又是单独一个二级域名等等。

六、被假蜘蛛误导和消耗资源。

现在有很多冒充搜索引擎的假蜘蛛会频繁爬取网站页面,轻则文章被采集,重着消耗光了服务器资源让真蜘蛛不想来了。

比如:网站权重不是很高,又没有主动提交URL地址,但是文章发布后能在1小时内就有蜘蛛来爬取,而且停留时间较长。

七、网站用了CDN缓存设置不对。

CDN缓存是一把双刃剑,很多新人不知道如何调控CDN配置,导致因为CDN广泛的IP地址让网站在搜索引擎那处于频繁更新IP的问题。

比如:CDN缓存时间不合理,缓存文件丢失和异常,回源设置错误,等等。

八、网站存在不合格的问题。

搜索引擎对网站的考核是比较严格的,随着技术的革新会越来越严谨。

比如:网站采集文章、不正当手法运营和优化、作弊SEO操作、网站排版差、广告过多,等等。

如果网站出现有蜘蛛比较频繁的来访,但是就不抓取收录,就先从以上八点开始自查解决。

搜索引擎不抓取网站的原因总结

我们都知道搜索引擎会没有派出蜘蛛通过访问网站进行抓取内容页面,如果你的网站不被抓取就会影响收录,所以我们有必要了解为什么会出现不抓取的问题。一、网站结构浪费消耗了蜘蛛资源搜索引擎对网站是有蜘蛛配额的,...

搜索引擎不收录网站内容页面的原因

不同的搜索引擎对网站内容页面的收录标准是不一样的,而且有很明显的区别,但是通常都是基于内容及页面的价值和质量进行分析诊断出优劣性,然后决定是否收录。一、页面存在渲染堵塞等其他问题。网站页面的渲染会对S...

百度收录tags页面,不收录文章页面的原因是什么?

近期百度搜索特别喜欢收录网站tags页面,其中的原因让很多人迷惑不解,如果细心的去分析会发现其实原因很简单,可能百度急需问答性内容,而tags页面就是关键字标签的意思,意味着这类页面有可能存在解答内容...

搜索引擎蜘蛛爬取JS和CSS文件的原因

我们分析网站日志时会发现搜索引擎会偶尔爬取JS和CSS文件,如果路径没有错,那就不用担心,这是搜索引擎在了解我们网站的代码、结构、排版、渲染、内容,也就是在熟悉网站全套环境,如果出现比较频次的爬取JS...

搜索引擎蜘蛛抓取频次下降的原因

懂网站SEO的人都知道,搜索引擎的蜘蛛对网站的抓取频次在很大程度决定了权重分值,当蜘蛛抓取频次下降时是需要警惕的,及时排查问题并且解决,所以要知道是什么原因让蜘蛛抓取频次下降的。一、同质化页面太多。如...

头条搜索快速收录网站页面的方法

头条搜索对网站的支持度还是不错的,值得去做SEO优化,但是头条搜索对网站的页面收录是比较严苛的,如何能快速被收录就很重要。登陆头条搜索站长后台,选择点击左边导航中的数据提交--链接提交,如下图示例:向...

网站提高搜索引擎蜘蛛访问频率次数的方法

我们在做网站SEO优化和运营时会经常观察搜索引擎的蜘蛛爬虫来访抓取的频率和次数,因为这可以判断出网站的权重值大概处于什么阶段,也能分析出网站内容页面收录的时长,对优化网站SEO有很重要的参考价值,所以...

全球搜索引擎蜘蛛UA标识名称说明

我们在分析网站日志时会经常看到很多蜘蛛爬取,通过UA标识名称可以分析出是哪里的蜘蛛,然后进行实际的需求屏蔽和开放,对于SEO优化来说是不可小视的,尤其是网站服务器性能和宽带不足以支撑大量蜘蛛爬取而导致...