服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

搜索引擎蜘蛛抓取份额是由什么决定的?

2020-12-24 17:49:32 阅读(181 评论(0)

Google新SEO代言人GaryIllyes在Google官方博客上发帖:WhatCrawlBudgetMeansforGooglebot,讨论了搜索引擎蜘蛛抓取份额的问题。对于大中型网站来说,这是一个非常重要的SEO问题,有时会成为网站自然流量的瓶颈。今天的帖子总结了Garyillyes帖子中的博客和论坛帖子的主要内容,以及我自己的一些案例和理解。强调以下概念也适用于百度。搜索引擎蜘蛛抓取的份额是什么?顾名思义,抓取份额是搜索引擎蜘蛛花在网站上抓取页面的总时间上限。对于特定的网站,搜索引擎蜘蛛花在这个网站上的总时间相对固定,不会无限期地抓取网站的所有页面。抓取份额的英文谷歌使用crawlbudget,直译是爬行预算。我不认为这意味着什么,所以我用抓取份额来表达这个概念。什么决定了抓取份额?这涉及到捕获需求和捕获速度的限制。抓住需求,抓住需求,crawldemand,指的是搜索引擎“想”抓取特定网站的页面。有两个主要因素决定抓住需求。一是页面权重,网站上有多少页面达到了基本页面权重,搜索引擎想要抓取多少页面。第二,索引库里页面是否没有更新太久。归根结底还是页面权重,权重高的页面不会更新太久。页面权重与网站权重密切相关。提高网站权重可以使搜索引擎愿意掌握更多的页面。抓取速度限制搜索引擎蜘蛛不会为了抓取更多的页面而拖垮别人的网站服务器,所以会为某个网站设定抓取速度的上限,crawlratelimit,也就是说,服务器可以承受的上限,蜘蛛抓取不会减慢服务器,影响用户访问。服务器响应速度足够快,速度限制略有上升,抓取速度加快,服务器响应速度下降,速度限制下降,抓取速度减慢,甚至停止抓取。因此,抓取速度限制是搜索引擎“能”抓取的页数。什么决定了抓取份额?抓取份额是考虑抓取需求和抓取速度限制的结果,即搜索引擎“想”抓取和“能”抓取的页面数。网站权重高,页面内容质量高,页面足够,服务器速度足够快,抓取份额大。小网站不需要担心抓取份额小网站页面数量少,即使网站重量低,服务器慢,每天搜索引擎蜘蛛抓取,通常至少可以抓取数百页,十天如何抓取整个网站,所以成千上万页的网站不用担心抓取份额。成千上万页的网站一般都不是什么大事。如果每天有数百次访问可以减缓服务器,SEO就不是主要需要考虑的事情。大中型网站可能需要考虑抓取数十万页以上的大中型网站,也可能需要考虑抓取份额是否足够。例如,网站有1000万页面,搜索引擎每天只能抓住数万页面,所以抓住网站可能需要几个月,甚至一年,也可能意味着一些重要的页面不能被抓住,所以没有排名,或者重要的页面不能及时更新。要及时、充分地抓取网站页面,首先要保证服务器足够快,页面足够小。如果网站有大量高质量的数据,抓取份额将受到抓取速度的限制,提高页面速度将直接提高抓取速度的限制,从而提高抓取份额。百度站长平台和Googlesearchconsole都有数据捕获。百度抓取频率如下图所示:上图显示SEO每天发布这个级别的小网站。页面抓取频率与抓取时间(取决于服务器速度和页面大小)无关,表明没有用完抓取份额,不用担心。有时,抓取频率和抓取时间有一定的对应关系,如下图所示:可以看出,抓取时间改善(减少页面尺寸,提高服务器速度,优化数据库),明显导致抓取频率上升,使更多的页面被抓取,网站更快。GoogleSearchConsole中更大点站的例子:顶部是捕获页面数量,中间是捕获数据量。除非服务器出错,否则这两个应该是相应的。下面是页面抓取时间。可以看出,页面下载速度足够快,每天抓取数百万页没有问题。当然,正如前面所说,一方面可以抓住数百万页,另一方面可以抓住搜索引擎。大型网站经常需要考虑抓取份额的另一个原因是,不要在无意义的页面上浪费有限的抓取份额,导致重要的页面应该被抓取,但没有机会被抓取。典型的浪费抓取份额页面包括:大量过滤和筛选页面。几年前,关于无效URL爬行索引的帖子进行了详细的讨论。站内复制内容质量低、垃圾内容日历等无限页面被大量抓取,可能用完抓取份额,但不抓取该抓取的页面。如何节省抓取份额?当然,首先要降低页面文件的大小,提高服务器的速度,优化数据库,减少抓取时间。然后,尽量避免上面列出的浪费抓取份额的东西。有的是内容质量问题,有的是网站结构问题。如果是结构问题,最简单的方法就是禁止捕获robots文件,但是会浪费一些页面权重,因为权重只进不出。在某些情况下,使用链接nofollow属性可以节省抓取份额。小网站,因为抓取份额用不完,加nofollow毫无意义。在大网站上,nofollow可以在一定程度上控制权重流动和分配。精心设计的nofollow将减轻无意义页面的权重,增加重要页面的权重。搜索引擎在捕获时会使用URL捕获列表,根据页面权重对待捕获的URL进行排序。如果重要的页面权重增加,它将首先被捕获。毫无意义的页面权重可能低于搜索引擎不想捕获。最后几个说明:链接加nofollow不会浪费抓取份额。但是在Google上会浪费权重。noindex标签不能节省抓取份额。如果搜索引擎想知道页面上有noindex标签,就必须先抓取页面,所以不节省抓取份额。canonical标签有时可以节省一点抓取份额。和noindex标签一样,搜索引擎要知道页面上有canonical标签,首先要抓取页面,所以不直接节省抓取份额。但是有canonical标签的页面被抓取的频率往往会降低,所以会节省一点抓取份额。抓取速度和抓取份额不是排名因素。但是没有被抓取的页面也不是排名。

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

PPT制作软件推荐,告别PPT用什么软件制作的疑惑

现在社会,许多大学生和上班族对PPT的制作并不陌生,在平时的工作和学习生活中都会用到PPT,PPT用什么软件制作呢?一起看看我为大家整理的PPT制作软件推荐吧。 1.OPlus OPlus是微软官方模板网站。涵盖了PPT模板…查看详情

自己在家做电商需要些什么设备

  电商是近年来非常火热的行业,越来越多的人开始选择在家做电商。如果你也想在家做电商,那么需要以下东西:  一、基础设施  基础设施是开展电商的第一个环节,包括了硬件设备和软件环境。对于硬件设备而言,一般需要一台电脑、一台打印机、一个摄像头…查看详情

农产品要商品化、品牌化、电商化,互联网推广是什么角色?

农产品滞销,农民“丰产不丰收”是常见社会现象,也是国家农业部高度重视并极力解决的问题。互联网推广是什么?是渠道,也是销售。2020年上半年的网络数据统计显示,“互联网+农产品”能够有效帮助农产品销售,在一定程度上解决农产品滞销问题,为农户解…查看详情

【小程序管理系统】后端精细化让你从起点就有优势

小程序分为企业版和个人版,两者的区别在于,个人版不支持微信认证,不能对外发布只能作为测试使用;企业版需要以个体户、企业或组织机构的营业执照进行注册。小程序的开发涉及到前端和后端,后端是指小程序管理系统,负责上传产品和内容,前端负责小程序的页…查看详情

选择网站开发建设公司的正确姿势

企业官网对于企业的营销推广非常重要,它企业品牌形象和企业文化展示的重要渠道。一个企业如果没有自己的官方企业网站,就很难向客户传递自己的品牌理念、产品信息,无法让客户更清晰的认识自己,所以很多中小企业都会选择网站开发建设公司来为自己建设官网。…查看详情

字符串是什么意思 哪些属于字符串

相信很多没用接触到计算的朋友都不知道字符串是什么意思,在计算机技术领域比较常用,在编程代码这块也比较常见,下面万商云集小编给大家来详细介绍一下字符串的相关常识。  什么是Python中的字符串?  我们许多熟悉C,C++等编程语言的人都会得…查看详情

网络测速软件有哪些 网络测速app推荐

现在很多的用户都比较关心自己的网速问题,现在市面上的网络测速软件也是有很多的,下面万商云集小编给大家来详细介绍一下网络测速软件有哪些 网络测速app推荐这方面的内容。希望能帮助到大家。  1.speedtest  测网速speedtest…查看详情

erp解决方案能给中小企业带来什么?

erp解决方案有什么具体的功能?它能够帮助中小企业带来什么?图片来源网络erp解决方案可以从每个部门、每个业务流程中获取信息,打破部门之间的信息壁垒,将企业发展所需的信息高度集成。生产、销售、市场、分销、财务、人力资源、项目管理、存货管理、…查看详情

eclipse下载教程 eclipse如何下载

macbookpro怎么下载eclipse?在macbookpro上下载eclipse的步骤如下: 1.打开浏览器,进入eclipse官网; 2.在“DownloadPackages”选项中选择需要的Eclipse版本; 3.选择操作…查看详情

淘宝营销活动有哪些类型?3种常见营销类型

淘宝活动是卖家网店流量的重要来源之一,无论是收费还是免费,网店一旦参加,都将获得巨大的流量,那么常见的淘宝营销活动有哪些类型?综合看来,淘宝网的活动非常多,常见可分为平台活动、渠道活动和类目活动三种类型。 1.平台活动 淘宝网(淘宝集市、…查看详情

linux系统和win系统有什么区别

Linux系统和Windows系统是两种广泛使用的操作系统,它们具有许多区别。以下是关于这两个系统之间的一些主要区别的简要介绍。1. 开源 vs 闭源:Linux是开源软件,意味着它的源代码对用户开放,可以由任何人进行修改和分发。相比之下,…查看详情

知识产权如何申请 2023年知识产权申请流程

  知识产权涵盖的范围很广,包括了专利权、版权等,而专利权包括发明专利权、实用新型专利权、外观专利等,版权包括软件著作权、文字版权、音乐版权等,还有商标权.下面小编就给大家来详细介绍一下知识产权如何申请 2023年知识产权申请流程这一块…查看详情

商业网站推广的方法有哪些?

  优质答案(1)  网站推广传统的方法:搜索引擎、微信朋友圈等,这些方法属于免费推广的范畴,但关于电商方面的推广确没有涉及,下面来仔细聊聊关于电商推广的一些方法  一、搜索  搜索引流是我们平时最常见的一种。买家不论在哪个平台购物,首先第…查看详情

做小程序代理是商机也是挑战

小程序刚出来的时候,嗅到这股潮流的人早就在这个领域赚到钱了,小程序至今也有2年时间了,没有哪个互联网产品能够这么快风靡起来,不论是商家还是用户都觉得小程序非常实用,不仅不站手机内存,可以节省大量储存空间。 图片来源于网络站在风口上,就能开启…查看详情

会员卡管理软件助力经营,这4款帮商家get营销诀窍

无论是线下经营店铺还是线上虚拟商铺,越来越多的商家重视店面会员机制所带来的经营增值效应,而随着经营规模的不断扩大,经营者对于会员及会员卡的管理工作量也在增加,此时就需要借助专业的会员卡管理软件来助力经营,今天就介绍4款能够帮助商…查看详情

最新文章