搜索引擎蜘蛛抓取份额是由什么决定的?
2020-12-24 17:49:32 阅读(193) 评论(0)
Google新SEO代言人GaryIllyes在Google官方博客上发帖:WhatCrawlBudgetMeansforGooglebot,讨论了搜索引擎蜘蛛抓取份额的问题。对于大中型网站来说,这是一个非常重要的SEO问题,有时会成为网站自然流量的瓶颈。今天的帖子总结了Garyillyes帖子中的博客和论坛帖子的主要内容,以及我自己的一些案例和理解。强调以下概念也适用于百度。搜索引擎蜘蛛抓取的份额是什么?顾名思义,抓取份额是搜索引擎蜘蛛花在网站上抓取页面的总时间上限。对于特定的网站,搜索引擎蜘蛛花在这个网站上的总时间相对固定,不会无限期地抓取网站的所有页面。抓取份额的英文谷歌使用crawlbudget,直译是爬行预算。我不认为这意味着什么,所以我用抓取份额来表达这个概念。什么决定了抓取份额?这涉及到捕获需求和捕获速度的限制。抓住需求,抓住需求,crawldemand,指的是搜索引擎“想”抓取特定网站的页面。有两个主要因素决定抓住需求。一是页面权重,网站上有多少页面达到了基本页面权重,搜索引擎想要抓取多少页面。第二,索引库里页面是否没有更新太久。归根结底还是页面权重,权重高的页面不会更新太久。页面权重与网站权重密切相关。提高网站权重可以使搜索引擎愿意掌握更多的页面。抓取速度限制搜索引擎蜘蛛不会为了抓取更多的页面而拖垮别人的网站服务器,所以会为某个网站设定抓取速度的上限,crawlratelimit,也就是说,服务器可以承受的上限,蜘蛛抓取不会减慢服务器,影响用户访问。服务器响应速度足够快,速度限制略有上升,抓取速度加快,服务器响应速度下降,速度限制下降,抓取速度减慢,甚至停止抓取。因此,抓取速度限制是搜索引擎“能”抓取的页数。什么决定了抓取份额?抓取份额是考虑抓取需求和抓取速度限制的结果,即搜索引擎“想”抓取和“能”抓取的页面数。网站权重高,页面内容质量高,页面足够,服务器速度足够快,抓取份额大。小网站不需要担心抓取份额小网站页面数量少,即使网站重量低,服务器慢,每天搜索引擎蜘蛛抓取,通常至少可以抓取数百页,十天如何抓取整个网站,所以成千上万页的网站不用担心抓取份额。成千上万页的网站一般都不是什么大事。如果每天有数百次访问可以减缓服务器,SEO就不是主要需要考虑的事情。大中型网站可能需要考虑抓取数十万页以上的大中型网站,也可能需要考虑抓取份额是否足够。例如,网站有1000万页面,搜索引擎每天只能抓住数万页面,所以抓住网站可能需要几个月,甚至一年,也可能意味着一些重要的页面不能被抓住,所以没有排名,或者重要的页面不能及时更新。要及时、充分地抓取网站页面,首先要保证服务器足够快,页面足够小。如果网站有大量高质量的数据,抓取份额将受到抓取速度的限制,提高页面速度将直接提高抓取速度的限制,从而提高抓取份额。百度站长平台和Googlesearchconsole都有数据捕获。百度抓取频率如下图所示:上图显示SEO每天发布这个级别的小网站。页面抓取频率与抓取时间(取决于服务器速度和页面大小)无关,表明没有用完抓取份额,不用担心。有时,抓取频率和抓取时间有一定的对应关系,如下图所示:可以看出,抓取时间改善(减少页面尺寸,提高服务器速度,优化数据库),明显导致抓取频率上升,使更多的页面被抓取,网站更快。GoogleSearchConsole中更大点站的例子:顶部是捕获页面数量,中间是捕获数据量。除非服务器出错,否则这两个应该是相应的。下面是页面抓取时间。可以看出,页面下载速度足够快,每天抓取数百万页没有问题。当然,正如前面所说,一方面可以抓住数百万页,另一方面可以抓住搜索引擎。大型网站经常需要考虑抓取份额的另一个原因是,不要在无意义的页面上浪费有限的抓取份额,导致重要的页面应该被抓取,但没有机会被抓取。典型的浪费抓取份额页面包括:大量过滤和筛选页面。几年前,关于无效URL爬行索引的帖子进行了详细的讨论。站内复制内容质量低、垃圾内容日历等无限页面被大量抓取,可能用完抓取份额,但不抓取该抓取的页面。如何节省抓取份额?当然,首先要降低页面文件的大小,提高服务器的速度,优化数据库,减少抓取时间。然后,尽量避免上面列出的浪费抓取份额的东西。有的是内容质量问题,有的是网站结构问题。如果是结构问题,最简单的方法就是禁止捕获robots文件,但是会浪费一些页面权重,因为权重只进不出。在某些情况下,使用链接nofollow属性可以节省抓取份额。小网站,因为抓取份额用不完,加nofollow毫无意义。在大网站上,nofollow可以在一定程度上控制权重流动和分配。精心设计的nofollow将减轻无意义页面的权重,增加重要页面的权重。搜索引擎在捕获时会使用URL捕获列表,根据页面权重对待捕获的URL进行排序。如果重要的页面权重增加,它将首先被捕获。毫无意义的页面权重可能低于搜索引擎不想捕获。最后几个说明:链接加nofollow不会浪费抓取份额。但是在Google上会浪费权重。noindex标签不能节省抓取份额。如果搜索引擎想知道页面上有noindex标签,就必须先抓取页面,所以不节省抓取份额。canonical标签有时可以节省一点抓取份额。和noindex标签一样,搜索引擎要知道页面上有canonical标签,首先要抓取页面,所以不直接节省抓取份额。但是有canonical标签的页面被抓取的频率往往会降低,所以会节省一点抓取份额。抓取速度和抓取份额不是排名因素。但是没有被抓取的页面也不是排名。
推荐阅读
- 网站获取流量的方式有哪些 网站获取流量的方式技巧
网站目的那就是为了将企业或者个人想要展示的信息曝光出去,给用户看到,还有一个是为了获取到更多的流量。同时不同行业的网站去做优化,效果也是有很大差异的,所以无论是哪个行业都面临着共同的问题,要怎么去做好网站优化将效果转换好,又要怎么样才能…查看详情
- 知识产权如何申请 2023年知识产权申请流程
知识产权涵盖的范围很广,包括了专利权、版权等,而专利权包括发明专利权、实用新型专利权、外观专利等,版权包括软件著作权、文字版权、音乐版权等,还有商标权.下面*就给大家来详细介绍一下知识产权如何申请 2023年知识产权申请流程这一块的…查看详情
- 电子阅读器排行榜,怎么选择电子阅读器
很多人在平时看书的时候都会选择电子阅读器,选择一款比较好的电子阅读区,相对来说是非常方便的,而且功能也比较齐全,因此在选择之前也应该要了解相关的排行问题,那么电子阅读器排行榜都有哪些?下面就来详细的了解一下电子阅读器排行榜以及怎…查看详情
- 影响淘宝商品权重的因素有哪些?
搜索作为店铺获取免费流量的核心渠道,在日常运营推广中,还有一项非常重要的指标——淘宝商品的权重,若想产生更多流量,自然而然需要提升商品的权重,获得消费者的认可,那么影响淘宝商品权重的因素有哪些? 1. 商品属性 淘宝网卖家在填写商品属性时,…查看详情
- 谷歌镜像是什么意思?有什么作用?
谷歌镜像(Google Mirror)是指对谷歌搜索引擎的镜像站点,也就是把原来的谷歌网站内容(包括搜索结果、谷歌应用程序等)做了一个完全的备份,用户可以通过访问谷歌镜像站点来获取Google搜索结果或使用Google的其他应用程序。…查看详情
- 国外十大免费服务器有哪些?
现在很多的中小企业也会用到国外的服务器,很多人对国外的服务器不是很了解,下面万商云集*给大家来介绍一下国外十大免费服务器有哪些?希望能帮助到大家了解这一块的详情内容。 一、什么是服务器 服务器(Server),也称伺服器,是提供计算服务…查看详情
- php如何实现加入购物车功能
web前端购物车功能实现?要实现web前端购物车功能,可以通过以下步骤实现。 首先,需要一个按钮或者图标用于添加商品到购物车之中。 其次,在商品详情页面上添加一个按钮或者超链接,用于将该商品添加到购物车中。 然后,在购物车页面上展示商…查看详情
- 香港公司如何查询
怎样查询香港公司的注册信息? 香港公司注册信息查询步骤: 1:进入“公司注册处综合资讯系统”,点击进入查询系统,选择无账号使用者登陆。 2:登入之后,会出现服务条款,选择接受并登入。注意最上方的语言选择,选择简体中文或繁体中文。 …查看详情
- mysql数据库查询语句
mysql表的查询方式?MySQL支持以下常用查询方式: 1、SELECT:查询操作,用来从表中检索数据。 2、UPDATE:更新操作,用来更新表中现有的数据。 3、INSERT:插入操作,用来向表中添加新数据。 4、DELETE:…查看详情
- 什么是CRM平台?是帮助企业管理与客户间的业务关系的平台
伴随着销售市场的发展趋势,人性化的营销方法愈来愈受到高度重视。因此,假如公司要想得到大量的顾客,就务必要搜集很多的信息内容,充分了解市场,认识自己所应对的状况。要是没有CRM管理系统这类顾客可视化工具出现,那么公司不论是在变化营销层面,还是…查看详情
- 如何设计网站的首页
官网主页怎么设置?1官网主页的设置需要考虑用户体验和页面美观度 2首先,应该以用户需求为导向,将重要的信息放置在显眼的位置,让用户能够快速找到需要的内容;其次,要保证页面美观度,采用统一的风格和色彩搭配,营造出整洁、清晰、舒适的用户体验;…查看详情
- 2022美术作品版权登记收费标准
美术创作是一件很有艺术气息的事情,但是现在也有很多的美术作品侵权的现象,下面万商云集*给大家来详细介绍一下2022美术作品版权登记收费标准,希望能帮助到大家。 美术作品版权登记收费标准 美术作品每件三百元。 《中国版权保护中心著作…查看详情
- 淘宝店铺商品属性怎么优化,淘宝店铺商品属性优化技巧
做电商,选对产品是关键,但重中之重还是取决于淘宝商品属性怎么优化,优化直接影响着其转化率,本文整理了一份淘宝店铺商品属性优化技巧供大家参考。 1.淘宝网、天猫商城搜索引擎调用的参数主要是标题,其次就是商品的属性; 2.从淘宝网首页的类目进去…查看详情
- 广州注销营业执照怎么预约
对公账户销户怎么预约? 需要先打电话给开户行,跟开户行确定好对公业务的时间,按照预约的时间过去办理业务,需要带的资料是公司营业执照正本、公财私三章、法人身份证原件、开户许可证、对公账户网银U盾、财智卡,柜台在办理注销的时候如果您的对公…查看详情
- 盘点国内外好用的文件恢复软件,内附测评
目前网上的文件恢复软件良莠不齐,要么是打着效果噱头,要么则捆绑一大堆流氓软件,真正良心的软件并不多,小万针对此做了一个整合,盘点国内外好用的文件恢复软件,内附测评内容。 1.Recuva 主打免费版本的一款文件恢复软件,但是因为零成本的原因…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
邮箱:zjb@iwanshang.com
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的AI增效平台

400-0033-166
8:30-18:00















































注册有好礼



