详解YouTube的架构原则和扩展经验
2020-12-31 11:38:18 阅读(203) 评论(0)
YouTube发展迅速,每天视频点击量超过1亿,但维护站点并保证伸缩性的人却寥寥无几。这类似于PlentyOffish,少数人维护庞大的系统。原因是什么?放心,绝对不是靠性格,也不是靠孤独。我们来看看YouTube的整体技术结构。平台 ApachePythonLinux(SuSe)MySQLpsyco,动态Python到C的编译lightpd取代Apache进行视频查看状态,支持2005年2月和2006年3月每天3000万视频点击,2006年7月每天1亿视频点击,2个可伸缩软件架构师2个软件开发工程师,2个网络工程师,1DBAWeb服务器1,NetScaler用于负载均衡和静态内容缓存2fast_cgi运行Apache3,使用Python应用程序服务器来处理要求的路由4,应用程序服务器与多个数据库和其他信息源交互,以获取数据和格式化html页面5,通常可以添加更多的机器来提高web层的可伸缩性6,Python的Web层代码通常不是性能瓶颈,大部分时间阻塞在RPC7,Python允许快速灵活地开发和部署8,通常每个页面服务不到100毫秒的时间9,使用Psyco(类似JIT编译器的动态Python到C的编译器)来优化内部循环10。对于一些昂贵的块使用预先生成和缓存的html12,数据库使用行级缓存13,缓存完整的python对象14,一些数据被计算并发送到每个程序,因此这些值缓存在本地内存中。这是一种使用不当的策略。这是一种使用不当的策略。应用服务器中最快的缓存不需要太多时间就能将预计值发送给所有服务器。只需得到一个代理来监控变更,预计算,然后发送。视频服务1,成本包括带宽、硬件和能源消耗2,每个视频由一个迷你集群组成,每个视频由一台以上的机器持有3,使用一个集群意味着: -更多的硬盘持有内容意味着更快 -failover。如果一台机器出了问题,另一台机器可以继续服务 -在线备份4,使用lighttpd作为Web服务器提供视频服务: -Apache的费用太大了 -使用epoll等待多个fds -从单过程配置到多过程配置,处理更多的连接5,大部分流行内容转移到CDN: -CDN在多个地方备份内容,这样,内容更接近用户的机会就会更高 -CDN机器往往内存不足,因为内容太流行,内容进出内存的颠簸很少。6.不太流行的内容(每天浏览1-20次)在很多colo站点使用YouTube服务器。 -长尾效应。一个视频可以播放多个视频,但是很多视频都在播放。多个视频可以播放,但许多视频正在播放。随机硬盘块被访问 -在这种情况下,缓存不是很好,所以花钱在更多的缓存上可能没有多大意义。 -调整RAID控制,注意其他低级问题 -调整每台机器上的内存,不要太多或太少 视频服务关键点 1.保持简单和便宜。2.保持简单的网络路径。内容和用户之间不应该有太多的设备。3.使用常用硬件,很难找到昂贵的硬件来帮助文档。4.使用简单而常见的工具,使用大多数建在Linux或以上的工具5,可以很好地处理随机搜索(SATA,tweaks)缩略图服务1,达到高效惊人的难度2,每个视频大概有4个缩略图,所以缩略图比视频多很多3,缩略图只有几台机器上的host4,持有一些小东西遇到的问题: -OS级别的大量硬盘搜索、inode和页面缓存问题 -单目录文件限制,特别是Ext3,后来移动到多层结构。最近内核2.6的改进可能使Ext3允许大目录,但在文件系统中存储大量文件并不是一个好主意 -每秒都有大量的请求,因为web页面可能会在页面上显示60个缩略图 -Apache在这种高负载下的表现非常糟糕 -在Apache前端使用squid,这样工作了一段时间,但由于负载继续增加,以失败告终。它把每秒300个请求变成了20个请求 -尽量使用lighttpd,但由于使用单线程,它陷入了困境。遇到多过程问题,因为它们保持自己独立的缓存 -这么多图片,一台新机器只能接管24小时 -重启机器需要6-10个小时来缓存5,YouTube开始使用GogleBigTable来解决所有这些问题,分布式数据存储: -避免小文件问题,因为它收集文件在一起 -快,容忍错误 -由于使用分布式多级缓存,延迟较低,该缓存与多个不同的collocation站点一起工作 -更多信息参考GoogleArchitecture,GoogletalkArchitecture和Bigtable数据库 1,早期 -使用MySQL存储元数据,如用户、tags和描述 -用RAID10存储整个10硬盘的数据 -YouTube依靠信用卡租用硬件 -YouTube经历了一场常见的革命:单服务器,然后是单master和多readslaves,然后是数据库分区,然后sharding模式 -痛苦和备份延迟。master数据库是多线程的,运行在大机器上,所以可以处理很多工作。slaves是单线程的,通常运行在较小的服务器上,备份是异步的,所以slaves会远远落后于master。 -更新导致缓存失效,慢I/O硬盘导致慢备份 -使用备份架构需要大量的money来获得更高的写作性能 -YouTube的解决方案之一是将数据分为两个集群,将传输分为优先级:视频查看池和一般集群2,后期 -数据库分区 -分为shards,不同的用户指定不同的shards -扩散读写 -更好的缓存位置意味着更少的IO -硬件减少30% -备份延迟减少到0 -依靠信用卡,可以随意完善数据库的可伸缩性数据中心策略1,因此,一开始只能使用受管主机提供商2,受管主机提供商无法提供可伸缩性,无法控制硬件或使用良好的网络协议3,YouTube改为使用colocationarangement。现在YouTube可以定制一切,并同意自己的合同4,使用5到6个数据中心和CDN5,视频来自任何数据中心,而不是最近的匹配或其他任何东西。现在YouTube可以定制一切并同意自己的合同4,使用5到6个数据中心和CDN5,视频来自任何数据中心,而不是最近的匹配或其他任何东西。如果一个视频足够受欢迎,它将移动到CDN6,这取决于视频带宽,而不是真正的延迟。可以来自任何colo7,图片延迟非常严重,特别是当一个页面有60张图片时,使用bigtable将图片备份到不同的数据中心,代码查看谁是最近的扩展思维,虽然下面不是一个新想法,但我希望它能帮助你。分而治之是扩展技术的灵魂。考虑以层次化的方式完成所有工作。这也是数据分片的症结。要知道如何将数据分区,以及如何将分区的数据连接起来。总而言之,保持简单和松散的耦合是非常必要的。充分利用Python的动态特性,构建易于扩展的软件架构。近似的正确性。相信监控系统报告的系统运行状态。假如问题没有出现,就认为一切都很好。不一致的数据模型。比如读评论的人和写评论的人会对你刷新页面的动作有不同的反应,但是不需要完全基于事务处理进行系统设计,会显得过度矫枉过正。我们仍然需要不一致的数据模型。分布式系统的随机性。像气象系统一样,分布式系统在调试分布式系统时会有更多的随机性。例如,缓存过期。一般情况下,服务器会缓存流行视频24小时。如果缓存同时过期,服务器将同时开始缓存,负载如雷声!最快的函数调用是不做任何调用。合理设计事务处理的间隔和次数。仔细观察API,心中有数。如何定义输入和输出?本质上,所有的函数调用都是围绕数据发生的。函数调用后会发生什么?RPC重定向应用于Python。程序员是代码的构建者,所以要做好协议。如果代码不幸失败,也可以从RPC输出中追踪原因。没有完美的组件。一个组件的运行周期可能会持续1-6个月,没有人知道它会持续多久。随着时间的推移,我们会用Python和C重写一些东西,这证明你正在淘汰旧组件,当你观察到一个新组件出现时,它就诞生了。没有人知道整个系统的运行机制。因此,我们需要定义组件。视频转码与视频搜索完全不同,建立良好的数据规范非常重要。效率与可扩展性并重。最有效的是用C实现过程,但这种方法缺乏可扩展性。关注宏观层面、组件及其失败的原因。使用RPC明智吗?内联如何?分解研究可能会发现不同之处。重视算法。与其绞尽脑汁用Python来实现高效算法,不如用它来做更实用的事情。C语言在这方面有其优势。很少从事面向对象的设计。我们使用大量的名称空间来组织数据,但很少面向对象。我愿意用以下词来形容我们的代码树:简单、实用、优雅、正交、可组合,这是我们的追求。总结YouTube解决问题的哲学只有一个词:简单。许多YouTube产品最初来自一个简单的Python脚本。这是我们的一句老话,不积小步,不至千里;不积小流,不能成江海。
推荐阅读
- 最热完本小说排行榜,‘剑来’高居榜首
看小说可以转移注意力,缓解心理压力。当你躁动不安时,不妨坐下静静品读一本你比较感兴趣的小说,陶冶情操,修身养性。所以我整理了一些已经完结的小说,完本小说排行榜前六名,我来给大家揭晓!1.《剑来》《剑来》是众多小说网站中的一部完结网络小说,它…查看详情
- 免费的英语学习软件 2022好用的英语学习软件
现在越来越多的人对于学习英语的需求是越来越大了,现在很多的人都在自学英语,但是很多的玩家都不知道什么软件比较适合自学英语,下面万商云集小编就为大家介绍下2022免费的英语学习软件,希望能帮助到大家。小A阅读 把英语学习和阅读结合起来,…查看详情
- 服务社这款企业管理软件免费版全面解析
随着科技的进步与发展,各大企业也随着上市。一个好的企业更是需要一个好的管理。目前,市场上的大部分企业管理软件都为收费软件。经过各种交流与讨论,本文为大家推荐这一款免费的企业管理软件。 关于“服务社”这款功能强大的企业管理软件,它集成了主控系…查看详情
- 怎么做自己的小程序?有复杂的开发制作,也有简单的模板搭建
微信小程序覆盖的行业范围很广泛,因此现在越来越多人都想到利用小程序来引流获客。随着各种小程序制作工具的兴起,如今个人制作小程序已经不是什么难事,懂代码的,可以用官方开发工具自己开发;不懂代码的,可以用第三方小程序工具来制作。那么怎么做自己的…查看详情
- 服装行业企业网站应该具备的4个特点
通过线上销售提高服装整体销量,早已成为服装行业的共识。绝大部分服装企业都拥有自己的企业网站用以推广、销售商品,有的甚至建设了好几个企业网站。但企业网站建设不在数量,关键是运营,运营得好一个企业网站就能带来巨额收入。那么服装行业企业网站如何运…查看详情
- 专利权的保护期限是多久?
在平时很多的小伙伴都不知道专利权的保护期限的基本情况,而且对专利权的保护期限都不是很熟悉,下面万商云集小编就为大家整理了专利权的保护期限这方面的相关内容,希望下面的内容能帮助到各位。 一、专利权的保护期限是多久? 专利权的保护期…查看详情
- 企业运营网站的几个小技巧
随着越来越多的企业对网站的认识,网站运营也走入了大家的视野,成为大家关注的焦点,网站建设好后,只有经过有效的运营才能达到企业想要的效果,所以网站运营对企业来说是非常重要的。往大了说网站运营的内容包括了网站的策划、建设、测试、项目执行以及后期…查看详情
- 数组公式是什么意思
求和公式什么意思?能把一组有规律的数组利用简单的等式计算出来的公式就叫做求和公式,这个公式不是固定的一个式子.是自己通过找规律总结出来的,化简得(n-2)an-(n-1)a(n-1)=a1,这对于任一N均成立 当n取n-1时式子变为,(n…查看详情
- 2022年五大业务流程管理软件
都2022年了不会还有人没有流程管理软件吧,那今天我就来给大家介绍几款2022年五大业务流程管理软件,只要你下载了这几款软件,你就会实现流程自由,还在担心没有软件吗?那就赶紧看下去这篇文章吧。 1.吸管业务流程管理软件 这…查看详情
- 现在加盟什么店比较火
随着消费者需求的不断变化,加盟行业也在不断发展,一些行业因为技术进步或者市场供求关系的变化而随时变化,而一些行业则因为顾客偏好和经济环境的变化而成为热门。本文将从餐饮、教育、美容美发、生活服务四个方面介绍目前比较火的加盟店。 一、餐饮…查看详情
- 微信小程序在哪里找?
微信小程序是一种类似于App的应用程序,可在微信上运行,它具有独立的开发、运营、营销等功能。微信小程序被广泛应用于移动支付、社交分享、游戏娱乐、在线购物等领域,成为了个人、商家、企业等各个领域中不可或缺的重要组成部分。 在寻找微信小程…查看详情
- 微信注销多久申请新号
微信号注销多久可以重新注册? 这个需要三个月或者半年之后才可以,如果你在注销期间可以通过登录取消注销。圣样子微信号就不是注销状态,就可以重新注册登陆的,然后就不需要等半年或者三个月之内再重新注册,因为注册一个微信号还是挺麻烦的,需要绑…查看详情
- 盘点五款省时省力的图书管理软件,轻松管理图书借阅情况
图书馆对于大学生来说或者一些考研、博士来说是一个黄金圣地,书中不是说了嘛,书中自有颜如玉,书中自有黄金屋,那么图书管理软件都有哪些呢,要是被借走了咋办呢,今天我们几来盘点一下图书管理软件都有哪些。 1、小满图书管理 这是一…查看详情
- 唱歌录音软件 唱歌录音软件排行榜前十名
现在很多人喜欢把自己唱歌的结果录下来,那么录音设备就是很重要的存在了,下面万商云集小编给大家i详细介绍下唱歌录音软件,希望能帮助到大家。 一、录音宝 录音宝是一款支持实时录音和录音转文字的手机录音软件、录音专家、录音机及录音转文字助…查看详情
- 二级域名用来做网站都有哪些好处?二级域名优势介绍
很多商铺或者是企业都是拥有自己网站的,做的人都知道选择的域名不一样,网站带来的优势和效果也是不同的,有些企业在做网站的时候很纠结,不知道是使用一级域名还是二级域名比较好,其实二级域名也是非常不错的,而且也有很多的优势,那么二级域…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的数字选用平台

400-0033-166
8:30-18:00
















































注册有好礼



