分析美团的Ursa分布式存储系统
2020-12-30 13:39:48 阅读(277) 评论(0)
1.Ursa云硬盘在IaaS云计算平台中起着至关重要的作用,几乎已经成为亚马逊EBS等必备组件(ElasticBlockStore)、盘古、OpenStack中的Cinder等阿里云。云硬盘可以为云计算平台带来更高的数据可靠性和可用性、灵活的数据快照功能、更好的虚拟机动态迁移支持、更短的主机故障恢复时间等诸多优秀特性。随着万兆以太网的逐渐普及,云硬盘的优势得到了加强和突出,其必要性变得非常强。云硬盘的底层通常是分布式块存储系统。目前,CephRBD等开源领域也有一些这样的项目、Sheepdog。此外,虽然MooseFS和GlusterFS被称为文件系统,但它们也可以用来支持云硬盘,因为它们的特性接近块存储系统。在评估中,我们发现这些开源项目存在一些问题,使其难以直接应用于大规模生产系统。比如CephRBD效率低(CPU使用过高);Sheepdog在压力测试中丢失数据;Mosefs的POSIX语义支持、基于FUSE的架构、不完全开源的2.0版本等问题给其自身带来了诸多局限性;GlusterFS和Ceph属于红帽收购的开源存储系统,主要用于scale-out文件存储场景,在云计算领域使用不多。此外,这些存储系统在未来很难充分发挥万兆网卡和SSD的性能潜力。此外,这些存储系统很难充分发挥万兆网卡和SSD的性能潜力,也很难在未来承担沉重的责任。由于上述原因,美团云开发了一种新的分布式块存储系统Ursa,通过简单稳定的系统架构、高效的代码实现和仔细考虑各种非典型场景,实现了高可靠性、高可用性、高性能、低成本、可扩展性、易操作维护、易维护等目标。Ursa的名字起源于Dota中的熊战士,他具有很高的攻击速度、攻击力和生命值,分别隐喻存储系统中的IOPS、吞吐量和稳定性。2.1分布式块存储相关项目及技术Ceph(主要参考:https://www.ustack.com/blog/ceph_infra/)Ceph项目起源于其创始人Sageweil在加州大学SantaCruz分校攻读博士学位期间的研究课题。该项目于2004年开始。Sage在2006年的OSDI学术会议上发表了关于Ceph的论文,并提供了项目的下载链接,因此开始广为人知。2010年,Ceph客户端部分代码正式进入Linuxkernel2.6.34。Ceph还提供三个层次的分布式存储服务:对象、块和文件,其中只有块层存储与我们有关。由于块存储在IaaS云计算系统中占有重要地位,近年来Ceph的*度显著提高。许多基于Ceph的云计算系统实例提供块存储服务,如UnitedStack、MirantisopenStack等。ceph性能测试测试版:0.81操作系统:centos6.x测试工具:fio服务器配置:CPU:IntelXeone5-2650v2@2.6GHzRAM:96GBNIC:10GbeHDD:6NLSAS,7200RPMRAIDController:DellH710p(LSI2208with1GBNVRAM)服务器数量:4。其中一个是兼职客户端。注意:由于客户端位于存储服务器上,四分之一的吞吐率不通过网卡。测试结果如下:读IOPS:16407(此时客户端CPU占用率超过500%,5台服务器CPU的总利用率接近500%。写IOPS:941顺序读吞吐率:21859KB/s顺序写吞吐率:67242KB/s顺序读延迟:1.6ms(664IOPS)顺序写延迟:4.4ms(225IOPS)网络ping值:0.1324ms本地硬盘顺序读写延迟:0.03332ms(29126IOPS)从测试角度看。Ceph阅读吞吐率正常,但吞吐率低于阅读的1/3,性能低;读写延迟率明显大于网络延迟和磁盘I/O延迟之和;CPU占用率太高。2.2Sheepdog(主要参考:http://peterylh.blog.163.com/blog/static/12033201221594937257/)Sheepdog是日本NTT实验室Moritakazutaka为虚拟化平台创建的分布式块存储开源项目,2009年开源[1]。自2011年9月以来,一些淘宝工程师加入了Sheepdog项目和Corosyncc等相关开源项目、开发Acccord。自2011年9月以来,一些淘宝工程师加入了Sheepdog项目和Corosyncc等相关开源项目、Accord的开发。Sheepdog主要由集群管理和存储服务两部分组成,其中集群管理目前由Corosync或Zookper完成,存储服务是新实现的。Sheepdog采用无中心节点的全对称架构,基于一致性,实现从ObjectID到存储节点的定位:每个节点分为多个虚拟节点,像ObjectID一样,采用64位整数唯一标识,每个虚拟节点负责一段ObjectID范围,包括节点ID。ObjectID对应的虚拟节点存在于Dataobject副本中,以及后续的节点。Sheepdog没有单点故障问题,存储容量和性能可以线性扩展。新节点可以通过简单的配置添加到集群中,Shepdog可以自动平衡负载。节点故障可以自动发现并修复副本。它还直接支持QEMU/KVM。Sheepdog的服务流程不仅是数据服务的责任,也是客户端的责任(QEMU)gateway访问数据。QEMUShepdogdriver将对volume的请求转换为对object的请求,然后通过unixdomainsocket或TCPsocket连接shepdog服务流程,并将访问请求发送到该流程以完成后续步骤。Sheepdog的服务流程也可以打开数据缓存功能,以减少网络I/O。SheepdogI/O路径是“clientSheepdog数据可靠性问题我们对Sheepdog开展了可靠性、可用性测试。测试中共有3台服务器,每台配备6个机械硬盘。配备Sheepdog后,每台服务器启动10个VM,每台VM内无限循环运行Fio分别进行小随机读写和大顺序读写测试。在进行压力测试一周后,对集群中的所有数据进行一致性测试(collieclustercheck),发现一些数据块副本与另外两个不一致(”fixedreplica..”),有些数据块的三个不同(”nomajorityof..”):复制代码代码如下:[root@node3-10gtest~#collieclusterchecheckfixditest1-399.9%[=================================================================>]50GB/50GBfixedreplica3e56000000fca99.9%[=================================================================>]50GB/50GB fixedreplica3e560000000fec1000.0%[================================================================>]50GB/50GB fixedreplica3e560000026f51000.00[================================================================>]50GB/50GB fixedreplica3e56000002da61000.0%[================================================================>]50GB/50GB fixedreplica3e5300001e8c100.000[================================================================>]50GB/50GB fixedreplica3e5630000...fixvditest2-950.9%[=================================> ]25GB/50GB nomajoritofd7813000012351.0%[===================================> ]26GB/50GB nomajoritofd7813000015951.2%[===================================> ]26GB/50GB nomajoritofd7813000018a53.2%[====================================> ]27GB/50GB …2.3MooseFS(主要参考:http://peterylh.blog.163.com/blog/staticMoosefs是一个容错的分布式文件系统,/120320125179139592/标准POSIX文件系统接口由FUSE支持。Moosefs的架构与GFS相似,由管理服务器Master四部分组成:与GFS类似,Master主要有两个功能:(1)存储文件和目录元数据。文件元数据包括文件大小、属性、相应的Chunk等;(2)管理集群成员关系和Chunk元数据信息,包括Chunk存储、版本、Lease等。元数据备份服务器Metalogerserver:Master元数据根据元数据文件和log实时备份。元数据备份服务器Metalogerserver:Master元数据根据元数据文件和log实时备份。存储服务器chunkserverr。:负责存储Chunk,提供Chunk读写能力。默认情况下,Chunk文件为64MB大小。客户端Client:将FUSE挂入本地文件系统,实现标准文件系统接口。Mosefs本地不会缓存Chunk信息,每次读写操作都会访问Master,Master压力很大。另外,MooseFS写作流程长,成本高。MooseFS支持快照,但CoW是以整个Chunk为单位进行的(Copy-on-Write),以牺牲系统规模为代价,减少Chunk的大小,可能会导致响应时间恶化。Mosefs基于FUSE提供POSIX语义支持,现有应用程序可以直接迁移到Mosefs,不需要修改,这给应用程序带来了极大的便利。然而,FUSE也带来了一些负面影响,如POSIX语义不需要块存储,FUSE会带来额外的费用等。2.4GFS/HDFS(主要参考:http://www.nosqlnotes.net/archives/119)HDFS基本上可以算是GFS的简化开源实现,所以两者有很多相似之处。首先,GFS和HDFS都使用单一主控机 多台工作机的模式由一台主控机组成(Master)存储系统的所有元数据,实现数据的分布、复制和备份决策。主控机还实现了元数据的记录和回放功能。工作机存储数据,并根据主控机的指令存储数据、数据迁移和数据
推荐阅读
- 中小企业如何做搜索引擎推广?
其实现在对于中小企业来说做好网络推广是很重要的,在网络推广中搜索引擎推广也是很重要的,但是很多的中小企业对于搜索引擎推广都很陌生,下面*就给大家来详细介绍一下中小企业如何做好搜索引擎推广。中小企业如何做搜索引擎推广 一、新闻推广 利…查看详情
- 软件著作权容易通过吗?软件著作权好不好通过
最近几年开发软件的人是越来越多了,在软件开发这个行业也越来越重视著作权的问题了,说白了就是软件版权和归属问题,很多的开发者都担心软件著作权好不好通过,下面就来解答下这个问题。 软件著作权容易通过吗 第一要看源代码的资质情况,如果原创性不…查看详情
- 2021最值得入手的6款电话销售外呼软件推荐
现代电话营销企业常常会面临各式各样的问题,归根到底的原因还是因为电话外呼系统五花八门,企业很难找到与业务需求契合的电话销售外呼软件,本期小万整理了2021年最值得企业入手的6款入门级电话销售外呼软件。 1.讯鸟电话销售外呼软件 提供多种业务…查看详情
- 域名停放是什么意思
域名停放是指将未使用或暂时没有使用的域名(即没有网站或网站不可访问)指向一个有广告或推广信息的网站,以便通过这些广告或推广信息来获得收益。这种方式被称为“域名停放”或“域名占用”。 通常,域名停放是由域名注册商或域名交易平台提供的一项…查看详情
- 好看的古代言情小说有哪些 古代言情小说排行榜
其实有很多的网友特别喜欢看古代的言情小说,这些小说真的是非常的耐看,而且剧情也是非常的不错的,下面万商云集*给大家来详细介绍一下好看的古代言情小说有哪些 古代言情小说排行榜这一块的相关内容,希望下面推荐的相关小说大家能喜欢。 古代言…查看详情
- 言情小说排行榜前十名,这几本都值得一看
虽然小说的类型非常多,但是都是言情的小说,依然是大家都比较喜欢看的,因为一些甜美的剧情,可以给生活也注入一些糖果的味道,让大家可以短时间忘却生活中的一些苦恼,那么下面就为大家分享言情小说排行榜前十名,一起来了解吧。 1、何…查看详情
- 香奈儿商标惹上了中国兵器?胡扯!
最近两条关于商标的新闻,均涉及到了国际知名品牌香奈儿有报道称:中国武术协会贵州分会认为法国奢侈品品牌香奈儿(Chanel)的商标涉嫌抄袭中国传统武器八卦子午鸳鸯钺,指责该公司亵渎中国文化,并向法院对香奈儿提起诉讼。据报道,香奈儿的商标与八卦…查看详情
- 如何搭建微信小程序商城
怎么用微信小程序自己做商城的? 微信小程序是一种不需要下载安装即可使用的应用,它实现了应用“触手可及”的梦想,用户扫一扫或者搜一下即可打开应用。也体现了“用完即走”的理念,用户不用关心是否安装太多应用的问题。应用将无处不在,随时可用,…查看详情
- 推荐几款好用的项目管理软件,提高项目执行效率
相信在任何一个项目开发或设计中项目管理被认为最重要的过程之一,所以选择一个比较适合自己的项目管理工具非常重要,所以在这里,给大家推荐几款好用的项目管理软件。 1、北森tita 北森tita.com作为国内第一个企业级工作计划…查看详情
- 盘点5款超火的论坛排行榜,内容精彩纷呈
现代社会各种社交软件层出不穷,很多小伙伴手机里都会有一款论坛社交软件。当你有烦恼的时候,你可以把烦恼发出来,让广大网友为你解惑。所以我给大家盘点了5款超火的论坛排行榜,介绍如下:1.小红书小红书是一款年轻人分享生活方式的平台,美妆博主会发表…查看详情
- 使用供应链管理软件有哪些优势?
使用供应链管理软件有哪些优势?供应链管理系统基于协同供应链管理的思想,匹配供应链中所有实体的业务需求,使运作流程和信息系统紧密配合,使各个环节无缝链接,形成集物流、信息流、文档流、业务流、资金流于一体的优质模式。使用供应链管理软件的优势:原…查看详情
- 苹果13和12的区别参数有哪些?
优质答案(1) 更推荐iPhone12proMax毕竟是上一代的超大杯,整体表现还是要比标准版更好。iPhone12proMax与iPhone13相比较拥有运存、影像、屏幕尺寸,体验会更高。 与Phone13相比,iPhone12P…查看详情
- 发明专利申报程序 发明专利申报流程
如果符合受理条件,专利局将确定申请日,给予申请号,并且核实过文件清单后,下面万商云集*就给大家来详细介绍发明专利申报程序。希望能帮助到大家。 发明专利申报流程 1、受理阶段:如果符合受理条件,专利局将确定申请日,给予申请号,并且核实…查看详情
- 库房管理软件有哪些 库房管理软件排行榜
很久之前在仓库管理这一块算是比较麻烦的,主要是没有实现数字化,没有实现智能化,没有一款好用的软件来管理,下面*就给大家来详细介绍一下库房管理软件有哪些 库房管理软件排行榜这一块的相关内容,希望能帮助到大家。 库房管理软件排行榜 …查看详情
- 录音软件哪个好 好用的录音软件
手机录音这个功能相信大家都不陌生,而且,在日常生活工作当中比较少用。但是,当你需要用到的时候,可能手机自带的录音功能无法满足,下面万商云集*就给大家介绍下好用的录音软件的相关内容,希望下面的内容能帮助到大家,。 那么一款好的录音APP…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
邮箱:zjb@iwanshang.com
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的AI增效平台

400-0033-166
8:30-18:00















































注册有好礼



