服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

分析美团的Ursa分布式存储系统

2020-12-30 13:39:48 阅读(273 评论(0)

1.Ursa云硬盘在IaaS云计算平台中起着至关重要的作用,几乎已经成为亚马逊EBS等必备组件(ElasticBlockStore)、盘古、OpenStack中的Cinder等阿里云。云硬盘可以为云计算平台带来更高的数据可靠性和可用性、灵活的数据快照功能、更好的虚拟机动态迁移支持、更短的主机故障恢复时间等诸多优秀特性。随着万兆以太网的逐渐普及,云硬盘的优势得到了加强和突出,其必要性变得非常强。云硬盘的底层通常是分布式块存储系统。目前,CephRBD等开源领域也有一些这样的项目、Sheepdog。此外,虽然MooseFS和GlusterFS被称为文件系统,但它们也可以用来支持云硬盘,因为它们的特性接近块存储系统。在评估中,我们发现这些开源项目存在一些问题,使其难以直接应用于大规模生产系统。比如CephRBD效率低(CPU使用过高);Sheepdog在压力测试中丢失数据;Mosefs的POSIX语义支持、基于FUSE的架构、不完全开源的2.0版本等问题给其自身带来了诸多局限性;GlusterFS和Ceph属于红帽收购的开源存储系统,主要用于scale-out文件存储场景,在云计算领域使用不多。此外,这些存储系统在未来很难充分发挥万兆网卡和SSD的性能潜力。此外,这些存储系统很难充分发挥万兆网卡和SSD的性能潜力,也很难在未来承担沉重的责任。由于上述原因,美团云开发了一种新的分布式块存储系统Ursa,通过简单稳定的系统架构、高效的代码实现和仔细考虑各种非典型场景,实现了高可靠性、高可用性、高性能、低成本、可扩展性、易操作维护、易维护等目标。Ursa的名字起源于Dota中的熊战士,他具有很高的攻击速度、攻击力和生命值,分别隐喻存储系统中的IOPS、吞吐量和稳定性。2.1分布式块存储相关项目及技术Ceph(主要参考:https://www.ustack.com/blog/ceph_infra/)Ceph项目起源于其创始人Sageweil在加州大学SantaCruz分校攻读博士学位期间的研究课题。该项目于2004年开始。Sage在2006年的OSDI学术会议上发表了关于Ceph的论文,并提供了项目的下载链接,因此开始广为人知。2010年,Ceph客户端部分代码正式进入Linuxkernel2.6.34。Ceph还提供三个层次的分布式存储服务:对象、块和文件,其中只有块层存储与我们有关。由于块存储在IaaS云计算系统中占有重要地位,近年来Ceph的*度显著提高。许多基于Ceph的云计算系统实例提供块存储服务,如UnitedStack、MirantisopenStack等。ceph性能测试测试版:0.81操作系统:centos6.x测试工具:fio服务器配置:CPU:IntelXeone5-2650v2@2.6GHzRAM:96GBNIC:10GbeHDD:6NLSAS,7200RPMRAIDController:DellH710p(LSI2208with1GBNVRAM)服务器数量:4。其中一个是兼职客户端。注意:由于客户端位于存储服务器上,四分之一的吞吐率不通过网卡。测试结果如下:读IOPS:16407(此时客户端CPU占用率超过500%,5台服务器CPU的总利用率接近500%。写IOPS:941顺序读吞吐率:21859KB/s顺序写吞吐率:67242KB/s顺序读延迟:1.6ms(664IOPS)顺序写延迟:4.4ms(225IOPS)网络ping值:0.1324ms本地硬盘顺序读写延迟:0.03332ms(29126IOPS)从测试角度看。Ceph阅读吞吐率正常,但吞吐率低于阅读的1/3,性能低;读写延迟率明显大于网络延迟和磁盘I/O延迟之和;CPU占用率太高。2.2Sheepdog(主要参考:http://peterylh.blog.163.com/blog/static/12033201221594937257/)Sheepdog是日本NTT实验室Moritakazutaka为虚拟化平台创建的分布式块存储开源项目,2009年开源[1]。自2011年9月以来,一些淘宝工程师加入了Sheepdog项目和Corosyncc等相关开源项目、开发Acccord。自2011年9月以来,一些淘宝工程师加入了Sheepdog项目和Corosyncc等相关开源项目、Accord的开发。Sheepdog主要由集群管理和存储服务两部分组成,其中集群管理目前由Corosync或Zookper完成,存储服务是新实现的。Sheepdog采用无中心节点的全对称架构,基于一致性,实现从ObjectID到存储节点的定位:每个节点分为多个虚拟节点,像ObjectID一样,采用64位整数唯一标识,每个虚拟节点负责一段ObjectID范围,包括节点ID。ObjectID对应的虚拟节点存在于Dataobject副本中,以及后续的节点。Sheepdog没有单点故障问题,存储容量和性能可以线性扩展。新节点可以通过简单的配置添加到集群中,Shepdog可以自动平衡负载。节点故障可以自动发现并修复副本。它还直接支持QEMU/KVM。Sheepdog的服务流程不仅是数据服务的责任,也是客户端的责任(QEMU)gateway访问数据。QEMUShepdogdriver将对volume的请求转换为对object的请求,然后通过unixdomainsocket或TCPsocket连接shepdog服务流程,并将访问请求发送到该流程以完成后续步骤。Sheepdog的服务流程也可以打开数据缓存功能,以减少网络I/O。SheepdogI/O路径是“clientSheepdog数据可靠性问题我们对Sheepdog开展了可靠性、可用性测试。测试中共有3台服务器,每台配备6个机械硬盘。配备Sheepdog后,每台服务器启动10个VM,每台VM内无限循环运行Fio分别进行小随机读写和大顺序读写测试。在进行压力测试一周后,对集群中的所有数据进行一致性测试(collieclustercheck),发现一些数据块副本与另外两个不一致(”fixedreplica..”),有些数据块的三个不同(”nomajorityof..”):复制代码代码如下:[root@node3-10gtest~#collieclusterchecheckfixditest1-399.9%[=================================================================>]50GB/50GBfixedreplica3e56000000fca99.9%[=================================================================>]50GB/50GB   fixedreplica3e560000000fec1000.0%[================================================================>]50GB/50GB   fixedreplica3e560000026f51000.00[================================================================>]50GB/50GB   fixedreplica3e56000002da61000.0%[================================================================>]50GB/50GB   fixedreplica3e5300001e8c100.000[================================================================>]50GB/50GB   fixedreplica3e5630000...fixvditest2-950.9%[=================================>                ]25GB/50GB   nomajoritofd7813000012351.0%[===================================>               ]26GB/50GB   nomajoritofd7813000015951.2%[===================================>               ]26GB/50GB   nomajoritofd7813000018a53.2%[====================================>              ]27GB/50GB   …2.3MooseFS(主要参考:http://peterylh.blog.163.com/blog/staticMoosefs是一个容错的分布式文件系统,/120320125179139592/标准POSIX文件系统接口由FUSE支持。Moosefs的架构与GFS相似,由管理服务器Master四部分组成:与GFS类似,Master主要有两个功能:(1)存储文件和目录元数据。文件元数据包括文件大小、属性、相应的Chunk等;(2)管理集群成员关系和Chunk元数据信息,包括Chunk存储、版本、Lease等。元数据备份服务器Metalogerserver:Master元数据根据元数据文件和log实时备份。元数据备份服务器Metalogerserver:Master元数据根据元数据文件和log实时备份。存储服务器chunkserverr。:负责存储Chunk,提供Chunk读写能力。默认情况下,Chunk文件为64MB大小。客户端Client:将FUSE挂入本地文件系统,实现标准文件系统接口。Mosefs本地不会缓存Chunk信息,每次读写操作都会访问Master,Master压力很大。另外,MooseFS写作流程长,成本高。MooseFS支持快照,但CoW是以整个Chunk为单位进行的(Copy-on-Write),以牺牲系统规模为代价,减少Chunk的大小,可能会导致响应时间恶化。Mosefs基于FUSE提供POSIX语义支持,现有应用程序可以直接迁移到Mosefs,不需要修改,这给应用程序带来了极大的便利。然而,FUSE也带来了一些负面影响,如POSIX语义不需要块存储,FUSE会带来额外的费用等。2.4GFS/HDFS(主要参考:http://www.nosqlnotes.net/archives/119)HDFS基本上可以算是GFS的简化开源实现,所以两者有很多相似之处。首先,GFS和HDFS都使用单一主控机 多台工作机的模式由一台主控机组成(Master)存储系统的所有元数据,实现数据的分布、复制和备份决策。主控机还实现了元数据的记录和回放功能。工作机存储数据,并根据主控机的指令存储数据、数据迁移和数据

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

国内b2b网站有哪些 2022 国内b2b网站排行榜

  随着这几年的疫情的影响企业知道网络营销的重要性,但是很多一直苦找无门没有合适的自己互联网营销方式,我们来看下B2B不仅仅是建立一个网上的买卖者群体,它也为企业的之间的战略合作提供了基础。任何一家企业,不论它具有多强的技术实力或多好的经营…查看详情

一般商标价格多少

商标的价格因多种因素而异,包括地区、商标分类、申请途径以及专业服务费等。以下是关于商标价格的一般指导和相关信息:商标作为企业的重要资产之一,有助于区别和保护其产品或服务。商标的价格通常由以下几个方面决定:1. 地区:商标注册费用在不同国家和…查看详情

企业沟通不畅 效率低?总管家CRM来帮你

“工欲善其事必先利其器”出自论语,意思是:一个工匠要想工作做得好,必须使用锋利的工具。对于普通的销售员来讲,想要有效管理客户,快速提升销售业绩,必须使用高效的跟单工具。对于企业来讲,想要提升管理水平,提高整体效益,必须借助先进的管理工具。图…查看详情

织梦模板首页修改教程

织梦模版下修改列表页头部模版和列表页底部模版后,网站的其他网页还是没有成功。希望好心人给以讲解?首先你看下,你修改的所谓列表页头部模板和底部模板在其他的模板文件是不是调用同一个,如果是的话,就更新缓存下。 然后在生成,织梦经常是缓存导致修…查看详情

电视剧免费看的软件有哪些 电视剧免费看的软件排行榜

  现在市面上大多数电视直播软件都是要收费的,而且这些收费电视直播软件还是比较贵的,但是也有很多电视直播软件是不收费的,下面小编就给大家来详细介绍一下电视剧免费看的软件有哪些 电视剧免费看的软件排行榜这一块的相关内容,希望能帮助到大家。…查看详情

商标可随意使用吗?

网站logo和名称如果没注册商标的话,别人使用算侵权吗?不算。 我们国家对商标的适用原则是申请在先原则,就是谁先在商标局申请,这个商标就是谁的。如果都没有申请,肯定是谁都可以使用的。商标注册就是给予给予商标注册人以商标专用权,防止他人侵权…查看详情

域名注册管理机构不接受你的域名申请?可能是你不了解这些!

域名注册管理机构并不是指域名市场或平台上接受个体域名注册申请的公司,它和域名注册服务商/代理商是有明显区别的,某个具体的域名注册申请业务并不在域名注册管理机构的责任范围,所以不接受你的域名注册申请也很正常。如果您遇到了被拒的情况,您可以了解…查看详情

万商云集通过CMMI 3级认证,研发管理能力获国际认可

近日,万商云集经过CMMI研究院主任评估师的严格评估,顺利通过CMMI3级认证,向业界展示了万商云集领先行业的研发管理能力和孜孜不倦的品牌追求。(CMMI3级认证证书) CMMI资质是美国CMMII1titute企业管理的资质认证,是目前在…查看详情

阅读神器!6款免费看小说软件推荐

看小说是许多人闲暇时打发时间的方式,市面上各种小说软件琳琅满目,不少是需要付费后才能阅读的,因此许多人会在网络上寻找一些免费的看小说软件。那么,免费的小说阅读APP哪个好用呢?今天就为大家5款免费的小说阅读器,一起来了解一下吧。…查看详情

合作伙伴:葛氏济世堂

品牌介绍葛氏济世堂是四川省利健济世科技有限公司于2014年1月28日注册的第5类医疗用品品牌,注册号:9998238。葛氏济世堂自成立以来,坚持为顾客提供医药、健康理疗服务,葛氏济世堂的产品从制作到最终为理疗者服务,全程由公司核心团队严格把…查看详情

线上签合同用什么软件?线上签合同用软件排名

因为现在已经进入到了一个网络的时代,所以难免也会有一些需要线上签合同的情况出现,如果没有一个好用的工具,在平时生活中,自然就会受到一些影响。可以选择使用线上签合同的软件,不仅功能强大,同时也可以快速完成线上签合同的需求,那么下面…查看详情

新能源汽车品牌有哪些 新能源汽车十大名牌

  新能源汽车领域这两年涌进了不少新兴的汽车品牌,而且国家也在大力发展新能源汽车,目前市面上的新能源汽车品牌还是i非常的多的,下面万商云集小编给大家来详细介绍一下新能源汽车品牌有哪些新能源汽车十大名牌,不知道下面的新能源汽车品牌有没有大家喜…查看详情

苹果怎么弄抖音动态壁纸

  苹果怎么弄抖音动态壁纸呢?这是一个相对较新的技巧,但非常流行。如果你不知道如何做,不用担心,下面将为您详细描述。  您需要将设备升级至iOS13以上的版本。苹果推出了一种名为“Live Photos”的功能,使您的照片可以动态地播放。…查看详情

为什么注册商标?企业容易被告侵权,赔偿他人损失

为什么注册商标?因为商标是企业建立自主品牌的第一步,是企业的形象,并可以帮助企业巩固市场地位。企业若不注册商标,则随时可能被他人侵犯自己权益或面临被告侵权的风险。 图片来源于网络 为什么注册商标?这五大理由你不能不知道。◤ 1. 获取法律…查看详情

如何做好网站建设和推广

很多中小企业在建设网站时,往往对建设工作和推广工作的开展非常盲目。致使网站上投入很多的精力和财力,却依然不能得到好的效果。那么如何才能做好网站建设和推广,使企业网站更具竞争力呢?第一、做好网站建设和推广的第一步就是完成建站 网站建设是提升企…查看详情

最新文章