服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

分析美团的Ursa分布式存储系统

2020-12-30 13:39:48 阅读(263 评论(0)

1.Ursa云硬盘在IaaS云计算平台中起着至关重要的作用,几乎已经成为亚马逊EBS等必备组件(ElasticBlockStore)、盘古、OpenStack中的Cinder等阿里云。云硬盘可以为云计算平台带来更高的数据可靠性和可用性、灵活的数据快照功能、更好的虚拟机动态迁移支持、更短的主机故障恢复时间等诸多优秀特性。随着万兆以太网的逐渐普及,云硬盘的优势得到了加强和突出,其必要性变得非常强。云硬盘的底层通常是分布式块存储系统。目前,CephRBD等开源领域也有一些这样的项目、Sheepdog。此外,虽然MooseFS和GlusterFS被称为文件系统,但它们也可以用来支持云硬盘,因为它们的特性接近块存储系统。在评估中,我们发现这些开源项目存在一些问题,使其难以直接应用于大规模生产系统。比如CephRBD效率低(CPU使用过高);Sheepdog在压力测试中丢失数据;Mosefs的POSIX语义支持、基于FUSE的架构、不完全开源的2.0版本等问题给其自身带来了诸多局限性;GlusterFS和Ceph属于红帽收购的开源存储系统,主要用于scale-out文件存储场景,在云计算领域使用不多。此外,这些存储系统在未来很难充分发挥万兆网卡和SSD的性能潜力。此外,这些存储系统很难充分发挥万兆网卡和SSD的性能潜力,也很难在未来承担沉重的责任。由于上述原因,美团云开发了一种新的分布式块存储系统Ursa,通过简单稳定的系统架构、高效的代码实现和仔细考虑各种非典型场景,实现了高可靠性、高可用性、高性能、低成本、可扩展性、易操作维护、易维护等目标。Ursa的名字起源于Dota中的熊战士,他具有很高的攻击速度、攻击力和生命值,分别隐喻存储系统中的IOPS、吞吐量和稳定性。2.1分布式块存储相关项目及技术Ceph(主要参考:https://www.ustack.com/blog/ceph_infra/)Ceph项目起源于其创始人Sageweil在加州大学SantaCruz分校攻读博士学位期间的研究课题。该项目于2004年开始。Sage在2006年的OSDI学术会议上发表了关于Ceph的论文,并提供了项目的下载链接,因此开始广为人知。2010年,Ceph客户端部分代码正式进入Linuxkernel2.6.34。Ceph还提供三个层次的分布式存储服务:对象、块和文件,其中只有块层存储与我们有关。由于块存储在IaaS云计算系统中占有重要地位,近年来Ceph的关注度显著提高。许多基于Ceph的云计算系统实例提供块存储服务,如UnitedStack、MirantisopenStack等。ceph性能测试测试版:0.81操作系统:centos6.x测试工具:fio服务器配置:CPU:IntelXeone5-2650v2@2.6GHzRAM:96GBNIC:10GbeHDD:6NLSAS,7200RPMRAIDController:DellH710p(LSI2208with1GBNVRAM)服务器数量:4。其中一个是兼职客户端。注意:由于客户端位于存储服务器上,四分之一的吞吐率不通过网卡。测试结果如下:读IOPS:16407(此时客户端CPU占用率超过500%,5台服务器CPU的总利用率接近500%。写IOPS:941顺序读吞吐率:21859KB/s顺序写吞吐率:67242KB/s顺序读延迟:1.6ms(664IOPS)顺序写延迟:4.4ms(225IOPS)网络ping值:0.1324ms本地硬盘顺序读写延迟:0.03332ms(29126IOPS)从测试角度看。Ceph阅读吞吐率正常,但吞吐率低于阅读的1/3,性能低;读写延迟率明显大于网络延迟和磁盘I/O延迟之和;CPU占用率太高。2.2Sheepdog(主要参考:http://peterylh.blog.163.com/blog/static/12033201221594937257/)Sheepdog是日本NTT实验室Moritakazutaka为虚拟化平台创建的分布式块存储开源项目,2009年开源[1]。自2011年9月以来,一些淘宝工程师加入了Sheepdog项目和Corosyncc等相关开源项目、开发Acccord。自2011年9月以来,一些淘宝工程师加入了Sheepdog项目和Corosyncc等相关开源项目、Accord的开发。Sheepdog主要由集群管理和存储服务两部分组成,其中集群管理目前由Corosync或Zookper完成,存储服务是新实现的。Sheepdog采用无中心节点的全对称架构,基于一致性,实现从ObjectID到存储节点的定位:每个节点分为多个虚拟节点,像ObjectID一样,采用64位整数唯一标识,每个虚拟节点负责一段ObjectID范围,包括节点ID。ObjectID对应的虚拟节点存在于Dataobject副本中,以及后续的节点。Sheepdog没有单点故障问题,存储容量和性能可以线性扩展。新节点可以通过简单的配置添加到集群中,Shepdog可以自动平衡负载。节点故障可以自动发现并修复副本。它还直接支持QEMU/KVM。Sheepdog的服务流程不仅是数据服务的责任,也是客户端的责任(QEMU)gateway访问数据。QEMUShepdogdriver将对volume的请求转换为对object的请求,然后通过unixdomainsocket或TCPsocket连接shepdog服务流程,并将访问请求发送到该流程以完成后续步骤。Sheepdog的服务流程也可以打开数据缓存功能,以减少网络I/O。SheepdogI/O路径是“clientSheepdog数据可靠性问题我们对Sheepdog开展了可靠性、可用性测试。测试中共有3台服务器,每台配备6个机械硬盘。配备Sheepdog后,每台服务器启动10个VM,每台VM内无限循环运行Fio分别进行小随机读写和大顺序读写测试。在进行压力测试一周后,对集群中的所有数据进行一致性测试(collieclustercheck),发现一些数据块副本与另外两个不一致(”fixedreplica..”),有些数据块的三个不同(”nomajorityof..”):复制代码代码如下:[root@node3-10gtest~#collieclusterchecheckfixditest1-399.9%[=================================================================>]50GB/50GBfixedreplica3e56000000fca99.9%[=================================================================>]50GB/50GB   fixedreplica3e560000000fec1000.0%[================================================================>]50GB/50GB   fixedreplica3e560000026f51000.00[================================================================>]50GB/50GB   fixedreplica3e56000002da61000.0%[================================================================>]50GB/50GB   fixedreplica3e5300001e8c100.000[================================================================>]50GB/50GB   fixedreplica3e5630000...fixvditest2-950.9%[=================================>                ]25GB/50GB   nomajoritofd7813000012351.0%[===================================>               ]26GB/50GB   nomajoritofd7813000015951.2%[===================================>               ]26GB/50GB   nomajoritofd7813000018a53.2%[====================================>              ]27GB/50GB   …2.3MooseFS(主要参考:http://peterylh.blog.163.com/blog/staticMoosefs是一个容错的分布式文件系统,/120320125179139592/标准POSIX文件系统接口由FUSE支持。Moosefs的架构与GFS相似,由管理服务器Master四部分组成:与GFS类似,Master主要有两个功能:(1)存储文件和目录元数据。文件元数据包括文件大小、属性、相应的Chunk等;(2)管理集群成员关系和Chunk元数据信息,包括Chunk存储、版本、Lease等。元数据备份服务器Metalogerserver:Master元数据根据元数据文件和log实时备份。元数据备份服务器Metalogerserver:Master元数据根据元数据文件和log实时备份。存储服务器chunkserverr。:负责存储Chunk,提供Chunk读写能力。默认情况下,Chunk文件为64MB大小。客户端Client:将FUSE挂入本地文件系统,实现标准文件系统接口。Mosefs本地不会缓存Chunk信息,每次读写操作都会访问Master,Master压力很大。另外,MooseFS写作流程长,成本高。MooseFS支持快照,但CoW是以整个Chunk为单位进行的(Copy-on-Write),以牺牲系统规模为代价,减少Chunk的大小,可能会导致响应时间恶化。Mosefs基于FUSE提供POSIX语义支持,现有应用程序可以直接迁移到Mosefs,不需要修改,这给应用程序带来了极大的便利。然而,FUSE也带来了一些负面影响,如POSIX语义不需要块存储,FUSE会带来额外的费用等。2.4GFS/HDFS(主要参考:http://www.nosqlnotes.net/archives/119)HDFS基本上可以算是GFS的简化开源实现,所以两者有很多相似之处。首先,GFS和HDFS都使用单一主控机 多台工作机的模式由一台主控机组成(Master)存储系统的所有元数据,实现数据的分布、复制和备份决策。主控机还实现了元数据的记录和回放功能。工作机存储数据,并根据主控机的指令存储数据、数据迁移和数据

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

参考液晶电视销量排行榜,选择合适的家用液晶电视

因为现在很多人都想要追求比较高清的观影模式,所以会想要为家庭选择一些液晶电视机,但是因为自己在选择电视的经验不是很充足,所以就会陷入两难的抉择,具体可以参考以下的液晶电视销量排行榜。1、酷开酷开始终走在世界的前列,因为在电视领域深耕了多年以…查看详情

小白必看 | 版权登记保护范围

我们在生活中方方面面都与版权打着交道,又随着大家对版权意识的逐渐增强,版权保护、版权登记愈发重要。但即便大家有这样的意识,不过对于版权的相关内容也依旧谈不上熟悉。接下来,小万就来为大家介绍一下关于版权登记保护范围吧! 图片来源于网络 ▍ …查看详情

【供参考】版权登记作品说明书模板+范文

对于没有版权登记经验的新手来说,最好地选择其实是委托版权登记代理公司代为办理。如此,无论是登记流程还是资料填写(如版权登记申请表、版权登记作品说明书等),亦或是后续进度跟进,都无需自己再操心或因为不知如何操作而延误进度。 图片来源于网络 但…查看详情

小编带你了解具体的服装购物网站排行榜

大家网上购物不仅仅是买一些日用品了,更多的人会选择在网上购买一些服装,而且现在互联网资源发展的比较好,有专门的服装购物网站供给大家使用,具体来说有以下的服装购物网站排行榜。 1、唯品会 唯品会其实专门做的是衣服品牌,而且大…查看详情

2021hr管理软件免费版排行榜

一款高效的hr管理软件免费版可以帮到企业降低成本增加效率,加快数字化进程。那么市面上我们应该如何精准的选择一个hr管理软件呢?我们对数款软件进行了测评,最终整理了这篇2021hr管理软件免费版排行榜。 一、hrSaaShr管理软件免费版 一…查看详情

制作幻灯片软件有哪些 制作幻灯片软件排行榜

  现在很多的场景都会使用到ptt,而且大家经常会制作ptt,下面小编给大家来详细介绍一下制作幻灯片软件有哪些 制作幻灯片软件排行榜这一块的相关内容,下面的这些软件都是制作ptt比较简单的,。  制作幻灯片软件排行榜  1、《PPT在线…查看详情

盘点钮门快递系统的作用与亮点

随着科技发展的日新月异,物流行业的成长也是十分迅猛,与此同时针对其研发的各种快递系统更是开始大批出现在人们的视野当中,那么哪款快递系统才是真正适合大众的呢?在这里我要为大家推荐钮门快递系统,下面我会为大家一一盘点钮门快递系统的作用与亮点。 …查看详情

手机浏览器哪个好用速度快

手机浏览器是我们在移动设备上用来访问互联网的主要工具之一。选择一个好用速度快的手机浏览器对于提高我们的上网体验至关重要。以下是一些被认为速度较快且功能齐全的手机浏览器。1. Google Chrome:Google Chrome是一款受欢迎…查看详情

B2B网站建设需要注意哪些方面?

B2B网站是是现阶段比较成熟的一种网站,能实现商家之间直接交流合作,提升双方的满意度。很多企业在B2B网站建设方面更是始终不得窍门,难以发挥出网站的最大功能。现在就来了解一下进行B2B网站建设有那些方面是需要着重注意的。B2B网站建设需要注…查看详情

淘宝新店如何提升信誉值

现在很多网购消费者在淘宝上购买宝贝的时候,都会看商家的信誉值,如果商家的信誉不好,可能会直接pass掉,这就给新入驻淘宝的店长带来了难题,新店没有信誉难道就不能在淘宝上开店赚钱呢吗,答案当然是否定的,不然淘宝也就没有存在的价值了。我们需要明…查看详情

windows10截屏快捷键是哪个

  Windows 10是一个非常流行的操作系统,它拥有许多方便的快捷键,其中一个常用的功能就是截屏。在日常的工作中,我们常常需要捕捉屏幕上的某些部分或全屏内容,以便于向他人或自己进行展示或保存。因此,Windows 10提供了多种快捷…查看详情

企业产品好、服务好,为什么要做网络推广?

为什么要做网络推广?一定要做网络推广吗?这是企业老板十分疑惑并想寻求一个答案的问题。尤其是认为自己产品好、服务好,在市场中具有竞争优势的老板,对此更加疑惑。图片来源于网络 为什么要做网络推广?当企业老板了解网络推广的优势后,相信心中会明了。…查看详情

光端机是什么设备

光电转换器和光端机的区别?区别1:功能不同。光纤收发器和光电转换器只有光电转换的功能,光端机具有联网控制,身份验证,光电转换,协议转换等功能。 区别2:使用环境不同。光纤收发器和光电转换器用于局域网远距离通信。光端机是宽带出口设备用于…查看详情

小服装店收银系统有安装的必要吗?

部分运营者会存在这样一种思维,只有规模大一点的服装店或者连锁品牌才用得到服装收银系统,对于小服装店收银系统有安装的必要吗这个问题一直存在疑惑,对于这些店面来讲,服装收银系统真的没有用吗? 答案是有必要,但在系统选型时建议商家选择对应业务需求…查看详情

微信小程序PHP后台实现的方法

公众号小程序怎么开发?1.注册成为微信公众号开发者。 2.进入“开发”页面,申请开通小程序功能。 3.进入小程序管理后台,创建一个新的小程序。 4.下载小程序开发工具,进行开发和调试。 5.编写小程序代码和UI界面,与后端服务器交互…查看详情

最新文章