针对京东应用开发平台jae的一些核心技术进行分析
2021-01-04 10:27:22 阅读(187) 评论(0)
JD.COMPaaS平台的主要服务对象是两类人,一类是个人开发者,二类是JD.COMISV。在数据开放平台日益成熟的背景下,他们都希望以最低的成本方便地部署自己的应用程序,提高生产力。而且京东Paas平台是为了满足开发者和ISV的这一需求而开发的。JAEEEAS平台的核心是JAE(JingdongAppEngine),以CloudFoundry为核心,之所以选择CloudFoundry,是因为CloudFoundry是社区中最早开源、最成熟、最活跃的基础PaaS平台。为了为开发人员提供更方便的服务,JAE云化基本服务,访问高可用MySQL服务、Redis缓存集群服务、消息队列等各种应用组件服务;此外,它还结合应用开发工具,为开发人员提供github代码托管服务、云测试、Java工程云编译和资源统计信息,使开发人员更加*自己的代码业务。此外,JAE对平台上托管的应用程序进行健康监控,支持查看应用程序日志,并提供其他安全服务。让开发者只关心自己的应用代码,JAE为其提供其他一切,大大提高了开发者的效率,降低了开发成本。下图描述了JAE与PaaS平台用户及其他相关服务的关系。JAE还根据JD.COMPaaS平台的需求进行了许多有针对性的功能扩展。本文主要讨论JAE的核心技术点。JAE的其他基本服务将参考其官方网站:智能路由(LoadBalance)众所周知,CloudFoundry支持设置应用的实例数。但是,当并发量增加时,请求(Request)能否均匀分配给后端的例子?对于多实例的应用,Cloudfoundry采用随机策略响应客户端的要求,不能公平有效地利用实例资源。当并发量达到峰值时,有可能发生雪崩。为了解决这个潜在的问题,JAE借鉴了nginx的路由策略,采用了权重(weight)算法中,负载越小,响应请求的机会就越大。那么,我们需要进一步解决的问题是:如何计算实例的负载,以及在收到请求后如何分流?下图是JAE的模块关系图:所有请求首先到达router模块,router保存所有实例的路由信息(即实例的ip和port),并决定哪个实例来响应请求。每个实例的ip和port信息都是dea模块通过nats消息总线转发给router的。实现原理是dea将服务器上的所有实例信息发送给nats,router订阅消息,收到后保存在路由表中,通过过期失效机制定期获取最新实例信息。为了让router获得每个例子的负载信息。我们对dea模块进行了改造,每次向nats发送消息时,我们都会“携带”此时此刻的负载信息。dea模块收集dea服务器本身及所有实例的CPU利用率、内存利用率、I/O等原始信息一起发送给router。router决定如何从这些原始数据中计算负载值。至于用什么算法来计算负载,这是router自己的职责范围。我们采用了以下算法:实例真实负载=(vm负载*30% *70%实例负载*100%vm负载=CPU已使用%*30% Mem已经使用了%*30%的实例负载=CPU已经使用了%*30% Mem在上述算法中使用了%*30%,在计算实例的负载值时,我们考虑了dea的因素,因为dea实际上是服务器(虚拟机),而实例运行在dea上的每个过程中。如果一个dea的负载很高,而其上一个例子的负载很低,那么router可能不会将请求交给这个例子。如果一个dea的负载非常高,而其上一个示例的负载非常低,那么router可能不会将请求交给这个示例。所有算法都应该考虑dea的感觉。计算每个应用实例的负载值后,JAE提供了以下平衡策略:从以下代码可以看出,Router采用了weight策略。有状态的(stateful)未经智能路由处理请求。例如,当session存在时,在第一个请求之后,服务器将响应请求的实例信息回写到客户端的cookie中。当router收到客户端的下一个请求时,它将转发给同一个例子。有人可能会问,这是否会影响请求的响应时间?答案是肯定的,但影响很小,因为算法是纯数值计算,效率很高。目前算法只考虑了几个常用的因素,还有优化的空间,比如增加负载的因素,比如I/O,例带宽的使用等。弹性伸缩(Auto-scaling)在最后一个话题中,当并发量继续增加时,所有实例的负载都可以通过智能路由平衡,但如何应对实例负载的持续增加,并面临应用程序随时不可用的情况?只需添加例子!虽然我们可以通过JAE控制界面轻松地增加或减少应用程序的实例数(只要资源满足)。然而,这种纯手动方法显然是不可取的。JAE采用弹性伸缩机制自动化这一过程。常用的方法是定义扩展规则。以下是JAE管理页面的规则设置:规则是用户层面的全球定义。每个用户可以创建多个规则,并在具体应用绑定规则后生效。该规则的正确执行取决于“过去几分钟平均申请次数”的指标。我们通过实时统计获得这个指标。实现流程图如下图所示:所有router服务器均安装agent、flume集群实时收集routernginx访问日志,保存在redis中,定期清理,同时将分析结果保存在同一redis集群中,规则引擎从redis中获取数据,与应用程序的规则进行比较,判断是否触发规则。然后调用cloudcontrolerestfulapi来扩展或减少实例数。向云日志和云监控模块发送原始日志和分析结果,为应用程序提供相应的功能。将原始日志和分析结果传输给云日志和云监控模块,为应用程序提供相应的功能。例如,查看和搜索dashboard管理页面上的应用程序日志;应用PV、UV监控趋势图等。智能启动(Auto-loading)如果80%的应用程序不活跃,但总是占用资源,就会造成巨大的浪费。智能启动的意思是,当某个应用程序在一段时间内未收到请求时,应用程序将暂时休眠,并在下一个请求到达时立即启动。长时间不要求的应用,再次访问时,会有秒级加载延迟。如图所示,访问日志的计算结果也用于智能启动,计算统计周期中每个应用程序的访问次数,并保存在Redis集群中。智能启动模块从CDB过滤获取待处理的应用列表,依次获取Redis周期内应用程序的总访问次数。如果发现为零,首先调用Ccrestfulapi停止应用程序,然后将CCDB中的应用程序识别为Sleep状态,并通知Router更新路由表信息,使路由表中有所有正在运行的应用程序实例信息,还有sleep状态的应用信息。当Router收到下一次访问时,首先从路由表中找到相应的实例信息,发现该应用程序处于sleep状态,将激活该应用程序,并立即返回给客户端一个加载页面。当Router收到下一个访问时,首先从路由表中找到相应的实例信息,发现该应用程序处于sleep状态,将激活该应用程序,并立即返回给客户端一个正在加载的页面。通过刷新页面,您可以正常访问应用程序。下表从natsmessage解释了模块之间的交互:资源隔离和访问控制资源隔离是cloudfoundry的精髓。除了各种功能便于JAE开发外,最重要的是“安全感”。资源隔离意味着应用程序之间的资源相互隔离不受干扰。访问控制意味着在JAE内部,应用程序不能以任何方式相互访问或操作其他应用程序。但其他应用程序可以通过HTTP访问。JAE在整个过程中也做了一些尝试,在这里分享。JAE在整个过程中也做了一些尝试,在这里分享。Cloudfoundry使用warden实现资源隔离和访问控制,但JAE的第一版资源隔离策略使用vcapdev,当时没有warden。在当时的背景下,cloudfoundry官网还没有迁移到v2版,业内成功应用也相对较少。JAE采用稳中求进的方案,即在vcapdev的基础上,借鉴warden的思路,实现资源隔离和访问控制。接下来,我们将详细介绍JAE第一版的资源隔离实现方法。部署所需资源灵活,不仅支持单机部署,还支持多机部署,对个人开发者有很好的参考。如上图所示,实现JAE第一版资源隔离和访问控制的方法是vcapsafemode cgroup quota ACL。首先,vcapsafemode提供了访问控制功能,安全模式为dea服务器创建了n个用户,默认为32个用户,vap-user-11至vap-user-32.它属于vcap-dea用户组。启动应用程序实例分配用户,并将代码目录的所有者设置为此用户。如果实例停止,则回收用户。这可以简单地保证应用程序之间的访问控制,不同的应用程序(不同的用户)不能相互访问。vcapsafemode只设置了应用程序目录的权限,限制了目录间的访问,但大多数系统命令和系统文件,如ls,仍然可以看到或操作mkdir,/usr/bin,/etc/init.d/,这很危险。JAE通过LinuxACL(accesscontrollist)禁止大部分系统命令,有点杀敌1000自损800的味道。许多应用程序需要调用系统命令。ACL的具体做法是限制用户组vcap-dea对绝大多数系统命令的查看和操作权限:JAE使用safemode ACL在某种意义上实现了访问控制。为什么说是某种意义上的?在特定的Namespace中,虽然它提供了一些功能,但没有Namespace的概念,PID、IPC、Network是全球性的,每个Namesapce中的资源对其他Namesapce都是透明的,而safemode是透明的 ACL是一种共享方案。后来JAE升级的主要原因是Namespace问题。其次,说到资源隔离,应用的系统资源可能有内存,CPU、磁盘和带宽等。JAE借鉴warden方案,利用linux内核自带的cgroup和quota来解决内存,CPU、磁盘隔离问题。下面,借此机会介绍warden的实现细节。cgrouppwarden实现原理(ControlGroup)它是Linux核心的功能。简单地说,它是对过程进行分组,然后对资源进行调试和分配。其结构为树形结构。每个root都管理下面的所有分支,分支共享root资源。这些群体由每个子系统控制和监控。cgroup的子系统有:CPU、CPUset、CPUacct、memory、devices、blkio、net-cls、freezer,不同的linux内核版本提供不同的子功能。cgroup的系统目录位于/sys/fs/cgroup,JAE宿主机为ubuntu12.04LTS,默认有以下子系统:CPU、CPUacct、devices、freezer、当dea启动时,memory将重新初始化cgroup和mount子系统。安装cgroup系统/tmp/container在cgroup下,mount了四个子系统。当部署应用程序时,/tmp/container/cgroup/memory目录生成此应用程序的进程节点,命名为#{instance_name}-#{instance_index}-#{instance_id},即“应用名-应用实例号-实例id”,将应用的内存配额写入memory.limit_in_bytes,memory.memsw.limit_in_bytes。限制可用的最大内存和swap值。限制了可用的最大内存和swap值。然后将实例的过程ID写入每个子系统的tasks文件中,注意到每个子模块的notify_on_release设置为1,告诉cgroup,如果应用程序消耗的资源超过限制,kill就会下降。Warden写了一个OomNotifier服务来监控内存的消耗,然后进行具体操作。就我个人而言,Oomnotifier可能有更“温和”的处理方法或更逻辑的处理方法。但目前OomNotifier只做了kill操作。JAE为什么不设置CPU子系统来设置内存配额?由于在JAE环境中,应用程序主要是内存消耗,如果CPU想设置配额,只能设置占用时间的比例,逻辑上不能更直观地为应用程序分配CPU资源,因此采用了“平均分配”的原则。如果虚拟机上只有一个应用程序示例,则此应用程序示例可以“独家”,因此CPU资源。如果有两个应用程序示例,则每个应用程序最多只能使用50%,以此类推。CPU的利用率是过去一段时间使用实例所占用的CPU时间/总时间。接下来说到磁盘配额,JAE使用了linux内核的Quota。Quota可以对某一分区下指定的用户或用户组进行磁盘限额。限额不是针对用户主目录,而是针对这个分区下的用户
推荐阅读
- 刷机软件到底哪一个比较好?这5款值得考虑
因为大家每个人对刷机软件的需求都不一样,我们对手机的技能就掌握的不一样,但是呢?有的人使用的是苹果手机,有的人使用的是安卓手机,但我们应该如何操作呢?刷机软件到底哪一个比较好?我们必须得尝试一些不同的电脑刷机软件,这样让我们的操…查看详情
- 六款实用的PPT制作软件
无论是大学生还是办公室职员,大家对PPT制作软件一定不陌生,在平时的学习或工作过程中,我们都会使用PPT制作软件。在这里,我将分享一些实用的PPT制作软件。一、officePlusOfficePlus是微软Office的官方在线模板网站。包…查看详情
- 阿里店铺如何运营?这2点是关键!
近年来,网购成为人们生活中不可或缺的一部分。随着互联网不断发展,许多人也学会在网上开店,从而缩小成本,扩大市场范围,获得更多收益。很多人也靠网店发家致富,那么网店究竟应该怎么运营才能获益最大化呢?那我们就谈谈最具影响力的阿里店铺,看看运营阿…查看详情
- 推荐几款功能强大的无线网络管理软件,功能好用到飞起
无线网络管理软件可以很好的帮助我们更好的管理无线网络,以及保护无线网络的网络安全。那么,wifi管理用什么软件?我今天为大家整理出来了几款好用的无线网络管理软件推荐给大家! 1.共享精灵 这款软件是一款完美的精品软件,解决没…查看详情
- 值得用的3款优质智能数据分析软件推荐
在这个科技发达的时代,越来越多企业家为满足人们的日常生活需求而随之上市。但不是每一个企业都能够稳步发展,为了能够更加便利客户的需求以及公司的发展,*在这里里为大家整理了3款优质智能数据分析软件推荐,有兴趣可了解。 YonghongDeskt…查看详情
- 云邮箱是什么?
云邮箱是一种基于云计算技术的电子邮件服务,其主要特点是用户的邮件数据存储在云端服务器上,而非传统的个人计算机本地存储。通过云邮箱服务,用户可以在任何网络连接的设备上随时随地访问和管理自己的邮件,无需受到地域、时间和设备的限制。 云邮箱…查看详情
- 市面上常见的拍照相对优秀的几款手机,苹果仅排第三
在如今的日常生活中手机不再仅仅是一种通话工具。它的功能越来越有趣。手机摄影功能日渐强大到已经足以取代相机,照相手机是很多人选购手机时的重要考量。其轻巧便携的特点能让使用者随时随地拍下一张又一张精美的照片。*精选了一下目前市面上常见的照相手机…查看详情
- 互联网产品运营方法涉及到的主要内容和最终目的
互联网产品运营可以解释为用运营技巧辅助产品在互联网渠道进行销售,一般来说都是产品为主,运营为辅。互联网产品运营方法所涉及到的主要内容包括市场运营、用户运营、内容运营、社区运营及商务运营等。图片来源于网络市场运营:有花钱和不花钱两种方式,对产…查看详情
- 企业网站代运营可以为企业带来四大好处
随着互联网的发展,线下企业转型线上搭建网站,于是出现了企业网站代运营服务。刚转型线上的企业,要组建一个专业的运营团队需要美工、文案人员、运营人员等会有大量的时间成本和人力成本,但企业网站代运营可直接解决此问题,帮助企业节省成本、提升网站整体…查看详情
- 黄仁勋:9岁闯荡美国,现被称为“硅谷最好斗的男人”
在硅谷,他被称为最好斗的男人。在牛人遍地的硅谷,黄仁勋是唯一一个被誉为,可以比肩亚马逊的贝佐斯和特斯拉的马斯克的华人。这位1963年出生的科技大佬,不爱格子衫,也不爱白衬衣黑西裤,一件标志性的皮衣像极了中年摇滚歌手。尽管黄仁勋一向着装另类、…查看详情
- windows10怎么进dos然后格式化
Windows10进入MS-DOS命令行 MS-DOS 命令行是一种字符界面控制台,它可以让我们通过输入命令来操控系统,很多高级用户和程序员经常使用它进行各种操作,比如格式化*盘、修复系统文件、安装驱动程序等,本节将介绍如何在 W…查看详情
- 企业应该如何选择代运营公司
电商行业发展这么多年,如今的电商行业已经非常成熟,很多人都选择通过网络创业,有人买就有人卖,各行各业就像蝴蝶效应一样,随机伴随而来的相关产业也应运而生,比如说网店代运营公司,在近几年网店代运营公司就像雨后春笋一样,层出不穷,那么竞争如此激烈…查看详情
- 编程自学书籍有哪些?
自学编程书籍?1、《实战Java程序设计》 这是一本既注重实战,同时也注重底层“内功”训练的书,非常适合初学者阅读! 2、《程序员修炼之道——从小工到专家》 这本是指导程序员从低等级向高等级转变的必要圣经。每一篇幅都需要仔细阅读,深入…查看详情
- 淘江湖入口在哪里?淘江湖有什么用?
聚划算怎么没有分类了?有啊,淘宝聚划算的入口已经换位置了,由淘宝首页的左角处移到了正上方,就是“首页”过来依次“淘宝商城”然后就是“聚划算”了,还有首页的“网站导航”那里,你把鼠标停在那里,就可以在“淘江湖”下面看见淘金币小课堂增加了什么新…查看详情
- 好玩的网页游戏有哪些 十大网页游戏排行榜
玩游戏我们可以先看一下别人玩什么游戏,然后如果感兴趣的话,你也可以根据别人玩的游戏去玩耍,当然我们也可以先了解一下十大网页游戏排行榜有什么,了解了排行榜从排行榜中做选择的话,会节省很多的时间,能在短时间之内做出选择。十大网页游戏排行…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
邮箱:zjb@iwanshang.com
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的AI增效平台

400-0033-166
8:30-18:00















































注册有好礼



