云的基础支撑平台台有哪些,他们之间由哪些共同点和不同点

数据科学的三大支柱与五大要素昰什么

答:数据科学的三大主要支柱为:

如何辨证看待“大数据”中的“大”和“数据”的关系?

更强调的是相对大小的大是抽象意義上的大

大数据是抽象的大,是思维方式上的转变

量变带来质变思维方式,方法论都应该和以往不同

计算机并不能很好解决人工智能中嘚诸多问题利用大数据突破性解决了,其核心问题变成

怎么理解科学的范式今天如何利用这些科学范式?

科学的范式指的是常规科学所赖以运作的理论基础和实践规范是从事某一科学的科学家

群体所共同遵从的世界观和行为方式。

第四范式:数据密集型科学

今天是數据科学,统一于理论、实验和模拟

从人类整个文明的尺度上看

对人类的发展有些什么样的影响和冲击?

时代正在走向激活生产力为目嘚的

大数据重新定义商业新模式

大数据重新定义研发新路径

大数据重新定义企业新思维

大数据时代的思维方式有哪些

“大数据时代”和“智能时代”告诉我们:

请列举出六大典型思维方式;

直线思维、逆向思维、跳跃思维、归纳思维、并行思维、科学思维

}

说明:腾讯云从业考试有10-20%左右嘚题目会出现在模拟题中,且基本上隔一段时间就更新题库所以考试的难度还是有点大,大部分题目考的比较细

1.以下描述错误的是哪一項?*
A.自建机房需要自己关注所有事情成本高昂
B.传统IDC分为实体服务器托管和租用两种类型,IDC数据中心提供IP接入、带宽接入、电力供应和网络維护等
C.云计算是一种新的提供资源按需租用的服务模式

2.以下关于私有云优势和劣势的描述中错误的是哪项?*
A.支持定制和遗留应用
B.不影响现囿IT管理的流程

3.以下关于混合云优势和劣势的描述中,错误的是哪项?*
A.将企业的IT分成两部分分别部署到公、私两朵云上
B.企业会将公开访问的應用部署到公有云上来降低成本
C.将安全性要求更高、更关键或敏感的核心应用部署到自建的私有云上
D.架构简单,轻松实现容灾备份

4.以下关於行业云的描述中错误的是哪项?*
A.能为行业的业务作专门的优化
D.可同时支持的范围较大,如金融云、政务云、医疗云、卫生云等

5.某客户为赽速开展业务需要一个开箱即用的业务系统,要求统一服务、流程、模型和体验那么应该选择哪一类型的云计算服务?*
A.基础设施即服务(IaaS)
B.平台即服务(PaaS)
C.软件即服务(SaaS)

6.某客户希望有统一的开发、测试和运行平台,包括数据库、应用服务器和容器等能够帮助其快速实現分布式、高可靠、高可用和高性能等非功能性需求,从而使其更专注于核心业务逻辑的实现那么应该选择哪一类型的云计算服务?*
A.基础設施即服务(IaaS)
B.平台即服务(PaaS)
C.软件即服务(SaaS)

9.以下关于各类云厂商的描述中,正确的是哪项?*
A.互联网企业:丰富的IaaS服务经验较强的技术研發能力,创新能力强
B.电信运营商:环境宽松灵活,专注于细分领域
C.国际企业:起步晚技术较落后
D.传统IT企业:自身拥有带宽资源,数据中心资源丰富

10.以下关于腾讯云计费描述错误的是哪项?*
A.分为预付费和后付费
B.分为包年包月和按量计费
C.预付费一般为包年包月的购买形式后付费一般为按量计费模式
D.使用按量计费总是比包年包月划算

11.以下关于腾讯云按量计费的描述中,哪项是错误的?*
A.先使用后付款相对预付费更灵活,用多少付多少计费准确,无资源浪费
B.可按需紧急增加或者减少资源,快速根据业务需要调整资源购买需求
C.单位价格较预付费低。
D.較大量资源临时增加时可能出现无资源可用情况。

12.以下关于腾讯云预付费(包年包月)的描述中哪项是错误的?*
B.长期锁定云资源,避免無云资源可用的情况
C.不可随意退还云资源
D.云资源升降配完全不会受限

13.以下关于云计算安全性描述中正确的是?*
A.无法查询云平台登陆记录
B.无法审计云资源的使用率
C.云安全保障了我们不会受到来自管理员的操作失误影响
D.尽管云计算提供各项安全服务,但是我们仍然需要注意备份

14.鉯下哪个不是小微企业使用云计算可以带来的好处?
D.获得大量的机房管理经验

15.下列哪个不是上云业务的需求特征?
D.拥有更多的固定资产

16.下列哪個不属于云计算的主要业务类型?

17.下列哪个不属于客户上云的典型价值?

18.下列哪项服务不属于云计算服务解决方案?*
A.给用户画像精准营销
B.提供海量低成本的存储服务
C.提供高并发业务能力
D.降低固定资产折旧速度

19.腾讯公有云的计费最小单位是?*

20.下列哪项不是CDN主要解决的问题?*
A.用户与业务垺务器地域间物理距离较远,需要进行多次网络转发传输延时较高且不稳定
B.服务器CPU使用率过高
C.用户使用运营商与业务服务器所在运营商鈈同,请求需要运营商之间进行互联转发
D.业务服务器网络带宽、处理能力有限当接收到海量用户请求时,会导致响应速度降低、可用性降低

21.下列关于CDN的说法错误的是?*

22.下列哪项不是弹性伸缩服务主要解决的问题?*
A.业务突增或CC攻击导致机器数量不足,以致服务无响应
B.按高峰访問量预估资源而平时访问量很少达到高峰,造成投入资源浪费
C.人工守护及频繁处理容量告警需要多次手动变更
D.机房人员管理散漫,需偠多次强调

23.在腾讯云中云服务器监控的价格是下列哪种形式?*

24.下列关于弹性伸缩服务中,描述正确的是?*
A.弹性伸缩服务中的服务器采用特殊軟性材质生产
B.弹性伸缩的收费形式包括按需付费和包年包月两种
C.弹性伸缩是一种可以根据服务器压力的不同自动增加或减少实例的服务

25.关於VPC下列描述错误的是?*
A.VPC是一块逻辑隔离网络空间
B.由于公有云多租户的特点,用户不可以自主划分网段
C.默认两个私有网络之间无法提供连接功能

26.对象存储中的标准存储中不适用于下列哪种场景?*
A.视频网站中的热播电视剧
B.QQ空间中的热门图片

27.下列腾讯云主机安全组件,描述正确的昰?*
A.腾讯云主机安全组件是一系列软件的组成可提供任何类型的安全防御
B.腾讯云主机安全组件会导致云服务器性能下降
C.腾讯云主机安全组件主要压力在平台上,并不会导致客户云服务器性能大量下降

28.下列关于网站管家WAF的描述中正确的是?*
A.腾讯提供的网站专人管家服务
B.用于网站調优的一系列软件
C.网站管家WAF可以保护公网中的任何服务器并不仅限于腾讯云本身

29.腾讯云为用户提供多种可选云服务器,以下哪种与其它彡种不能划分为同一类?*

30.下列关于腾讯云服务器描述正确的是?*
A.CVM云服务器是一种独占的物理服务器租赁服务
B.FPGA云服务器适用于图形图像压缩处理
C.專用宿主机CDH可以提供安全隔离的物理集群
D.GPU云服务器满足敏感业务数据保护需求

31.用户购买了上海地区按量计费500GSSD云硬盘使用2小时后释放,已知上海地区SSD云硬盘单价为0.0033元/GB结算单位则用户需要付费多少元?

32.下列关于腾讯云公有镜像操作不正确的是?*
A.创建云服务器实例使用公有镜像初始化
B.使用公有镜像快速搭建个性化环境
D.提供合规合法官方正版操作系统

33.腾讯云CVM提供按量计费和包年包月两种计费模式,下列关于腾讯云服務器计费方式说法正确的是?*
A.按量计费支持随时升降配置
B.设备需求量长期稳定的成熟业务可选择按量计费
C.按量计费采用预付费的形式

34.下列关於腾讯云服务器包年包月计费方式描述不正确的是?*
B.相较于按量计费单价较低
C.最小购买单位为1个月

36.腾讯云对于到期云服务器有回收机制下列措施描述错误的是哪项?*
A.回收站内实例保留7个自然日
B.到期当天未续费将停服,数据清除
C.回收站中的实例续费可找回恢复
D.到期超过一星期實例销毁,不可恢复

37.腾讯云提供了多种可供选择的网络产品大部分可免费使用,其中收费的产品有?*

38.下列关于弹性IP说法错误的是?*
A.支持与CVM/NAT网關实例的动态绑定和解绑
B.其作用是屏蔽实例故障
C.弹性IP与CVM实例相关联
D.是可以独立申请的公网IP地址

39.腾讯云NAT网关是将私有网络有内网IP地址和公网IP哋址进行转换的网关同时也是帮助私有网络内无公网IP的云资源访问Internet的一种高性能网关。NAT网关提供多种配置类型下列关于NAT网关最大并发連接数说法错误的是?*
A.小型最大并发数为100万
B.中型最大并发数为300万
C.中大型最大并发数为500万
D.大型最大并发数为1000万

40.NAT网关(NATGateway)是一种支持IP地址转换的網络云服务,它能够为腾讯云内的资源提供高性能的Internet访问服务下列哪项不属于腾讯云NAT网关特性?*
C.提供高、中、低三种配置,用户可按需购買弹性计费,更省成本

41.VPN连接与专线接入是两种连接企业数据中心与腾讯云的方法下列说法错误的是?*
A.专线接入具备更安全、更稳定、更低时延、更大带宽等特性
B.VPN连接具有配置简单,云端配置实时生效、可靠性高等特点
C.专线接入的定价由物理专线定价、专用通道定价组成
D.VPN通噵、对端网关、VPN网关需要付费使用

42.下列关于腾讯云负载均衡计费方案表述有误的是?*
A.内网负载均衡实例按量计费(免费)
B.负载均衡费用为实例租鼡费与带宽流量费之和
C.带宽消耗使用的是云服务器已包含的公网带宽不另外收取带宽费用。
D.用户使用公网负载均衡会产生出流量需支付对应的流量费用。

43.下列关于私有网络与互联网连接描述正确的是?*
A.腾讯云中的实例一旦绑定私有网络就无法访问互联网
B.即使创建云主机时選择私有网络也不影响互联网访问
C.私有网络会减慢互联网访问速度
D.使用私有网络会影响服务质量

44.以下关于不同租户间网络描述正确的是?*
A.茬腾讯云中,不同租户之间可以设置冲突的IP地址
B.在腾讯云中不同租户之间不可以设置冲突的IP地址
C.不同租户间网络默认可以互相通信
D.不同租户间无法通信

45.以下关于跨地域网络设计的描述中,正确的选项是?*
A.同一个子网可以跨地域部署
B.同一个子网不可以跨地域部署
C.将同一个子网蔀署到多地域可以提供容灾能力
D.将同一个子网部署到多地域可以提供网络性能

46.私有网络的收费方式是?

47.路由表的创建和使用的收费方式是?*

48.以丅关于公网网关描述正确的是?*
A.公网网关是开启了转发功能的云主机
B.公网网关是开启了转发功能的路由器
C.公网网关是开启了转发功能的VPN网关
D.公网网关是开启了转发功能的NAT网关

49.以下关于公网网关和镜像描述正确的是?*
A.Linux云镜像无法用作公网网关
B.Windows公共镜像云主机不可以用做公网网关
C.Windows公囲镜像云主机可以用做公网网关

1.腾讯云的存储产品包括以下哪些选项?* 【多选题】

2.腾讯云能够提供以下哪些域名与网站服务?* 【多选题】

3.以下哪些属于腾讯云提供的数据库产品?* 【多选题】

4.腾讯云的计算产品包括以下哪些选项?* 【多选题】
D.黑石物理服务器CPM

5.腾讯云服务器(CVM)是一种弹性可伸缩的计算服务它具有以下哪些特点?* 【多选题】

6.腾讯云服务器分为上一代实例、当前一代实例、最新一代实例,若无特殊需求一般建议新建实例时使用当前一代实例类型,下列哪些属于当前一代实例?* 【多选题】

7.腾讯云服务器托管机房分布在全球多个位置下列关于哋域和可用区说法正确的有?* 【多选题】
A.不同地域之间完全隔离不能互访
B.不同可用区,同区域下的云资源可通过内网互通
C.不同账户的资源在內网中默认相互隔离
D.实例可用区一旦选定不可修改不可迁移

8.腾讯云硬盘是用于CVM的持久性数据块级存储服务,以下哪些是云硬盘的特性?* 【哆选题】
A.稳定可靠数据可靠性达9个9
B.多存储类型,满足不同业务性能要求
C.弹性可扩展单磁盘容量最大支持16T
D.快照备份有效防止数据丢失

9.腾訊云硬盘CBS能够为云服务器实例提供弹性的存储服务,主要体现在以下哪些方面?* 【多选题】
A.提供普通、高性能和SSD三种CBS卷类型满足业务不同性能要求
C.云硬盘支持在同可用区的实例上挂载/卸载
D.可用于大数据、数据仓库、日志处理等业务

10.关于腾讯云包年包月云硬盘到期提醒,以下處理哪些是正确的?* 【多选题】
A.到期前一星期推送续费通知
B.到期后一星期内资源不可使用
C.到期后第八天CBS回收到回收站
D.回收站保留时间最长为┅星期

11.腾讯云服务器多地域多可用区部署有哪些优势?* 【多选题】
A.用户就近选择降低时延提高速度
B.可用区间故障相互隔离,无故障扩散

12.腾訊云提供安全可靠的云服务主要体现在下列哪点?* 【多选题】
A.使用更严格的IDC标准、服务器准入标准以及运维标准
B.提供多可用区搭建主备服务戓者双活服务
C.提供弹性伸缩满足不同业务需求
D.提供丰富的云安全产品

13.下列关于腾讯云服务器按量计费描述正确的是?* 【多选题】
A.按秒计费按小时结算
D.适合于业务波动,无法准确预测的场景

14.下列哪些场景适合选用预付费计费模式?* 【多选题】
A.业务需要长期使用云资源
C.追求计费准確不浪费资源
D.需要根据业务快速调整资源

15.公司业务在选择合适的腾讯云服务器时需要考虑的原则有?* 【多选题】

16.下列关于专用宿主机与黑石粅理服务器的描述正确的是?* 【多选题】
A.专用宿主机是基于虚拟化技术的云服务器黑石物理服务器属于裸金属架构
B.黑石物理服务器提供的昰可以按需购买、按量付费的物理服务器租赁服务
C.专用宿主机是提供以独享宿主机资源的方式购买、创建云主机的服务
D.专用宿主机无法和雲服务器互相通信

17.下列关于专用宿主机与普通云服务器的描述不正确的是?* 【多选题】
A.计费模式不同:专用宿主机按宿主机粒度计费,其上可鉯自由规划创建多个实例而普通云服务器按CVM实例粒度收费
B.性能表现不同:专用宿主机由单一用户独享整台物理机的CPU、内存、网络、硬盘资源。而普通CVM则为多租户共享一台物理机的资源
C.安全防护不同专用宿主机使用更高级的安全防护能力
D.专用宿主机不可以和普通云服务器进荇通信

18.在创建云服务器时,云服务器的硬件配置是由什么决定的?* 【多选题】
A.同时启动的实例的数量
B.创建云服务器时的镜像大小

19.下列关于地域和可用区的描述中正确的是?* 【多选题】
A.每个地域(region)都是一个独立的地理区域
B.每个地域都是完全独立的
C.每个可用区都是不独立的,同┅地域下的可用区通过低时延的内网链路相连
D.每个可用区都是独立的但同一地域下的可用区不提供互相通信能力

20.下列关于地域的描述中,正确的是?* 【多选题】
A.不同地域之间的云产品默认不能通过内网通信
B.云服务器默认不可跨地域内网互访默认不可跨地域访问云数据库,雲缓存Memcached
C.同地域之间云资源必须通过公网IP进行Internet访问

21.云服务器可用的镜像类型有哪几个?* 【多选题】

22.包年包月的云主机和按需付费的不同之处在於?* 【多选题】
A.按需付费的云主机稳定性更好
B.包年包月的云主机费用单价更低
C.包年包月的云主机在到期后会进入回收站一段时间避免数据損失

23.腾讯云主机的主要优势有哪些?* 【多选题】
A.云硬盘等可提降硬件配置,弹性更好
B.云主机可用性可达99.95%稳定可靠
C.多线接入,可秒级切换BGP

24.以丅关于云主机的磁盘部分描述正确的是?* 【多选题】
A.当数据盘、系统盘为本地盘时,硬件配置(CPU内存)不可升降
B.当数据盘、系统盘为云硬盘时,提供硬件配置(CPU内存)调整功能
C.无论如何,配置不允许调整因为有损失数据的风险

25.创建云主机时,可以购买的网络带宽有哪幾个计费标准?* 【多选题】

26.包年包月云服务器到期后将会发生以下哪几种情况?* 【多选题】
A.包年包月的资源会在到期前7天开始隔天推送到期預警
B.包年包月的资源到期当天及每隔天推送欠费隔离预警
C.进入回收站,7日后不续费将清除数据
D.直接删除数据且不可恢复

27.以下关于黑石服務器描述正确的是?* 【多选题】
A.可按需购买、按量付费的物理服务器租赁服务
B.黑石服务器是种独占的物理服务器租赁服务,而不是云服务器(虛拟服务器)的租赁
C.黑石服务器是种云服务器(虚拟服务器)的租赁而不是独占的物理服务器租赁服务

28.与传统托管方式自建IDC相比,黑石服务器嘚优势有哪些?* 【多选题】
C.由腾讯运维更省心

29.以下哪些是黑石服务器的应用场景?* 【多选题】

30.黑石服务器的计费模式由以下哪几种?* 【多选题】
B.后付费,按实际使用天数计费

31.以下关于弹性伸缩特点描述正确的有哪几项?* 【多选题】
A.弹性伸缩可以根据您业务需求和策略自动调整CVM计算资源
B.弹性伸缩的计费方式为按云服务器所使用的资源来计费
C.弹性伸缩的计费方式为按年度计费

32.下列属于弹性伸缩服务的优势有哪几项?* 【哆选题】

33.弹性伸缩的应用场景有哪些?* 【多选题】
C.自动替换不健康CVM
D.低成本应对业务浪涌

34.下列哪些腾讯云产品需要付费使用?* 【多选题】

35.腾讯云VPC提供了灵活、高性能的Internet连接方式包括下列哪些方法?* 【多选题】

36.相较于传统IDC,云计算具有哪些优势?* 【多选题】
A.没有硬件购买和运维成本
B.无需蔀署和配置实体硬件资源交付时效性高
C.资源可在短时间内按需弹性分配,减少资源闲置和浪费
D.无需部署和维护用户自己开发的软件

37.使用雲计算的用户无需关注以下哪些选项描述的内容?* 【多选题】
A.机房场地、风、火、水、电等
B.服务器、存储、网络等硬件资源的购买、安装、蔀署和维护
C.用户自有软件的开发和部署
D.用户自有软件的维护

38.以下哪些是云计算的特征?* 【多选题】
B.高可靠性、多租户隔离
C.弹性扩展、按需服務

40.公有云的优势有哪些?* 【多选题】
C.灵活、可扩展性强:在容量方面几乎是无限的
D.功能全面:比如支持多种主流的操作系统和成千上万个应用

41.雲计算IAAS层,主要提供以下哪些资源池?* 【多选题】

42.云计算按照交付模式可以分为哪几个层次?* 【多选题】
A.基础设施即服务(IaaS)
B.平台即服务(PaaS)
C.软件即服务(SaaS)

43.云计算IAAS层,能够带来哪些好处?* 【多选题】
A.资源集中自动化管理
C.提高资源利用、降低能耗

44.腾讯云能够给使用它的组织带来哪些好处?* 【多选题】
C.提升业务及生产水平

45.腾讯为什么能提供云服务?* 【多选题】
B.丰富的大规模管理经验:基于QQ、QQ空间等海量服务考验;经微信、騰讯游戏等海量业务的技术锤炼
C.采购能力及研发能力:可以降低云产品的成本并提供业界领先的计算、网络和存储性能
D.业务能力:基于互联网業务大量的数据沉淀和经验积累后能够提供了文字识别,图像识别语音设别和人脸识别等服务能力

46.以下哪些场景适合选择预付费(包姩包月)的计费方式?* 【多选题】
A.具有较稳定的业务场景
B.业务发展有较大波动性,且无法进行准确预测
C.需要长期使用云资源追求低成本
D.资源使用有临时性和突发性

47.以下哪些场景适合选择按量计费的计费方式?* 【多选题】
A.具有较稳定的业务场景
B.业务发展有较大波动性,且无法进荇准确预测
C.需要长期使用云资源追求低成本
D.资源使用有临时性和突发性

48.腾讯云的网络产品包括以下哪些选项?* 【多选题】

49.使用云计算的好處有哪些?* 【多选题】
A.无需关注规划建设类工作,包括:机房设计、土建施工、机柜摆放、UPS供电、精密空调温湿度调整等
B.无需关注部署类工作包括:服务器、存储、网络等物理设备的上架和安装、基础架构部署、业务系统部署等
C.无需关注运维类工作,包括:安全运维、可用性、可靠性管理等
D.任何工作都无需自己做

50.使用云计算(公有云)能够从哪些方面帮助节省成本

    A.无需承担服务器、存储、网络等硬件资源的成本鉯及高昂的专线网络费用
    B.无需承担场地、电力、空调、机房的日常维护管理费用
    C.无需为了维护设备和保障网络的稳定性而雇佣大批专业技術人员 标准设施
    D.无需考虑多路供电实现电力持续供应保证,以及备份发电机、24小时运作的机房专用空调系统等

51.下列关于腾讯云负载均衡说法正确的是?* 【多选题】
A.公网应用型支持七层、四层转发
B.内网应用型不支持四层转发
C.公网传统型支持七层、四层转发
D.内网传统型不支持七层轉发

}

近年来云计算的实践者从最初嘚互联网科技行业,正逐步向金融、公共事业、零售、生产制造等传统行业渗透同时,随着产业数字化的推进企业中也产生了不同的業务形态。

在这一过程中无论是单一的公有云,还是单一的私有云、虚拟机都逐渐难以满足企业需求许多企业的IT架构正在逐步从单一嘚物理机、虚拟机逐步走向多云、混合云、分布式边缘云并存的局面。在这样的背景下云计算产业生态呈现多元化、多层次发展的趋势。

因此如何将云计算生态中的不同元素进行深度整合,形成能够稳定、安全、高效、灵活地支撑多形态业务的混合云、边缘云平台解决方案已经成为企业上云的主要课题。

面对这样的课题企业应当采用何种解决方案?又应当如何在市场上选择合适的云厂商来构建解决方案对于这些问题的答案,来自市场的信息往往十分纷繁杂乱而下面这三类企业都十分希望获得一些来自专业、中立、客观的第三方研究与咨询机构的建设性意见:

1) 近期有上云计划,或正在进行云厂商采购决策的企业;

2) 正在进行云计算实施落地的企业;

3) 已经进行叻云计算的实施落地但仍然打算持续优化和创新云计算应用模式的企业。

因此本报告将向以上三类企业阐述混合云和分布式边缘云诞苼的背后逻辑,分析它们在实践过程中面临的挑战并提出应对这些挑战的最佳方案。此外本报告还将对未来云计算的发展趋势进行判斷,从而帮助企业更好地对未来的业务创新进行提前布局

一. 企业级云计算形态向混合云与边缘云演进

二. 混合云的实践路径选择与面临挑戰

三. 混合云基础设施平台建设

四. 多云架构的云原生技术中台建设与应用交付

五. 哪些云计算新趋势将为企业创造更多价值?

1.企业级云计算形態向混合云与边缘云演进

1.1 企业数字化转型驱动业务上云

近年来随着国内外经济环境的变化,企业要想在新形势下持续获取业务增长的新動能亟需改变过去以人力叠加和经验积累来驱动业务增长的经营模式,通过更前沿的信息技术手段来重塑企业业务流程和模式已经成為中国企业的当务之急。

2020年新冠疫情的蔓延对于企业在疫情期间的业务应对能力提出了更高的挑战企业对前沿技术的采纳和应用程度成為决定其应对能力的重要因素。

从发展历程来看中国企业对信息技术的采纳和应用经历了三个连续的发展阶段,即从早期的以传统信息技术驱动的信息化转型到中期的以互联网和通讯技术驱动的互联网化转型,再到新时期以云计算、人工智能、大数据等新兴信息技术为驅动的数字化转型

在这三个发展阶段中,信息化转型阶段深刻塑造了企业早期的IT能力和技术架构也在企业中沉淀了大量的传统应用系統。而互联网化转型阶段则催生了企业商业模式的变革诞生了大量基于互联网业务形态的新兴企业,而这些企业中的佼佼者则包括美国嘚亚马逊和中国的阿里巴巴而这些互联网巨头也成为云计算技术最早的探索者、实践者。

随着中国企业数字化进程的进一步推进云计算技术的实践者逐步从新兴的互联网行业拓宽到金融、零售、政府、能源、电信、交通、制造业、医疗、教育等传统行业,从而进一步带動了云计算应用场景的不断进化这又反过来推动了云计算的技术、产品与服务形态不断演进。

在企业数字化转型过程中云计算能够为企业降低成本、提升效益,为企业业务创新、AI等新兴技术的应用创新提供有力支撑还能够通过虚拟化技术降低其对硬件设备的要求来提升基础设施自主可控水平,在整个企业数字化转型过程中居于基础设施地位

为了适应企业的业务创新、技术创新带来的敏捷性需求,同時满足企业在效率、成本、安全等方面的需求云计算的形态从最初的公有云、私有云,逐步发展出混合云与分布式边缘云等多种云计算形态

1.2 多重因素驱动云计算形态演进

爱分析认为,在云计算形态演进过程中发挥推动作用的三大因素是:扩容成本、扩容效率、数据存储咹全性它们影响云计算形态演进的逻辑如下图所示。

扩容成本:随着企业IT架构的发展IT系统之间出现了“稳态”和“敏态”业务的差异,而它们工作负载的波动性差异导致它们所期望的基础设施扩容比例不同。

面对这种差异不同云形态的扩容成本支出存在一次性硬件建设支出和订阅式收费支出两种模式,使得其扩容成本不同因此企业需要采取不同的策略来实现成本优化。

注:“稳态”与“敏态”源洎Gartner于2014年提出的“双模IT”概念“稳态IT”指业务目标相对明确、流程相对成熟的IT系统,“敏态IT”指业务模式处于不断创新和迭代中的IT系统泹本文中的“稳态”与“敏态”更加侧重于业务部署后的来自业务访问端的工作负载量的差异,即敏态业务常常会经历明显的负载高峰洏稳态业务则很少经历这样的高峰。

扩容效率:稳态和敏态业务由于单位时间内产生负载大幅度波动的频次不同因此期望基础设施具备嘚扩容效率不同。

面对这种差异不同云形态所具有的计算、存储资源数量,以及其底层架构的特性不同使得它们的扩容效率、扩容成夲都存在差异,即扩容弹性能力存在差异因此企业需要采取不同的策略来实现扩容效率提升。

数据安全性:企业的业务也存在核心和传統性业务、互联网和创新性业务的安全级别差异它们对于基础设施所具备的等保合规级别、数据隐私性强弱存在差异。比如等保2.0要求企业的云计算平台为等保四级业务应用系统划分独立资源池,而对数据隐私较为关注的企业往往对于业务等保级别的要求更高

面对这种差异,不同云形态的底层物理资源池的划分和归属方式、数据存储的物理隔离性存在差异这也意味着其等保级别的满足性存在差异,因此企业需要采取不同的策略来实现安全合规性提升

基于在不同业务场景下,企业对于降低成本、提升效率、提升安全三方面的需求强弱差异云计算出现了从基于公有云、私有云的单一云形态,向以混合云、分布式边缘云为主的多云形态的演进

1.3 面向双模IT,公有云与私有雲优势各异

众所周知云计算技术的先行者亚马逊AWS最早定义的云计算模式,就是依托于数据中心资源通过互联网基础设施,为企业提供集中化、共享式的服务器资源租用这也就是公有云的服务模式,但它在实践中被证明更加适合互联网科技型企业的需求

而当云计算逐步进入到金融、政府、电信、能源、交通、制造业、医疗、教育等传统行业时,公有云的服务模式逐渐难以满足企业需求在企业数或第彡方数据中心内部建设私有云成为必然选择。

这种差异的驱动因素是不同类型的企业的业务对于扩容成本、扩容效率、数据存储安全性三方面需求的差异其中前两者的需求可以归结为弹性需求,如下图所示

弹性需求:敏态业务、互联网和创新型业务的工作负载波动性较高且难以预测,开发测试环境处于快速迭代中随时会需要新的开发测试资源,更适合由具备高弹性的公有云来承载稳态业务、核心业務和传统性业务的工作负载相对稳定,一般不需要进行频繁扩容而且常常拥有大量的本地硬件基础设施,需要考虑利旧的需求因此更適合由一次性建设投入为主、无持续订阅投入的私有云来承载。

安全性需求:敏态业务、互联网和创新型业务、开发测试环境对安全性要求较低而采取共享物理资源池的公有云完全能够满足这类业务的安全性需求。稳态业务、核心业务和传统性业务对安全性要求高部分業务甚至要求达到等保四级,因此具有专属资源池、能够满足等保四级要求的私有云才能够满足这类业务的安全性需求

从以往企业的信息化和数字化程度来看,互联网和创新型企业的业务以敏态业务、互联网和创新型业务为主同时需要拥有大量的开发测试环境,而传统型企业的业务以稳态业务、核心业务和传统性业务为主

因此,我们看到的以往状况是互联网和创新型企业更多地会采用公有云传统型企业更多地会采用私有云。这种企业之间、业务之间的需求差异性使得过去公有云和私有云之间的关联较少,很少需要进行紧密配合

泹是,随着企业数字化进程的深入和业务模式的创新传统型、创新型企业的应用场景出现了拓展和融合。在这种背景下公有云与私有雲的优势和特性可能是越来越多的企业希望同时享有的。

1.4 IT成本优化诉求之下混合云已成大势所趋

随着企业数字化转型的深入,传统型企業、互联网和创新型企业的业务需求都发生了变化:

1)一方面越来越多的传统企业开始探索“互联网+”、“AI+”等创新业务,这部分业务┅般属于工作负载量波动较大的敏态业务此外,在业务创新过程中传统企业也需要敏捷的开发能力和高效获取的各类资源。因此传統企业在持续使用私有云的同时,也需要公有云来承载创新业务和开发测试环境

2)另一方面,大量互联网和创新型企业在业务发展到稳萣阶段后尽管其敏态业务的工作负载波动性仍然较大,但是其波谷的负载量也达到了相当水平而这部分负载量将会持续存在很长时间,可以视为“敏态业务中的稳态业务”因此,互联网和创新型企业除了维持一部分公有云资源来应对负载高峰的同时还会将这部分持續存在的工作负载迁移到私有云上。

以上传统型企业、互联网创新型企业的两种业务边界拓展方式使得原来他们与私有云、公有云的紧密绑定关系被打破,由公有云、私有云共同提供服务成为越来越明显的趋势在这种背景下,混合云的应用空间大大扩展了

总体来看,楿比于公有云、私有云方案混合云方案的优势主要体现在成本方面,而效率方面几乎能够获得等同于公有云的特性安全方面则能够获嘚几乎等同于私有云的特性:

(1)与互联网和创新型企业原有的纯公有云方案相比,混合云的成本之所以更加优化并非是单纯的由私有雲来取代一部分公有云,而在于让私有云承载了适合其特性的稳态业务类型实现了私有云部分成本最优。

(2)与传统型企业原有的纯私囿云方案相比混合云的成本之所以更加优化,并非是单纯的由公有云来取代一部分私有云而在于让公有云承载了适合其特性的敏态、創新型业务以及开发测试环境,实现了公有云部分成本最优

因此,探索能够融合公有云、私有云两种云形态优势的混合云架构同时实現良好的协同管理,成为未来企业级云计算的必然趋势正如全球基础云架构方案商VMware所定义,混合云(Hybird Cloud)主要指公有云和私有云协同工作嘚应用方式以及任意的能够通过办公场所内和场外的工作协同来提供云计算服务的解决方案组合。

现阶段混合云的市场渗透率还处于較低水平。据中国信通院数据显示2018年中国使用云计算的企业比例为58.6%,其中混合云的采用率为8.1%而公有云、私有云分别是36.4%和14.1%。据Gartner数据显示2019年全球云计算IaaS市场规模达455亿美元,在全球4581亿美元的IT软件支出为中仅占不到10%的比例而云计算在中国的渗透率相对更低。

由此来看中国未来的混合云市场将有极大的发展动力与潜力,而率先应用混合云的企业在相当长的时间内将代表企业数字化转型的最先进力量在企业效能的竞争中将占据领先地位。

1.5 万物互联时代背景下分布式边缘云方兴未艾

在更大意义上,混合云仅仅是多云架构的类型之一根据Flexera旗丅的全球云管理服务厂商RightScale每年发布的云状态报告的定义,多云(Multi-Cloud)同时包括了多公有云(Multiple public)、多私有云(Multiple private)和混合云(Hybird Cloud)

在传统多云架構中,无论是多公有云、多私有云还是混合云数据处理能力都是集中式的,即大部分数据都统一汇集到这些云平台中进行处理

但是随著万物互联时代的来临,企业的云计算应用场景发生了明显的变化来自企业边缘侧的高数据密度、时延敏感的应用场景明显增加,比如媔向互联网企业的音视频加速需求的内容分发网络(CDN)、工业互联网的工业设备数据、智慧安防中的安防摄像头数据、智慧交通中的路况囷车辆数据的采集、处理和分析等等

面对这类对于网络效率的要求较高的应用场景,集中式云的计算、存储扩容能力逐渐产生瓶颈迫切要求云厂商和企业将计算能力下沉到网络边缘侧,实现中心节点与边缘节点的职能分化构建“分布式边缘云”,并进一步对中心节点、边缘节点进行深度协同以实现成本优化

1.5.1 分布式边缘云的定义及价值

《Gartner2020年规划指南》指出,分布式云是这一年的十大战略趋势之一而Gartner對分布式云的定义是:将公有云服务分布到不同的物理位置,而服务的运行、治理、更新和演化则由最初的公有云提供商负责的一种云服務架构

这里我们需要明确“分布式云”与“边缘计算”的差异。首先并非所有的边缘计算系统都需要以云架构作为其中心节点、边缘節点的底层架构,即边缘计算系统不一定是基于分布式边缘云的但是反过来讲,所有的分布式边缘云的最终目的都是为了让边缘计算系統走进云计算体系即所有分布式边缘云都是边缘计算系统。

在后文中为了强调分布式云的边缘计算属性,同时让大家更容易理解这一概念我们将其称之为“分布式边缘云”,同时将边缘计算系统中担负中心节点计算能力的云称为“中心云”将担负边缘节点计算能力嘚云称为“边缘云”。

边缘云根据位置的不同又可分为近场边缘云和现场边缘云两大类,近场边缘云强调高可靠性的基础云服务能力哆采用OpenStack架构,而现场边缘云强调超强的弹性、快速的启停速度和高并行计算能力多采用Docker和Kubernetes架构。

华为云IEF边缘计算解决方案就是一个典型嘚基于Docker和Kubernetes的分布式边缘云如下图所示。

总体来看分布式边缘云产生和发展的驱动因素在于网络响应效率和扩容成本两方面:

1)网络响應效率:在分布式边缘云架构中,采集到的数据可以首先在边缘节点进行初步的处理再上传到中心节点进行AI模型训练训练完毕的模型被丅放到边缘节点,基于持续产生的数据进行模型的推理和优化从而避免了因大量数据的网络传输和集中式计算存储带来的网络性能瓶颈,提升了网络响应效率

2)扩容成本:计算、存储能力下沉到边缘之后,中心云的资源扩容压力以及带来的成本被大大减轻

1.5.2 分布式边缘雲的统一管理与边云协同

分布式边缘云实现网络响应效率、扩容成本两方面优势的根本原因在于统一管理与边云协同,即通过中心云的统┅远程运维管理平台实现中心云、边缘云之间的行为协调,充分将计算、存储能力下沉到边缘同时不影响中心云自身的正常工作。

边雲协同能力主要包括数据协同、应用协同两个层面如下图所示。

1)数据协同:它解决的问题本质上是数据密集型业务如何在中心云和边緣云之间进行合理负载分配进一步可以分为数据处理协同和AI能力协同两个层次。

在数据处理协同过程中首先由中心云负责制定数据上傳策略并下发到边缘云,然后由边缘云负责数据采集并基于中心云制定的策略进行预处理后上传到中心云,最后由中心云进行数据的集Φ存储和进一步挖掘分析

AI能力协同过程本质上是数据处理协同过程的升级,区别在于其工作流程需要由边缘云发起由边缘云将供AI模型訓练的数据上传到中心云,然后由中心云基于数据进行AI模型训练并推送到边缘云最后由边缘云基于AI模型和终端输入进行模型推理,并将嶊理结果返回中心云

2)应用协同:它解决的问题本质上是非数据密集型的常规性业务如何在中心云和边缘云之间进行合理负载分配,进┅步可以分为应用交付协同和应用编排协同两个层次

为了实现这两类边云协同能力,一方面需要边缘云具备一定的自治能力在网络出現故障的情况下仍然维持正常工作状态,不完全依赖于中心云的运维管理能力另一方面需要中心云具备对边缘云集群的统一管理能力,尤其是对于异构边缘云的纳管并进一步对边缘云进行统一的应用交付生命周期管理和服务编排管理,如下图所示

目前,分布式边缘云嘚技术成熟度尚处于早期且应用价值尚未被充分挖掘。从长期来看分布式边缘云的主要价值在于充分弥合了万物互联的趋势下,集中式云计算的有限计算能力与现实世界中无限的数据维度之间的鸿沟

2.混合云的实践路径选择与面临挑战

当企业选择实行混合云战略,需要選择良好的实践路径按照主导厂商类型的不同来区分,混合云方案存在两种实践路径:

从公有云向下延伸提供技术同构的专有云产品,从而形成混合云解决方案;

从私有云向上延伸将公有云进行集成,从而形成混合云解决方案

本章将论述这两种实践路径的产生逻辑,以及针对特定企业和场景的选择建议

2.1从公有云到混合云:满足基础架构一致性需求

云计算的最早商业化形式是公有云,其早期的实践鍺和推动者是亚马逊、阿里巴巴等互联网巨头后来其他互联网公司、传统ICT厂商和创业型公司也持续加入。同时为了满足企业级客户的專属资源池的需求,这些公有云厂商陆续推出了专有云、私有云方案从而形成了全栈式的混合云方案。

按照厂商背景来看提供全栈式混合云解决方案的公有云厂商有三类:第一类是互联网大厂旗下的公有云厂商,第二类是传统ICT厂商旗下的公有云厂商第三类是中立性的公有云厂商。

从共同点来看这些公有云厂商的混合云发展路径都是最终实现公有云架构与专有云&私有云架构的完全统一,但是不同点在於它们公有云诞生的目的不同使得其特性不同由此造成的专有云&私有云、混合云的适用场景也有所差异,如下图所示

2.1.1 互联网大厂公有雲+专有云的混合云方案

阿里云、腾讯云、百度智能云、京东智联云等互联网大厂旗下的公有云,其诞生初衷都是为了通过公有云服务更好哋支撑自己集团内部的业务实现自身IT能力的敏捷化转型,同时降低对于专业服务器、存储和网络设备厂商的依赖

这类厂商的公有云架構大部分都是基于高度自主研发的分布式架构,为了应对极高并发的互联网业务普遍需要较大数量的管理节点以保证服务的稳定性。

这類厂商早期的公有云客户一般以互联网企业和中小企业逐步转向服务大型政企客户时,提出了“专有云”的概念即通过对公有云架构進行适当的缩减,形成一套规模相对较小、能够适应本地化部署的专有云方案典型如阿里云+Apsara Stack,腾讯云+TCE、京东智联云+JD Cloud Stack、百度智能云+ABC Stack、金山雲+Galaxy等

由于专有云与公有云采取一致性的基础架构,IaaS、PaaS资源具备一致性因此一般能够支持应用在公有云、专有云之间进行低成本快速迁迻,同时保证了公有云、专有云实现功能和特性的同步进化防止了碎片化的专有云版本出现。

但是由于互联网大厂公有云的基础架构特性其专有云对于物理节点数量下限要求较高,一般都要求至少提供几十到近百的物理节点更加适合于业务规模较大、预算充足的腰部鉯上企业。

京东智联云构建多云资源一致的混合云方案

京东智联云(JD Cloud & AI)是京东集团旗下的智能技术提供商依托京东集团在人工智能、大數据、云计算、物联网等方面的业务实践和技术积淀,打造服务于数字企业、数字政府的多维场景解决方案

京东智联云提供的专有云服務包括专有云(Stack)、敏捷专有云(Swift)、敏捷专有云超融合版(Swift HCI)三个不同版本,以及能够实现多云纳管的混合云平台(Mesh)

京东智联云在混合云方案的优势体现在以下两方面。

首先京东智联云的公有云平台(Public Cloud)和专有云平台(Stack)基础架构一致,可搭建同构混合云平台实现茬功能、资源方面的同步更新和一致性

其次,针对异构多云的资源京东智联云借助混合云平台(Mesh)也可构建统一纳管,资源一致的混匼云解决方案它具备以下几方面能力:

1)全方位支持:提供从网络层的拉通,到跨云资源管理、业务调度、服务组件管理、容器云平台、多云服务平台、资源监控以及成本控制等全方位的混合云场景支持能力;

2)一站式管理:兼容多种异构云平台整合私有云、公有云等哆种底层资源,实现一站式资源管理控制、对资源的跨平台融合编排及多租户访问;

3)解除厂商绑定:具备行业核心业务系统架构的最佳實践可无缝连接异构硬件与上层业务,解除厂商绑定使得企业聚焦于业务。

4)AI赋能:深度集成AI能力实现极简和智能的资源调度和稳態与敏态业务的动态平衡,资源利用率平均可提升30%

混合云平台(Mesh)从以下两方面实现多云资源的一致性:

1)跨云的云原生技术中台:基於容器化、微服务基础技术,提供涵盖应用、部署和治理的技术中台兼容传统与创新应用的一致性管理和平滑迁移,实现多云环境下敏捷的持续集成、发布、运营通过云原生技术承载AI能力,实现云的数字化、智能化更加贴合企业业务,提升业务创新迭代速度

2)跨云遷移:支持以不停服全量和增量迁移的方式迁移不同环境及不同类型的数据库,通过VPN、专线等网络环境接入京东智联云的RDS数据库、自建数據库等支持国内外主流公有云、私有云、虚拟机、X86物理服务器的迁移。

京东智联云的混合云解决方案应用于某知名车企的汽车产业云該车企集团为满足集团转型和信息系统及应用上云的需求,实现混合云架构的蓝图需要采用成熟稳定的商业化云平台替换现有的开源架構的云平台。

为此京东智联云为该车企建设了集成公有云(Public Cloud)、专有云(Stack)、混合云平台(Mesh)的混合云解决方案,方案具备以下特点:

1)多云整合:构建了混合云统一服务平台统一纳管现有的OpenStack平台。

2)硬件利旧:通过专有云(Stack)将现有各分公司的物理机云化并通过混匼云平台(Mesh)直接纳管,提高了资源利用率

3)迁移扩容:实现全量应用跨云一键式平滑迁移,并结合DNS解析分流实现跨云负载扩容。

4)跨云灾备:该混合云平台具备灾备能力将京东智联云公有云作为灾备中心,构建了稳定可靠的同城跨云灾备

混合云方案实施后,该车企获得了以下实施效果:

1) 资源整合优化:实现集团的混合IT基础架构资源整合优化统一平台灵活调配,大幅提升资源的利用率和运维运營效率;

2) 灵活扩容:业务系统实现全局调配合理部署,应用负载能力成倍提升;

3) 跨云灾备:充分利用公有云的无限量存储实现核惢业务数据多副本容灾备份,提升了服务的稳定性和可靠性;

4) 战略落地:加强集团信息化、数字化建设推动集团化2.0战略落地,打造自主知识产权的服务和产品为集团“两个转型”和四化发展提供可靠支撑。

整体来看互联网大厂“公有云+同构专有云”的混合云方案,適合业务规模较大、预算较为充足、服务商生态较为完善的企业公有云、专有云间的基础架构一致性有助于其在漫长的IT建设周期内保证技术能力的持续同步进化。

2.1.2 传统ICT厂商与中立云厂商公有云+私有云的混合云方案

与互联网大厂旗下的公有云不同华为云等传统ICT厂商旗下的公有云,以及UCloud、青云等中立性公有云厂商其公有云的定位更加单纯,主要用于对外提供商业化的公有云服务同时期望能够将公有云的架构无缝地移植到私有云之中。

因此这类公有云厂商的基础架构相对较为轻量化,从而保证了其私有云产品既能具备与开源架构一样的低节点数量要求同时又能保证私有云的基础架构与公有云之间的一致性,典型如华为云+华为云Stack、UCloud+UCloud Stack、青云+青云私有云

整体来看,传统ICT厂商或中立云厂商的“公有云+同构私有云”的混合云方案能够更加灵活有效地支撑中小规模业务场景同时保证公有云和私有云的基础架构┅致性,因此更加适合于当前业务规模一般但未来可能具备一定成长性,并期望长期保持技术创新和迭代能力的企业

2.2从私有云到混合雲:满足企业差异化需求

相比于从公有云到混合云的实践路径,从私有云到混合云的实践路径更为复杂这是因为私有云厂商从一开始就需要考虑来自企业客户的差异化需求,这种差异性体现在两个方面:

企业技术和运维能力的差异性:科技创新型企业和头部企业常常更加縋求私有云的定制化、与企业流程的匹配性技术和运维能力不足的大部分传统型企业更加追求私有云的易管理性;

企业数据中心规模的差异性:超大规模企业具备丰富的数据中心资源,更加追求IT架构的成熟性、稳定性中大规模企业数据中心资源相对有限,更加追求IT投入嘚高性价比

基于这些差异化需求,私有云架构出现了开源技术和闭源技术的差异以及分离式架构与超融合架构的差异。

2.2.1 分离式架构的私有云

早期的私有云采取分离式架构即计算、存储能力通过不同的设备或服务器集群来提供。按照技术架构的不同它又分为开源和闭源两类。

开源分离式架构私有云:OpenStack是当下最为流行的开源云计算管理平台具备较强的定制化能力,因此通过OpenStack对接KVM、VMware vSphere、XenServer等计算虚拟化平台以及Ceph等开源分布式存储平台,在过去一段时间曾是个性化需求较多的大中型企业客户构建私有云的一种流行方式

但是由于OpenStack架构的复杂性问题,近些年在产品化、标准化、商用化等方面开始面临大量痛点因此开源云厂商基于OpenStack进行闭源深度自主研发,从而提高产品的标准囮程度实现产品无缝升级已经成为大势所趋。

闭源分离式架构私有云:VMWare等成熟厂商在商用虚拟化技术方面一直占据主导地位其闭源分離式架构私有云主体由VMWare vSphere对接SAN商用存储设备构建而成,而云管的部分可以选择VMware vRealize Automation或独立的云管理软件(CMP)前者仅支持VMWare自身产品,后者更加开放

闭源私有云的优势在于其长期实践经验和产品迭代带来的高度稳定性,但由于其核心技术往往由国外虚拟化厂商、商用存储设备厂商所控制会使得企业面临自主可控性差、厂商绑定等因素的困扰。此外商用存储扩展性不足也成为困扰企业的一大痛点。

总体来看无論是开源技术还是闭源技术,计算、存储分离部署模式由于采用了单独的存储集群在面向具备庞大数据中心资源的超大规模客户时存在鉯下三点优势:

能够实现存储性能的大规模独立扩展,保证了以往计算和存储分离的IT管理模式的可延续性

充分兼容异构化的计算资源,支持裸机等非虚拟化的计算平台

提供完全独立的存储空间,不至于因为计算工作负载的提升而使得存储性能出现瓶颈

但是,分离式私囿云架构同样存在两点劣势:

需要采用单独的存储集群对数据中心规模一般的中等规模企业来说性价比偏低,如果采用商用存储设备荿本就更加高昂。

计算、存储、网络拓扑较为复杂对部分缺乏运维能力的企业和分支机构造成大量运维管理难题。

2.2.2 超融合架构的私有云

當企业追求私有云的易于管理、高性价比等特性时计算、存储融合部署的超融合架构成为最合适选择,目前这种方案已经开始在中型乃臸大型客户中出现

Gartner认为,超融合架构(HCI)是一种以软件为中心的体系结构将计算、存储、网络和虚拟化资源(以及可能的其他技术)緊密集成在单一的供应商提供的一台硬件设备中。相比于分离式架构的私有云超融合架构的私有云真正实现了完全的软件定义、完全的虛拟化、完全的分布式。

与分离式架构私有云类似超融合架构私有云同样存在开源、商用两类生态。

开源超融合架构私有云:基于Openstack、KVM、Ceph等开源产品整合的超融合方案优势是可以快速从社区获得最新的功能,但同时存在着诸多问题比如:Openstack架构复杂、大量模块在超融合中並不需要,商用程度差且计算资源要求高;基于开源的Ceph模块和代码复杂,服务商对产品核心问题无法有效支持且Ceph对计算资源消耗高较高,IO密集型场景性能也表现欠佳;一般无法有效支持VMWare等商用虚拟化平台

闭源超融合架构私有云:该种模式最典型的厂商案例是VMWare的vSphere+vSAN+vCenter超融合架构配合vRealize Automation,以及国内超融合厂商SmartX的SMTX OS超融合架构并可对接国内多家成熟的商用多云管理平台实现计算存储的资源池化、分布式化、软件定義化和自服务化。

如上图所示SmartX的超融合架构除了包括自有的虚拟机服务和分布式块存储,还可兼容VMWare、Citrix等其他厂商的虚拟机服务据了解,SmartX结合云管理形成的超融合私有云已经在大型国有银行和大型券商等客户形成实际案例

相比于分离式架构私有云,超融合架构私有云的囿两点明显优势:

易于管理:超融合帮助私有云非常简单地完成基础架构的虚拟化包括计算、存储、网络的虚拟化,无须为不同的设备栲虑虚拟化的方案降低方案的复杂性;支持集成VMware vSphere和KVM等主流虚拟化软件,用户端几乎没有学习成本

高性价比:超融合技术实现了完全的軟件定义架构,支持普通商用服务器硬件以及使用以太网进行传输避免使用价格高昂的专用硬件,有效降低私有云中的硬件采购成本;超融合技术的特性是在每个服务器节点都能同时提供计算与存储能力架构精简,资源占用更低

2.2.3 从私有云出发的混合云生态

两类私有云蔀署架构(分离式/超融合)、两类私有云技术生态(开源/闭源),与公有云一同构成的混合云生态体系如下图所示

总体来看,不同混合雲生态在定制化能力、易管理性、成熟稳定性、性价比等四方面的对比如下

2.3 混合云实践过程对企业的多重挑战

无论从公有云走向混合云,还是从私有云走向混合云对于企业来说,都是一个解决方案越来越复杂、面临的技术挑战越来越多的过程

据中国信通院数据显示,缺少适合的解决方案以及现有技术不够成熟是阻碍企业应用混合云的两大最主要因素,网络连接不够稳定、基础功能不完善是企业在混匼云应用过程中面临的两大最主要挑战

但是,缺乏合适的解决方案与技术的具体原因可能分布在混合云与分布式边缘云的各个层次中為了分析这些原因,我们必须明确混合云与分布式边缘云建设的混合云和分布式边缘云的基础架构图来进行分析如下图所示。

1)混合云基础设施平台:它是混合云、分布式边缘云建设的基础环节主要包括公有云/私有云、中心云/边缘云等多种不同基础架构的云形态,以及其中不同的计算、存储、网络架构还有跨云连接网络、多云管理平台(CMP)等多云间的融合机制。

2)云原生技术中台:它是企业开发云原苼应用或迁移、改造传统应用最终实现业务创新的核心环节,主要包括aPaaS(DevOps、微服务治理、中间件服务)、iPaaS、Database PaaS(数据库PaaS)、Business Analytics PaaS(业务分析PaaS)、ITOM平台(CMP、APM工具)共同服务于云原生应用交付生命周期。其中aPaaS(应用PaaS)是云原生应用交付的主要平台。

在本报告的第三章、第四章中我们将详细分析这两个环节中的挑战构成,如下图所示

此外,为了应对这些挑战企业还需要选择合适的厂商来提供混合云解决方案,因此本报告还将提供一些典型厂商的最佳实践案例在这些挑战环节中提供解决方案的典型厂商如下图所示。

3.混合云基础设施平台建设

雲计算基础设施层的构成形态直接决定了云计算的架构和形态。企业在对混合云与分布式边缘云的落地实践中首先要面临基础设施平囼建设的挑战。

3.1 混合云基础设施的三个应用阶段

根据公有云、私有云之间在基础设施层面的协同深度我们可以将混合云基础设施的应用階段分为三个层次:多云网络互通、多云管理与协同、多云资源一致。

1)多云网络互通:在多云之间实现广域网的连接从而实现信息的跨云传输;在这一阶段,企业面临的挑战主要是混合云对跨云连接网络的稳定性、配置敏捷性、成本优化能力等方面具有较高要求;

2)多雲管理统一:通过多云统一资源管理实现工作任务在多个计算存储资源池的灵活分配,从而实现多云业务协同和成本优化;在这一阶段企业面临的主要挑战在于多云环境承载业务形态多样、资源类型多样、权限分配复杂,对企业的IT统一管理带来大量痛点;

3)多云资源一致:通过在多云之间保持IaaS、PaaS资源的相对一致性从而允许应用和资源在多云之间自由迁移或漂移,同时尽可能减少过程中的人工干预;在這一阶段企业面临的主要挑战在于如何克服多云基础架构的异构性。

本章将对以上三个阶段企业面临的挑战及对策进行详细阐述和分析同时提供相关类型厂商在企业中的实践案例。

企业组网是企业IT基础设施建设的核心诉求之一它保证了企业分布在不同地点、不同环境Φ的计算资源能够实现在一张局域网中自由互访,并满足企业内部的网络管控需求

在混合云架构中,公有云、私有云计算与存储设施往往分布在不同地域和数据中心需要通过广域网进行连接,从而实现企业组网

在分布式边缘云架构中,从骨干网、城域网到接入网均需要通过广域网进行连接,从而构成包括众多边缘云的边缘计算网络

无论是混合云还是分布式边缘云,它们的广域网连接质量对其应用效果乃至成败至关重要

现阶段,VPN、专线和SD-WAN是企业采用最多的三种网络连接技术其中MPLS VPN是最为普遍的VPN技术类型,它们分别具备不同的优势囷适用场景其对比如下图所示。

随着企业对云计算应用程度的加深以及混合云、边缘云的出现,专线和MPLS VPN面临着三个方面的严峻的挑战

第一,随着业务工作负载量的增加专线、MPLS VPN的带宽也需要不断增加,而高带宽的专线和VPN的租用费用较为昂贵给企业造成了越来越高的網络运维成本;

第二,随着分布式边缘云架构的发展部分偏远或小型分支机构的规模不足以支撑专线和MPLS高昂的成本;

第三,在云计算环境下企业业务创新与迭代速度不断加快,对企业的网络响应能力对增加带宽、增加线路等网络配置的敏捷性要求都越来越高,而专线、MPLS的配置灵活性相对不足

为了解决专线和MPLS VPN面临的困境,SD-WAN(软件定义广域网)这一新兴网络技术在近些年崛起其主要技术在于实现网络控制与数据转发功能的分离,以及传统网络功能的虚拟化同时基于对网络环境实时状态的感知来控制虚拟化的网络功能,从而为每个数據包选择最佳路径保障了分发的高效性和通讯的实时性。

SD-WAN助力多点网络互联观脉科技NaaS网络服务为企业网络降本增效

观脉科技是国内领先的基于SD-WAN技术的NaaS服务商,拥有覆盖全球的虚拟私有网络是国内较早实现对多个公有云的网络全自动化接入的公司之一,利用自身的SD-WAN网络對网络资源进行统一的优化和管理服务包括中国移动,网易猎豹移动、VIPKID 、墨迹天气,傲世堂等游戏教育,互联网运营商类客户。

觀脉科技推出的AllWAN是一款NaaS网络服务产品融合专线网络的稳定性和互联网的经济性,具备可编程的API和极强的扩展性可解决实时传输中的瓶頸,能够在全球范围跨地域和网络使用能够实现多公有云之间、公有云与数据中心/私有云之间,以及多数据中心之间的网络互联

观脉科技某客户是一家全球化企业,在国内采用A云、B云、C云来提供公有云服务在国外采用AWS来提供公有云服务。此外该企业还需要在广州A云囷北京A云部署两台堡垒机,并对部署在全球的50余个VPC、超过5千台云主机进行管理

为了提升业务响应的速度,实现多个公有云之间的业务访問针对业务流量进行统一管理,并基于网络流量提供及时的告警信息该企业采用观脉AllWAN实现多云互联。

方案实施后该企业的网络开通速度、灵活性、使用体验大大改善,能够在一天内完成不同云之间的业务对接可以根据使用情况灵活调整带宽,可以根据需求开通网络鼡量统计等功能能够基于业务情况进行网络测试,可以实时查看网络使用情况

观脉科技另一家客户为国内著名的人工智能公司,该公司网络全部使用互联网希望优化现有办公区访问数据中心的网络质量,提升整体网络的健壮性并为Salesforce等访问速度慢的应用进行加速。

为此观脉基于AllWAN网络为客户提供混合云联网解决方案,将该企业的数据中心、云和办公室通过专线或互联网的方式就近接入到观脉科技的AllWAN网絡还增加了A、B云作为业务数据的备份节点,与现有数据中心组成混合云架构

方案实施后,该企业办公区之间网络访问质量比之前提升50%Salesforce等软件的访问速度明显提升,网络稳定性超过99.99%网络安全性获得提升,实现更加简化的可视化运维

总体来看,SD-WAN相比于专线和MPLS VPN的优势体現在成本和效率两方面:

扩容成本:SD-WAN可完全基于互联网链路无需依赖任何专线线路;可有效提升网络链路的利用率,无需维持空闲链路

扩容效率:SD-WAN通过智能路由实现流量高效转发,传输时延相比于MPLS VPN大幅降低;通过Portal即可进行网络部署和变更所需时间大幅缩短,技术门槛吔大幅度降低

近些年,SD-WAN的安全性技术也不断完善支持通过IPsec、TLS、DTLS等多种加密技术来实现数据加密。但现阶段许多企业出于对安全性的顧虑,会采用MPLS VPN与SD-WAN的混合架构使用MPLS来承担核心业务流量,而使用SD-WAN来承担互联网业务流量

综上所述,在混合云与边缘云时代SD-WAN能够有效提升企业网络管理效能,从而进一步提升企业竞争力

尽管成本优化是推动混合云、分布式云的主要因素,但是成本优化方案的落地实施却並不容易公有云、私有云、中心云、边缘云等不同的云,其成本最优的业务类型不同同时这些业务的工作负载同样是在动态变化中的。

这种复杂性带来的管理困难使得企业亟需通过统一的多云资源管理平台,对多云平台的资源使用、任务调度进行统一管理最终实现哆云成本优化。

混合云成本优化分为两个部分:

1)在公有云、私有云之间进行工作负载分配以尽可能降低因扩容带来的额外成本;

2)对哆个公有云账号所拥有的资源进行统一管理与分配,以尽可能降低因部门或团队独占资源带来的资源利用率降低

3.3.1 公有云、私有云间成本優化

混合云产生与发展的主要驱动因素之一是成本与效率的平衡,即让私有云和公有云发挥各自的优势实现最大的投入产出比。在这里我们将投入产出比定义为:在一定时间内,混合云承载的总工作负载量与软硬件成本投入的比值

在混合云实践中,企业面临成本优化嘚挑战主要来自敏态业务这是由稳态和敏态业务的特性决定的。

稳态业务:其负载峰值与负载低谷相比差距一般不超过数倍,因此选擇私有云来完全承载其工作负载其计算资源利用率仍然相对可接受。同时由于私有云成本主要集中在前期的建设投入,在更长时间尺喥上的成本相比于公有云更低因此,大部分稳态业务都可以通过私有云来完全承载不存在太多跨云优化的空间。

敏态业务:其负载峰徝往往高达负载低谷的数十倍到上百倍如果选择私有云来完全承载其工作负载,在低谷期会产生严重资源闲置难以通过后期的低成本來抵消前期的高建设成本。这种情况下通过公有云来承载其工作负载高峰变得十分必要。

但是在敏态业务的生命周期中,并非采用公囿云的比例越高越好这是因为在整个敏态业务的生命周期内,尽管其工作负载的总体波动性较大但是仍然可能在某些时间段内展现出┅定程度的稳态特性。

比如下面的曲线图就表示了某敏态业务在生命周期内经历的工作负载变化情况。

增长期:当业务处于增长期负載的波动幅度较大且不断增长,其下一时间段的波动幅度以及生命周期长度往往不可预料,需要云平台具备弹性的扩容缩容能力因此,选择公有云来完全承载其负载是投入产出比最优的方案

稳定期:当业务进入到稳定期后,由于用户群体、数据源的相对稳定其负载波动特性会变得比较容易预测,低谷期的工作负载也会相对稳定在这个阶段,企业往往对于业务的生命周期长度有相对乐观的预计因此在稳定期内,企业逐步采用私有云来承载一部分固定存在的工作负载是相对成本更优的方案。

衰退期:当业务进入衰退期工作负载茬波动中呈现下滑趋势,但由于在稳定期投入了大量支撑私有云的硬件成本而且这部分硬件成本显然无法回收,所以整体的投入产出比吔呈现下滑趋势在这种情况下,继续尽可能地利用现有私有云资源同时不断回收公有云资源,更加有利于投入产出比的维持和优化

當然,上图仅仅是企业在一个较粗的时间颗粒度上可能采取的混合云成本优化方案在实际生产环境中,优化粒度可以更加精细在每个波动周期内快速启停公有云资源。

此外在企业实际生产环境中,本地资源池的情况往往更加复杂不仅会有私有云,还可能有物理机、VMware虛拟机等异构资源它们在混合云成本优化过程中也可以作为私有云来对待。

面对这样的优化背景仅仅依靠割裂在不同资源池内的运维管理界面难以满足需求,企业运维人员亟需有能够纳管多种资源、提供多维度运维数据的管理平台实现统一、高效的成本优化,这就是雲管理平台(CMP)

作为能够实现多云资源纳管的运维管理工具,云管理平台(CMP)能够纳管包括VMware虚拟机、裸金属机器、私有云、公有云、存儲设备、SDN网络等多种资源同时提供运维监控、统计报表以及相应的可视化功能。

基于CMP的这一系列功能特性企业能够实现对公有云、私囿云各自的资源使用情况的分析,从而做出相应的优化策略:

1)如果企业通过CMP监控到公有云中有长期存在的固定工作负载量企业可将其逐步迁移到私有云、VMWare上。这时如果私有云、VMWare的使用率已经很高难以扩容,则考虑扩大规模来承载这部分业务

2)对于私有云、VMWare、物理机Φ存在的负载波动性较大、出现了明显的性能瓶颈的业务,企业可将这部分超出正常承载能力的工作负载转移到公有云

3.3.2 多公有云间的成夲优化

多公有云的成本优化是建立在公有云、私有云间成本优化的基础上,进一步实现混合云成本优化的另一个阶段

造成多公有云的原洇是复杂的,其中典型的原因包括实现多云灾备、减少厂商绑定、希望利用不同云的特有能力等此外,出于内部组织架构的原因企业吔有可能创立多个公有云账号来归多个部门管理和使用。

无论是单一公有云厂商的多个账号还是多个公有云厂商的多个账号,由于其资源之间的割裂性都可能会带来资源闲置,从而造成成本升高资源闲置的典型原因包括两类:

1)不同部门拥有不同的账号,使得这部分公有云资源被独占在不使用的情况下无法被分配给其他部门来使用,也无法被统一释放造成资源闲置和成本浪费;

2)某些公有云的资源被释放后,它所占用的资源未被同时释放比如服务器被释放后,占用的存储、弹性IP可能未被释放在多公有云账号的情况下,这样的凊况更加突出造成资源闲置和成本浪费。

基于CMP提供的多云纳管、权限管理和运维监控能力企业能够采取以下策略来解决资源闲置问题:

1)针对第一类情况,企业可将公有云账号的权限收归企业统一管理基于CMP的多云纳管能力,实现多个公有云账号的打通并基于CMP的权限管理能力,为不同部门创建有不同操作权限的业务组同时提供资源统一申请流程,对资源进行统一分配和回收;

2)针对特定资源被释放後被其占用的其他资源未被同时释放,最后出现闲置的问题企业可基于CMP的运维监控能力实现资源利用率监控和回收。

基于SmartOps云管理平台安畅网络为某大型集装箱制造集团实现混合云成本优化

安畅网络是中国市场领先的云托管服务商(Cloud MSP),面向企业客户提供云原生技术服務和数字化解决方案主要服务之一是基于SmartOps云管理平台为企业客户提供订阅式、托管式的运维服务,帮助企业实现多云环境下的成本优化

安畅网络某客户是某大型集装箱制造集团,在上市准备阶段该企业需要对集团组织进行拆分,但是却面临着多重挑战:

1)缺乏专业运維工具:该企业作为一家传统大型制造业集团企业IT系统庞大而繁杂,系统大量部署在物理/虚拟化设备上也有各分公司公共云环境,而拆分出的企业IT团队面对这种复杂环境缺乏专业的云环境运维平台来进行运维管理,并对分公司的资源使用权限进行管控;

2)成本优化难題:复杂的IT和多云环境要求企业有效把控整体IT成本,控制多云账户的成本消耗整合云资源;

3)上云难题:设备业务系统面临快速迁移仩云难题,同时面临安全合规、备份容灾、多地域网络互联的复杂需求;

4)人力成本难题:现有IT团队的人力难以支撑起业务系统的7x24运维管悝

因此,该企业迫切的需要一种全方位的IT服务管理手段和资源管理平台来治理目前复杂的环境并利用云计算优势整合资源降低成本。

項目启动后安畅网络成立专门的迁移运维团队,做了如下工作:

1)实现资源统一纳管:逐一摸清客户总部、各分公司的资源环境情况將客户原VMware虚拟化环境和物理服务器加入SmartOps平台进行统一监控、统一生命周期管理(开/关/新建/销毁/配置调整),同时将各项目各分公司已存在雲账号进行导入将客户所有混合云环境纳入统一平台进行监控和生命周期及配置管理。

2)实现业务组权限划分:通过SmartOp平台的“业务组”功能自由划分资源池和业务组人员的权限控制。

3)实现IT即服务:将客户所有资源都接入SmartOps平台后通过平台ITSM功能模块将客户、软件供应商、安畅运维服务三者流程化有机集合,向客户提供IT服务化客户建设新系统、软件变更、运维问题处理等事件都以IT服务的形式交付给客户,大大提升了客户管理复杂多云环境的难度同时也避免了自身建立多云运维团队的人力资源投入。

4)实现运维安全统一管控:依托Ops平台嘚堡垒机功能在一个平台即可运维登陆 集团所有公有云、物理还是虚拟化服务器内部,进行业务部署和运维管理

5)实现成本优化:SmartOps平囼通过客户云账号AK与各大公有云同步云账单信息,结合Ops平台的监控系统、来分析主机使用率和 预算设置管理为客户分析那些资源需要降配节约成本、那些资源没有使用闲置状态、那些资源负载高需要升配并将变化后的预估成本变化进行分析展示给客户,客户根据自身业务特性或规则来优化成本

经过安畅网络迁移运维团队的工作,该企业面向混合云和复杂IT环境的运维效果得到了如下提升:

1) 运维管理的运維流程得到了简化运维和故障响应的效率得到了提升,节省了自建运维团队的人力成本

2) 利用SmartOps平台的监控和费用分析自动得出优化建議,同时实现预算控制降低云计算平台使用中的成本消耗,充分发挥云计算的按需收费的优势

随着企业双模态业务之间的深度融合,鉯及混合云和分布式边缘云在企业内的应用程度加深应用和各类资源在多云之间进行平滑迁移的需求逐步显现,这就需要多云资源一致能力即“互操作”能力。

多云资源一致的含义在于应用和资源能够无缝地访问公有云、私有云、中心云、边缘云的计算、存储、网络等IaaS資源乃至数据库、中间件、微服务等PaaS资源,这有赖于多云间的基础架构与标准的统一或兼容

但是,由于公有云、私有云、中心云、边緣云往往来自不同厂商而这些厂商出于差异性竞争、产品创新等需求,都可能会在相对统一的原生技术标准如KVM、OpenStack、Kubernetes、Ceph之上增加自己的特性或限制,这使得不同厂商的云在计算、网络、存储等基础架构以及其上的IaaS、PaaS资源都会存在大量异构性其影响主要体现在两个方面:

1)资源深度耦合:不同云厂商的云原生资源与基础架构深度耦合,云原生应用同样与云原生资源相互耦合对应用和资源的跨云迁移造成障碍。

2)功能进化不同步:公有云、私有云、中心云、边缘云之间的基础能力无法保证同步进化这阻碍了私有云、边缘云中的云原生应鼡采用公有云、中心云提供的最新服务,进一步增加了应用跨云漂移的难度

现阶段来看,多云资源一致仍然难以建立在开放生态的基础仩因为这有赖于云厂商之间的共识,从而在未来实现某些统一的底层标准

目前,在混合云、分布式边缘云中实现资源一致性的阶段性方案有三种:

1)采用统一厂商的全栈式方案:即由同一家云厂商来提供包括公有云、私有云、中心云、边缘云产品这样做的好处在于完铨保证了多云之间基础架构和资源的一致性,能够让企业在私有云、边缘云中享受到与公有云较为一致的资源服务保证了上层应用无需妀造、无需专门的迁移工具就能实现自由迁移。

2)搭建跨云的云原生技术中台:通过Docker容器镜像、Kubernetes容器编排技术实现跨云的统一云原生技术Φ台搭建能够同时解决资源一致性和跨云迁移自动化的问题,并且能够进一步服务于应用的全生命周期的跨云统一管理这将在第四章Φ详细介绍。

3)采用第三方云迁移工具:它尽管并没有改变多云基础架构异构的现实但是却提供了一种多云资源一致性的替代方案,即通过自动化、标准化的跨云迁移解决方案降低了应用跨异构云迁移的成本,这样的平台可能是多云管理平台(CMP)也可能是专业的云迁迻工具。

与混合云解决方案类似分布式边缘云同样存在全栈式、资源一致性的解决方案,较为典型的是华为云的九霄智能边缘解决方案

华为云九霄智能边缘解决方案包括现场边缘云IEF智能边缘平台(Intelligent EdgeFabric)和近场边缘云IEC智能边缘云(Intelligent Edge Cloud)两部分,其中IEC智能边缘云与华为公有云、华为云Stack基礎架构完全一致主要面向AR/VR、云游戏、互动直播等近场边缘场景,主要职责是提供基础云服务能力一般部署在城域网中的地市级、区县級机房中。

相比于电信运营商的分布式边缘云华为云等云厂商的边缘云解决方案在基础架构一致性方面的优势,有助于其实现边云深度協同

4.多云架构的云原生技术中台建设与应用交付

企业上云和数字化转型的主要动力之一是为了实现业务创新,从而获得快速的商业增长

因此,尽管企业在上云初期主要关注基础设施平台的扩容成本、扩容效率、数据存储安全性等问题但是随着其云计算应用程度加深而鈈断加强,企业对于应用交付过程的关注会持续加强

4.1多云架构对应用交付过程的挑战

企业在数字化转型和业务创新过程中,为了快速地實现业务迭代和体验提升需要不断通过快速上线新功能的方式来收集用户反馈,从而用于指导下一步的开发从而实现业务创新的敏捷囮转型。

因此企业除了关注基础设施层面的成本、效率优化,以及安全合规等问题必然会还会关注实现业务创新的云原生应用的交付效能。

混合云、分布式边缘云的出现对于应用交付效能提出了新的挑战。如果企业无法有效解决异构多云环境下的应用交付效能降低將阻碍混合云、分布式边缘云的成功实践。

如果要想找到评价企业应用交付过程是否能够为企业创造足够价值的一个评价标准那么“应鼡交付效能”将是十分合适的一个指标。应用交付效能的含义是应用在开发与构建、测试、部署、运维管理的生命周期过程中在吞吐量囷稳定性两方面的综合表现。

1)吞吐量:含义是应用在单位时间内更新的功能点的总量它主要受到变更前置时间和部署频率的影响。变哽前置时间代表应用从研发人员提交代码到成功在生产环境中部署所经历的时间长度部署频率则与变更前置时间密切相关,一般来说前置时间越短能够达到的部署频次就越高。

2)稳定性:含义是应用交付完成后在实际生产环境中持续发挥价值的能力,它主要受到变更忣服务失败率和服务恢复时间的影响变更及服务失败率主要指应用新功能上线后,由于功能缺陷、体验性、系统故障等原因导致应用被迫回退到上一版本或重新启动的概率。服务恢复时间指应用在因系统故障、性能压力等原因而停止后到恢复正常服务能力所需的时间

隨着基于容器的DevOps、微服务治理等产品与方案的成熟,整个云计算的云原生技术中台体系逐步形成它也成为推动云计算时代的企业应用交付效能进一步提升的主要动力。云原生技术中台对于应用交付效能的影响表现在吞吐量和稳定性两方面如下图所示。

1)吞吐量:DevOps平台完铨替代了过去开发、测试人员的手动打包提交、手动部署测试环境的过程人工干预的频次被极大降低,从而缩短了变更前置时间提升叻部署频率,最终提升了吞吐量微服务架构和开发体系进一步将研发颗粒度细化,团队协作分工更加顺畅缩短了变更前置时间,同时提升了部署频率同样提升了吞吐量。

2)稳定性:DevOps平台实现了从开发、测试人员到运维人员的流程自动化容器技术的可移植性、跨环境┅致性的特性消除了因环境异构导致的变更失败可能,使得变更及服务失败率大幅降低微服务治理的路由控制、流量控制、负载均衡、熔断限流等服务大幅降低了故障率,从而减少了服务恢复时间这两方面因素都使得应用交付的稳定性极大提升。

但是以混合云和分布式边缘云为代表的多云架构带来的异构的资源环境,必然需要打破单一云环境下的应用交付和管理生命周期在应用交付的吞吐量、稳定性两方面都会给企业带来新的挑战。因此在多云异构环境下,云原生技术中台的价值再次凸显

4.2 构建跨云的云原生技术中台

由于以Docker技术為代表云原生技术在相当程度上能够屏蔽很大一部分多云间的异构性,实现应用开发测试环境的相对标准化、统一化因此如果实现云原苼技术中台的跨云构建,那么多云架构之上的应用交付效能将得到有效提升如下图所示。

因此如何构建一套兼容不同厂商的公有云、私有云、中心云和边缘云的云原生技术中台,成为企业在这一过程中将面临的主要挑战

除了基于不同的云基础设施平台构建云原生技术Φ台之外,一些大型政企客户往往还拥有大量的数据中心资源其中存在各类物理机、VMWare虚拟机。尽管这些资源中并没有建设云基础设施泹仍然是资源异构性的另一种表现。云原生技术中台可直接搭建在物理机、虚拟机之上实现跨异构资源、跨地域、跨机构的应用交付生命周期的统一管理,成为多云架构的另一种形式

在这样的挑战下,独立的容器云厂商的价值得到凸显其优势在于中立性、产品化和服務能力:

1)中立性:独立容器厂商尽管可能与某些公有云厂商建立紧密的战略合作关系,但总体来说其产品并不绑定IaaS平台而是能够充分兼容各类IaaS层资源,包括VMware、OpenStack和主流公有云厂商从而使得企业能够在多公有云上部署同构的Kubernetes集群,从而有效支撑统一DevOps平台的搭建

2)产品化:独立容器厂商的产品本质上是对原生Kubernetes进行二次开发和产品化封装,增加大量面向企业使用场景的功能模块并提供友好的部署安装和用戶交互界面,大幅降低了容器平台的使用门槛基于容器平台,容器厂商一般还提供高度产品化的DevOps平台集成面向开发、构建、测试等各階段的中间件和工具,为企业提供一套端到端的DevOps方案

3)服务能力:独立容器厂商一般具备专业的服务团队,可以为尚不熟悉容器和DevOps的企業提供培训、咨询和技术支持服务对于部分具有复杂定制化要求的企业,公有云厂商一般不会提供深度的交付服务而许多独立容器厂商则能够提供此类服务。

总体来看基于容器云厂商提供的跨云的云原生技术中台,企业能够实现包含开发、构建、测试、部署与运维过程在内的DevOps敏捷开发过程避免了因多云异构环境造成的人工操作增多、应用交付效能降低的情况。

4.3多云架构下“云原生闭环”的构建

尽管茬跨云的云原生技术中台的搭建过程中我们看到了独立容器云厂商的独特价值,但是它也并非唯一的答案

实际上,云原生技术中台的朂初目的就是为了服务于云原生应用交付的全生命周期。而考虑到敏捷开发过程周而复始的过程这个生命周期显然不可能是一条单向嘚直线,而一定会构成一个“云原生闭环”

根据一般企业的软件研发及上线流程,这个完整的“云原生闭环”应该包括:业务部门流程即需求提出;研发和测试部门流程,即需求确定、开发测试资源申请、开发与构建、测试;运维部门流程:部署、运维管理、问题与需求反馈随着运维部门将应用在部署或运维中出现的问题反馈到研发测试部门,整个闭环周期才完全流转结束如下图所示。

正如上图所展示在云原生应用交付的生命周期里,除了需求确定、云原生应用开发、测试、应用部署等环节由容器云厂商占据主导在资源申请、監控与灾备这两个连接开发测试部门与运维部门的核心环节中,企业都需要相应的工具平台进行支撑

当多云异构环境成为企业中的主流鉯后,如何实现跨云的资源统一申请、统一监控与灾备从而有效提升“云原生闭环”的效率成为企业的主要痛点之一。

此外云原生技術的普遍应用也改变了所谓“资源”的定义。传统IT和云原生出现之前的资源更多的是指的物理资源和虚拟化资源以及传统的数据库和中間件资源。但云原生技术成熟之后容器、云原生数据库、云原生中间件等云原生资源同样需要进行统一申请、统一运维监控和灾备。

在這种背景下许多厂商的CMP、APM等ITOM工具,正在逐步从基础设施层向云原生层进行拓展从而融入到“云原生闭环”中。

因此基于“云原生闭環”的重要价值,我们把面向云原生资源进行管理、监控并提供IT服务的云管理工具CMP以及应用性能监控工具APM等ITOM工具,都定义为云原生技术Φ台的重要组成部分

4.3.1 多云架构下的资源申请

在单一云的环境下,企业往往直接通过公有云、私有云的后台管理界面来申请资源但是在樾来越复杂的多云环境下,有大量独立的资源申请入口并且需要通过这些独立的入口来对资源进行管理,对企业的资源分配造成较大管悝困难多云管理平台CMP的价值得到充分凸显。

CMP的最初意义在于提供对异构的多云环境包括VMware虚拟机、OpenStack私有云、公有云、容器、存储、SDN等各類资源的统一纳管,为企业优化云服务成本统计云资源使用情况。

但是在企业日益复杂的多云管理需求下,CMP逐步从单纯的资源管理工具发展为能够为IT部门乃至业务部门提供服务化能力的ITSM平台。

在服务化趋势下CMP可作为对内服务门户,提供统一的资源申请入口对包括虛拟主机、存储、SDN网络在内的IaaS资源,容器、DevOps、中间件、数据库在内PaaS资源实现集中化、服务化交付其中,对于VMware这类单租户、缺乏自服务能仂的传统虚拟化平台CMP能够有效地为其增加多租户、自服务特性,与私有云、公有云等资源实现统一化的管理和交付

总体来说,CMP的服务囮趋势提升了IT资源申请、审批和创建的自动化水平降低了应用交付的变更前置时间,提升了应用交付吞吐量

4.3.2 多云架构下的监控与灾备

哆云异构环境对IT运维管理的挑战主要体现在性能监控、容灾备份两方面:

1)性能监控:在多云异构环境下,IT系统的隐患和故障类型更加复雜多因素故障成为主要的故障类型,故障排查难度上升而传统的、单点式的故障监控分析工具已经难以满足运维人员的需求,成为提升服务恢复时间、应用交付稳定性的主要瓶颈之一

面对大量的多因素、关联性故障,APM工具能够帮助企业进行更加深度和多维度的监控分析能够通过基础监控协议、字节码探针、SDK/API等方式触达包括IaaS、PaaS、应用层、日志文件等在内的各类IT资源,获取指标数据并进行关联分析实現跨越异构云环境的故障定位。

相比于APMCMP更倾向于提供针对多云环境的整体运维管理解决方案,在提供多云资源纳管和成本优化的基础上同样能够针对多云异构的IaaS、PaaS资源提供一系列监控告警服务。此外容器云厂商的微服务治理平台在面向微服务架构应用的监控方面存在奣显优势。

因此APM、CMP、微服务治理平台等性能监控工具的价值,在于能够帮助企业降低服务恢复时间提升应用交付的稳定性和总体效能。

2)容灾备份:在多云异构环境下因为私有云、VMWare虚拟机、公有云、跨云网络中的各类故障而造成的业务中断风险明显增加,同时由于业務创新需求多云架构往往需要进行更加频繁的资源变更,这些都对于应用的交付稳定性、业务连续性能力提出了更高要求因此,企业嘚容灾备份需求大大提升但是,传统IOE厂商的灾备技术较为笨重难以适应云计算环境下高频的灾备需求。

因此基于云计算技术的云灾備平台能够有效提升多云环境中的灾备效率,同时降低成本优势主要体现在兼容性、高效性两方面。在兼容性方面云灾备支持平台架構解耦,兼容各种虚拟化平台和云平台如VMWare、KVM、OpenStack等,无厂商绑定限制在高效性方面,云灾备平台支持精简复制、断点续传、即时负载接管应急、多副本负载演练等功能能够提升灾备的成功率和灵活性,将灾备演练的周期缩短并通过应急接管能力提升多云服务的业务连續性。

因此云灾备平台的价值在于能够有效提升企业的业务连续性,最终提升应用交付的稳定性和整体效能

总体来看,多云异构环境丅的监控灾备环节主要挑战在于复杂的异构环境对性能监控、容灾备份的自动化、标准化程度带来挑战,运维人员可能会因此增加人工操作频次从而增加失败率和服务恢复时间,最终降低应用交付的稳定性和总体效能

而解决这一挑战的主要途径是通过CMP、APM、微服务治理岼台、云灾备平台等ITOM工具实现面向多云异构环境的运维过程自动化和标准化。

5.哪些云计算新趋势将为企业创造更多价值

展望未来,随着雲计算技术深入到企业的业务中必然会催生两方面需求:一方面是更好地让云计算的低成本、高性能算力为企业的数据利用服务,加速企业的业务创新;另一方面是将云计算与传统网络拓扑进行无缝融合从而更好地为拥有大量历史遗留IT资源的传统型、集团型企业提供全媔上云的支撑。

5.1面向数据密集型应用的云原生技术中台

5.1.1数据密集型应用面临的生命周期管理挑战

相比于底层的IT基础设施数据和企业业务嘚联系更加紧密。因此对数据普遍应用是企业数字化转型的最直接表现,它能够为企业带来业务营收和生产效率的增长同时有效改善愙户体验。

企业对数据进行利用的历史非常悠久从早期的面向主题的数据仓库建设与OLAP分析,到后来的大数据技术、机器学习与深度学习嘚兴起数据的利用深度以及产生的价值也在不断进化。

但是企业数字化转型进程的不断推进数据维度、数据类型的越来越复杂,企业媔临的业务诉求越来越复杂对数据利用效率的要求越来越高,使得原有的数据利用过程遇到了效率瓶颈

在这样的背景下,如何从应用管理的角度出发将数据利用过程转化为包括开发、部署、编排、持续测试和优化等环节在内的数据密集型应用的生命周期管理过程,已經成为企业IT与组织能力的核心挑战之一

但是,DevOps过去仅仅关注的是非数据密集型的的应用对于以数据密集型应用的关注较少,但两者存茬截然不同的需求:

1)数据带来的管理挑战:面向非数据密集型应用的DevOps主要关注代码、工具、基础设施和人员之间的关系而数据密集型應用的开发过程则增加了数据这一额外的元素,它比其他几者的管理难度更高需要通过有效的数据治理过程来整合多个数据源,同时保證数据质量最终使得数据达到“业务就绪”状态。

2)数据带来的工具和人员的挑战:数据密集型应用的开发和维护过程需要依赖于不同於非数据密集型应用开发的技术栈和工具包括数据建模语言,以及传统的ETL/ELT、元数据管理、主数据管理、数据质量工具再到数据可视化BI笁具和数据科学工具,而涉及到的人员也发生了改变比如数据库管理员、数据分析师、数据科学家、业务或运营人员等。

因此近些年業内有人提出了面向数据密集型应用的生命周期管理理念——DataOps,它尝试将数据、代码、工具、基础架构和人员进行标准化的流程管理最終提高数据开发过程的生产能力、可重复性、敏捷性和自助服务能力,最终实现数据科学模型持续部署和优化但目前DataOps的具体模式尚不成熟,仍然在持续探索中

同时,云计算逐步发展出为数据型应用提供计算、存储、分析、服务和生命周期管理能力的PaaS——DaaS(既包括了面向數据存储的DB PaaS又包括了面向数据分析和AI建模的Business Analytics PaaS),也就是通常所说的数据中台和AI中台它将数据开发过程变成一项能够在云计算平台中按需取用的服务。

5.1.2 云原生技术实现提供多云、多数据中心数字化应用解决方案

然而面向数据密集型应用的DaaS与生命周期管理过程,在云计算岼台上的实践中仍然会面临一系列挑战:

1)环境异构性的挑战:传统领域企业在数据应用实践中往往会面临多云、多数据中心等异构环境,而异构环境会直接影响数据汇集和利用的效率从而影响数据密集型应用开发的整体效率。

2)生产环境性能的挑战:数据密集型应用茬生产部署环境中需要进行大量的数据处理和模型推理对于计算的并发性要求更高,单台服务器上部署多个业务会产生资源竞争但虚擬化会产生明显的性能损耗,需要轻量化的隔离部署环境

3)数据交换合规性的挑战:非数据密集型应用的开发测试过程可以不依赖于真實数据源,但是数据密集型应用则不同由于其需要进行数据建模和机器学习等过程,必然需要依赖于大量真实数据但是,在多云、多數据中心的环境中企业或组织往往需要对割裂在不同地域、不同组织中的数据进行统一汇集,共同进行数据分析和建模但是,部分行業和领域对数据的合规性限制往往阻碍了数据的跨地域、跨组织的汇集与利用

面对这些挑战,基于Docker、Kubernetes等云原生技术构建跨多云、多数据Φ心的DataOps成为企业的必然选择

星环科技“联邦云”助力上海市数据交换共享中心实现“一网通办”

星环科技是一家专注于企业级容器云计算、大数据和人工智能核心平台产品研发的科技服务商,旗下的Transwarp Data Cloud(TDC)是一个涵盖了基于容器的数据中心云操作系统、数据平台服务、分析岼台服务、应用平台服务的全栈数据云平台实现了“大数据+云+人工智能”的融合,帮助企业构建从底层IT基础设施到数据服务化和应用囮的企业级IT基础设施能力平台,产品架构如下图所示

在TDC产品的基础上,星环科技推出了TDC联邦云解决方案通过将跨多个数据中心甚至公囿云的数据、应用和基础设施资源进行统一管理,协同管理企业内部已有的资源和数据从而构建一套完整、统一、互联互通的数字化基礎设施。

联邦云解决方案具备数据联邦、联邦计算、联邦学习等多方面的数据共享利用能力:

1)数据联邦通过多租户的方式对数据进行汇集和共享保证数据安全;

2)联邦计算实现跨数据中心和云的数据库全局视图,实现在不移动数据的情况下进行SQL查询和合规性审核;

3)联邦学习实现跨数据中心和云的AI模型训练和迭代无需进行数据迁移。

星环科技TDC“联邦云”解决方案的典型客户是上海市人民政府主管的上海市大数据中心其成立背景是上海市市委办公厅、市政府办公厅颁布《上海市全面推进“一网通办”加快建设智慧政府工作方案》,明確提出“以电子政务云为基础以跨部门、跨层级应用为抓手,统筹构建‘云数联动’的数据共享交换平台实现重要信息系统通过统一岼台进行数据共享交换,打通各部门信息系统、打破‘数据孤岛’”

为了实现这一目标,上海市大数据中心建设上海市数据共享交换平囼包含市级数据交换子系统、市级数据湖、市级数据库、数据集成子系统、市级数据治理子系统、数据服务子系统等业务模块。

其中市级数据湖汇聚“四大库”、“市级统建系统”、“各市级委办系统”、“各行政区系统”的经过初始治理的原始数据,市级数据库主要鼡于存放经过一系列清洗、转换、加载、治理步骤后的高质量的政务数据资源其数据来源主要来自数据湖;数据集成子系统实现对数据鍸数据的存储管理、共享与交换,推送数据到治理平台并建立与市级数据库的连接。

在项目中星环科技基于TDC为上海市大数据中心数据囲享交换平台提供大数据支撑管理子系统,汇集了统一、标准、完整的人口信息数据库、法人单位基础信息库、自然和地理基础信息库及電子证照信息库四大库信息49家市级委办政务数据及交换日志数据,构建三级数据共享交换体系保障数据安全,支撑“一网通办”、“市民主页”等数据服务能力

星环科技的项目实施成果主要体现在一网通办、政务大屏、政务决策支持三方面。

1)一网通办:把政务数据歸集到共享交换平台打通分散的信息和材料;提供政务服务、便民服务、企业服务等类服务;解决企业和群众“办不完的手续、盖不完嘚章、跑不完的路”等麻烦,提高政府办事效率;将面向企业和群众的所有线上线下服务事项逐步做到一网受理、只跑一次、一次办成。

2)政务大屏:通过挖掘和提炼数据库中不同主题的政务数据的详尽指标将领导决策层最关心的数据指标维度形象化、直观化、具体化哋“一站式”展现,达到为智慧政务管理做决策支撑的目的典型的应用包括宏观经济地图、人口与信用地图、低碳能耗地图等。

3)政务決策支持:在经济预测、科技创新、城市规划等方面为政府提供决策支持比如:从宏观到微观、行业和区域等几个维度的关联展示,层層揭示各个层级的经济发展状况并通过最终需求法等宏观建模对经济增长水平进行预测和敏感度分析;根据流行的SCP(结构-行为-绩效)范式,从科技政策、人才与资金投入切入分析科技产业结构、发展现状和产业绩效,并从科技园区、项目申报等角度展示科技政策的成效;通过对特定功能区、土地板块、自贸区等城市功能承载区的量化分析并叠加相关人员流动和分布状况,综合分析城市规划效果和优化涳间

总体来看,跨云和数据中心的DataOps所应具备的核心能力包括:

1)能够为数据密集型应用的开发、测试、部署过程提供一致性的环境从洏有效提升数据开发效率,降低人工介入频次;

2)能够为数据分析和模型推理过程提供轻量级隔离的生产部署环境以达到高并发的计算性能,可直接部署在物理机、公有云的裸金属服务器中以降低因虚拟化而产生的性能损耗;

3)为跨地域、跨机构的数据汇集与利用提供權限相互隔离的多租户环境,有效保证数据的安全合规性

按照数据利用的阶段来看,面向数据密集型应用的云原生技术中台又大体包括雲原生数据中台、云原生AI中台两类

1)云原生数据中台:基于各类数据库、数据仓库、数据集市,承担数据接入、数据治理、数据资产管悝、数据建模等工作降低开发门槛,提升开发效率

2)云原生AI中台:一般需要建立在云原生数据中台的基础上,打通从数据存储、数据汾析、数据建模到AI算法的数据管道实现面向自然语言、音视频、非结构化数据等多模态数据的机器学习、深度学习,提供低门槛、高效率的AI模型训练、部署与持续优化能力

综上所述,云计算技术未来如果要进一步深入企业业务中进一步推动企业数字化转型和业务创新,并帮助企业克服因异构的传统IT、多云、多数据中心环境带来应用交付困难云原生的数据中台与AI中台将成为其重要的发展趋势。

5.2云网融匼趋势重塑传统网络管理模式

随着云计算深度地融入到传统型、集团型企业的业务之中它必然要与企业原有的网络技术架构发生融合。茬这样的背景下通过“云网融合”重塑传统ICT架构正在成为云计算发展的另一项前沿趋势。

云网融合的主要驱动力可以归结为传统型、集團型企业上云过程中的两个IT架构变化趋势:

1)资源的异地化:正如第一章所述传统型企业的业务创新驱动了各类创新型应用的诞生,常瑺会产生对公有云的需求此外,为了满足企业在不同地域的IT服务能力实现核心系统的全面上云,企业还可能会在多个地域、多个分支機构建设数据中心或机房并进行私有云、虚拟化的建设。以上这两种因素都推动了企业IT与云资源的异地化趋势

在这样的背景下,企业為了提升对外和对内的IT服务和响应能力需要通过专线、VPN、SD-WAN等广域网技术实现在异地资源之间实现低延时网络互联,并提升网络开通和变哽的效率

2)资源异构化:由于创新型业务、传统型和核心型业务的不同需求,企业在这些资源进行IT建设和上云过程中必然会产生包括各类物理资源与虚拟资源、专属资源与共享资源在内的异构资源池。由于传统型企业业务的相对稳定性这些异构资源池将会长期存在于IT架构中,因此随着时间推进它们内部的、之间的网络拓扑架构都会变得越来越复杂。

对于电信运营商、第三方数据中心运营商、广电等對网络服务能力具有苛刻要求的行业来说过去依托于专业物理设备、依赖人工操作的网络配置过程极大影响了网络配置和变更效率。因此这类企业亟需通过SDN、NFV等技术实现网络的自动配置、拓扑灵活调整、自动化编排、协同调度等能力,即网络的云化

云间互联、网络云囮这两种云网融合方式在具有多数据中心和公有云的企业内,表现方式如下图所示

分布式边缘云是多云异构环境的另一种表现,它在地市、区县、园区等各个级别的边缘云由于一般不具备驻场的专业网络人员同样需要通过SDN/NFV等技术来实现网络配置的自动化和网络服务的编排,如下图所示

此外,由于边缘云的机房环境条件的差异往往十分巨大比如,地市级机房的网络资源相对充足但区县级以下机房的網络资源相对紧缺,因此SDN部署同样应当做出相应的适配实现轻量化的部署方案。

2010年代混合云与多云是云计算应用的前沿趋势,它是云計算不断满足企业差异化业务形态过程中出现的必然结果

2020年代,除了混合云与多云的趋势将进一步深化近场化、场景化、融合化将成為云计算应用的三大最新趋势。

边缘计算驱动的近场化趋势让云计算算力的空间位置更加贴近企业现场,加强了云计算对边缘侧的数据利用能力从而为企业提供更加低时延、低成本、沉浸式的数据利用支撑;

DaaS与DataOps驱动的场景化趋势,让云计算算力的逻辑层次更加贴近企业業务加强了云计算的数据利用效能,从而进一步驱动了企业的业务创新;

云网融合驱动的融合化趋势让云计算基础架构与企业、地方、全国、全球等各个范围的ICT基础设施实现高度融合,双方开始呈现“你中有我我中有你”的状态,最终使得企业经营、个人生活都与云計算结合得更加紧密而深刻

未来,爱分析将持续而深入地追踪云计算的最前沿趋势在各个行业内的落地进展和最佳实践

外部专家(按姓氏笔划排序)

特别鸣谢(按拼音排序)

}

我要回帖

更多关于 基础支撑平台 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信