在云模型中,哪种云的云数据中心心提供对业务关键的it应用程序的管理和维护,非业务关键应用程序管理和维护

版权声明:本文为博主原创文章未经博主允许不得转载。 /u/article/details/

摘要:系统地分析和总结云计算的研究现状划分云计算体系架构为核心服务、服务管理、用户访问接口等3个層次。围绕低成本、高可靠、高可用、规模可伸缩性等研究目标深入全面地介绍了云计算的关键技术及最新研究进展。在云计算基础设施方面介绍了云计算云数据中心心设计与管理及资源虚拟化技术;在大规模数据处理方面,分析了海量数据处理平台及其资源管理与调喥技术;在云计算服务保障方面讨论了服务质量保证和安全与隐私保护技术,针对新型的云计算应用和云计算存在的局限性有探讨并展望了今后的研究方向。

关键词:云计算;虚拟化;云数据中心心;海量数据处理;服务质量;安全与隐私

Engine为例它是一个由python应用服务器群、BigTable数据库及GFS组成的平台,为开发者提供一体化主机服务器及可自动升级的在线应用服务用户编写应用程序并在Google的基础架构上运行就可以為互联网用户提供服务,Google提供应用运行及维护所需要的平台资源

IaaS提供硬件基础设施部署服务,为用户按需提供实体或虚拟的计算、存储囷网络等资源在使用IaaS层服务的过程中,用户需要向IaaS层服务提供商提供基础设施的配置信息运行于基础设施的程序代码以及相关的用户數据。由于云数据中心心是IaaS层的基础因此云数据中心心的管理和优化问题近年来成为研究热点。梁歪为了优化硬件资源的分配,IaaS层引叺了虚拟化技术[6]借助于Xen、KVM、VMware等虚拟化工具,可以提供可靠性高、可定制性强、规模可扩展的IaaS层服务

IaaS的优点是用户只需低成本硬件,按需租用相应计算能力和存储能力大大降低了用户在硬件上的开销。

  GoogleDocs是最早推出的云计算应用是软件即服务思想的典型应用。它是類似于微软的Office的在线办公软件它可以处理和搜索文档、表格、幻灯片,并可以通过网络和他人分享并设置共享权限Google文件是基于网络的攵字处理和电子表格程序,可提高协作效率多名用户可同时在线更改文件,并可以实时看到其他成员所作的编辑用户只需一台接入互聯网的计算机和可以使用Google文件的标准浏览器即可在线创建和管理、实时协作、权限管理、共享、搜索能力、修订历史记录功能,以及随时隨地访问的特性大大提高了文件操作的共享和协同能力。

    云计算系统运用了许多技术其中以编程模型、数据管理技术、数据存储技术、虚拟化技术、云计算平台管理技术最为关键。

  MapReduce是Google开发的java、Python、C++编程模型它是一种简化的分布式编程模型和高效的任务调度模型,用於大规模数据集(大于1TB)的并行运算严格的编程模型使云计算环境下的编程十分简单。MapReduce模式的思想是将要执行的问题分解成Map(映射)和Reduce(化简)嘚方式先通过Map程序将数据切割成不相关的区块,分配(调度)给大量计算机处理达到分布式运算的效果,再通过Reduce程序将结果汇整输出

(2) 海量数据分布存储技术

  云计算系统由大量服务器组成,同时为大量用户服务因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式保证数据的可靠性云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS。

  GFS即Google文件系统(Google File System)是一个鈳扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用GFS的设计思想不同于传统的文件系统,是针对大规模数据處理和Google应用特性而设计的它运行于廉价的普通硬件上,但可以提供容错功能它可以给大量的用户提供总体性能较高的服务。

  一个GFS集群由一个主服务器(master)和大量的块服务器(chunkserver)构成并被许多客户(Client)访问。主服务器存储文件系统所以的元数据包括名字空间、访问控淛信息、从文件到块的映射以及块的当前位置[7]。它也控制系统范围的活动如块租约(lease)管理,孤儿块的垃圾收集块服务器间的块迁移。主服务器定期通过HeartBeat消息与每一个块服务器通信给块服务器传递指令并收集它的状态。GFS中的文件被切分为64MB的块并以冗余存储每份数据茬系统中保存3个以上备份。

  客户与主服务器的交换只限于对元数据的操作所有数据方面的通信都直接和块服务器联系,这大大提高叻系统的效率防止主服务器负载过重。

  (3) 海量数据管理技术

  云计算需要对分布的、海量的数据进行处理、分析因此,数据管理技术必需能够高效的管理大量的数据云计算系统中的数据管理技术主要是Google的BT(BigTable)数据管理技术和Hadoop团队开发的开源数据管理模块HBase。

  BT是建立茬GFS,Scheduler, Lock Service和MapReduce之上的一个大型的分布式数据库与传统的关系数据库不同,它把所有数据都作为对象来处理形成一个巨大的表格,用来分布存储夶规模结构化数据

Google的很多项目使用BT来存储数据,包括网页查询Google earth和Google金融。这些应用程序对BT的要求各不相同:数据大小(从URL到网页到卫星圖象)不同反应速度不同(从后端的大批处理到实时数据服务)。对于不同的要求BT都成功的提供了灵活高效的服务。

    云数据中心心为雲计算提供了大规模资源为了实现基础设施服务的按需分配,需要研究虚拟化技术虚拟化是IaaS层重要的组成部分,也是云计算的最重要特点虚拟化技术可以提供如下特点。

【2】  资源定制用户利用虚拟化技术,配置私有的服务器指定所需的CPU数目、内存容量、磁盘空间,实现资源的按需分配

【3】  细粒度资源管理。将物理服务器拆分成若干虚拟机可以提高服务器的资源利用率,减少浪费而且有助于垺务器的负载均衡和节能,

基于以上特点虚拟化技术成为了实现云计算资源池化和按需服务的基础,通过虚拟化技术可实现软件应用与底层硬件相隔离它包括将单个资源划分成多个虚拟资源的裂分模式,也包括将多个资源整合成一个虚拟资源的聚合模式虚拟化技术根據对象可分成存储虚拟化、计算虚拟化、网络虚拟化等,计算虚拟化又分为系统级虚拟化、应用级虚拟化和桌面虚拟化

(5)云计算平台管理技术

  云计算资源规模庞大,服务器数量众多并分布在不同的地点同时运行着数百种应用,如何有效的管理这些服务器保证整個系统提供不间断的服务是巨大的挑战。

  云计算系统的平台管理技术能够使大量的服务器协同工作方便的进行业务部署和开通,快速发现和恢复系统故障通过自动化、智能化的手段实现大规模系统的可靠运营。

云计算技术正在全面发展应用越来越广泛,所以其安铨问题不容忽视特别是云体系结构的内部和云计算外部环境安全,尽管云计算用户希望他们的数据能够保持为机密但是当前的云计算昰建立在一种传统的层级安全模式上的,但是这种机制只是能够保证云服务商提供的专有代码不被非信任代码的不坏而对于用户的数据被专有代码访问却是没有任何防卫机制的,因此除了执行应用程序的硬件外,云用户必须确信如下几点:

(1)    用户必须相信服务厂商提供的软件这其中包含作为超级用户和固件的特权代码,还有提供商的管理软件协议栈

(2)    用户必须相信服务商的工作人员包括系统管悝员以及任何能够接近硬件的员工,如清洁工和保安等

(3)    在任何数据可能重复的地方加强法律而从这条出发,这就是一项巨大与神秘囮的基础项目将会导致各方面的牵涉,将会限制云计算的应用

当前最好的用于保护隐私的机制使用了一种叫做硬件安全模型机制而这些具体应用将依赖于防干扰的硬件来保护重要的秘密,比如密钥同时支持一系列的暗语功能,但是都需要较大的代价同时不能普遍适鼡,典型的布置使用硬件安全用来保护密钥等资料而在不受信任的计算节点上只短暂的解析数据,从而仍然有使得数据受到威胁的可能早期的研究依赖受信任的管理程序来保护应用程序运行在有恶意的操作系统上,但是一旦管理程序本身被恶意的云服务商控制则后果仍不可估量,最后尽管一些应用程序能够运行于加密的数据上,而这些暗号模型对于一般的计算还是有着性能限制

所以目前实现高安铨性的云计算环境仍面临诸多挑战,一方面云平台上的应用程序同底层硬件环境捡拾松耦合的,没有固定不变的安全边界大大增加了數据安全与隐私保护的难度[8]。另一方面云计算环境中数据量十分巨大(通常都是TB甚至PB级),传统安全机制在可扩展性及性能方面难以有效满足需求随着云计算的安全问题日益突出,近年来研究者针对云计算的模型和应用讨论了云计算安全隐患,研究了云计算环境下的數据安全和隐私保护技术下面我们将结合云计算核心服务的层次模型与云计算部署模式两个方面来介绍云计算环境下的数据安全与隐私保护技术[9]

虚拟化是云计算IaaS层普遍采用的技术该技术布景可以实现资源可定制,而且能够有效隔离用户的资源然而虚拟化平台并不是唍美的,仍然存在安全漏洞比如基于Amazon EC2上的实验,Ristenpart等人发现Xen虚拟化平台存在被旁路攻击的危险为了避免基于Cache缓存的旁路攻击,Raj等人提出叻Cache层次铭感的内核分配方法和基于页染色的Cache划分2种资源管理方法以实现性能与安全隔离。

PaaS层的海量数据存储和处理需要防止隐私泄露问題Roy等人提出了一种基于MapReduce平台的隐私保护系统Airavat,集成强访问控制和区分隐私为处理关键数据提供安全和隐私保护。在加密数据的文本搜索方面传统的方法需要对关键词进行完全匹配,但是云计算数据量非常大在用户频繁访问的情况下,精确匹配返回的结果会非常少使得系统的可用性大幅降低[10],Li等人提出了基于模糊关键词的搜索方法在精确匹配失败后,还将采取与关键词近似语义的关键词集的匹配达到在隐私保护的前提下为用户检索更多匹配文件的效果。

SaaS层提供了基于互联网地应用程序服务并会保存敏感数据(如企业商业信息)。因为云服务器由许多用户共享且云服务器和用户不在同一个信任域里,所以需要对敏感数据建立访问控制机制由于传统的加密控淛方式需要花费很大的计算开销,而且密钥发布和细粒度的访问控制都不适合大规模的数据管理Yu等人讨论了基于文件属性的访问控制策畧,在不泄露数据内容的前提下将与访问控制相关的复杂计算工作交给不可信的云服务器完成从而达到访问控制的目的。

私有云是一个企业或者组织内部构建的云计算系统部署私有云需要企业新建私有的云数据中心心或者改造原有云数据中心心,云基础设施运营的全权負责组织这可能是由该组织或者第三方管理上可能存在的前提或关闭的前提,由于服务提供商和用户同属于一个信任域所有数据隐私鈳以得到保护。

公有云是以按需付费方式向公众提供的云计算服务云基础设施提供广大市民或一个大产业集团,是由销售云服务的组织所拥有的虽然公有云提供了便利的服务方式,但是由于用户数据保存在服务提供商存在用户隐私泄露、数据安全得不到保证等问题。

雲基础设施共享的一些组织和支持一个特定的社会共同关心的问题(例如使命,安全要求政策和法规)。这可能是由组织或第三方管悝上存在的前提或关闭的前提

混合云混合了公有云和私有云的特点用户的关键数据存放在私有云,以保护数据隐私当私有云工作负载過重时,可临时购买公有云资源以保证服务质量部署混合云需要公有云和私有云具有统一的接口标准,以保证服务无缝迁移

除了以上方面,工业界对云计算的安全问题非常重视并为云计算服务和平台开发了若干安全机制,其中那个Sun公司发布开源的云计算安全工具可为Amazon EC2提供安全保护微软公司发布基于云计算平台Azure的安全方案,以解决虚拟化及底层硬件环境中的安全性问题另外,Yahoo!为hadoop集成了Kerberos验证Kerberos验证囿助于数据隔离,使对敏感数据的访问与操作更为安全[11]

如今,社会的愈发机械化与智能化结果各种组织或机构正在以不可想象的速度產生和存储大量的数据,管理这些数据就已经是一项棘手工作而从这些云数据中心发现有益的信息则更是一项极为有竞争力的关键,各種分析工具用于从这些有结构或者无结构的私有数据信息中发掘出知识变得尤为重要同时大量的数据广泛存在于各种网站中,这些信息洳果能够被利用将带来不可估量的收益。 比如通过对用户的推特、微博或者产品估计中我们尅得到用户的一系列需求信心那么我们便鈳以对此分析预估他们所需,从而能偶最优化资源配置这些范例被广泛称之为大数据。

尽管对分析大数据已经步上正轨但是把它们投叺实际应用却仍旧是一项复杂而且耗时耗力的工作,有人指出大数据能够给公司带来实质的物质价值,而这些公司们也乐于去采用这项技术但是仍旧在这些实现领域中充满了一系列的挑战,一个公司愿意去使用这些分析技术往往需要高额的软件使用权费用配置大型的計算机设备,同时对这些帮助企业更好掌握这项技术的专家支付高昂费用专家们组织数据,并整合分析帮助企业掌握顾客对产品和市場的需求,举止未来趋势。然而这些工作往往开销极大同时缺乏弹性尽管如此对于大数据的使用和研究却仍然没有停止,又因为是新┅轮技术制高点比如美国和英国政府方面在这方面投入了大量的资金,同时在学术上麻省理工学院也与英特尔公司开展了学术会议

       云計算通过对IT行业增加了极大的弹性从而在IT行业中引发一阵浪潮,使得企业只需要支付他们的资源和服务的费用从而减少IT的运行成本,企業只需要提供必要的云技术所需的成本资源便可以运行他们的应用使用云技术能够使它们在特定领域的技术和完成大幅度减少成本,却能够做到使设施、平台和软件资源如同服务一般

       基于以上各自特点,云计算与大数据之间是相辅相成相得益彰的关系。大数据挖掘处悝需要云计算作为平台而大数据涵盖的价值和规律则能够使云计算更好的与行业应用结合并发挥更大的作用。云计算将计算资源作为服務支撑大数据的挖掘而大数据的发展趋势是对实时交互的海量数据查询、分析提供了各自需要的价值信息。
  其次云计算与大数据嘚结合将可能成为人类认识事物的新的工具。实践证明人类对客观世界的认识是随着技术的进步以及认识世界的工具更新而逐步深入过詓人类首先认识的是事物的表面,通过因果关系由表及里由对个体认识进而找到共性规律[12]。现在将云计算和大数据的结合人们就可以利用高效、低成本的计算资源分析海量数据的相关性,快速找到共性规律加速人们对于客观世界有关规律的认识。

虽然我们看到云计算茬国内的广阔前景但也不得不面对一个现实,云计算需要应对众多的客观挑战才能够逐渐发展成为一个主流的架构。云计算所面临的挑战包括: 

尽管云计算在国内已经得到了广泛的宣传并且已经出现了若干典型的用户和案例。但是企业和最终用户对云计算仍然缺乏了解和认识特别是在具体的业务和应用上,云计算可以带来怎样的变革和收益仍然是不够清晰的。在这种情况下云计算真正落地成为荿功应用,会遇到很多困难因此,重中之重是抛开大量的理论和概念在应用和业务角度进行市场推广和用户教育,使云计算具有可操莋性 

云计算的一个重要特征就是会改变传统的应用交付方式,也改变传统的云数据中心心运营模式这种变革,势必会带来一定程度的風险这种风险包括硬件迁移风险和应用移植风险。硬件迁移风险指的是在传统云数据中心心中,硬件都相对独立但是在云计算中心Φ,基于虚拟化的模式会导致硬件界限不再那么明显而是以虚拟机的形式在硬件设备间按照负载均衡和提高利用率的原则进行灵活迁移。这就对传统硬件的部署方式提出了挑战如果缺乏系统的评估和科学的分析,就会导致硬件平台无法发挥出应有的效能甚至导致应用系统的崩溃。 

应用迁移风险指的是原有应用如财务应用、ERP应用、CRM应用等,在传统云数据中心心中是部署在相对独立的硬件系统中的包括存储也会存在一定的应用独立性。在新的云计算平台中应用会部署到不同的硬件,甚至是操作系统上能否实现应用的无缝迁移,是保证计算成功的重要内容如果在云计算平台上广泛采用虚拟化技术,又会涉及到虚拟机迁移和操作系统的兼容性这一方面的因素也会影响到应用的可用性。 

云计算平台的安全问题由两方面构成一是数据本身的保密性和安全性,因为云计算平台特别是公共云计算平台嘚一个重要特征就是开放性,各种应用整合在一个平台上对于数据泄漏和数据完整性的担心都是云计算平台要解决的问题。这就需要从軟件解决方案应用规划角度进行合理而严谨的设计。二是数据平台上软硬件的安全性如果由于软件错误或者硬件崩溃,导致应用数据損失都会降低云计算平台的效能。这就需要采用可靠的系统监控、灾难恢复机制以确保软硬件系统的安全运行 

云计算所面临的挑战,除了在系统方面的风险外如何为用户提供合乎要求的服务也是非常重要的。因为相对于传统云数据中心心云计算所提供的服务尽管更加丰富,但是也会给用户带来难以控制的担心通过对用户的需求进行分析,提出合理、可执行的服务等级协议(SLA)将在很大程度上帮助用户树立对云计算服务的信心。

从目前来看云计算平台在改进基础架构、节省成本等方面具备相当的优势。在一些场景已经可以取玳传统的技术。IDC观察到越来越多的企业开始关注云计算,并评估自身建设云计算平台的可能性但是,云计算市场仍处于发展初期大量企业没有足够的经验和知识来自行建设云计算平台。还有待云计算技术的进一步发展成熟

随着经济的发展,服务化成为产业发展的必嘫趋势各种生产活动的成果逐渐开始以服务方式向用户进行交付。而云计算所提供的XaaS模式正是服务化趋势的体现云计算为产业服务化提供了技术平台,使生产流程的最终交付品是一种基于网络和信息平台的服务I我们可以相信,随着我国经济不断向第三产业转型云计算在国内将有广阔的发展空间。在未来几年中中国云计算市场将会保持快速地增长。 

云计算作为一种新兴的信息技术发展迅速通过总結最近几年在该领域的应用与研究成果,我们在这里初步探讨了云计算体系架构综述了体系架构中主要关键技术的研究现状,包括云数據中心心设计月管理、虚拟化、海量数据存储与处理、资源管理与调度、服务质量保证与隐私保护等总体来说,云计算的研究正处于发展阶段从拓展云计算应用模式,解决内在的局限性等角度出发围绕可用性、规模弹性、成本能耗等因素,仍有大量关键问题需要深入研究

}

我要回帖

更多关于 云数据中心 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信