首页
首页  >  

运营商IT支撑系统的云化

2013-04-17  来源:中国信息产业网  作者:

中国移动通信集团设计院副院长 张同须

各位领导专家和业界同仁大家上午好!今天跟大家讨论的题目是关于运营商IT设施的云化方面的话题,大家对于云计算的概念都很清楚,刚才工信部的刘院长也讲到了关于公众云,还有私有云,包括我们所谓的三大服务,PaaS、SaaS、IaaS,但是对于运营商,云计算技术,对运营商最急迫的应用点在哪里?那么我们分析下,通过这几年的时间看,对云计算在运营商应用来讲,对于IT设备的优化,提高效率,节能方面的措施,应该是最为急迫的,而且也取得了一些成效。

所以今天有关“运营商IT设施的云化”的话题,跟大家交流。主要是五方面的内容。

首先对于运营商来讲,IT方面的一些现状,主要有几个特点,第一就是IT资源规模比较大,运营商发展到今天,用户数非常多,特别是我们国家,拥有亿数量级的用户数,同时为了应付有效的竞争和提供高质量的服务,IT设施的建设是非常庞大的规模,而且这几年非常快的增长态势,下面看一个典型的省,大致的服务器的数量,首先系统很多,包括业务支撑管理信息,以及网管系统还有今后发展的新业务系统,每一个系统所要求的服务器类型都超过上千台,这样加在一起应该是几千台规模,这么大规模的服务器,怎么样能够提高效率,目前基本上还是各系统建各系的现状。

第二个特点,资源的孤岛现象是比较严重,大部分IT系统,依然采用传统的竖井式的建设模式,IT系统的资源无法在跨系统间进行共享,同时因为各系统建各系统的特点,使得资源的利用率非常低,各个业务有峰值的时候,虽然业务之间峰值不在一块,但是依然起不到消峰的作用,占用的资源比较大。

第三系统的压力也是不均衡,资源由于没法共享,只能采用被动的采购,使得更大容量的设备采购,来应付我们业务增长所需要的扩容。最后一点,异构的环境下不同的存储采用不同数据的复制、迁移、这些软件,也使得我们之间数据也无法共享。

第四系统部署的周期长、运维也比较难,大家可以看到特别是对于IT系统、服务器,由于我们在估算和实际运行之间能力存在一些差别,部分系统已经不堪重负,经常发生提前扩容这样的情况,同时由于我们市场部门是面临第一线,因此我们在市场有需要的时候,也不大容易做到使我们支撑系统满足市场的需要,还有就是维护方面存在一定的疲于奔命的现象。

基于这样的现状,提出如果采用云计算的技术来做IT的支撑云,是不是可以?通过这样的愿景,我们希望能够实现基于IT系统低成本、高效建设和发展的需求,在基础设施和应用等方面实现系统架构的创新,这样的创新,显然以云计算的技术是最合适的,因此我们目标就要打造服务于内部应用的支撑系统云,与公众云是有所不同,主要是用于内部系统的,从技术设施角度来看呢,要以资源池形式支撑IT系统的资源需求,具备根据需要来分配资源和弹性扩展的能力,在应用系统方面,要采用多租户形式实现多个IT系统的相对集中。

从目前实践状况看,通过这几年基本上有大致的状况,或者几个步骤:

第一个首先要做虚拟化的资源池,从服务层面来讲,还是有应用层比方说SaaS,平台层有PaaS,基础设施层有IaaS,从管理层对于这几个层面,统一性管理,上面有私有云、公有云的服务,目前主要还是要把资源池进行虚拟化。

第二个方面的实践状况,就是终端的桌面云,现有的终端,大致上终端能够做很多事情,包括存储,包括访问、计算等等,也是说我们每个人的终端是一个非常复杂的智能系统,未来如果采用云计算之后,希望能够把这些能力迁移到网络中去,使我们的终端变成一个相对简单、专用化的终端,这样能充分地采用云计算的技术,使终端变得瘦,变得小,只完成接触的访问,这样也是今后的发展的方向。

第三个方面实践状况,在云计算方面的分布式计算、存储以及对大量数据进行如何高效的存储方面,做一些工作,特别是针对传统的小型机和磁盘阵列存在的封闭和高成本问题,我们可以通过分布式计算的方式,达到标准化、低成本、高扩展性的优势。

目前通过实践也可以看到,从支撑云的建设,也存在一些问题,第一个是集中在IaaS层面进行的虚拟化比较多一些,而在PaaS层面和SaaS层面虚拟化应用比较少,目前来看,基本上在IaaS层面做的工作相对多一些。第二个就是我们在云管理平台的标准和功能方面还需要完善,在资源池设备的标准化管理和可管理性方面也需要进行完善。

第三个方面就是资源池也存在着分散建设,缺乏资源和能力的互通和共享方面的问题,资源池跨域技术也不成熟,虚拟化共享受地理分布和机房条件的限制也比较大。另外安全方面也受到一些限制。

最后一点是在分布式技术方面目前仅限于Hadoop这样较少的开元架构,还有待于进行更多的不同架构的尝试。

从IT支撑云成熟度或者建设的角度的步骤来看,主要有四个阶段,第一个阶段叫启动阶段,第二个是池化、第三个是云化,第四个阶段是优化方面的工作。

目前启动当然已经过去了,池化的工作已经开展,比方说在技术方面,我们要采用一些虚拟化的技术,来扩展应用,在规划方面,能够进行小规模分散建设的资源池等等。当前要达到的目标,是怎么样从池化阶段能够过渡到第三阶段,就是云化,在云化阶段,从技术上云计算技术的采用更加标准化更多和安全化更高,规划方面要逐步形成大规模的集中资源池的情况,使得资源共享和动态调配能够更加高效和方便。

从建设上要在组织架构上,要适应云计算进行变革,建立应用与资源池的互动的流程方法和制度,从维护来讲,要使得各个层面的接口逐渐地标准化,使得资源管理进行统一,当然后期第四阶段还要对这种结构进行进一步的优化,这是成熟度。

第三个大方面,给大家沟通的内容就是关于云化的方法论,刚才也谈到目标和实践,从方法论的角度,大概是什么样的路径,才能够达到这样的目标。基本步骤是,对现有的IT系统首先要进行云化的改造,包括硬件的标准化的定制化,软件标准化的模板化,通过这样的工作,逐步向传统系统平台上的工作负荷,迁移到云平台上,那么之后我们要通过两个方面,一个是跨应用的整合,一个是跨管理域的整合,那么通过跨应用整合,形成一个同管理域的IT云,通过跨管理的整合,形成跨应用域的IT云,通过这两方面的工作,逐步实现我们集中化的IT云,最后要达到我们的目标,就是说要在可靠性方面更高,资源利用率更高,可扩展性更强,以及我们业务部署的速度最快,从而来实现利用云计算技术能够把我们IT支撑系统得到进一步的优化。

在方法论方面,首先看资源池的建设,要构建云计算资源池,要实现IT系统资源共享和按需分配,是目前云化的过程中前端的工作。通过资源池系统的建设,分了四个层面,第一个层面是资源池,包括我们的服务器,包括存储、网络设备等等,怎么样能够高效地去建设;第二层面是资源能力层,有了这样一个资源层的基础设施,如何计算资源的管理、存储资源的管理、网络资源的管理,使他们的能力能够更加有效地释放。

第三个,是资源的抽象层,包括管理配置等方面的工作,最后更高的层面就是接口层,通过底层能力的提供,利用统一的接口层来把能力转化成我们的应用,这是关于资源池系统的建设方面的想法。

第三个方面关于云化迁移前的评估,如果把现有的烟囱式为主的IT系统的建设方式,过渡到以云计算技术为基础的,首先的工作就是要进行云化前的迁移工作,在这方面我们要进行多方面的评估,包括我们现在X86是不是最佳选择,目前大部分都还是采用X86的系统,但是我们还是要想一想是不是最佳选择,另外要看看我们平台换了以后它的必要性和合理性是不是存在,业务的需求和负荷特点是否清楚,也就是说云化之后,如果和实际的业务和应用来负载不是那么匹配的话,那云计算采用之后,他的一些效果就会大打折扣,此外风险,比如说安全方面的风险有多少,成本到底怎么样去核算等等。所以通过这些方面的评估,做到心里有数,就可以进行云化前的系统迁移工作。

从云化的迁移流程来看,大致的原则就是要先简单后复杂,先处理好异构平台的迁移,另外优先考虑安全性,同时我们各个业务要先独立分配虚拟化的子资源池,通过测试或者各方面评估之后,再进行相应的迁移,从手段来看,还是通过相应的工具,通过备份,再恢复,再重新搭建的方式来进行,以免数据产生不必要的丢失,从流程来看,当然包括迁移前的准备,业务的迁移,迁移后的测试,以及测试不成功,再重新返回,直到最后业务各界上线成功,这是简单的云化迁移的流程。

第四个方面,跟大家简单地探讨一下,尽管有很多优点,也面临关键的技术问题,需要逐步的克服。第一个是多租户的问题,多租户是一种软件架构的技术,要探讨与实现对于多用户环境之下,在保证跟用户间数据隔离的前提下,如何共用相同的系统或者程序组建,技术本身是非常明确,在实际的应用过程中,可能还存在相应的问题,怎么样能够在支撑系统云化的实施中,应用多租户的技术,是通过云化实现集中化的关键之一,这方面还在逐步解决的过程中。

第二个就是组网方面的问题,从资源池虚拟化之后,对组网也提出新的要求。比方说如何采用增强性的二层或者大二层的技术;各层设备,虚拟化迁移时候的联动问题;标准化等方面的问题,这些都是在组网方面所要面对的,在具体的单元方面,也牵扯到服务器的虚拟化,牵扯到应用的扩展性,物理空间的扩展,以及在网络层面的VLAN的划分规划以及组网,存储组网方案等等。

这些方面,都是在云化方面需要面对和解决的关键技术和问题。

第三个就是存储,云计算之后,大量的数据都要进行存储,怎样能够高效的存储?目前看来,要针对不同类型的数据,采用相应的不同的方式,才能够做到高效的存储,当然现在从数据的网络环境来讲,我们面临着互联网和专网从数据类型来看,有结构化的,有半结构化的,还有非结构化的类型,所以针对这样的情况,可能有不同的或者不同类型的存储方式,有文件存储的服务,有我们记录存储的服务,还有以对象为基础的存储服务,以及以数据库表的存储服务等等各种方式,我们把这些东西搞清楚之后,就可以使存储方面能够更加高效地进行,这也是在云化过程中面临的技术问题。

第四个方面就是安全,安全大家都清楚,实际上也是我们云计算过程中,实施的过程中大家特别是客户最考虑的问题,包括我们全局的故障,是不是会经常发生,包括安全的隔离,尤其是多租户环境之下,不同用户之间,不同群之间的安全隔离,这也是一个很大的问题,包括安全策略,安全威胁以及安全管控,这几个方面,当然安全没有百分之百的安全,只能说面对这些方面,怎么样能够进一步的或者尽可能的把安全的风险降到最低,这里面也会逐渐有一些新的技术,来加以采用。

最后想再谈一下关于云化和管理提升方面的问题。云计算的采用,对目前特别运营商,不止是新技术的采用,另外很重要的方面就是对于管理体制,运维管理、系统建设流程等方面,也是从管理方面,也要进行相应的变革,因此我们说云计算采用所带来的影响,本质上是需要对IT管理的组织架构制度和流程进行变革的过程,因此对于企业IT系统的发展影响也是非常深远的,从目前各个运营商的情况来看,那么要打破烟囱式的建设方式,还需要在相应的管理部门的设置,架构的改变等等还要做出相应的调整,这样才能适应云计算采用的趋势。

第二个是系统云化以后系统的开发模式,可以看到现有IT系统,每个系统从应用到硬件都是全面集成的,而且每个系统是每个系统的,大家都是并排的,各个系统都包括相应的硬件平台,操作系统、数据库应用,管理安全等方面的策略和技术,但是相互之间没有关系,在云计算环境之下,应该改变这样的情况,要利用标准化的硬件和开发平台进行相应的开发应用,比方说有统一的资源池,要有标准化的接口或者向上层来提供的能力,通过云计算相应的平台,或者API的接口来实现相应的IT方面的应用。

对于这样的系统要进行统一的运行维护、管理和安全方面的管理,从这个角度看,云化之后的管理模式的变化还是非常大。

第三方面关于云化后的基础设施资源供应流程方面,怎么样能够从一个技术设施资源云化的流程来进行考虑的具体的细节。

第四方面在云平台的运营和管理,要建立好集中化、专业化的云平台的管理团队,实现统一的管理运营和维护,按照服务水平协议,统一向用户提供云服务,运营商这几年,通过数据中心的建设,也是想从设备这个角度来看,我们有统一的一个方式,从管理来看,要建立一个集中化、专业化的云平台的管理团队,这样的理念去迈进,特别是在实施过程中,IDC的建设也更加注重环保和节能,尤其是节能,中国移动这几年在节能方面做了很多的实践。刚才谈到了POE值,目前大部分都在2以上,2.3、2.4,那么中国移动现在做的实践,应该说可以降到1.5前后,就是2以下是绝对没有问题的,通过对于空调、设备等等各方面的仓储化,节约化的设计,使得我们现在IDC能够逐步适应低能耗的需求。

最后我想有几句话跟大家共享,运营商IT支撑系统的云化,应该说是能够打破孤岛,实现资源共享动态调整,从而提高我们资源的利用率,降低建设成本,也能够提高运维效率,降低运维成本,能够建立新的资源规划使用模式,提高部署的敏捷性,提高可扩展能力,从而也增强业务的快速、响应的能力,支撑系统的云化,也是现在的运营商,应对竞争创新发展的技术和管理变革的方式。和大家沟通的这么多,不对的请大家批评指正。谢谢!

关键词:PaaS、SaaS、IaaS 云计算 云平台