技术
首页  >  技术  >  CNII特约专家

ODCC网络工作组技术专家、中国移动SDN项目经理李晨:未来数据中心网络的思考与实践

2015-11-06  来源:中国信息产业网  作者:

ODCC网络工作组技术专家、中国移动SDN项目经理李晨

CNII网讯 11月5日,2015开放数据中心峰会在北京国家会议中心举行。本届峰会由开放数据中心委员会(ODCC)主办,阿里巴巴、百度、腾讯、中国电信、中国移动、中国信息通信研究院、英特尔等单位承办,是国内在数据中心领域的一大行业盛会。会议由上午的主论坛和下午的五个分论坛构成,分论坛的主题分别为天蝎整机柜、新型服务器、模块数据中心、数据中心网络、行业数据中心技术发展与运维。

ODCC网络工作组技术专家、中国移动SDN项目经理李晨在下午的数据中心网络分论坛上发表了题为《未来数据中心网络的思考与实践》的演讲。

以下是演讲内容实录:

非常荣幸有机会作为最后一位嘉宾在这儿演讲。因为我听了前面各位嘉宾的介绍是非常有料的,我自己也学到了很多。所以在材料里面我不会太多的介绍技术方面的内容,我想多介绍一些我们的实践,以及我们遇到的一些问题,希望跟业界的同行们多讨论讨论,希望能够推动解决。

今天我演讲的题目叫做NovoDC数据中心网络的思考与实现。先介绍一下NovoDC的背景,再介绍一下我们的实践和解决的问题。

SDN和NFV是未来网络的一个基础性的技术,我们看到很多咨询的行业也给过报告,说SDN和NFV未来的网络会带来很多的优势,包括虚拟化、灵活的流量调优、业务迅速上线等等,都对。从我个人的角度来说,我认为SDN和NFV整个网络给运营商带来最大的变化是业务的灵活提供。它能够把我们传统上用户对于网络租用的时间,几乎是一个月或者更长的时间缩短到只有几天甚至几个小时就上线了。这种灵活的提供从线上到线下的过程是一个质的改变。

在业务灵活提供的基础上,我特别认可杨总的那句话,我们是想把业务的灵活提供作为最最核心的一个驱动力,但是不可以。因为要想提供最最灵活的业务,你的前提是一定要提供可靠的、可保证的运维,来保证用户不会用着这么好的业务突然就断了。所以,真正引用SDN最大的驱动力是我们需要SDN和NFV做到更加高效的运营,这就在于平台的精细化。同时尽量在建这些新的网络的时候能够把它的成本降的再低一点。

在这儿稍微介绍一下我们认为SDN和NFV的关系。总体来说,我们认为网络它是由网源和连接共同组成的。右上角我们想画一个棋盘,我们认为NFV是网源的功能虚拟化的技术,SDN是一种连接的技术,把用户和网源都连接在了一起。可以说未来网络可能是SDN跟NFV共同组成的,NFV和SDN的关系它们可以完全没有关系。比如说我用SDN的网络连接的技术,用传统的这些网源,这是OK的。也可以我用NFV的网源,但是我用传统的连接技术这也没有问题。如果把SDN跟NFV结合在一起,它会更加好的实现网络功能的虚拟化,给用户带来更便捷的服务,这是一套组合拳。

基于SDN和NFV对业务的影响以及它们之间的关系,中国移动在今年6月份GMSA的大会上,我们提出了中国移动未来网络的一个计划,叫做NovoNet。分为两个部分,Novo是拉丁语创新的一个词根,到底新在哪,我们想到了三个方面。第一是指新的架构,在这种架构下我们认为未来的软件是基于网络化、虚拟化、可编程很快就可以操作。第二是虚拟运营,基于灵活的调度让资源利用最大化。第三是新的服务,我们可以按需的为用户提供服务,甚至我们会开放API给用户,让他直接调用,更好的满足他的业务的需求。这是Novo创新给我们带来的不同。另外是Net,对运营商来说不仅仅包括数据中心的网络、IP广域连接的网络,也包括传送网和移动核心网。我们是想把端到端的网络都能够通过SDN和NFV的技术让它做到协同,达到资源最大的利用。

NovoNet所依据的技术的架构和体系就是SDN+NFV的方式去做的。今天我们介绍的NovoDC主要是NovoNet作数据中心领域的介绍。我们对NovoDC的一个目标其实就是VPC加上业务链。有关业务链用户在租用数据中心内的一个网络的时候,通过实际的运营情况,70%以上的用户都会直接说我还要防火墙、负载均衡、VPN、IPSec等功能,所以怎么把虚拟网络用SDN实现以后更好的串在业务链里,为他们提供防火墙、负载均衡以及安全的增值的服务。总体来说NovoDC的目标可以概括为四点,一是虚拟的网络。用户在定义数据中心的时候,可以自己去规划自己的IP、网关间的访问策略、防火墙和负载均衡的策略、需求、算法,是完全不用受到其他用户的任何影响的。这对于传统的方式来说一个很大的改变。二是不同租户之间相互隔离。三是可以扩展。

我们今天看到的许多需求,他们总来问我们为什么你只提供一个云的服务,但是你不能把VPN或者远端的站点连在一起,我们也想尽快的通过一些手段实现多地多中心的互联。最后一个是用户自己管理自己的虚拟的网络。

前面是一些背景的内容,下面我想介绍一下具体的实践和思考。第一是NovoDC的架构的设计。NovoDC的架构分为四个部分,最顶层我们借鉴了ONF,包括最早的SDN资料给出了NovoDC的架构。最早是SDN的APP我们叫做应用层,更多的是面向业务,面向不同的租户,可以在这个平台上去定义自己虚拟的网络和业务链等等,做到业务的编排。这是应用层。

应用层大部分情况下是直接为用户服务的,如果在应用层还有一个更全的平台,让用户去调度,我们的应用层也应该对上能够提供开放的接口。中间这一层是协同层,我们会使用Openstack。Openstack也会对接多厂家多种虚拟化平台。

第三层是有关控制管理层,这一层其实就是我们前面介绍的SDN和NFV在数据中心里到底要怎么样把它们和业务连接在一起。首先我们会通过控制器和Openstack模块二层、三层来做对接,实现基本的网络连接的功能。除此以外,像防火墙、负载均衡、VPN,后面我们还会扩展一些增值保源的服务,我们尽量继承Openstack,由各个厂家的VNFM实现对接。

最下面一层是转发层,SDN包括软硬件的交换机以及SDN的网关,还有Net设备。NFV是真正实现转发的VNF。

下面介绍一下我们NovoDC具体方案的设计。

所有粉色的部分代表的是SDN集中管理的转发面。大家可以先关注左下角,左边指的是虚拟化的服务器,当我们要终结VXLAN的时候,跟传统网络实现互通,我们要部署SDN的硬件的网关,旁挂在核心交换机上。一些服务器确实是非虚拟化的,接入的时候我们也会部署一些硬件的QR交换机支持SDN实现整体的网络的连接。对于控制器、Openstack我们会通过管理网和整体的转发设备连在一起。我们也是评估了业界的方案以后,给出现有的应用场景最成熟的一个方案,在这个方案下,希望大家注意一点,这块有一个前提,安装在虚拟服务器的虚拟化平台上。

前面提到的总体方案设计,今年中国移动已经有了一部分的商用部署,12月份会继续有更大规模的商用部署。我们更多的是和厂家合作,对于中国移动来说,我们也是有一套完整的自研产品的计划。橘色的部分是我们自己想做的东西,第一是有关SDN的APP或者Enabler。SDN是最重要的,从SDN的名字就可以看出来,我认为APP就是在SDN里面的最核心的价值。通过虚拟的隔离把网络的能力开放出来,这是APP层面去做的,我们会大量的开发。另外一点是SDN的控制器,应该感谢开源的平台,以及现在最和的ODR。开源的力量确实很大,中国移动想做SDN的控制器,我们有两个方面。第一是累了以后提高运维和运营的能力,必须有一个团队的人一定要深入的了解在控制器的方式下具体的实现的流程,以及网络功能的一些基本的要求。

第二是对于运营商来说,其实我们希望多厂家组网,不是因为钱的问题,而是生态平衡的问题,必须要做多厂家。但是大家看今天的SDN解决方案,它很优秀,有很多优点,但是也带来一个问题,没有一个厂家说我能跟其他多个厂家的转发设备互通。所以我们一个很大驱动力是希望把多厂家的硬件也好、软件也好,交换机融入到我们自己的SDN网络环境里面。

第三,我们会定制开发硬件的交换机,基于OS做硬件流量的调整实现软件层面的接入。

重点提一下控制器和交换机的内容。控制器最上面有关业务的逻辑,接下来是框架的层次,再往下是具体的协议占以及工具层。对于框架和协议我们会做大的修复。

再下面是定制的交换机,我们会在操作系统层面做一些定制化的开发,还有具体的转发数据的采集。通过这种方式一方面降低QR交换机的成本,另外一方面按在现有商用交换机使用的过程中发现有很多的故障,很难去定位。所以,基于定制化的交换机,我们对于它的操作系统做一些改动以后,是希望更多的能够通过第三方的网管软件读取交换机的目标,加强我们的运维能力。我们也欢迎业界和有相关开发经验的对于数据中心交换机或者网络设备的网管开发的厂家的同事们、专家们,多跟我们联系,共同去推进这一块的内容。

前面是中国移动在NovoNet上的设计,接下来介绍一些我们的实践。第一是测试,新技术的引入测试是最重要的。2013年起我们就把国内,甚至北美20多个能叫来的openflow的厂家都叫来了,我们就想验证一下到底这个技术成不成熟。测试结果有几个,一是2013年的时候1.0占70%的支持,1.3是30%的支持。另外是控制器的可靠性非常的差,还有一个是流表是用Ttime存的,不可商用。最后openflow协议本身有很多问题,部分字段定义的不清楚,厂家理解不同。2014年我们开始验证多个厂家Openstack加SDN成熟的可靠性以及广域网的问题,今年年初据我了解我们开展了一次比较早的业界做SDN+NFV在数据中心整体解决方案用的商用测试,我们完成了一阶段的测试,马上要做二阶段的测试。

主要分三块,第一是有关Openstack业务的测试,整体的流程是不是跑通,是不是稳定可靠的,模拟多个用户并发的在Openstack上创建。第二,单独的设备级的测试,包括可靠性性能这部分内容。第三,有关NFV网元的测试,数据中心我们更多的关注防火墙、负载均衡和网关。

测试结果我们还是比较乐观,接口的对接支持的还是比较好的,在整个方案里,我们最担心的是有大量的数据包在虚拟化的虚机上跑的时候,会不会对性能带来一些影响。实际的测试过程中,我们发现对于大包来说,流量打到8G的时候,万兆的网卡,CPU的性能消耗占整个物理服务器的20%。对于我们应用的场景来说还是能够接受的。有关于NFV网元性能加速方面还是比较不错的,我们认为很多功能是可以商用的。

有关省内私有云的商用的部署。上层是我们自己开发的APP的界面,用户可以通过拖拽的方式创建自己云内的私有云的网络。我们做了四个平台的整合,一方面是APP,另外一个是Openstack,还有一个我们用了SDN厂家的控制器,最后一个比较有意思,虚拟化厂家选的是VMware,把SDN整体的解决在一起,我们攻克了比较夺得技术的难点。商用上线半年多。

最后一个是标准化,记得以前很多同事都问过我,软件需要标准化吗?因为SDN是一个软件定义的网络,是不是我们就不需要做标准化,自己开发全套就可以了。我觉得SDN更需要标准化,我们之所以用SDN的一个初衷在于我们希望业务能够更快更灵活的上线,SDN本身是一个网络,它要把很多厂家的设备集成到你的网络里面来。如果你没有一个标准化接口,对接的时间绝对会大大的推延,导致你最初的目标是没有办法实现的。所以在SDN的标准化方面,我们一开始就定位于在ONF上做一些标准化。有关运营商的网络怎么定义SDN,在这之前ONF更多的是定位于数据中心怎么来定位SDN,在运营商网络上用的时候我们发现有一个问题。运营商网络是多段,是端到端的,是多层的网络。另外,对于每一层的技术,比如传输网有OPN等等,是一个多层多技术的网络,在这种场景下要应用SDN,这是我们工作组一直关注的。参加ONF国内的企业越来越多了,希望大家更多的融入到这个工作组,一起在国际化的组织上推动需求场景以及接口上的具体的诉求。

2016年的工作我们会更多的在开源组织中推进我们现有的研究成果。

前面讲的主要是基于SDN和NFV的,最后一页稍微有点延伸,介绍一下数据中心基础设施层面达到低成本运营的方式。我也参加了ODCC的网络组,推动AOC线缆的标准化的工作。AOC线缆主要替代了传统的光模块和光纤做一个一体化的,长度可以选的1米、3米、10米、15米,对我们最大的吸引力是成本是比较低的,基本是光模块、光纤1/3、1/2的成本。在大规模的万兆的数据中心里,单个数据中心的成本节省很大,但是有一个比较大的问题,这个线缆主要用在服务器的网卡和交换机之间连接,兼容性不是很好。所以我们希望在ODCC组织里面能够把兼容性的问题更好的解决。

NovoDC数据中心网络面临的问题:

第一,虚拟化平台和SDN紧耦合,影响成熟度。我们有很大的驱动力希望能够把SDN好的技术应用到实际的网络里面,有什么方式?我们想到了解耦,怎么样解耦虚拟化平台和SDN,可能下一步需要用TOR去做。

第二,北向接口的问题。当我们想提供业务链的时候,我们需要把SDN流量导到防火墙、负载均衡上面去,导的过程中我们发现控制器和NFV之间是有一部分接口的,这部分接口导致了SDN的厂家必须选择指定的VNFF的厂家,才能实现完整的解决方案。之所以有这个原因是因为目前在Openstack架构下,没有一个标准的接口把控制器和VNFF通信的过程提取出来,让它去完成。为了解决这个问题,我们在我们的架构下我们用北向接口的方式直接告诉APP再由APP告诉VNFF。接口已经定好了,目前正在做厂家的VNFF和多个北向接口的对接。

第三,控制器和硬件转发设备之间的南向接口难打开。目前硬件的这些交换机是不直接支持openflow的,所以当控制器下达openflow流表到这些设备的时候,硬件设备是需要配一个适配层,要把openflow的流表翻译成现有的转发设备的流表。

第四,测试相关问题。SDN再好,我们在评标的时候也需要有一个很完善的测试报告,但是有关控制器的性能没有一个很好的解决方案,希望进一步的研究。

推动未来的数据中心,像NovoDC中国移动的数据中心未来的发展方向,一是高效运营,二是灵活业务提供,三是低成本运营。SDN和NFV在数据中心领域即将迎来建设爆发期,但是我前面提到的四个问题还需要我们去克服和解决。作为中国移动来说我们希望跟业界更多的SDN和NFV的厂家,一方面在产品的对接和互通方面,一方面在北向接口的标准化方面,还有多虚拟化平台去支持SDN方面多做一些努力和尝试。

最后是有关基础设施方面,比如是AOC线缆,ODCC会有一个AOC的工作组,专门是做这块的,希望大家多参与。

关键词:开放数据中心峰会 ODCC SDN