技术
首页  >  大数据  >  大数据专题

浪潮集团资深互联网产品和技术专家曲刚:助力天蝎 合作共赢

2015-11-06  来源:中国信息产业网  作者:

CNII网讯 11月5日,2015开放数据中心峰会在北京国家会议中心举行。本届峰会由开放数据中心委员会(ODCC)主办,阿里巴巴、百度、腾讯、中国电信、中国移动、中国信息通信研究院、英特尔等单位承办,是国内在数据中心领域的一大行业盛会。会议由上午的主论坛和下午的五个分论坛构成,分论坛的主题分别为天蝎整机柜、新型服务器、模块数据中心、数据中心网络、行业数据中心技术发展与运维。浪潮集团资深互联网产品和技术专家曲刚出席会议并发表题为“助力天蝎 合作共赢”的演讲以下是演讲内容实录。

浪潮集团资深互联网产品和技术专家曲刚

曲刚:大家下午好,我是曲刚,来自浪潮。接下来的内容跟大家一块看一下数据中心在TCO诉求下的技术演进。

刚才几位嘉宾都讲了各自的一些方面,我这里有一些部分是重复的,这一点不管是我们的客户还是整机柜的集成厂商,还有我们部件的厂商,大家最起码在这个重复点是达成了一致,有一个共识,在ODCC的号召下面,大家在这么一个组织里能以一个合作和开放的态度来共同搭建完整的生态链。

首先在整个互联网发展的大前提下,我们的数据中心也好,或者是我们相应的业务发展也好,都有一个突飞猛进的增长,带来的是我对这些存储的诉求更加紧密。对于冷热数据分级存储,同样我们产生了不同类型不同形态的产品,如何在这个统一的硬件架构下实现存储的融合或者说存储的池化,这是一个问题。另外,服务器的能效我们现在基本上都已经做到了极致,如何在其他的IT设备上通过一定的优化和改善,更加让它节能,降低数据中心整个的PUE的能耗值。

接下来的内容,以解决这两个问题来出发,主要从存储技术的发展和演进,以及IT设备的技术演进这两个方面来进行,首先我们来看这个数,刚才东芝的吴博已经提到了,随着整个行业包括云计算、大数据和物联网的发展,我们可以乐观来做一个估计,到2020年我们整体的数据存储的需求达到44ZB,每个行业的发展都有一些泡沫的存在,或多或少的都会存在。保守一些,IDC,他之前做了一个预测,我们会达到35ZB,不管怎么样,从2010年我们进入ZB时代,到2020年这十年间,我们几乎是每年都会有个翻倍,到现在最起码有30倍数据的增长。数据的增长就会带来服务器的增量,因为现在的数据基本上都是在服务器上进行存储。但是现在市面上一些可以用来做存储的服务器设备,它的选择性并不是很多,统一的存储架构可能会带来一些不适应的地方,比如说我现在要做一些热数据的处理,讲求的是时效,在现有的架构下可能没有办法做到很低的延迟,就需要通过软件的方式,原来可能串型存储的数据变成并型存储。我们本来是想把钱花在存储上,因为受到平台的限制,我们可能一些钱花到了不该花的计算上。通过这两点我们可以思考一下,我们现在需不需要这么多的服务器,对于海量的存储没有一个更加低成本的解决方案。数据的分级根据访问频次不同进行分级,从这个角度考虑,做一个硬件方面的冷热的分级,对于这些热数据可以通过SSD、PCIE等来实现数据的快速处理,对应的我们也有开发出相应的在天蝎整机柜上使用的一些节点。对于冷数据,我们抛开1、3或者1、5的平台,我们采用更低功耗的,或者是我们用一些更加低功耗性能还有保证的一些硬盘设备,来实现存储的成本降低。同样我们有相应的一些节点。通过这种思路,我们做了一系列的产品,外边也展示出了三款不同类型的节点。现在这么一个完整的产品线,这种存储的成本是可以做到优化,对不同存储的需求,我用不同的节点来实现,大家各司其职。但是这样也有一个问题,你产品线变得冗长之后,我开发或者是我的投入会变得比较麻烦,尤其是到了硬件迭代的时候,因为我之前已经有了这些产品了,我要去接着迭代下去,就会出现一个峰值,我开发的时候一个产品一个产品来做,但到了同时都要更换的时候,比如现在新的CPU要出来了,这个时候全线下面都要进行升级,这个投入这个开发的工作,包括验证,大家一块来导入这个新产品的过程会非常的漫长,也是很痛苦的。

刚才这几个节点我们也可以看到,它是在整体的机箱架构的限制的条件下,CPU和硬盘的数量是固定的配比关系,不管是12盘或者8盘位的架构,都是固定的。我们有没有一种方式来打破这个固定的配比关系,基于这方面的考虑我们做了一个全新的产品,基于标准的SAS协议和交换机。这个产品的样子就是这样,可以通过上行的一些计算节点,通过Switch转折,连接到下面不同的存储节点上,这个配比关系,它可以灵活进行搭配,而且可以热配,这个图上显示计算节点一可以通过Switch连到存储节点2,这只是一个演示,实际上可以任意进行动态的搭配。绿色的是我已经配比进去的,随便选一个Server的节点,灰色是等待配比的,深一点颜色的是可以跟其他节目电话共享的架构,这样相对来说非常灵活,通过一些固定的随机带的软件,可以灵活的进行搭配,真正做到存储资源的池化。这个节点放到整机柜里的样式就是这样,任意的位置,放一些计算节点进来,通过Switch来连一些存储的节点,大家可以放心节点的数量搭配,会有一些疑问说能搭多少节点,是不是整个柜子单机柜来实现,其实是可以扩展的。我们现在开发的这个是1U里边有三个小的单板,每个板上有17个口,整个Switch有68个口,每个口都是12GB的SAS信号,对单柜来说是完全冗余,可以实现跨柜的存储。对于整柜可以实现共享机柜里其他的一些支撑模块的功能,比如说供电、散热,都可以直接从机柜里里边来实现。

接下来看一下在服务器之外的IT设备它的供电,其他设备的技术演进。首先我们看一下供电这一块,刚才阿里的肖总已经对这块都做了说明,我们可以简单快速过一下。首先传统的包括我们现在选择最多的这种供电方式,双入的市电同时的供应。这个链路上可以看到,市电进来之后会进行一个逆变整流的设备,转换到UPS上,再翻过来经过一个整流才到服务器的电源,才能被服务器利用。经过两级逆变和整流,损耗是非常大的,大概有76%的实际使用率,20%多都已经被损耗掉了。在这方面有很多优化的空间,接下来我们可以市电直供,减少逆变的损失。通过这种方式,比如市电一进来之后直接整流进服务器了。对于经过UPS输出来的直流的电源,整流之后也可以来用,实现高压直流的供电,减少一个逆变的过程,这种方式就会更好的提高总体的供电系统的利用率。再接下来,两路都是在负载均衡的模式下来供电,受电源特性的影响,电影可能在负载50%的时候,整体的利用率相对来说是最高的。但是现在我双入的电源,它是一个冗余的设计,可能利用率在20%几甚至10%几的时候,这时候电源的转换效率是比较低的,对于电池技术的发展包括天蝎整机柜技术的发展,我们现在实现了一路式待机状态下供电的模式。我们的损耗就可以只是受一路的影响,另一路只是在待命自然就没有损耗。通过这种方式来实现整体能耗的高利用率。

在整体的数据中心建设这一块,这种集中式的弊端,大家在天蝎2.5规范里也是集中在做,把集中式供电转变成分布式的连续供电,也就是UPS。目前浪潮已经在开发阶段,具体的测试也进行了差不多一大半了,也是得益于电池技术的发展,所以这个产品才会快速的在整机柜里实现。目前浪潮的整机柜产品里边带的连续供电系统,它是以1U节点的形态出现的,1U里面搭配了4个小的模块,可以实现4.4kw的15分钟连续供电,对于8kw或者10kw的供电,插相同类型的BBU进去可以实现。

接下来是整个数据中心另外一部分,非IT设备制冷这一块,我们比较了解的,现在制冷几乎是所有数据中心建设当中必须要考虑的而且需要重点考虑的这一环,不管是液氨还是冷机和水侧、自然冷这种,PUE在里面占的比例特别大,一般都是30%左右,现在有没有一种方法把这30%的能耗节省下来,其实国外包括OCP现在也在考虑,现在新风机房出现,没有冷却这一块,机房选址的时候,我在一些高纬度的地区或者海边,可以实现有强风对流和正常散热的场景。和国外相比,国内有一个明显的不同,受空气污染的影响,空气中有太多的硫化物或者金属粉尘,可能会有腐蚀,很多报道都提到说哪的数据中心会有老化严重的现象。对于这种腐蚀的问题,我们浪潮在开发这种适用于新风机房的服务器的时候,已经有一个重点的考虑,包括部件的选型还有整体的结构设计、风道设计加上耐腐蚀工艺的处理。实现在现有的整体的新风环境下,连续运行450天,现在这个机柜还是正常在运行,所以通过这个实践我们也可以看到这条路也是可行的,通过节省或者直接去掉整个数据中心的制冷这一块,来降低整体的PUE。基于这些技术,浪潮从2010年开始第一代推出,到现在SmartRack4.0,对应的是天蝎2.0的机柜,接下来浪潮也会基于以上提到的几点,开发出全新的产品,不久的将来也会有新产品的发布。

这些就是我分享的内容,谢谢大家。

关键词:开放数据中心