运营
首页  >  运营

2015开放数据中心峰会天蝎整机柜分论坛讨论集萃

2015-11-06  来源:中国信息产业网  作者:

CNII网讯 11月5日,2015开放数据中心峰会在北京国家会议中心举行。本届峰会由开放数据中心委员会(ODCC)主办,阿里巴巴、百度、腾讯、中国电信、中国移动、中国信息通信研究院、英特尔等单位承办,是国内在数据中心领域的一大行业盛会。会议由上午的主论坛和下午的五个分论坛构成,分论坛的主题分别为天蝎整机柜、新型服务器、模块数据中心、数据中心网络、行业数据中心技术发展与运维。在“天蝎整机柜”分论坛上,众多业界专家就会议主题展开热烈讨论。以下是讨论实录

天蝎整机柜圆桌讨论

参加天蝎整机柜论坛圆桌讨论的嘉宾:

主持人:英特尔数据中心集团中国事业部总监 周翔

ODCC服务器工作组组长、百度高级技术经理张家军

Mellanox公司亚太市场开发总监刘通

东芝电子存储产品战略部经理吴博深

ODCC天蝎整机柜服务器项目经理、阿里巴巴高级专家肖德芳

ODCC天蝎测试项目高级技术顾问、英特尔数据中心事业部平台架构师龚海峰

浪潮集团资深互联网产品和技术专家曲刚

IBM中国OpenPOWER首席架构师刘洋

ODCC天蝎3.0项目经理、腾讯服务器架构师王伟

分论坛一天蝎整机柜圆桌讨论实录:

周翔:接下来进入圆桌讨论环节,在圆桌讨论的时候欢迎大家踊跃提问。下面有请百度高级技术经理张家军,Mellanox的刘通先生,东芝电子存储产品战略部经理吴博深先生,还有我们的ODCC天蝎整机柜服务器项目经理、阿里巴巴高级专家肖德芳,还有龚海峰,英特尔数据中心平台架构师,浪潮集团资深互联网产品和技术专家曲刚,以及IBM中国OpenPOWER首席架构师刘洋,还有ODCC天蝎3.0项目经理、腾讯服务器架构师王伟。

首先欢迎大家,大家敞开来问问题,可以针对天蝎项目,可以针对某一个技术,以及将来的发展方向。

提问:请问一下各位专家,在天蝎3.0里面,机柜也好还是服务器也好,散热这块有几种方式,比较推荐的散热是什么方式?

王伟:前面提到在天蝎3.0的架构设计中,我们会尽可能多的重用现在1.0和2.0的散热系统,因此更多是风冷的方式,这也对3.0的很多设计做了一些限制,比如功耗不能太高,简单来讲,在短期内,在我们瞄向2017年的天蝎3.0设计中,我们还会采用传统的风冷设计,未来我们也是在研究。阿里的同学也在研究是不是能够采用液冷等方式提高服务器的功耗,这个还在探讨当中。

肖德芳:看到3.0跟2.0有一些很大的差异,刚才王伟提到,我们3.0尽量重用2.0的成果和设计,考虑到3.0一些新的想法,我们不希望受到2.0的约束,3.0可能会做一些全新的考虑,我们主观上可能去尽量沿用风扇散热的设计,也会做一些其他的研究包括液冷这样的一些技术。我们也倡议在这方面的专家能够加入到项目组,3.0做得可以更有先进性。

提问:大家好,我叫张宇,我来自台达电子上海设计中心,我们主要是负责服务器架构的电源的设计。在刚刚的演讲中嘉宾多次提到了怎么样来实现节能减排,优化服务器的功耗这样的一个理念。这个也是契合于我们作为一个电源的设计公司的发展理念,我们的目标就是去设计效率更高的产品,来实现绿色环保这样的理念。现在天蝎服务器的架构里面用到的是直流12v为这样的电源架构,随着整个机架功耗的提升,在这个Busbar上的损耗可能会日益严重。在后续的设计当中,包括3.0的设计当中,会不会考虑到去提升Busbar的电压等级,比如说24v或者48v这样更高的电压等级,来实现这一部分的节能减排、低功耗的目标?

张家军:谢谢这位朋友,我觉得这个问题非常好,其实从我们刚开始设计1.0的时候就有考虑过是用多少伏的,有12v的选择,有48v的选择,还有更激进的用380v直接进来的。最后我们做了大量调研工作,综合考量了它的技术风险、技术成熟度,引进方案对既有服务器体系变化的程度,以及最后我们预期能获得收益的大小。基于我们后来最终定下的12kw的机柜来讲,我们觉得是改变最小的技术集成度最高的也是安全性最高的。最近我们还在同步看一些其他的供电的解决方案,但是老实说,基于我们目前对整体评估和测试,我们发现即便从12v提到48v,在整条链路上的收益并不是那么显著,可能会有一些空间的提升,比如说1%或者更低,我们可能需要去评估1%为此付出的代价是什么。目前没有一个明确的答案说我们一定会做什么或者不做什么,沿着现在12v继续走下去,至少目前没有面临特别严峻的挑战说我们一定要做一些改变。

龚海峰:关于供电电压,对于服务器而言,这是一个生态链,并不是光做电源或者服务器,对一个服务器系统大家知道,主板里有各种各样的芯片,很多通用的部件,他们这么多年的标准制定下来,大家都按照标准来做,已经成了事实的一个现实,12v在整个目前生态链里面是不可或缺的。对于我们整机柜Busbar往更高电压去走,这个是一个非常好的课题,真的要去实现的话,涉及到生态链,这个在短期内不一定会看到非常好的收益,从长远来看,我相信这是大家一个研究的方向,最终实现节能减排和更高效的绿色的数据中心。

刘洋:刚才在展台讨论这个供电的事情,IBM现在这种Open POWER有两个层面的事情在做,一个在做单机性能的优化,另外一个层面是在数据中心这一块的优化,包括整个的冷却系统,包括风冷水冷,还有一些直流供电方面,包括48v或者更高的直流供电,都会有一些研究,也希望在中国这边接着Open POWER这个平台,跟各个厂家把这个事情落地。我也同意刚才嘉宾说的,48v不是简单的事情,需要整个生态链,需要所有的合作伙伴一起去努力。

提问:我看到你们的BBS是12v的电池,但是我们看到OCP包括谷歌是48v的电池,现在我们看到一些锂电,我已经看到一些锂电在Rack里的备份非常方便,一个小盒子插进去就行了。想问一下,用12v的电池主要考虑什么,第二个问题,后面会不会用到48v的电池去备份?

肖德芳:这个问题提得非常好,刚才说到电池,我们BUC由一组电池组成,电芯也不是12v,是串联加并联和起来的。刚才你提到的48v,比如我们的电池是48v,这是一个很好的话题或者一个课题可以研究,但是短期内如果直接导入可能还是要花点时间的。

曲刚:首先现有的是在12v这么一个供电模式下进行的,很多事分步骤来进行,我们在现有的架构上先实现这种分布式的BBU这种产品,来满足整体能耗的降低。接下来可以再来考虑48v的BBU的情况。

提问:我看到曲工的材料上也讲,数据中心的制冷方式会超压缩机制冷到风自然冷去变化,浪潮在数据中心的制冷方式上面你们用哪一种方式比较多,在这些方式上你们后面是怎么规划制冷方式的?第二个问题,因为液冷在未来CPU的发展会越来越大,在散热方面,还有在PUE上面有巨大的优势,液冷必然在未来是一个发展的趋势。当前在液冷方向还是有柜机的有框机的,在这块液冷,浪潮或者天蝎这块是怎么去考虑未来液冷的方向,怎么选择这个方向?液冷还有点高温水冷却、低温水冷却的问题对PUE影响也比较大,这块向各位专家问一下是怎么发展的?

周翔:这个问题稍微转换一下,这可能不是只针对浪潮的,可能更多是看天蝎整机柜在接下来散热上面,特别是风冷以及在将来技术上的选择,有没有可能考虑液冷这样的技术。

曲刚:对于所有的制冷方式,我们现在在天蝎整机柜上采用的散热都是风冷,基于这种新风耐腐蚀的高温的环境下,浪潮同步开发出了一个水冷背板,但是因为产品开发包括诉求来决定我的产品的生产,虽然有这么一个产品,但是目前可能BAT或者在座的一些公司,可能大家都没有在用,我们只是在一些通用的机架上,比如1U、2U机器上来挂接,现在在天蝎整机柜上是没有用的。对于散热,除了风冷,我们现在跟客户同步做的,包括浸泡式的液冷,我把整机柜放倒,整体的机架里面冲上一些低沸点的液体,不知道天蝎3.0会不会考虑这种散热的方式,我们可以同步来做这个事。

龚海峰:要实现这个目标,除了改进制冷方案之外,架构的创新,还有一些其他的方式也可以达到这个目的。像我们天蝎3.0大家在倡导资源池化,要提高资源的利用率,或者把资源解耦。其实这些在很多程度上都可以帮助去实现这个目标,通过更好的管理使得我的资源的利用率更高,把那些闲置的资源把它能够关掉,或者架构上做一些解耦之后,我整个的机构上的设计更加适合于去做。我相信也是天蝎3.0在创新上需要去做的一些方向。

张家军:这个话题很大,简单说两句,刚才在茶歇的时候还跟戴尔的几个专家聊到这个问题,不能用液冷去解决问题,第一个,从数据中心今天的供电和散热机构来看,用风侧自然风的方式,无疑把数据中心的PUE做到极致,如果加入双入,基本上1.0G肯定能保证。后面两个巨大的挑战,尤其在中国搞这个事情,一个是温度的可控性的范围,我们很难有这样一个地方能够说常年比如在20多度的平均温度,或者最高温度不超过25度、30度,这样的地方很难找。第二,大家都知道不只是北京空气不好,其实全国的空气都不好污染是非常大的问题。百度从2011年的时候就开始研究高温和耐腐蚀,我们现在已经在做,用数千台服务器规模的试点去验证这个事情,等到后面更成熟的时候我们也会放到ODCC的框架里去,去推动它更大规模的应用。把高温耐腐蚀解决了,让设备能够持续以相对高的温度能够保持三到五年的稳定运行,这个很关键。第二,液冷这个事情,绝对不会是一一般杆子打死的,比如通过液冷可以去解决一些超高的计算密度的问题,比如大家经常玩的超频,如果把这个做得很好,多花一点钱解决功率的问题,提升20%、30%,那还是非常显著的。最近大家也知道像量子计算也很火,量子计算本身解决一个问题,要用超低温控制量子稳定态的问题,这些都给我们提供很大的想象空间,到底哪个是更好的,我觉得没有更好的,只是说哪个是更适合的,你的应用场景是什么,而且天蝎3.0是开放的,我们会考虑多元化的方案。

吴博深:其实硬盘是在一个机柜里面数量也不少,每片盘7000来转,也挺耗电,我们这边也在跟BAT在看,到底有哪些省电模式我们可以尽量去做。另外要考虑一点,省了电,启动的响应时间也是关注点。

周翔:在这上面一定是有机会的,特别是像我们做的这些高温耐腐蚀,接下来硬度也会面临同样的问题,我们把这些技术做好,我觉得我们是有很大的发展前景的。

时间关系,大家的提问就到这里,请各位嘉宾发表一下对天蝎3.0的展望、期许。

刘通:刚才我们讲了这些技术问题,我自己都在学习,对我来说全部都是比较陌生的,我们是计算机里面一个组件,在天蝎机柜里面如果能够有机会加入,刚才我看到很多演讲在讲到资源的池化,也讲到资源池化以后对网络的挑战性,其实作为Mellanox,我们已经在考虑如何用高速网络去解决资源池化的问题,从功耗比来讲,虽然我们网卡占的功耗非常小,但是我们还是在极力下降网卡和交换机的功耗,无论是功耗比还是性能,我们都在为未来的大型的机柜方式做考虑。

吴博深:东芝这边我们也是积极在参与BAT的这个项目,接下来期望有更快的可以在新的3.0上面可以体现,始终我没有在场那么多专家专业,我是市场部的,所以就八个字,天蝎无敌,再创佳绩。

张家军:四个字,说到做到。

肖德芳:我们一起加油,把ODCC一起做好。我们刚开始搞的时候,其实我们定位还是比较低的,我们自己就想做点事情,看到今天,尤其今天的峰会,今天上午大会两千多人,一下子把我们天蝎、ODCC提到非常高的高度,甚至引起国家工信部很多领导的关注,对我们自主可控知识产权这方面提了很多要求。我们这么多人的参与,必定能把天蝎、ODCC做好,以后不仅是在中国做好,在国际上也能有影响力。

龚海峰:很多人问我,说你们英特尔在天蝎里面到底想去讲什么东西,也会问到说你连续两年在ODCC的发言都是在讲管理,那套管理到底是什么。其实我是想说,ODCC的名字,开放数据中心,我代表的英特尔我们想做的事情或者想支持的就是开放、合作、创新,因为英特尔本身做服务器,服务器芯片市场没有超过20年,十几年前英特尔芯片只是用在PC上,到现在很多的都在用英特尔的CPU做服务器,本身的基础是开放、合作、创新,相信我们接下来在往天蝎3.0和再往后的合作当中,我们大家一起秉承开放、合作、创新的理念,相信一定可以取得更好的成绩。

曲刚:其实软件的开发快速迭代,硬件也是一样从天蝎1.0到现在我们也是一步一步慢慢走过来同时在国外还有一个OCP的组织,也是在整机柜这方面,大家共同做努力。相信在座的各位包括其他国内的厂商,大家携起手来共同朝这个目标奋进,天蝎会走得更好。

刘洋:IBM不光是在服务器这个层面,制冷、供电等所有技术的公开,帮助到ODCC,达到在中国这边数据中心的共同发展。大家都提到了要走出国门,OCP的人也要求我们把天蝎的服务器弄到国外,我这里说一点,我希望3.0的时候是不是可以有一个英文版本的标准出来,我在跟外国同事交流天蝎2.0标准的时候,发现谷歌翻译确实很差。

王伟:3.0的时候我们肯定还是保持开放的心态,欢迎所有的技术和方案能提交给我们这个工作组来进行探讨。第二希望长远,我们希望ODCC、天蝎能够走得更远,而不是驻足于当前的成就。

周翔:谢谢在座的嘉宾,今天下午的会议到这里就全部结束了,谢谢大家。

关键词:开放数据中心