【运维】数据中心第三次变革浪潮袭来
微模块数据中心的出现,代表着云数据中心领域正在悄悄经历着一场新的变革,一场与时代变化比速度的变革。
某业内人士曾感慨地说起一个故事:国内有家大型银行,在2000年左右当它的一个大型数据中心落成后,该银行曾乐观地说:“我的数据中心至少可以用十年。”孰料,五年后该银行启动了第二个大型数据中心的建设。再过了三年,当第二个大型数据中心即将投入使用之时,该银行表示已经着手开始第三个数据中心的选址。
数据量飞速飙升的今天,在大数据时代呼啸而来的浪潮中,这家银行的数据中心扩展速度恐怕会更加骇人。
“现在国内IDC市场上的竞争形势比较杂乱,其中有不少数据中心还是以传统机房工程和简单集成堆叠的。真正有规模有实力,有自身特点和差异化优势的服务商还不多。”中兴通讯数据中心产品线总经理李华说。
这个故事的背后,是数据中心建设中IT容量规划难以把握的现实困难。建立一个高度自适应、高可扩展性的数据中心一直是业内相关厂商的努力方向。这种努力也推动了数据中心的第一次和第二次变革浪潮:2003年左右,在第一波互联网热潮渐渐回归理性的同时,企业级数据中心迎来第一次建设热潮,新型的技术理念开始被引入数据中心,高效、可靠成为这个期间数据中心建设的关键词。但是,随着时间推进,传统数据中心在空间、效率、能耗上的瓶颈也显现出来:空间紧张、效率低下、能耗过高,这些特点使得企业每年为传统数据中心支付巨大开支,而且数据中心属于长期建设项目,一旦建成,用户往往很难进行改造和升级,这无异于给企业带上了一付“金手铐”。
基于这种市场趋势,第二次数据中心变革浪潮应势而起——模块化数据中心思想开始流行。这种将电源、配电、制冷系统、机柜、管理和服务有机地集合起来,通过标准化的模块化架构实现“边成长边投资”构建数据中心的方式,比传统的数据中心在安装和管理上要容易很多,也更加高效和节能,赢得了许多企业客户的信赖。
中兴通讯副总裁吕阿斌:“对目前的中兴来说,主要阵地仍然是数据中心‘壳’的建设,用户的管理软件,也就是数据中心的‘瓤’,都需要重新定制,而未来,瓤和壳一定会发生更深度的关系。”
然而,在应对云计算和大数据带来的业务快速变化方面,传统的模块化数据又开始显出捉襟见肘的局促性——随着云计算带来的虚拟化、大数据、移动化应用,以及对弹性计算资源的需求,作为实现大规模计算的基础设施,数据中心是重要的物理架构和硬件平台。云计算技术的发展,让客户将不得不面对激增的业务量、随时变化的业务模式,在数据中心建成后如何尽可能缩减能耗、运维管理成本等严峻的问题——一方面,互联网应用的迅速增加,原本按年计算的数据中心建设周期,已经无法应对用户的需求;而另一方面,用户对数据中心的成本、能耗,特别是运维管理的要求变得更加突出。
正是在这种背景下,第三次数据中心变革浪潮袭来。中兴通讯提出了IDC机房产品化,从集装箱到SoHoMo(Smart office,Home office,Mobile office),再到微模块,中兴通讯在不断尝试各种类型的数据中心模式的同时,也在快速提高研发团队在结构、热设计等方面的能力。最终,中兴通讯数据中心团队得出结论——微模块是目前能够最快速响应用户需求,并且可以灵活应对各种应用场景的方式。
微模块数据中心的出现,代表着云数据中心领域正在悄悄经历着一场新的变革,一场与时代变化比速度的变革。
微模块的创新
“2009年,中兴通讯实施了两大战略,一个是ICT转型,另一个就是开始对云计算等新市场的拓展。”中兴通讯副总裁吕阿斌说,“而承载这两大战略的,就是中兴的政企市场部门。”
在开展业务的同时,吕阿斌和他的团队发现,整个数据中心的建设过程中,机房占用面积、电力消耗、交付速度、可扩展能力等都是业界关注重点,但在传统的数据中心基础设施建设中,横着一个突出的问题:在很大程度上,“数据中心就是机房装修”。吕阿斌发现,很多数据中心没有生命周期管理,软硬件产品升级更新、数据中心升级都缺乏依据,同时,随着业务扩展越来越快,传统数据中心粗放的管理模式也不再适用。
比如,过去由于业务相对平稳,传统数据中心对基础设施的变更通常要1~2年,甚至更长时间才会进行一次,但随着数据量和业务量的激增,用户企业对数据中心的交付时间越来越迫切。再比如,过去数据中心冗余设计相对比较高。以运营商为例,日常业务量与春节等高峰时段相比,仅需要用到10%~30%的计算能力,这就意味着,数据中心里有大量闲置的资源,但这并不会降低数据中心的投资和能耗,而这实际上会带来巨大的物理资源和能源浪费。
为此,整个行业都在探索数据中心的提升与改善——为了提升服务器密度,集装箱式数据中心、模块化数据中心等备受微软和众多公司推崇;而为了有效降温,Google等公司甚至在海面以下建起数据中心。但这些仍然不足以解决数据中心面临的问题。
为此,中兴通讯提出了IDC机房产品化,从集装箱到SoHoMo,再到微模块,中兴通讯在不断尝试各种类型的数据中心模式的同时,也在快速提高研发团队在结构、热设计等方面的能力。
最终,中兴通讯数据中心团队得出结论——微模块是目前能够最快速响应用户需求,并且可以灵活应对各种应用场景的方式。
“我们的微模块数据中心和目前业界所谓的模块化数据中心还并不完全相同。” 中兴通讯数据中心产品线总经理李华告诉记者,微模块数据中心是将传统机房的机架、空调、消防、布线、配电、监控、照明甚至计算存储网络等IT硬件等系统统一集成一体的高度集成化产品,客户不用再单独面对一般数据中心建设复杂的现场工程管理,而是统一在工厂预制完成。
“我们的微模块数据中心最小可以做到4个机柜一组,这是业内最小的模块了。”吕阿斌说。和传统数据中心相比,微模块数据中心交付周期可由1~2年缩短为2~3个月,TCO可降40%左右。同时,微模块数据中心具备模块化、绿色节能、云计算、智能管理特点,可以帮助客户从节能减排、快速交付、高能效、创新业务盈利能力、精细化运营几个方面来提升投资回报 。
此外,从能源效率上来说,一般的模块化数据中心只是简单地对冷热通道进行隔离,但仍然是传统的建设方式,比如把机柜部分的空间进行分离后再进行一些管理和控制。最常见的就是原来空调的上下送风打通,形成一个冷通道,但这种模式送风距离长,而且送风不均匀,而微模块数据中心因为整体设计,具备一套群控系统,能够全面分析数据中心里面各处的温度,并精细化地优化各个地方的能量分配,从而做到智能降温。
值得一提的是,中兴通讯数据中心统一管控系统ZXCLOUD iDCIM集基础设施(传感器、智能设备)、IT设施、云计算的运维和运营管理于一身,改变了传统数据中心多层级不同系统并存难以管理的现状,大大减少了运维的工作量。iDCIM数据中心监控系统具备丰富的界面组态、多样的报警功能、开放式协议接口、大容量的数据采集、存储功能以及智能的数据分析技术。用电管理系统对整个机架服务区用电量进行管理和记录,同时可以通过网络进行外部访问,温度、湿度、湿气和烟雾探测监测都与具有入侵探测功能的警报系统整合在一起,便于集中管理和远程监控。
踩准需求的节拍
2012年,一次偶然的机会,吕阿斌遇到了腾讯数据中心的一位负责人。这位负责人告诉他,腾讯QQ和微信每天产生大量用户数据,数据中心每年仅存储服务器就要新增数十万台,数据中心的瓶颈让IT部门压力越来越大,从2010年起,腾讯就开始尝试推出了几个版本的微模块数据中心,试图找到一个既能支持庞大业务,同时还要能快速部署的解决方案。
在两个人关于数据中心的讨论中,吕阿斌提出的数据中心产品化的思路让这位腾讯负责人非常感兴趣,双方一拍即合。
“业务部门对我们的要求经常以‘周’甚至‘天’为周期。”腾讯网络平台部数据中心架构师李典林曾在一次公开论坛上坦言,“为了应对不断爆炸的业务数据需求,腾讯的数据中心部门一直处于连跑带颠的追赶状态。正是快速、灵活、可扩展、高能效的要求,让腾讯自然而然地走上了微模块数据中心的道路。”
于是,在整整7个月的时间里,中兴通讯数据中心和腾讯数据中心的团队几乎合二为一,联合中国联通一起,对数据中心里的每一个细节进行讨论和细化,再测试, 打造了位于深圳龙岗区国人通信科技园的坪山数据中心。中兴通讯数据中心架构师翁建刚谈及这一次项目合作感慨万分:“项目团队对每一个细节都精益求精,从UPS电源,到空调解决方案的选择,再到定制化软件,甚至机柜的宽和高都是经过仔细推敲才确定下来。坪山数据中心完全由微模块组成,一期建设20个微模块,二期建设40多个微模块,总共部署了1200多个机柜。整个项目从装修进场到完工,只花了4个多月的时间,二期40个微模块从进场安装到通过测试验证只用了45天时间,充分体现了微模块易复制、部署速度快的优势。”
据李典林介绍,坪山数据中心按照场地情况,部署了由12个机柜和18个机柜组成的两种不同的微模块。“我们在有柱子的地方部署由12个机柜组成的微模块,在没有柱子的地方部署由18个机柜组成的微模块,这种部署方式帮助我们实现了空间的灵活利用。”
同时,微模块内部的电源模块、行间空调数量等可以根据IT机柜功率灵活配置数量,满足不同功率密度的需求,目前微模块内可支持的最大机柜功率达到12KW。而通过综合采用各种技术,如高压直流+市电直供的供电方式、行级制冷和冷通道密封技术,空调系统变频节能等技术,位于中国南方城市深圳的坪山数据中心实现了较好的能效水平。
“测试结果表明,在保证可靠性的基础上,坪山数据中心在负载达到1/3的时候,PUE保持在1.5左右。通过提高负载率和提高运营温度等优化手段,我们有信心让这个数据中心的PUE降低到1.4左右。”李典林如是说。
这样的结果,让腾讯非常满意。QQ目前拥有8亿用户,4亿移动用户,在数据仓库存储的数据量单机群数量已达到4400台,总存储数据量经压缩处理以后在100PB左右,并且这一数据还在以日新增200TB到300TB,月增加10%的数据量不断增长,腾讯的数据平台部门正在为1000个PB做准备。
同样,在中国东面的江苏太仓,也从数据中心的这一次变革中找到了适合自己的方式。2013年,江苏太仓市科教新城管委会组建全资国有公司太仓兰云信息科技有限公司(以下简称“兰云”),打造太仓互联网终端及应用产业园区的云计算公共服务平台。为了能快速向全市文化科技企业提供IT集成服务,兰云公司数据中心的一期建设需要在60天内完成整体机房交付。按照传统数据中心的建设模式,这是一项“不可能完成的任务”。兰云公司的负责人拜访了国内多家主要数据中心服务提供商,最长的认为这个项目需要两年时间,最少的也需要至少4个月才能完成。最终,兰云公司找到了中兴,凭借中兴内部团队的默契合作和对物流供应链的精确控制,做到了物料合理协调和高速施工,艰巨的任务顺利完成。
“按照模块化原则每年投资建设和扩容来灵活调整,一方面避免兰云公司数据中心基础设施的重复投资建设;另一方面也有力保障后续数据中心机房能够快速完成交付,满足园区企业的业务需求。”太仓互联网终端及应用园区副总经理李志超说,中兴微模块数据中心,还通过合理的风路设计,大大提升了机房制冷效率,使整体机房PUE控制在1.6以下,同时,单机架功率达到9KW,比过去的3KW提高了3倍以上,“这些都是我们之前没想到的”。
开放迎竞争
“现在国内IDC市场上的竞争形势,说实话还比较杂乱,其中有不少数据中心还是以传统机房工程和简单集成堆叠的。真正能够有规模有实力,有自身特点和差异化优势的还不多。”李华表示,尽管云计算的发展,让数据中心的建设如火如荼,仅国内提供数据中心解决方案及服务市场的供应商就有数千家,但目前,数据中心市场仍然高度分散。
据了解,几年前国内的主流数据中心服务商仍然是IBM、惠普、戴尔等国外企业,近几年中兴等国内服务商正在快速崛起。在李华看来,“从整体架构的能力来看,包括中兴通讯在内的主要IDC服务厂商,已经达到了相对的能力。在而市场的覆盖,对客户需求理解方面,本土企业更占优势,所以这也是我们一个比较好的契机。”
对此,吕阿斌表示,对目前的中兴来说,主要阵地仍然是数据中心“壳”的建设,用户的管理软件,也就是数据中心的“瓤”,都需要重新定制,“而未来,瓤和壳一定会发生更深的关系。”
事实上,在中兴通讯内部,“瓤”和“壳”的化学变化正在发生。据介绍,中兴通讯的研发团队正在进一步研究服务器、存储、网络等模块和机房整体的关系,今年,中兴通讯将提供符合“天蝎计划”设计规范的微模块数据中心。与此同时,中兴通讯也进一步加大了虚拟数据中心软件的研发。可以预见,兼备高密度低能耗、强大的计算存储能力、高度开放的虚拟数据中心应用及管理平台将为其客户带去更大的价值。
“而更重要的是,我们不会闭门造车,而是要发挥整合的力量,和更专业的第三方伙伴合作,形成资源整合。”吕阿斌强调。他深信,任何一家公司都不可能做到大而全,“数据中心是一项非常复杂的工作,从服务器到空调,从传感器到控制模块,如果全部都自己开发,不仅需要庞大的团队和成本,还可能无法保证项目的质量,所以我们要OPEN,全球整合资源,质量、成本、交付,利用大家的优势提供优质的价值。”