技术
首页  >  技术  >  技术要闻

大数据“落地”需破除三大障碍

2013-03-07  来源:中国信息产业网-人民邮电报  作者:工业和信息化部电信研究院通信标准所 魏凯

大数据时代已经来临。在人们畅想大数据将带来美好生活的同时,一个更加现实的问题却摆在眼前——大数据如何“落地”?政府和行业机构如何营造适应大数据发展的产业环境,企业如何开发强大和实用的数据分析工具,用户如何看待和适应大数据对个人隐私的“暴露”?虽然我们目前无法给出圆满回答,但是包括政府、企业、用户在内的多方正在积极寻找答案。

大数据无疑是当今的时髦词汇。不管是云计算、社交网络,还是物联网、移动互联网和智慧城市,都要与大数据扯上关系。各种与大数据有关的会议、文章、书籍铺天盖地。有人谈论大数据时代的公民生活,也有人谈论大数据时代网络反腐,仿佛一夜之间我们就进入了大数据时代。

大数据引发“思想启蒙”

国际上,大数据还真是热火朝天,各方都在积极行动。一方面,政府积极介入推动。2009年,联合国启动“全球脉动计划”,借大数据推动落后地区发展。2012年1月,世界经济论坛年会把“大数据、大影响”作为重要议题。美国从开放政府数据、开展关键技术研究和推动大数据应用三方面布局大数据产业。美国在开放政府数据上非常积极,通过Data.gov开放37万个数据集,并开放网站的API和源代码,提供上千个数据应用。除了推动本国政府数据开放,美国倡导发起全球开放政府数据运动, 已有41个国家响应。美国政府还投资两亿美元促进大数据核心技术研究和应用,把大数据放在与集成电路、互联网同等重要的位置,从国家层面推进。

另一方面,资本市场也对大数据钟爱有加。2012年4月,大数据分析公司Splunk首次公开上市发行股票,引发投资者关注。12月初,为企业市场提供Hadoop解决方案的创业公司Cloudera在E轮融资中获得6500万美元融资,估值约为7亿美元。近期,高盛联席主席斯科特·斯坦福说:“投资大数据及其运用回报率最高。”大数据领域的企业并购热度也在上升,在单笔平均并购金额方面,大数据超过云计算位居IT领域榜首,在总并购额上也位居第二。

在各方力量的推动下,大数据科研和产品开发逐渐活跃起来。一个新概念的兴起,最初往往会有人快速地“新瓶装旧酒”。已经存在好多年的商业智能、数据仓库等技术被重新包装,以大数据系统的面目出现在市场上。这也使人困惑:到底大数据与传统数据分析技术有什么差别?可以说大数据最重要的特征是将数据处理的对象扩展到互联网级别(Internet Scale),技术上的进展主要包括:一、单数据集达到PB级别;二、非结构化占主流;三、几天至数秒内完成高速处理。技术形成了批处理、流处理和交互分析三种计算模式。离线批处理(Batch Processing)技术以MapReduce和Hadoop系统为代表,实时流处理(Stream Processing)技术以Yahoo的S4系统和Twitter的Storm系统为代表,交互式分析(Interactive Analysis)技术以谷歌的Dremel系统为代表。

大数据的火暴,也带动了国内学术界、产业界和政府对大数据的热情,但笔者认为其更大意义应在于唤醒了人们对数据的重视。2012年以来,中国计算机学会、中国通信学会先后成立了大数据委员会,研究大数据中的科学与工程问题,科技部的《中国云科技发展“十二五”专项规划》和工信部的《物联网“十二五”发展规划》等都把大数据技术作为一项重点予以支持。虽然这些举措着眼长远,短期难以看到效果,但这种热潮的确触发了一场“思想启蒙”运动,使得“大数据是资产,不是包袱”、“要拿数据说话”等观念逐步深入人心,改变了以往不重视数据积累、不相信数据分析等认识。有了这种思维模式的改变,大数据的应用就有了希望。

关键词:大数据