技术
首页  >  大数据  >  要闻

促进数据流通 释放数据红利

2017-05-17  来源:中国信息产业网-人民邮电报  作者:中国信息通信研究院 魏凯

我们正处于一个最好的时代,数据极大丰富;同时也是一个最坏的时代,数据孤岛越来越严重。一方面,互联网巨头、政府、大型企业对数据资源的掌控能力越来越强,数据量滚雪球式增长。另一方面,即便巨头们也并不拥有全景数据,他们的大数据业务还需要与外部数据关联,一般创业企业要想获得外部数据就更加艰难了。大数据的应用需要融会贯通,只有流通起来,才能释放数据中蕴藏的巨大价值。

数据流通并非新生事物。早在1840年,邓白氏公司创建,那个时候就开始了数据的买卖,它从各个渠道搜集数据、整理数据、加工数据,并把数据分析结果提供给别人,帮助客户判断个人或企业的信用,征信业随之诞生。20世纪90年代由美国30多家电信运营商、有线电视运营商联合成立的NCTUE公司,最初在这些公司内部交换欠费信息,逐步发展成美国一个最大的数据源。在线上营销领域,前几年被Oracle收购的Bluekai,也是类似的角色。国外把这类公司称作数据中间商(data broker)。最近几年,随着互联网的发展,我们逐渐进入一个大规模采集、交换和利用数据的时代,数据的流通变得越来越普遍。

2009年以来,随着大数据热潮席卷全球,专门的数据交易市场诞生。数据交易市场,即data marketplace,与data broker类似但不太一样,它是一个线上的数据买卖场所,买家和卖家在这个平台上进行交易。比较知名的有Qlik的DataMarket、CSC的infochimps、Salesforce的data.com和微软的Azure Data Marketplace(微软的Azure Data Marketplace已于2016年年底关闭)。这些数据交易平台的出现,在一定程度上缓解了中小企业数据获取难的问题。

在国内,这几年数据流通,特别是数据交易的概念就像大数据一样火爆。我们观察,2010年以来,几乎每个月就要成立一家数据交易平台。北京、贵阳、武汉、哈尔滨、上海、钱塘等地相继成立了数据交易中心,还有很多地方的数据交易平台在筹建。

数据作为流通交易的标的,与一般商品有很大差别。数据是信息的载体,其特殊性在于,你拥有了并不意味着我不能再拥有,是非独占的;你的1GB数据和我的1GB数据是完全不同的,是不能互换的。数据还有一个特殊性,就是它可能描述了其他人,数据买卖可能会涉及数据描述主体(人或企业)的利益,会涉及公共利益、涉及国家安全。正因为数据是一种特殊的商品,我们对它的认识还不是很充分,现在要交易流通,还存在很多问题。

当前,数据流通缺乏规则,利益攸关方都很纠结。数据的利益攸关方包括数据源、数据使用方、政府、公众和流通交易平台。对数据源来说,要把数据拿出来卖,是要承担风险的,法律风险和舆论风险,也要承担数据控制权丧失的风险,但经济效益并不是十分显著。对数据购买者来说,他们也面临着来源合不合法、质量能不能保障的疑惑。对公众和媒体来说,在当前地下数据黑市猖獗的情况下,很难区分哪些是合法的哪些是非法的,很可能大家一听到数据交易,就直接联想到那些非法行为。如何让公众把合法的数据流通与非法行为区分开,让社会为数据流通提供一个宽松的舆论环境,是非常重要的。对政府来说,数据流通要不要监管、怎么监管、谁来监管也都是悬而未决的问题。在多方纠结的情况下,对数据交易平台来说,如何让市场活跃起来,打消各个方面的顾虑,同时提升自身的可信程度,是非常关键的问题。

数据流通要发展,急需建立行业规则。需要研究探讨数据权属、交易标的合法性、资产评估与定价、安全与隐私保护、监管机制等问题。

美国这几年对数据交易的讨论越来越多,社会各界立法和行业自律的呼声很高。关于数据交易中的个人隐私保护是美国公众关心的焦点,用户知情权、选择权、数据中间商的大规模数据泄露等是最关键的议题。美国联邦贸易委员会连续几年都发布了关于数据流通的研究报告,呼吁提升数据流通的透明度和可审计性。众议院连续三年提交“数据流通透明度和可审计法案”,目前尚未通过。这个法案的重点是规范数据交易过程中怎么保护各方的利益,特别是个人信息怎么保护。第一,数据来源是不是合法;第二,个人知情权、选择权、退出权有没有保障;第三,如何防范个人信息大规模泄露。因为如果大的数据交易平台发生数据泄露,影响的不是一百万两百万人,而是几亿人。根据美国govtrack网站的“大数据”分析,这个法案通过的概率为0.1%,还相当漫长。行业里的巨头们开始急迫地呼吁,加快推动行业自律,参与其中的企业自我约束,提升安全标准,改善社会形象,创造良好的环境。

数据流通在我国处于发展初期。我们呼吁行业自律,共同研究,协调数据交易的数据源、交易平台、购买者这三个利益相关方。我们要确保交易数据的合法性,数据交易平台的安全、透明,数据利用的合法性,政府的监管尺度等。数据中心联盟一直关注大数据产业发展,致力于破解数据流通面临的困境,组织国内大型互联网公司、电信运营商、数据交易所、交易平台等50多家机构,于2016年4月发布了《数据流通行业自律公约》,并着手形成自律监督机制,取得了初步成果。建立完善的数据流通制度体系,长路漫漫,还需要多方携手,共同推动。

应用是大数据稳健成长、发挥作用的关键。随着大数据应用的普及,电信业越来越重视从大数据中挖掘潜在的商业价值。大数据正在颠覆传统的价值链,行业之间的分界线变得模糊,让竞争态势不断发生变化。电信业若是能紧跟这些变化,及时转型业务模式,就会看到许多扇新的大门正向其敞开。

关键词:Qlik govtrack NCTUE 数据获取 数据业务