移动互联网
首页  >  应用平台  >  应用平台要闻

跨过AI技术的三座大山

2017-07-14  来源:中国信息产业网-人民邮电报社  作者:临江

  人工智能(AI)早已有之,从上个世纪50年代图灵测试以及人工智能概念的提出,到现在已经走过了60余年的光阴。几经沉浮,在去年AlphaGo击败人类围棋顶尖高手后,AI再一次成为聚光灯追逐的目标。“抢夺人类的工作机会”“毁灭人类”,一时间有关AI的各种产业、社会甚至伦理道德问题甚嚣尘上。无论如何,AI掀起了一场变革,360人工智能研究院院长谭平甚至认为人工智能是人类最后的发动机,将引发第四次工业革命。AI在解决各行各业工作效率、资源分配、价值产出等问题方面都会给人们带来巨大的惊喜。面对AI+时代的到来,我们应该敞开胸襟去拥抱,去感受前所未有的技术带来的无穷魅力。

  如何拥抱?如何更好地为我所用?AI不是外卖快餐,立等可取。变革必然带来阵痛,AI技术与传统技术的融合、对传统产业的改造还有很多实际困难亟待解决。

  很多专家学者将今年喻为AI商用元年。在金融、物联网、教育、制造等行业,AI确实已经到了商业落地的节点。纵观目前的发展态势,各个行业或是企业使用AI技术的水平参差不齐。IBM中国研究院副院长邵凌将其分为三个层次,第一个层次是利用现有AI API开发应用,基本上利用一些其他的AI平台所提供的API来构建自己的应用,这些平台包括IBM WATSON API、百度大脑API、讯飞开放平台API,这是比较简单入门的方式,但是这种方式本身也有很多的局限性;第二个层次是利用企业数据定制AI模型,这是目前比较多的,利用一些企业自己拥有的数据,根据已经发表的或者是开源的算法和框架,来定制企业自用的AI模型,例如将图像识别用于医疗、安全、智能客服等领域;第三个层次是构建新的AI系统。

  不论是哪一种应用水平,很多问题是具有共性的。中国信息通信研究院技术与标准研究所副所长何宝宏认为,AI有三大基础力量——新数据、新硬件、新算法。当企业运用AI技术真正去解决企业实际问题时,他们面临的挑战和遇到的问题远比想象的多。例如,企业使用深度学习来定制自己的模型需要很复杂的步骤,包括定义训练任务、准备训练数据、数据预处理、深度学习模型选择、选择深度学习训练框架及搭建环境、配置模型训练的超参数、深度学习模型训练等等。但总的说来,无外乎数据、硬件、算法的问题。

  没有数据,AI就是无源之水、无本之木。在AI领域,甚至有句老话“只要有足够的数据,任何问题都可以解决”,数据之重要性可见一斑。以AI在医疗领域的应用为例,长期以来的一个困难是缺乏高质量、干净的有临床标注的数据。例如,如果需要AI在肿瘤的精准诊断和治疗方面发挥作用,就必须有大量的肿瘤患者的基因数据以及临床表征资料,但是首先各个机构缺乏这样一个积累,包括医疗管理部门、研究院所、医院诊所、医疗IT公司等等都缺乏高质量的数据,当然也缺乏数据之间的开放共享。只有各个部门联合起来,打造各种高质量的生物样本库、加大电子病历推广等才有可能积累高质量、海量的医疗数据,才能让AI有更加深度的学习和认知判断。

  而硬件特别是芯片的发展也是影响AI发展的一个重要因素。深度学习这几年的爆发性发展正是得益于芯片技术的进步。如果不是芯片技术已经发展到了一定的高度,能够给大规模的机器学习提供足够的处理能力,我们肯定看不到战胜人类顶尖棋手的AlphaGo。而现在,AI的发展给芯片带来了严峻挑战。一方面,云端服务器需要有高功耗、高计算能力的芯片,朝着高性能超级计算机的方向发展,而另一方面则是手机等各种终端的人工智能芯片,需要更高的计算能力、更低的功耗。GPU/FPGA/ASIC等AI芯片带来了行业的大发展,但面对越来越高的要求它们也显得有些力不从心。这一点从各大科技巨头在芯片领域的投入就很容易发现。除传统的英伟达以外,苹果、微软、亚马逊、谷歌等“四大巨头”都参与其中,华为消费者BG CEO余承东也在2017中国互联网大会上宣布公司将在今年下半年推出自己的AI芯片。参与者的众多和投入的巨大一方面说明硬件的重要性,但另一方面也折射出硬件发展挑战之艰巨。

  最后,算法的发展也面临巨大的挑战。随着数据量的增大,计算能力要求的提升,深度学习等AI技术需要更高级、更快、更有效的算法。以最近百度做的神经机器翻译系统看,他们用32 块 K40 的 GPU做了10天的训练,谷歌的机器翻译系统用了更多,用了 96 块 K80 的 GPU 训练了6天。如果通过一些全新的算法设计或是系统设计,将这些训练大大加速,则对AI的飞跃发展将是一个极大的促进。事实上,很多领域面临的困难和未知更多,因为它们根本就没有现成的算法,比如无人驾驶领域,不仅需要硬件系统本身的创新,算法的创新也是必不可少的。

  暂且不论AI的社会、商业、人才等问题,光在技术领域它就至少面临三座大山的严峻挑战。爬山的过程总是辛苦,但只要翻越,说不定会有意想不到的美丽风景等着你,期待AI技术迎来全新应用的那一天!

关键词:AI 谷歌 技术与标准 GPU API 计算能力 IBM中国研究院 机器翻译 芯片技术 配置模型