大数据
首页  >  大数据  >  要闻

未来AI将减少对大数据训练的依赖,向更智能地自上而下推理转型

2019-01-16  来源:前瞻网  作者:

考虑如何投资于人工智能功能的公司首先应该明白,未来5年,应用程序和机器将变得更加智能。他们将减少对自下而上的大数据的依赖,更多地依赖自上而下的推理,这种推理更类似于人类处理问题和任务的方式。这种一般性的推理能力将使人工智能得到比以往任何时候都更广泛的应用,并为早期使用者创造机会。

最近,人工智能通过深度学习和机器学习取得了进步,通过对海量数据的训练,自下而上地建立了有关系统。例如,无人驾驶汽车被要求在尽可能多的交通场景下进行训练。但是这些被称为“数据饥渴神经网络”有着严重的局限性。他们在处理“边缘”情况(即数据很少的情况)时尤其容易陷入困境。一辆能够应对人行横道、行人和交通堵塞状况的无人驾驶汽车在处理异常情况时遇到了麻烦,比如孩子们穿着怪异的万圣节服装,在黄昏后穿梭于各个街道。

许多其他系统也很容易陷入困境。iPhone X的面部识别系统不能识别“清晨睡梦中醒来的脸”——用户在第一次醒来时浮肿、憔悴的表情。神经网络打败了国际象棋冠军,并在古老的日本围棋比赛中获胜,但如果把一幅图像倒过来或稍微进行改变,神经网络可能会识别错误。

数据饥渴的系统还面临业务和道德约束。并不是每家公司都有足够的数据来构建使用神经网络的独特功能。使用大量公民数据还会引发隐私问题,可能导致政府采取更多行动,比如欧盟的《通用数据保护条例》,该条例对个人数据的使用提出了严格要求。此外,不清楚这些系统如何使用输入数据来获得诸如操作或决策之类的输出。这就使得它们容易受到心怀不轨人士的操纵(比如干涉2016年美国总统大选的人士),当出现令人尴尬的错误时,组织很难解释其中的原因。

然而,在未来,我们将拥有自上向下的系统,它不需要那么多的数据,而且速度更快、更灵活,并且像人类一样,它天生就更聪明。许多公司和组织已经在使用这些更自然的系统。为了规划未来几年人工智能的发展方向,并据此规划投资和测试,企业应该在以下四个领域寻找发展:

更高效的机器人推理。当机器人像人类一样对世界有一个概念性的理解时,用更少的数据训练他们东西就更容易了。加州联合市的初创公司Vicarious正致力于开发机器人的人工通用智能,使它们能够从很少的例子中进行归纳总结。该公司的投资者包括马克·扎克伯格、杰夫·贝佐斯和马克·贝尼奥夫(Salesforce首席执行官)。

想想那些用杂乱的字母和数字判断你是人类还是机器人的网站。这种方式被称为验证码(完全自动化的公共图灵测试,一种用于区分计算机和人类的方式),它们对人类来说很容易解决,但对于计算机来说很难。基于计算神经科学,Vicarious公司的研究人员开发了一种模型,该模型能以远高于深度神经网络的速度破解验证码,数据效率是深度神经网络的300倍。要以67%的准确率解析验证码,替代模型每个字符只需要5个训练示例,而最先进的深度神经网络需要5万倍的实际验证码字符串训练集。这些模型能够比现在常用的人工智能方法更快地训练和更广泛地推广,将对世界有类似人类概念理解的机器人引入人类世界。

模拟人类专家行为。在面对高度不确定性和极少的数据时,自上向下的人工智能能够模拟人类专家将会做什么。在设计和控制多种工厂设备方面,自上向下的人工智能可以击败饥饿数据的方法。西门子正在使用自上而下的人工智能技术来控制燃气轮机中高度复杂的燃烧过程。在燃气轮机中,空气和气体流入燃烧室,在高达1600摄氏度的高温下点燃和燃烧。从气体的质量到空气的流动,再到内部和外部的温度,涡轮产生的排放量以及最终能持续运转多久,取决于许多因素的相互作用。

使用自下而上的机器学习方法,燃气轮机需要运行一个世纪才能产生足够的训练数据。相反,西门子的研究人员Volar Sterzing和Steffen Udluft使用的方法在机器的学习阶段几乎不需要数据。由此产生的监测系统对涡轮机的排放和磨损进行了精细的调整,优化了涡轮机的运行方式,不断地实时寻找最佳解决方案,就像专家智能地协调旋转多个旋钮一样。

常识。各种各样的组织都在努力教会机器使用常识来理解世界——理解日常物体和行为,自然地交流,处理不可预见的情况,并从经验中学习。但没有明确的训练或数据,人类天生就会做的事情,对机器来说极其困难。艾伦人工智能研究所的首席执行官Oren Etzioni说:“目前部署的人工智能系统无法可靠地回答一系列简单的问题,比如,‘如果我把袜子放在抽屉里,它们明天还会在那里吗?’”或者“你怎么知道牛奶盒里装的是什么?”

为了帮助定义对机器来说具有常识意味着什么,艾伦人工智能研究所正在开发一个任务组合,可以根据它来度量进度。DARPA在人工智能研究方面投资了20亿美元。在其机器常识(MCS Machine Common Sense)项目中,研究人员将创建模拟人类认知核心领域的模型,包括“对象领域(直观物理)、位置领域(空间导航)和代理领域(有意参与者)”。微软和麦吉尔大学(McGill University)的研究人员联合开发了一种系统,有望解开自然语言中的歧义,这一问题需要多种形式的推理和知识。

利用高斯过程进行预测。人类通常且能毫不费力地对可能性进行预测,并采取最佳的行动,即使之前的经验相对较少。机器现在正在学习通过应用高斯过程来模拟这种推理——概率模型可以处理广泛的不确定性,并从经验中学习。谷歌的母公司Alphabet推出了Project Loon,旨在通过一套漂浮在平流层的巨型气球系统,向世界上服务不足的地区提供互联网服务。他们的导航系统采用高斯过程来预测气球在分层且高度可变的高空风中需要飞向何处。气球不仅可以通过分析过去的飞行数据做出合理准确的预测,还可以在飞行过程中分析数据并相应地调整预测。

这种高斯过程很有前途。它们不需要大量的数据来识别模式;推理和学习所需要的计算是相对容易的,如果出了问题,它的原因是可以追踪的,这与神经网络的黑匣子不同。

尽管所有这些进步都是相对较近的时期内取得的,但它们可以追溯到上世纪50年代人工智能刚刚起步的时候,当时一些研究人员开始追求模仿人类智能的自上而下的模型。但是,当进步被证明是难以捉摸的,并且自下而上的机器学习方法的丰富潜力变得显而易见时,自上而下的方法基本上就被抛弃了。然而,今天,通过强大的新研究和计算技术,自上而下的人工智能又重生。当它的光明前景开始显露出来,聪明的公司会把钱投在最有价值的地方。

关键词:人工智能 大数据