数码
首页  >  数码终端  >  数码图片新闻

揭秘谷歌AI实验室:我们不做产品,我们只是AI界的游戏玩家

2017-12-13  来源:AI星球(微信ID:ai_xingqiu)】12月13日报道 (编译:Denny)  作者:Katharine Schwab

编者注:本文作者为Katharine Schwab,外媒科技专栏作家。

说起来,那次算是一个惊喜的意外。

Jonas Jongejan是一位富有创造力的技术专家,同时他也是谷歌创意实验室(Creative Lab)的成员。在谷歌内部的黑客马拉松上落后之后,他费尽心思摸索着与人工智能有关的有趣想法。然后,他诞生了一个想法:“采用机器学习算法来识别照片中的物体,但是只是用线条和涂鸦来进行模拟,效果会如何呢?”

Jongejan发现模拟的效果非常好,即使失败了,程序识别出来的结果也很有趣;与此同时,这也让人得以一窥电脑是如何识别图像的。Jongejan说:“事实上,这个程序不是完美的,用户们可以各种‘调戏’它。‘Quick,Draw!’就是从这一概念中诞生的。”

在不到六个月的时间里,Quick,Draw!如病毒般在网上扩散。世界各地的人们都在玩这个实验性游戏,用户涂鸦了一个物体或动物后,神经网络程序将尝试对涂鸦进行辨认。最后,Quick,Draw!这款小游戏还登上了新闻社区Reddit的首页。

此外,其还带来了另一个意想不到的结果。所有玩过这一游戏的用户(目前达到了数百万人),他们把自己的画贡献出来,为程序添加了一组全是涂鸦的新数据。相比特意设置得不完美的‘Quick,Draw!’的算法,这组数据能用于训练更先进的神经算法。该程序团队的下一款成品,AutoDraw就基于此研发,比Jongejan最初的想法更为深入。在玩家们仍在画着涂鸦,试图让神经网络辨认的同时,AutoDraw还为他们提供了剪辑艺术版的简画,包括车、树等等。

Jongejan从未想过Quick,Draw!最终有超过5000万份的涂鸦,并衍生出研究论文、编码工具,甚至是用于分析人们在画某种动物(如火烈鸟)时表现糟糕的原因。Quick,Draw!是谷歌人工智能实验项目中最成功的案例,也许它也是对该公司价值的最好诠释。

AI Experiments(人工智能实验)基于谷歌创意实验室,由一个程序员、设计师和作家组成的团队创建,工作内容就是用谷歌的技术制造出酷炫好玩的产品。

这一项目运营仅仅一年,它通过有趣的产品或游戏,为揭开前沿技术提供了途径,同时也为向谷歌的研究人员和工程师们介绍新想法提供了渠道。虽然创意实验室的团队说,他们的新设计‘Quick,Draw!’只是为了辅助T恤衫制作图案,但我们不难想象,或许在未来的某个节点,能够识别用户绘画的计算机神经网络将出现在谷歌的程序中。

在这项计划开展的一年里,AI Experiments所做的近16个实验,诠释了该公司将自己视为机器学习和人工智能领域的领导者的定位。通过有趣的、甚至“有点蠢蠢的”实验让普通人和开发者更容易理解其技术,谷歌借此强化了自己的品牌,扩大了市场份额,并教会了人们如何看待人工智能这个华丽的新世界。

谷歌的人工智能试验品

创意实验室最早在2009年推出了首个实验,重点投放在了谷歌浏览器上。其中最成功的一款是与乐队Arcade Fire合作的互动电影。电影基于谷歌街景StreetView拍摄,定制化地为每位互动者展示了他们童年时街道的景象,这一实验大获成功。随后,创意实验室相继发布了Android实验、AR实验、WebVR实验、人工智能实验,以及最近的语音实验Paper Signals,所有这些项目都是开源的,并且基于谷歌技术。

但AI实验本身则比较新颖。AI实验开始于2016年11月,当时谷歌创意实验室的创意主管Alex Chen正与两位谷歌研究人员谈论机器学习的概念和作用。研究人员形象化地向他展示了神经网络的运作,随后他把这一概念带给了创意实验室的同事,就此埋下了AI实验的种子。

Chen表示:“让这个技术更易于使用,让更多的人了解它的真实性、背后的数学原理以及它的工作原理,甚至是开始玩这个技术、与之进行互动...这些,在我看来再好不过了。 ”

他的同事Jongejan开发出的“Quick,Draw!”,也成为了2016年末推出的少量首批AI实验之一。

为了构建游戏,Jongejan与一个专注于通过机器学习来破译手写的谷歌研究团队进行了合作。在谷歌技术仍在开发的过程中,创意实验室也经常与产品团队展开合作。 例如,在谷歌的AR平台ARCore发布之前,创意实验室就已经开展相关的实验。

Jongejan表示,“在知道新技术要推出时,我们参入其中,站在这一技术的最前沿。然后,我们进行可以推动技术进步的迭代实验,并且展示这种技术在未来在更大规模下的潜在可能性。有时,这将有助于产品团队。我们把自己当成技术的试验品。”

人工智能实验有两个主要的目标受众——首先当然是公众,其次就是开发者社区。Chen表示,这不是谷歌的产品,这只是一个巨大的有趣的代码示例,可能会引发其他开发人员的思考。我想知道他们是如何一起得出这个想法的,他们是如何实现这一想法的,原来Cloud Vision API(可以识别图像中的对象)还可以做这样的事。

从商业角度来看,这些开发人员是谷歌最为珍贵的用户,而实验则是激发他们对谷歌产品(如机器学习平台TensorFlow)和Cloud Vision API等工具的兴趣的一种方式。 这是创意实验室进行这类实验的一个重要原因。

创意实验室的领导人Amit Pitaru说:“我们正在以一种非常全面的方式来探索这些公共工具的可能性,我认为这很有价值。您可以向开发人员展示他们使用TensorFlow制作的酷炫内容,也许可以将其转换为活跃用户,并增加使用谷歌服务构建的开发人员数量,以及开发者工具的市场份额。”

关键词:谷歌 StreetView Android ARCore 图像分类 Reddit Schwab Katharine 外媒 人工智能