3年血亏10亿美元:谷歌DeepMind出了什么问题?
原标题:3年血亏10亿美元,Google DeepMind出了什么问题?
Alphabet旗下的DeepMind,一个在人工智能领域或许称得上是世界领先的公司,去年亏损5.72亿美元,在过去的三年中持续亏损,金额超过10亿美元。
这意味这什么?人工智能是否正在走向崩溃?
其实不然。众所周知,搞研究是最为烧钱的,因此,DeepMind每年都投入大量的资金,金额甚至比之前任何相关项目的金额都要大。?虽如此,但DeepMind亏损的上升幅度仍值得考虑:2016年为1.54亿美元,2017年为3.41亿美元,2018年为5.72亿美元。
这涉及到三个核心问题:DeepMind是否在科学上走上正轨?从Alphabet的角度来看,这种规模的投资是否合理?这种损失将会从整体上影响人工智能吗?
深度强化学习的局限性
关于第一个问题,人们有理由持怀疑态度。DeepMind一心扑在深度强化学习上,该技术将主要用于识别模式的深度学习与基于奖励信号的强化学习相结合。
2013年,DeepMind在一篇激动人心的论文中将这项技术命名为“深度强化学习”,该论文展示了如何训练一个神经网络系统来玩各种Atari游戏,比如Breakout和Space Invaders,不得不承认,有时候它们比人类玩得都要好。这篇论文是一篇工程杰作,大概也是促使Alphabet在2014年1月收购DeepMind的主要原因之一。随后,该技术进一步发展,推动了DeepMind在围棋和游戏StarCraft(星际争霸)中取得胜利。
问题就在于,该技术对环境的依赖非常大:在玩Breakout时,就连将游戏中的球拍向上移动几个像素这样微小的变化,都会导致游戏性能急剧下降。DeepMind在星际争霸游戏里的胜利也有着同样的局限——使用特定地图和特定“种族”角色时,其结果优于人类,使用不同地图和不同角色结果较差。如果要更换角色,则要从头开始重新训练系统。
在某种程度上,深度强化学习是一种涡轮增压式的记忆,使用它的系统能够实现一些人们觉得不可思议的目标,但它们本身对自己在做的事情只有肤浅的理解。因此,当前的系统缺乏灵活性,也无法在环境发生变化时进行调整。
深度强化学习还需要大量的数据。比如,AlphaGo在训练过程中参加了数百万次围棋游戏,织田莱香这远远超过了一个人想要成为世界级棋手所需要的数量,织田莱香而且实现这个目标需要巨大规模的计算资源,价格也不菲——据估计,训练AlphaGo的成本为3500万美元。
不过,这些都是出于经济学的考虑。正如Rebooting AI(重启人工智能)这本书中所说,真正的问题在于信任。目前,深度强化学习只能在受到严格控制,很少出现意外的环境中进行,将其运行在几千年里都没有出现变化的环境里或许可行,但在现实生活中,人们可能不会想依赖它。
商业方面收效甚微
由于现实生活中像DeepMind这样一心专注游戏上的AI项目不多,因此,DeepMind也尚未开展任何关于深度强化学习的大规模商业应用。包括2014年收购时支付的6.5亿美元,目前Alphabet已对DeepMind投资约20亿美元,相比之下,DeepMind去年的营收约为1.25亿美元。
另外,适用于围棋的AI技术,可能不适用于解决其他具有挑战性的问题,比如癌症和清洁能源。当然,这可能只是时间问题——DeepMind至少从2013年开始就致力于深度强化学习,而且科学进步很少能在一夜之间就转化为商业产品。DeepMind可能最终会找到一种方法,通过深度强化学习来产生更深入,更稳定的结果。
最终,深度强化学习可能被证明像晶体管一样,成为一项彻底改变世界的发明。
虽然DeepMind目前的战略不如人们所希望的那么丰富,但它仍是深度强化学习领域的佼佼者,而且,DeepMind管理严密,资金充足,拥有数百名博士,在游戏和围棋方面又大获成功,正在吸引越来越多的人才。如果人工智能领域的风向发生了变化,DeepMind转向另一个方向,它仍然能走在前列。
与此同时,从Alphabet方面来说,对DeepMind的投资并不是一个大赌注,它还在人工智能领域押下了目前正在快速增长的Google Brain。对于年收入1000亿美元,从搜索到广告推荐等核心业务都依赖人工智能的Alphabet来说,进行几笔重大投资并不疯狂。
对过度承诺的担忧
最后,DeepMind在经济方面的表现将如何从总体上影响人工智能,这个问题很难回答。如果炒作超过了实际效果,它可能导致“AI寒冬”的到来,甚至连支持者都不愿意投资。如果亏损继续以每年约两倍的速度增长,连Alphabet也可能被迫放弃DeepMind,投资者也会重新调整对人工智能的热情。
不仅仅是DeepMind,许多有望实现的进步还没有真正实现。虽然Mark Zuckerberg在2018年4月向国会做出的承诺,即人工智能将很快解决假新闻问题已经得到了缓和,但承诺的成本从来都不高,对人工智能的热情程度是由最终效果决定的,而不是承诺。
就目前的形式而言,对人工智能进行炒作远比构建人工智能要容易。虽然在广告和语音识别等有限领域已经取得了巨大的进步,但它无疑还有很长的路要走。
雷锋网注:本文编译自Wired