大约一年前,我们发表了一份《年度机器智能公司生态全景图》(The current state of machine intelligence 2.0),从那时起我们有幸见证了这个领域的很多活动。今年的 3.0 版生态全景图,比两年前的第一版增加了三分之一的公司,而且更加详细、尽量全面,但它也只触及了这个领域无限活力的表面。
与过去几年的情况一样,投资人仍对“问题为先”的机器智能情有独钟——我们投资了 35 家机器智能公司,它们专注于解决的问题从安全、招聘到软件开发各种各样。(我们的资金关注未来的工作形式,所以某些机器智能领域得到的投资比别的多。)
与此同时,有关机器智能方法的炒作仍在增加:“深度学习”这个词现在已经代表着一系列非常有意义的突破,就像“大数据”这个同样被炒作的词汇。我们关心的是一家公司的创始人是否使用正确的方法专注解决问题,而不是异想天开的方法。我们喜欢那些对技术的应用小心谨慎的人。
去年最大的变化是什么?我们正在接受来自不同人群的观点。在 1.0 版时,我们的消息来源几乎完全是创始人和学者。然后,我们开始增加投资人(包括私人投资人和公共投资)的观点。现在,我们的消息绝大多数来源于那些试图在他们的业务中使用机器学习的现有公司。
机器智能堆栈的“一站式服务”(one stop shop)第一次进入人们的视野——尽管它正式化需要一至两年。这种堆栈的成熟或能解释,为什么越来越多的著名公司更加专注于建立合法化的机器智能。任何对此时刻保持头脑清醒的人能够做出初期的发展和购买决定,所以我们认为尽早尝试布局这些技术比不尝试更好。
机器学习生态全景图 3.0
已经做好准备的玩家的世界
许多令人印象深刻的视觉突破都出现在游戏世界中,从 DeepMind 打赢 Atari 经典游戏、击败世界围棋冠军,到允许任何人在游戏环境中训练智能代理的 OpenAI Gym。
游戏世界为开始运行机器智能——尤其是强化学习——提供了一个完美的环境(例如,约束环境、显性奖励、容易比较的结果、印象深刻的画面)。游戏让自动驾驶汽车代理轻易在模拟的环境中行驶数万英里,这比在现实道路上更容易实现。现在,征服游戏世界的技术正在走向现实世界。经过游戏测试的技术进入现实世界的一个很有价值的例子是,DeepMind 使用神经网络为 Google 的数据中心节能提效。这就引出了一个问题: 现实世界中还有什么事情像游戏一样?或者现实世界中还有什么可以经由人的重新配置,变得更像游戏一样?
早期的一些尝试非常有趣。开发者发明了躲避交警的监视器,可以给黄瓜分类、给垃圾分类的程序,甚至开发了一个对话机器人来重现已逝亲人的记忆。Otto 的自动驾驶卡车的第一次商业运作是运啤酒,看起来就像《侠盗猎车手》的奖励关卡。我们很期待明年出现更多新的创造性的应用。
Why even Bot-her?
2016,我们见证了 Chatbot 的爆发,不管是好是坏,我们已经在手机应用程序的中看到了Chatbot 的增多。主要的平台(在机器智能的例子中,有 Facebook 、Slack,Kik)都在争相抢夺开发者,希望能让更多的人在自己的平台开发 Chatbot。这意味着,我们在得到一些优秀 bots 的同时,也必须要忍受一些很糟糕的。这就是公开实验的乐趣。
与手机 APP 的爆发式增长不一样,Chatbot 快速增长隐藏的风险是,我们会假定所有的对话交互界面都会拥有人类水平的对话能力。但显然,大多数的界面并不具备这种能力。下一年度,我们将会看到这种不切实际的想法的幻灭,与此同时,这也能迅速地澄清 Chatbot 的概念。
当我们的基金在研究这一新兴领域时,我们会把每一个技术分成两个部分:对话界面本身和其背后能从数据中进行学习、根据用户行为作出反应的“代理”(agent)。我们把大部分的时间都花在思考背后的代理上面,思考它是否能真正地解决一个有意义的问题。
究竟会不会有一个“一统天下的bot”?对于这一话题,我们搜集到了很多问题。坦白说,从研究的多个领域来看,我们并不同意这一观点。我们确定,不会有一个一统天下的 bot,甚至也不会有一个一统天下的交互界面。目前看来,bots 只是平庸的专家:主攻某一特定的领域。
关于代理如何进化,我们使用了一个框架去进行思考:一个 CEO 及其助理。许多名列Fortune 500 强的企业的 CEO 都会聘请一名日程安排员、一名副手、一个研究团队、一名文字编辑、一名演讲稿撰写人、一名私人购物员、一名司机和一名专业的指导。以上这些人,每一个都扮演着截然不同的角色,可以获得或者处理的数据也完全不一样。Bots,或者说代理生态系统,也应该有类似的职能分类和清晰的目标,并作出明显的功能区分(一些 CEO 也会有一名助理专门协调以上各种工作,所以也许我们会看到“一个主管一切的交互界面”)。
在我们的生态场景图中,你还能看到,一些企业级别的机器智能功能将会被重新创造(大多数是在交互界面而不是对话的 bots)。
迈向 11111000001
在大型机构里成应用机器学习的案例令人震惊的二元化,简直像一个顽固的电灯开关。虽然十分艰难,不过一旦成功用上了机器学习,这家机构就会把这种技术的潜力发挥到极致。谷歌、Facebook、苹果、微软、亚马逊、Uber 等公司在机器学习上大力投资,将其应用于几乎所有自己的产品线。
其他的公司则举步维艰,让人想起 1997 年,很多董事会焦虑地开会思考“该拿互联网这东西怎么办?”为什么对这些公司来说,扭转思维那么困难呢?机器智能与传统软件不同。不像大数据,你可以花钱买能力;但机器智能涉及到更加深层的组织架构和流程转变。企业需要一次性决定他们是否该信任机器智能去做分析,或者是否在他们的核心流程里嵌入通常是不可知的机器学习模型。团队需要弄清楚如何测试这种新获得的能力,应用也需要跟着改变才能提供比以前的系统记录更多的服务,员工也必须得到相应的培训,此外,他们还得学习自己输入的数据。
与传统的硬编码软件不同,机器智能仅能够提供概率性的输出。我们想让机器智能根据不完全的信息做出主观的决定(是不是莫名很像把事情全部交给同事去做?)。因此,这种新的机器智能软件会犯错误,就像我们人会犯错一样,我们需要考虑何时信任它,何时不信任它。
要让人信任新的机器智能,这种想法令人生畏,因而也使得机器智能比传统软件更加难以得到采用。有几个人告诉我们,要预测一家公司是否会成功采用机器智能的最大指标,是看他们是否有一个有高等数学学位的 C-Suite 高管。这样的高管知道机器学习不是魔术——只是(实打实的)数学而已。
机器智能商业模式将不同于发放许可证和订阅的软件,然而我们却不知道这个差别在哪里。与传统软件不同,我们仍然缺乏管理的框架来决定在哪里部署机器智能。Ajay Agrawal、Joshua Gans 和 Avi Goldfarb 等经济学家已经采取了第一步,帮助管理者去理解机器智能的经济学,并且预测在哪里部署机器智能才是最有效的。不过,我们仍有很多工作要做。
在接下来的几年里,我们所面临的真正危险不是我们在反乌托邦科幻电影中看到的种种情形。机器智能的真正危险在于,企业高管将对构建什么样的机器智能性能做出错误的决定。
无法“长大”的初创企业,构成了全景图中“彼得潘的永无岛”
我们一直在思考,什么才是通往一家大型机器智能公司的道路。不出所料,市场上已经有了许多机器智能收购案例(英特尔收购 Nervana和 Movidius,Twitter 收购 Magic Pony,Apple 收购 Turi,Salesforce 收购 Metamind,Uber 收购 Otto,GM 收购 Cruise,Ebay收购 SalesPredict,还有 Samsung 收购 Viv)。其中许多收购都发生在这些初创公司的早期,而收购价格还相当高。这是为什么呢?
已经成型且规模庞大的巨头公司难以理解机器智能,因此向他们销售这种技术是十分艰巨的,而以自助服务的方式使用这种技术的买家市场,规模又十分有限。但是,要是你明白了这项技术能如何增强你公司的实力,你就会发现它是如此宝贵,你抢占它都来不及。现在,巨头对机器智能(初创)公司都这么说,“别把你这技术卖给别人了,我全包了。”
市场这样的匮乏,导致机器智能初创公司,特别是全面型的技术提供商(horizontal technology providers)难以“长大”,就好像彼得潘一样。我们看到,能够成功进入长期生命轨迹的公司,要么将其技术打包,专为企业提供某种全新解决特定领域问题的应用程序,要么干脆在业界掀起改革,成为一个行业新的进入者(这最让人刺激)。我们在“生态全景图”中标记了几个行业类别,我们认为新兴公司今年可能的这些市场中“上道并且走远”。
机器智能让社会变得更加美好
一旦我们真正把这项技术的里里外外弄清楚,机器智能可以解决比传统软件更有趣的问题。我们很高兴看到这么多聪明的人使用机器智能让这个社会变得更好。
Conservation Metrics、Vulcan Conservation 等著名公司使用深度学习保护濒危物种;致力于创新的团队 Thorn 不断提出新的算法技术,保护孩子免受性剥削的伤害。技术巨头的慈善机构也加入进来,使得非营利组织具有免费存储、计算甚至开发的时间。谷歌与非营利组织合作,成立了全球渔业观察站(Global Fishing Watch),利用近乎实时的卫星数据,监测非法捕鱼活动,卫星智能初创公司 Orbital Insight(Bloomberg Beta 是投资者)与全球森林观察站(Global Forest Watch)合作,检测非法采伐和全球森林退化的其他原因。不止巨头,初创公司也有动作。 Creative Destruction Lab 加速器(Bloomberg Beta 亲密合作伙伴)投资了众多公司,其中有的从事早期疾病检测和伤害预防等事业。在使用机器智能协助高龄人口方面,我们已经看到一些进展,不过还希望看到更多。
在与很多投身于使用机器智能促进社会福祉的人交谈过程中,他们都提到了开源技术的关键作用。在过去一年中,我们看到了OpenAI 的成立,OpenAI 致力于为每个人提供世界一流的研究和环境;TensorFlow 和 Keras 这些深度学习平台也接连升级换代。非营利组织总是试图用更少的资源做更多的事情,而机器智能使他们能够扩大业务范围而不用增加预算。算法使非营利组织能够低成本地大规模提供那些普通人原本无法承受的服务。
我们还看到高校和企业智库的增长,其中包括 USC 的社会人工智能中心(Center for AI in Society),伯克利的 Center for Human Compatible AI,以及谷歌 DeepMind、微软、IBM 等多家公司达成 AI 合作伙伴关系(Partnership on AI),研究如何使用机器智能帮助人类。连白宫都采取了行动:在美国各地举办一系列免费公开研讨会之后,发表了一份 48 页的报告,概述了他们面向全社会征集到的建议,该如何应用机器智能安全、公平地解决普遍存在的社会问题。
在稍微轻松活泼些的层面,我们也听到了更多创新使用机器智能的消息。例如使用计算机视觉算法,帮助选择最好的可可豆制作高档巧克力、让机器写诗、烹饪牛排,创作音乐剧。
如果你正在研究一个独特或重要的机器智能应用程序,也请告诉我们,我们期待你的回复。
机器智能令人激动的未来,序幕已经揭开
所有这些活动只会持续加速发展。世界会给我们更多的开源和商用的机器智能模块,社会上将有更多的数据,也会有更多的人对学习这些方法感兴趣,并且总是会有值得解决的问题。我们仍然需要找到区分机器智能和传统软件差别的方法,我们正在努力。代码的价值不同于数据,但是使用这些数据基于代码改进的模型的价值又该如何评估?
一旦我们深入了解机器智能,我们或许可以回顾传统软件时代,并将其视为迎接现在的序幕。我们期待着明年机器学习会给我们带来什么,会有怎样的生态图景。
编译来源:https://www.oreilly.com/ideas/the-current-state-of-machine-intelligence-3-0