重磅 | 李世石首胜阿法狗 思考智能机器与人的未来

2016-03-13 17:03 来源:数邦客整理
浏览量: 收藏:0 分享

     在刚刚结束的李世石和阿尔法狗第四场比赛中,为荣誉而战的李世石,终于战胜了机器狗!其实,大家如此关注“人机大战”,在乎的不是棋局的结果,而是随着人工智能的不断进步,人们对智能机器的憧憬和忧虑也越来越多。智能机器真的有可能超越人类吗?


    鉴于三场连败,赛前多数人对此场李士石获胜并不看好。此场获胜转折点是在李士石长考执白出78手之后,AlphaGo冒似程序判断意料不到,接连使出系列晕招。令一直观看直播的嘉宾以为AlphaGo“崩溃”了。


    中国棋手柯洁评论称,我们必须承认谷歌就是了不起,阿法狗确实是超一流的水平,但是也没有到不可战胜的地步。


    3月10日,AlphaGo再败李世石,这一次李世石没有轻敌,布局阶段非常慎重,但他依然输了棋。一时间机器替代人类的声音在互联网爆发,然而事实果真如此吗?AlphaGo真的已经是非常强大的人工智能了吗?


AlphaGo其实只是弱人工智能

    AlphaGo的技术细节在今年《自然》杂志上详细公布过,我们细细研究一下,就会发现AlphaGo的原理其实非常简单。


    AlphaGo利用深度学习学习人类棋谱,模拟人类来选择几个优势点,然后通过蒙特卡罗树搜索,穷举计算这几个点胜率,从中优选。本质上来说,它还是搜索求解,而且是在非常固定的规则与模式下进行。

    它所用到的GPU通用计算,分布式计算,深度学习,神经网络,蒙特卡罗树搜索都不是新技术。只是把这些技术用到围棋上并投入大量资源是首次。

    按照人工智能的分类,AlphaGo还属于弱人工智能Artificial Narrow Intelligence (ANI)。

    弱人工智能是只能擅长于单个方面的人工智能,规则是封闭的。AlphaGo的判断可以用于围棋,达到很高的水平,它要下象棋也能达到很高的水平,但是就要从头再搞一套象棋的软硬件,它在围棋的深度学习无法通用于其他领域。

    按照人工智能的分类,还有强人工智能Artificial General Intelligence (AGI)强人工智能是指在各方面都能和人类比肩的人工智能,人类能做的脑力活动它都能做。它没有既定规则和领域,是开放式的。我们现在看到的各种幻想其实是强人工智能超越人类的高级阶段,AlphaGo作为弱人工智能,层次还相去甚远。


强人工智能是什么样子?

    AlphaGo在围棋很强大,但是围棋是一个固定规则,有明确输赢判断的游戏,围棋棋盘不会扔进一个象棋棋子。而强人工智能要面对的是真实的世界,它所面对的规则是开放式的。


    我们看一下李彦宏演示百度强人工智能的例子。

    在百度大会上,李彦宏展示了度秘的多轮对话的人工智能。李彦宏询问度秘度身份,问它来自哪,能做什么,最后还让度秘订了两杯咖啡。

    在这一组多轮对话中,李彦宏的问话是随机的,可能说各种问题,没有既定的规则。而度秘的人工智能首先要采集李彦宏的语音,然后把李彦宏的语音拆分成词,识别词意,然后识别李彦宏的语意,通过人工智能作出回答,最后把回答组织成句子,用语音说出来。

    李彦宏的话是开放式的,而且有前言后语,针对这种环境的就是强人工智能。看起来这组对话只是小朋友的智力水平,而实际难度远远高于AlphaGo结合深度学习与蒙特卡罗树搜索的弱人工智能。

    百度很热衷于展示自己在强人工智能上的成绩,在2015年联想大会上,李彦宏还演示过一次识图对话。

    李彦宏打开一张费德勒穿蓝色T恤打网球的图,问AI。“他在做什么?”“他的衣服是什么颜色的?”“他手里拿着什么?”而AI像人类一样应答无误。这组对话除了前面例子中开放语言的强人工智能,还有一组图片识别的强人工智能,强人工智能不知道自己看的是什么图片,但是它经过深度学习看过千亿张图片学习后,可以认出颜色,物体,动作。

这个看似小孩能完成的举动,难度也远超AlphaGo。图片没有既定规则,开放中学习寻找规律,远不是深度学习与树搜索能解决的问题。


其实,谷歌也在研发强人工智能,它和百度一样去参加国际评测FDDB与LFW(成绩还输给了百度)。谷歌知道AlphaGo看似酷炫,但是只是可以作作大广告,而人类真正的未在在强人工智能这个方向。
今天的AlphaGo位我们带来了一种新的表现,不会因为它败给李世石而使人工智能技术受到质疑,就像李世石在前三局输给它之后而使围棋受到质疑一样。这本来就是一次人工智能技术的伟大试验,而纵观人工智能发展的历史,出现了许多这样的测试。所以,在AlphaGo与李世石的对战背后,有一个更深层次的问题值得我们思考:为什么棋类游戏对于人工智能如此重要?


人工智能与棋牌游戏的历史

    如果追溯历史,人工智能与游戏的历史渊远可以追溯到18世纪晚期,奥地利的沃尔夫冈·冯·肯佩伦制造了一个可以下棋的「机器」,在84年的「职业生涯」里,这台机器几乎击败了所有的人类挑战者,甚至包括大名鼎鼎的拿破仑·波拿巴和本杰明·富兰克林。但这终究只是一场骗局,这台机器里藏有一个象棋高手,整个机器也以复杂的构造误导观众,从而能保证藏在机器里的人不被发现。



土耳其行棋傀儡的版画,来自1784年卡尔·戈特利布·冯·温迪施的作品《无生命的原因》


    现代意义上的人工智能与棋类游戏的暧昧情节始于1956年,是的,就是包括约翰·麦卡锡、马文·明斯基等人创造出「人工智能」一词的那一年。Arthur Samuel 创造了一种西洋跳棋的应用程序,并使用强化学习来训练这个程序。1962年的时候,Arthur Samuel 的这个西洋跳棋程序打败了当时全美最强的业余选手 Robert Nealey。


    西洋跳棋是一种两人棋盘游戏。玩家的棋子都是沿斜角走的。棋子可跳过敌方的棋子并吃掉它。它的历史比囯际象棋长久,始祖为中东跳棋。西洋跳棋的玩法有很多。最流行的游戏形式是被称为国际跳棋的波兰跳棋,其次为英国跳棋。


    不过,机器就赢了一场,其他几次对决中,机器完败。尽管如此,一场比赛的胜利还是让当时方兴未艾的人工智能研究着实兴奋了一把,毕竟,这是机器第一次战胜了人类。



Arthur Samuel 在IBM 701计算机上展示它的西洋跳棋


    随着西洋跳棋程序的不断进化,上世纪80年代晚期时候,机器已经可以打败顶尖的人类选手。西洋跳棋领域最后一场人机大战发生在1996年,一个名叫「Chinook」的程序完胜人类选手。2007年,Chinook的开发者们在《科学》杂志发明论文称:Chinook已经解决了西洋跳棋领域的所有难题,Chinook可以打败任何一个对手——不论这个对手是机器还是人类。一个值得玩味的事实是,就在Chinook开发者们宣传Chinook 不会失败的前几天,或许是人类历史上最伟大的西洋跳棋选手Marion Tinsley 去世。这留个世人诸多疑问:Marion Tinsley 会成为Chinook 克星吗?或者这是人类时代结束而机器时代开始的前兆吗?


    与西洋跳棋程序同时进化的还有十五子棋(又叫西洋双陆棋,它是一种古老的棋盘游戏,在棋盘或桌子上,靠掷两枚骰子决定走棋的步数,比赛的目的是要使自己的棋子先到达终点。这种棋戏把运气和技术结合在一起,通常两者对取胜都不可缺少。此类棋戏从20世纪后期开始风靡于世。)



十五子棋


    1979年,Hans Berliner 开发的 BKG 9.8 应用程序以7:1 的大比分打败了当时十五子棋的人类冠军 Luigi Villa。尽管 Berliner 和 Villa 都认为机器的胜利存在某种侥幸,但当时的电视转播评论员仍然抑制不住震撼「我不希望机器人来到新闻广播行业。」这可谓是又一个机器战胜人类的重要时刻。 BKG 9.8 之后,包括 TD-Gammon 以及随后的应用程序都要比人类玩得更好。


    值得一提的是,「投身」十五子棋的 TD-Gammon 与如今无情「碾压」李世石的 alphaGo 在技术层面很相似,他们都采用神经网络模型,并运用了强化学习的方法(当然,AlphaGo 还有其他技术的融合),60年前的 Samuel 也用这种方法训练自己的西洋跳棋应用。强化学习可以让这些游戏程序学到超越人类教练水平的技巧或知识,比如游戏程序可以「自己向自己学习」。客观意义上,十五子棋的爱好者们完全可以向TD-Gammon 学习相关知识,将其作为自己的教练。


    接下来就是国际象棋。在Arthur Samuel 打造他的西洋跳棋程序之前,克劳德·香农(信息论的开山鼻祖、同时也是「人工智能」一词的提出者)在1950年认为,国际象棋对人工智能研究来说是一项令人兴奋的挑战。「这个问题的解决方案将迫使我们承认机器是否能够思考的可能性,以及重新定义所谓思考的概念」。


    但香农的预言显然是错了,在1997年IBM 的深蓝打败卡斯帕洛夫之后,人类并没有遇到上述难题的困扰。于是,在几乎所有棋类游戏被机器征服之后,唯一剩下的就是起源于中国的围棋。一方面,当西方的机器打败所有西方的棋类游戏后,站在东方人的舞台,向象征东方人最高思维难度的围棋宣战,这里有太多隐喻。另一方面,人工智能研究者们孜孜不倦的挑战各种棋类运动,也正是因为这些棋类提供了一种可衡量和可比较的标准。


为什么是围棋?

    所谓可衡量的标准,部分原因就在于我们还无法理解「智能」一词。这也的确是一件颇为讽刺的事情,当人类还不清楚自身的「智能」时,却为了机器智能而奔波忙碌。


    美国心理学家 Louis Lean Thurstone 在1920年代的研究中发现,一些受访者在回答问题时更倾向于回答一些相对意义或者比较意义的问题,比如类似这样的问题「你更喜欢谁的画,Kandinsky 还是 Rothko?」就比单纯回答「你对Kandinsky 画喜欢多少?」要容易简单的多。这套理论被称为「比较性判断准则(Law of Comparative Judgement)」。通过让人们每次比较多个对象中的两个,而最终可以计算出每个对象的测量分数(定距尺度)。其运用范围非常广泛,也被应用到机器学习领域。



 Thurstone 的理论展示


    按照Thurstone 的理论,棋类游戏就成为测量人类与机器的一种工具。如果说棋类游戏代表了智慧与智能,那么比赛的结果就能展现出人类与机器在这个领域的强弱。而在国际象棋领域,ELO排名体系是棋手最看重的排名。这个排名的最大重点,在于强手打败弱手时,赚不了多少积分;反之就能赚比平常多的积分。每位参赛者都有一个实力值,实力值越高则排位越前。某种意义上说,排名也就是胜负关系的预测。


    ELO排名体系不仅仅适用与人类选手,在深蓝打败卡斯帕洛夫之后,多个国际象棋计算机程序在ELO排名体系上超过3300分。这个分数意味着这些计算机程序几乎可以打败任何一个人类选手。计算机科学家、国际象棋大师Ken Regan 的研究发现,如今的国际象棋已经进入到一个稳定期:机器之间的比赛分不出胜负,而人类在机器面前毫无胜算。


    当国际象棋最终被机器征服之后,还有哪些衡量标准呢?


    人工智能研究者也没有放弃对扑克的研究。相对于国际象棋和围棋,扑克没有所谓的完美信息:玩家们无法获取已发生事件的全部信息,诸如对手的底牌。比如虽然德州扑克的缺失信息比西洋跳棋少,但是这种不完美信息的特质计算机挑战德州扑克的难度颇大。


    再来看个可能的测量标准,RoboCup。这是是一种完全机器人参与足球比赛,是当前国际上级别最高、规模最大、影响最广泛的机器人赛事。那么问题就来了,有没有可能将人类选手放在这些比赛里?或者再脑动一下,有没有可能将无人驾驶汽车(特别说明的是,纳斯卡的无人驾驶和谷歌、特斯拉的无人驾驶并不一样)放到纳斯卡或F1比赛中?


    对于任何一个游戏来说,其规则的复杂性往往成为计算机能否快速并最终战胜人类的重要原因。Bill Robertie,三项棋牌游戏(国际象棋,扑克,西洋双陆)比赛的世界级专家曾做过一个统计,如下图所示,相较于国际象棋和西洋跳棋,围棋的难度要远远这些棋牌游戏,也正是如此,公众(准确地说是东亚三国的公众)如此震撼于Alpha Go对李世石的「碾压」。



    如前文所言,人工智能研究者使用棋类游戏作为智能的衡量标准,以此推进自身研究的发展。Alpha Go 缔造者、DeepMind 创始人 Hassabis 也强调,他要将 Alpha Go 延伸到更广泛的领域,由于 DeepMind 采用通用了的AI技术来研发AlphaGo,理论上其关键算法的确能够较快应用与其他领域。


    当Alpha Go 一次次让人类代表李世石面露无奈的表情时,作为人类的我们当然需要为李世石的失败感到难过,但同样,但正如樊麾在接受机器之心专访时所言,Alpha Go或许发现了一种新的围棋的美,是我们想象不到。因此从某种意义上说,这不是谁的失败,而是整个人类的胜利,我们通过机器看到人性的光芒,利用机器推动人类智慧的进步,相比于一个五番旗的围棋比赛,在另一个更大的棋盘上,人类与机器还在继续「模仿」与「被模仿」的比赛。


AlphaGo距离颠覆人类非常遥远

    科学与常识往往是违背的,AlphaGo赢了围棋看似开启了新时代,但是其真实意义类更似于计算器赢了人类口算,是单一领域的智能超越人类。只是围棋的难度远高于象棋,从1997年的深蓝到2016年到AlphaGo,人类因为更大的棋盘等了接近20年。


    而AlphaGo放到人工智能科学到角度看,只是计算能力很强的弱鸡,其高度远不如百度达到3、4岁小孩智力的强人工智能。弱人工智能只能在一些领域帮助人类,而当强人工智能未来发展到成人水平,人类当所有劳动就有可能被完全替代。那个时候人类就可以享受而不用辛劳了。 而当强人工智能完全超过人类以后,人类才需要担心机器会不会背叛人类的问题,那还是非常非常遥远的事情。所以,AlphaGo只是强大的弱鸡,我们无须过于担心。


标签:

责任编辑:admin
在线客服