2016杭州·云栖大会将于10月13日开幕,大会持续4日,将有10场峰会,90余场产业与技术论坛,超过600个演讲主题,数万平方米创新展览体验区和国内外顶尖科技在云栖小镇亮相。
云栖大会由杭州市政府和阿里巴巴集团主办,为创业者搭建交流的平台,帮助他们借助新技术实现梦想是大会一直以来的愿景。今年的云栖大会规模不仅超越了去年,也将是海内外规模最大的一次科技盛会。阿里巴巴技术天团也将首次齐亮相,并有在人工智能、科学研究等领域的重大合作发布。
阿里研究院将对2016杭州·云栖大会进行全程系列报道,敬请关注!
文|阿里数据经济研究中心秘书长潘永花
从今年年初的AlphaGo人机大战之后,人工智能成为了产业界最受关注的一大热点。其实,从1956年人工智能概念出现迄今已经60年的历史了,人工智能也经历了几番起起落落。为何今天成为了业界热点呢?归结起来,实际上是三大技术基础的成熟和发展奠基了人工智能的落地。
人工智能=数据+计算能力+算法
首先,人工智能对计算能力的要求很高,而以前研究人工智能的科学家往往受限于单机计算能力,需要对数据样本进行裁剪,让数据在一台计算机里进行建模分析,导致模型的准确率降低。伴随着分布式计算能力的迅速发展,云计算平台可以利用成千上万台的机器进行计算,尤其是GPU的发展为加速人工智能落地奠定了基础计算能力,使得类似于人类的深层神经网络算法模型为代表的人工智能应用成为现实;
其次大数据时代已经到来,多来源、实时、大量、多类型的数据可以从不同的角度对现实进行更为逼近真实的描述,而利用深度学习算法可以挖掘数据之间的多层次关联关系,为人工智能应用奠定了数据源基础;
第三是算法的发展尤其是Geof Hinton教授2006年发表的论文,开启了深度学习在学术界和工业界的浪潮,以人工神经网络(ANN)为代表的深度学习算法成为了人工智能应用落地的核心引擎。
因此,计算能力+数据+算法三者相辅相成、相互依赖、相互促进,使得人工智能有机会从专用的技术成为通用的技术,融入到各行各业之中。
阿里巴巴在人工智能技术研发以及应用场景方面进行了大量的实践,通过在电商、物流和金融相关的业务应用场景中不断积累人工智能核心技术,并逐渐通过阿里云ET平台输出到交通、政府、娱乐等更多的行业之中。
1.人工智能从替代客户服务到个性化助理
客户服务是很多行业的通用场景,覆盖银行、保险、电信、零售、制造、电商等多个行业,过往这些行业主要依靠自建或者租用呼叫中心,雇佣大量的客户服务人员提供服务,而大部分企业的客户服务中心都是企业的成本中心。
伴随着基于人工智能技术的智能客服的出现和发展,客服人员可能真会在不远的将来被机器替代掉了。Gartner最新报告预测,2020年智能机器人座席能满足40%的客服市场需求。未来,基于人工智能技术的智能机器人客服不仅能理解客户语言的上下文语义,还具备自我学习能力,可以理解口语化问题、分辨问题焦点,大大提升服务效率和水平,同时能够给客户提供更好的个性化体验。
以2015年7月阿里巴巴集团发布的人工智能购物助理虚拟机器人“阿里小蜜”为例,它的目标就是致力于成为会员的购物私人助理,让会员专享1对1的客户顾问服务、全程陪伴式、安全有保障的购物体验。这款应用基于语音识别、语义理解、个性化推荐、深度学习等人工智能技术,支持上下文理解的多轮对话,以及个性化记忆功能,同时机器人每天都会去学习几百万条人工的服务记录以及海量的知识源,自动改善智能解决能力。在淘宝和天猫平台上,每天有近5万次热线电话求助,无线端的在线服务量更是每天都超过100万次。
目前,“阿里小蜜”在每天应对百万级服务量的情况下,智能解决率达到了接近80%,甚至在部分重点场景上已经达到95%的智能解决率,满意度比传统的自助服务提升了一倍。同时,阿里巴巴利用人工智能技术对客户服务质量进行监控,减少人工干预,大幅提高了服务质量。
除了成为客户服务助理之外,基于人工智能的虚拟机器人融入更深入的语音识别、自然语言处理等技术,未来将会在很多场景下可能成为个性化助理,为不同的客户依据个性化需求提供不同的服务,能真正和人进行深入沟通,使得机器与人的交流更加自然、亲切和人情味,比如家庭服务、医疗服务、购物助手等。
2.计算机视觉技术在电商场景应用广泛:从身份识别、图片搜索到违规图片识别
计算机视觉技术是人工智能技术的核心技术之一。而作为计算机视觉技术中的关键基础,指纹及人脸等生物识别技术目前已经开始应用在身份识别的多个领域,比如支付宝钱包已经能够支持指纹和人脸识别的身份认证,刷脸支付成为了现实。
在未来,实现“所见即所得”会是电商的重要方向,图片搜索更将成为人们获取信息的常态。图像识别在手机淘宝的“拍立淘”产品中已经开始应用,通过手机拍照即可搜索相似商品,2015年双11当天,千万消费者使用了“拍立淘”功能,创造了超过数千万元的销售额。
图中文字识别(OCR)一直是计算机视觉领域的难点。阿里巴巴平台很多营销创意、商品都以图片形式存在,同时,也有一些商家在图片中内嵌违规的信息实现恶意推广的目的,图片内文字违规是比例相当大的一类,而传统监控手段多以人工肉眼来审核,费时费力,尤其是随着图片数量越来越大,这几乎已成为不可完成的任务。从2014年开始,阿里妈妈图像团队开始重点攻坚OCR技术,通过机器视觉的方式从图片中识别出文字,从而鉴别出违规的文案信息。
2016年6月,阿里巴巴旗下广告交易平台阿里妈妈图像团队的OCR(图中文字识别)技术刷新了ICDAR Robust Reading竞赛数据集的全球最好成绩,并大幅超越第二名。借助这一领先的OCR技术,阿里妈妈图像团队能够以95%的超高准确率识别图中违规文字信息,有效过滤商家恶意推广,维护消费者权益。2015年,阿里妈妈累计屏蔽了4600万条恶意推广。
阿里绿网依托于阿里巴巴全生态体系,拥有海量的特征样本及丰富的数据模型分析经验,也利用OCR技术进行了黄色图片鉴别。根据技术人员的测试,通过人工智能技术鉴别黄色图片,准确率高达99.6%以上。
3.人工智能在金融业应用:从客服、风控到业务创新
人工智能未来会重构金融服务的生态,成为普惠金融的基石,金融的个性化、场景化服务成为主要创新方向。伴随着基于大数据的机器学习算法的发展以及语音识别、人脸识别、自然语言处理技术的日趋成熟,蚂蚁金服已经将人工智能技术运用于蚂蚁微贷、保险、征信、风险控制、客户服务等多个领域。比如通过机器学习技术把蚂蚁微贷和花呗的虚假交易率降低了10倍。为支付宝的证件审核系统开发的OCR系统,使证件校核时间从1天缩小到1秒,同时提升了30%的通过率。2015年“双11”期间,蚂蚁金服95%的远程客户服务已经由智能机器人完成,同时实现了100%的自动语音识别。
蚂蚁金服与保险公司合作的“航空退票险”上线之后赔付率一度高达190%,保险公司面临巨大的亏损压力。通过引入机器学习技术,大数据技术建模、优化后,有效地降低了赔付率,并成功扭亏为盈,满足了保险公司的核保要求。
4.人工智能助力交通出行
从交通的角度来看,今天的交通拥堵对于城市管理者来说是个很大的难题,对于出行者来说路径的选择也一直是个问题;想像一下伴随着基于人工智能的无人驾驶汽车、无人机、送货机器人等产品的问世和成熟,交通管理的范畴将会变得更加复杂多变。阿里巴巴在利用人工智能技术实现交通状况的预测、控制和管理方面进行了一些有益的探索。
在交通拥堵控制和预测方面,基于交通历史数据,实时路况数据,手机基站信令数据,视频监控数据,信号灯运行数据等多数据源的整合,使用人工智能中的机器学习算法,可以实现交通拥堵的提前预测,并提醒管理者提前采取相应措施,同时也能帮助交通管理部门进行道路的更合理规划设计和对交通信号装置等相关因素进行调整,降低路况拥堵率。比如,为了解决拥堵难题,广州市交警近日引入人工智能技术阿里云ET搭建了“互联网+信号灯”控制优化平台。据了解,ET可对路口车辆运行情况进行分析,并输出对红绿灯时间的调整建议。试点结果显示,部分路段拥堵指数下降超25%。
同时,大数据与机器学习能力的结合还能够帮助出行者实现更优质的智能出行决策,可以根据用户地域、距离、时长、工具等不同场景学习不同的出行决策,形成出行决策模型;根据用户的定位数据、出行数据、反馈数据,也可以为用户提供省时、省力以及舒适性的偏好决策模型。比如,高德推出高德地图AI引擎,该引擎将基于高德出行大数据和机器学习能力,面向不同环境和需求,为用户提供“千人千面”的位置出行服务。
5.人工智能解放速记员和书记员?
根据Gartner预测,到2018年,客户数字助手将能跨渠道和合作伙伴识别人脸和声音:机器在倾听指令和告诉我们该做什么上比真人表现更好。语音识别和自然语言处理技术基础上的人工智能应用场景非常丰富,速记员和书记员的未来可能被智能机器人替代。
比如,在今年的阿里云2016年会上,阿里云ET的速记能力就曾在准确率方面以0.67%的微弱优势战胜第50届国际速联速记大赛全球速记亚军姜毅。9月13日,浙江省高级人民法院对外宣布,将在全省105家法院全面上线智能语音识别系统。该系统由阿里云人工智能ET提供技术支持,能够快速、准确的完成庭审记录,承担起“书记员”的角色。3个月前,系统曾在西湖区人民法院试点,准确率高达96%。这些都是阿里人工智能技术与行业应用场景落地的案例。
当然,目前的时代依然是弱人工智能时代,人工智能技术还主要为了解决特定的问题而存在,是任务型的人工智能,未来能否真的拥有人一样的思考、感知和认知能力还有很长的一段路要走。但总起来看,我们认为人工智能会有非常广泛的应用场景,既有通用的跨行业的场景,比如客户服务,个性化推荐,身份识别,网络营销,风险控制等;也会有针对某些特定行业的场景,比如交通出行、金融投资、医疗问诊、娱乐、制造、教育等行业的应用。