近日,在2018年腾讯伙伴大会的前夕,马化腾提出了腾讯聚焦构建“两张网”的战略举措:一方面深耕消费互联网,另一方面积极拥抱产业互联网。这一战略的背后实质其实是腾讯一以贯之的连接人与人、人与物、物与物的"人联网"、"物联网"和"智联网"的“三联”之路。
在人工智能领域,腾讯的目标是攻克AI终极难题-通用人工智能。那么通用人工智能是什么呢?“人工智能之父”图灵认为,当机器拥有人类智慧时,就成为了通用人工智能。
在第一天论坛上,腾讯副总裁姚星表示:“腾讯将立足脚下,利用好人工智能(AI)、大数据(Big Data)和云计算(Cloud Computing),即ABC科技,构建新型基础设施,做‘数字化助手’的标配,形成科技创新与产业应用相互促进的良性循环,这在医疗、安防、零售、交通与娱乐行业已经有所体现。”
四大实验室加码AI研究,开源新项目助力AI发展
目前腾讯共有四大人工智能实验室,分别为腾讯深圳AI Lab、腾讯西雅图AI Lab、腾讯优图实验室和微信人工智能实验室。 其中,腾讯深圳AI Lab主要关注四大研究+四大应用;腾讯西雅图AI Lab主要关注语音与NLP;腾讯优图实验室主要关注计算机视觉、AI+行业应用;微信人工智能实验室则主要研究AI语音。
在论坛上,姚星重点介绍了腾讯在AI赋能医疗和安防领域的研究:
在AI医疗方面,腾讯拥有了“觅影”AI影像筛查,能够进行食道癌、乳腺癌、肺癌等病症的早期筛查。此外,在此次论坛上,腾讯推出了智能显微镜,能够结合AR和AI,让显微镜能完成智能识别、检测、定量计算和报告生成等系列工作。
在AI安防方面,过去两年,优图实验室打造了天眼智能安防平台和天眼智能交通平台,能够进行检测、跟踪、分析,为相关部门提供帮助。
此外,腾讯AI实验室还在三大前沿技术领域进行了探索:AI驱动的Siren虚拟人、在虚拟世界中训练仿真成真实世界的TRobot机械臂、以及用AI打星际争霸。
论坛当天,腾讯AI实验室正式宣布开源“PocketFlow”项目。 该项目是一个自动化深度学习模型压缩与加速框架,可以整合多种模型压缩与加速算法并利用强化学习自动搜索合适压缩参数,解决传统深度学习模型由于模型体积太大,计算资源消耗高而难以在移动设备上部署的痛点,同时极大程度的降低了模型压缩的技术门槛,赋能移动端AI应用开发。
这次大会上腾讯宣布开源的PocketFlow框架项目,在腾讯内部正在为多项移动端业务提供模型压缩与加速的技术支持。例如,在手机拍照APP中,人脸关键点定位模型是一个常用的预处理模块,通过对脸部的百余个特征点进行识别与定位,可以为后续的人脸识别、智能美颜等多个应用提供必要的特征数据。
腾讯基于PocketFlow框架,对人脸关键点定位模型进行压缩,在保持定位精度不变的同时,大幅度地降低了计算开销,在本身已经十分精简的网络上取得了1.3 —— 2倍不等的加速效果,压缩后的模型也已经在实际产品中得到部署。这对于其他科技企业而言,是一个不错的值得借鉴的框架。
各大科技企业入局,开源魅力何在?
在所有腾讯的项目中,亿欧最感兴趣的是其开源项目。比尔盖茨在1976年就表示过对自由软件的反对,在《致爱好者的公开信》一文中,他说道:“有谁会在没有任何报酬的情况下来做这些专业的工作?怎样的爱好者才会投入三年的时间开发,发现所有的错误、编写文档并且免费发布产品?事实上,只有我们大量投资来为个人电脑做软件”。
或许在很多人眼里,开源项目很难赚钱。明明是自己以及团队辛辛苦苦研究出的成果却要免费分享出来,这无疑是件愚蠢的行为。这么一想,你就错了。我先来举两个例子:
上周,IBM以334亿美元的价格收购开源的企业软件制造商红帽公司(Red Hat),Red Hat也即将成为IBM混合云部门的一部分。 对于Red Hat 的收购是IBM公司迄今为止规模最大的一笔交易,也是美国科技史上最大的一笔交易。 IBM则希望这笔交易能帮助其在全球迅猛增长的云业务中赶上亚马逊、谷歌等巨头。
在今年国庆期间,基于彭博社一篇关于中国“黑客芯片”的报道,中美两国科技股板块一片哀嚎,相关个股大幅下跌。在科技股下跌的形式下,以Elastic之名进行交易的开源的数据搜索软件初创公司Elastic search在上市当日,股价一路走高,涨幅超过90%,达到约70美元,并在收盘时继续保持了这样的势头。
今天依托开源赚钱的产品已经很普遍了,况且开源一词的诞生就是为了拒绝免费。如今的企业已经不仅仅只是靠卖产品盈利了,它需要提供的更多是服务。这从侧面或许也可以展现开源软件拥有的巨大的分销优势。
据资料显示,自2016年腾讯首次在GitHub上发布开源项目,目前已累积开源覆盖人工智能、移动开发、小程序等领域的57个项目。此外,为进一步贡献开源社区,腾讯相继加入了Hyperledger、LF Networking和开放网络基金会,并成为LF深度学习基金会首要创始成员及Linux基金会白金会员, 这一系列的开源行为恰好与腾讯此次的大会主题“开放,共生”相契合。
在AI的圈子里,各大科技公司都能深深意识到数据的重要性,都纷纷建立了仅面向其内部的大型数据集,例如谷歌的JFT-300M和Facebook的Instagram数据集。 但这些数据集及其训练得到的模型都没有公开,对于一般的科研机构和中小企业来说,这些人工智能基础能力有着很高的门槛。
实际上,2018年9月份,腾讯AI Lab便宣布开源了另一个与AI相关的项目-Tencent ML-Images,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成,包括了1800万训练图像和1.1万多常见物体类别。这自然为人工智能领域的科研人员和工程师提供了充足的高质量训练数据,从另一方面促进人工智能行业的发展。
虽然腾讯的技术积累比较深厚,然而腾讯开源的起步却是十分艰难。
因为腾讯由业务和产品驱动的研发模式,使得它在开源之路上走得并不平坦,从业务和产品,到 KPI,再到部门之间的壁垒,这些因素都构成了腾讯开源路上的“拦路虎”。
姚星在本次会议结束后,接受媒体采访时表示,目前腾讯内部正在推动多个技术团队去构建公用的技术模块,去做更多开源的贡献,进行优化上云,把更多内部组件与框架开放给云上的客户。
小结
各大科技公司对开源项目其实贡献不少,如百度、阿里、谷歌,甚至连一度摒弃开源的微软也愿意放弃Windows时代的绝对控制,转而投身到开源社区的贡献中,并于一周前以75亿美元收购GitHub。
关于人工智能的的开源项目其实也不少,如贪吃蛇游戏的人工智能、教AI打游戏的框架、为线稿上色的AI项目等。
正是这些开源项目的公布,才让越来越多的人有机会在前人的研究基础上探索出更多有趣的AI。亿欧曾经采访过新西兰理工学院的教授,他表示, 从技术层面上来讲,目前国内外的AI水平其实差不多。但是从出发点来看,国外的企业研究AI大多抱着探索未知的目的,而国内的企业更多的是由利益驱动。
引述上述嘉宾的观点,笔者只是想表达,这种开源共享的行为,实质上更能促进AI这项技术的进步。一方面,它让后来者能站在巨人的肩膀上进一步的深入研究,从中获取灵感,探索出更多的应用;另一方面,在开源的同时,贡献者本身也能得到更多可以完善该项目的反馈。
一直以来,技术都是推动商业环境进化的重要因素,而目前最热的技术升级趋势,无疑是人工智能。当下,尽管人工智能行业本身已经进入了一个平稳的发展期,但它对于各行各业的赋能却正在以更热烈的姿态进行。