近日,美国问答网站Quora邀请百度副总裁王海峰博士回答网友提问。Quora是美国问答型SNS网站,被誉为“获取高质量内容的来源地”,聚集了大量高质量知识用户。在接受邀请后,王海峰在前后近三个小时的时间里,就人工智能在中国的发展、百度在自然语言处理(NLP)领域所取得的技术成果,以及实际应用等问题进行了回答。
NLP技术赋能新搜索生态圈
NLP是计算机科学、人工智能以及语言学的交叉学科,旨在解决计算机与人类语言之间的交互问题,这其中包括对自然语言的分析、理解、生成、检索、变换及翻译等方面。王海峰介绍,百度研发了多种NLP技术,包括知识图谱、语义理解、内容标签、情感分析、文本生成、摘要、深度问答、机器翻译和对话系统等。这些技术广泛应用于百度的搜索、信息流、智能助手等产品中,为数亿用户提供服务。
除了对NLP技术本身的研究,百度还将这些技术集成到统一的平台——NLP云,从而为百度各种产品提供服务支持。王海峰说,百度开发的NLP云平台拥有20多种NLP 模块,每天的请求数量超过1000亿次。
以百度的核心业务搜索来说,分词、命名实体识别、句法分析和复述等NLP模块都是其必不可少的基础模块。另一个NLP技术在搜索中的典型应用是问答,高性能的问答系统需要对查询实行精准的语义语法分析,构建大规模知识图谱,以及对网页搜索结果全面深入的分析,用户在搜索框中输入问题,搜索引擎就可以直接提供答案。
NLP成下一代搜索引擎技术之本
在百度众多产品中,搜索引擎无疑是 NLP 技术最大的用武之地。搜索引擎最基本的模式是自动化地聚合足够多的内容,对之进行解析、处理和组织,响应用户的搜索请求找到对应结果返回,这其中每一个环节都离不开自然语言处理技术。
作为搜索引擎领域的领军者,百度再一次扮演了改革者的角色,将人工智能与搜索引擎紧密捆绑在一起。王海峰表示,下一代搜索引擎将可以更加理解用户的意图和内容,意图与内容的匹配也更加精准,这些都将大大增强用户的使用体验。
此外,搜索引擎与用户的交互界面也将发生创新性变化,随着语音、图像等技术更加成熟和实用,用户将可以使用更加高效、便捷的多模搜索,自然语言交互将成为搜索引擎的主流交互模式。
王海峰在问答中重点提到,“未来的搜索将无处不在,随处可见,搜索将不仅仅是使用搜索引擎,还会融入到各种产品中。我们还将重新定义可搜索的内容,不仅包括当前搜索引擎已经索引的内容,还将纳入更多服务、物体、设备和数据。”
在问答过程中,王海峰还对中国人工智能的发展现状进行分析,人工智能被首次列到政府工作报告中,包括百度等中国互联网企业都将加大对人工智能方面的投入,可以说人工智能不仅迅速应用于各大行业,也在改变人们的日常生活,包括交通、教育、医疗等各个方面。
王海峰对于人工智能持乐观态度,认为“人类即将进入人工智能时代”。而在NLP技术的推动下,百度搜索引擎实现了与人工智能的完美融合,从而完成了从“人找信息”到“信息找人”的转变,为用户提供双向智能适配的信息分发服务。未来,借助人工智能技术,百度有望打造以搜索为核心的互联网新生态,从而实现从量到质的全新飞跃,让每个人都能感受到科技改变生活所带来的魅力。