2018年9月16日发布的《大数据应用蓝皮书:中国大数据应用发展报告No.2(2018)》指出,未来中国大数据应用技术的发展将涉及到5大热点领域,包括多学科融合、人工智能、知识图谱等。目前在互联网金融以及媒体领域已经大量使用大数据。
结合一年来对中国大数据发展与应用的分析和研究,蓝皮书对未来一段时间的大数据发展趋势进行了预判。
蓝皮书认为,纵观大数据应用的技术发展状态,未来我国大数据应用技术的发展将涉及到以下热点领域:
一是机器学习、人工智能继续成为大数据智能分析的核心技术,大数据预测和决策支持仍是主要应用。
在学术上,深度分析继续扮演技术主角,推动整个大数据智能的应用。通过像神经网络模型的深度学习,让计算机自动学习产生特征的方法,并将特征学习融入建立模型的过程中,增加设计特征的完备性。深度学习将在图像分类、语音识别、问答系统等应用取得重大突破,并有望得到成功商业应用。
二是数据科学带动多学科融合。
随着社会的数字化程度逐步加深,更为宽泛、更为包容大数据的边界不断完善,使得越来越多的学科在数据层面趋于一致,为类比科学研究创造了条件。“数据科学”的基础研究与成果将源源不断地注入技术研究和应用范畴中。
三是开源是主流技术,公测促良好研发生态。
大数据的处理模式更加多样化,Hadoop不再成为构建大数据平台的唯一选择。随着开源项目Spark不断被大规模应用,正成为大数据领域最大的开源社区。开源系统将成为大数据领域的主流技术和系统选择,并将引领着大数据生态系统的发展。各类大数据应用公测将促进大数据技术取得突破性进展。
四是基于知识图谱的大数据应用成为热门应用场景。
近年来,大数据成为大众媒体的热词,大众需要可视化的大数据,背后是基于知识图谱的大数据应用。可视化是通过把复杂的数据转化为可以交互的图形,帮助用户更好地理解分析数据对象,发现、洞察其内在规律。让对信息技术不熟悉的普通民众和非技术专业的常规决策者也能够更好地理解大数据及其分析的效果和价值,进而从国计、民生两方面都充分发挥大数据的价值。
五是数据立法正加紧推动,愈发重视数据安全。
大数据带来的安全与隐私问题包括有价值的大数据成为被攻击的目标,大数据的过度滥用带来隐私、秘密和机密泄露等。目前中国大数据产业快速发展缺乏较为统一的标准和规则,缺少完善的法律支撑,因此,国家将从数据的流动、交易、安全应用等问题上,进行国家层面的立法规范和保障,助力大数据产业持续健康发展。