2024年2月29日,2024中关村论坛系列活动——第二届北京人工智能产业创新发展大会举办。会上,国家发展改革委党组成员,国家数据局党组书记、局长刘烈宏受邀发言,首次重点谈论人工智能大模型中的数据应用。
01、让数据成为人工智能发展的催化剂
刘烈宏指出,2023年,以ChatGPT为代表的生成式人工智能在语言对话领域率先取得巨大突破,并陆续在计算机、生物、化学等领域取得显著进展。国内诸多企业相继推出大模型及相关的产品,并在互联网服务和行业数据化场景中加速落地,展现出巨大的应用前景。2024年2月,视频生成大模型取得突破性进展,引起全球广泛关注和讨论。大模型技术具有规模扩展性强、多任务适应性、能力可塑性强的特点,并仍在快速迭代、持续研究,有望成为通用人工智能的可行路径之一。
刘烈宏指出:“我们要充分发挥数据的基础资源作用和创新引擎作用,构建满足人工智能发展需要的数据开放、共享、流通、交易的模式,全面提高数据资源开发利用水平,让数据‘供得出、流得动、用得好’,真正成为人工智能发展的催化剂,推动做强、做优、做大数字经济。”
刘烈宏表示,将数据作为生产要素,是我国首次提出的重大理论创新,这也为我们抢抓人工智能战略机遇奠定了坚实的基础。大模型驱动的人工智能发展对于高质量数据供给提出了更高要求,数据要素的市场化配置和开发利用显得尤为重要。我们要充分发挥数据的基础资源作用和创新引擎作用。
02、刘烈宏首谈人工智能高质量发展
大会现场,刘烈宏分享了他基于数据和算力等角度对人工智能高质量发展的一些思考。在他看来:
第一,高质量数据是人工智能发展的根基。
人工智能技术的历次突破都离不开高质量数据集的支撑。回顾历史,由七万张手写数字图片组成的数据集,促进了图像识别领域的发展,快速推动了数据自动分类和聚类技术的发展;由1400万张各类互联网图片组成的数据集开启了深度学习的时代,极大地提升了人工智能感知技术的能力;由自然语言、编程语言、网络数据等组成的万亿级多模态高质量数据级开启了大模型时代,人工智能开始具备一定的认知交付能力,使得机器认知,甚至通用智能成为可能。
今天数据的“质”和“量”是推动大模型不断进步的关键。例如,在前提条件不变的前提下,使用更高质量的数据集来做训练,能使20亿参数量级的模型超过100亿参数量级的模型。
第二,高性能算力是人工智能发展的基础。
面对生成式人工智能服务和大模型的迅速兴起带来的旺盛的算力需求,需要从算力供给和算力网络调度等方面来做好统筹协调。从算力供给来看,需要加大低成本、高质量、易使用的算力供给;从算力网络的调度来看,需要做好人工智能、模型训练推理、离线分析等高时延业务等资源匹配,切实提升计算资源的整体使用率。
2023年12月,国家数据局联合有关部门共同印发了《深度实施东数西算工程加快构建全国一体化算力网的实施意见》,从“通用算力、智能算力、超级算力的一体化布局”“东中西部算力一体化协同”“算力数据算法一体化应用”“算力与绿色电力一体化融合”“算力发展与安全保障一体化推进”等五个统筹出发,推动建设联网调度、普惠易用、绿色安全的全国一体化算力网。
第三,行业应用是人工智能落地的关键。
我国超大规模市场为人工智能行业应用提供了丰富的土壤,这是我国推动人工智能应用迈向更高水平的重要优势。
例如在交通物流行业,人工智能技术应用可以助力企业提升运输效率,降低全社会物流的成本;在文化旅游行业开发文化大模型,能够贯通各类文化机构的数据中心,充分挖掘文化数据的价值;在科技创新领域以科学数据支撑大模型的开发,可以更深入地挖掘各类科学数据和科技的文献。
国家数据局与16个部门共同印发《数据要素层三年行动计划》,提升数据利用水平,推动人工智能行业应用落地,推动社会各界共同挖掘市场的需求。这为人工智能技术的行业应用奠定了基础。
第四,安全治理是人工智能发展的保障。
人工智能在对经济社会发展带来深远影响的同时也蕴含着隐私保护、算法安全、设施安全和技术耐用等潜在的风险隐患。
目前,国内多家企业已经设立了数据伦理安全委员会,积极落实行业自律,并取得了初步的成效。“在此基础上,我们还应该多维布局,汇聚政府、行业、企业等各主体,从科技伦理、立法、技术实践等维度推动人工智能安全治理,坚持创新发展和安全治理统筹原则,持续优化完善人工治理安全风险的防范。”刘烈宏说道。
第五,保障体系是人工智能发展的支撑。
人工智能高质量发展离不开人才的建设、标准规范和国际合作等保障体系。其中复合型人才是发展的强效动力,需要以社会需求和产业发展为导向,培养兼具理论和实践,掌握数据、算法、分布式计算等技能的跨专业人才队伍。
“统一的标准规范体系是发展的重要基础,需要构建关于人工智能数据、算力和算法的标准体系,有效提升高质量数据和高质量算力的供给。”刘烈宏表示,“开放的国际合作是发展的必经之路,需要积极开展人工智能国际合作,打造互联互通、互利共赢的人工智能的命运共同体。”
刘烈宏指出,下一步,国家数据局将把握数字化、网络化、智能化发展的趋势,大力推进数据资源的整合共享和开发利用,让数据赋能人工智能的发展,数据真正实现“供得出、流得动、用得好”,同时打造全国一体化的算力调度体系,加速算力的高质量发展。
↓↓了解更多资讯,请识别下方二维码↓↓
国脉集团是数据资产化先锋企业,主要提供培训、咨询和产品设计服务。为数据资源拥有者提供专业、规范、合规的全流程资产化服务,提升机构数据管理服务能力,实现数据资源价值最大化。运用最先进的培训理念方法和平台工具提供高绩效培训服务。研发“一头一体两翼”企业数据资产化咨询服务方法论,提升数据资产化战略设计、就绪度评估与咨询、入表和产品化全流程咨询服务。基于战略思维和实操需求研发“易”系列产品,并与数源方合作研发系列数据产品。
主要课程包括数据资产入表、数据经纪人、公共数据运营和政府CDO、数据精品等精品课程。
主要产品:数据易投、数据易贷、数据易保、数据易售。