魏钰明清华大学智能社会治理研究院助理研究员
伴随大模型、具身智能等前沿技术发展,智能社会转型的速度正呈指数级上升。特别是兼具高性能、低成本、开源等优势的国产大模型DeepSeek的重大突破,打破了我国生成式人工智能应用面临的技术壁垒,为人工智能(AI)在国内的大规模扩散创造了前所未有的机遇。截至目前,已有超过200家企业宣布接入DeepSeek,覆盖基础电信企业、云计算、芯片、金融、汽车、手机等多个领域。国产大模型在不同行业领域的加速部署和应用,不仅改变了我国人工智能产业格局,也促使人工智能的主体性特征更加突出[1],进一步加剧了智能社会的复杂性,给智能社会治理带来新的挑战。下文将基于DeepSeek国产大模型应用拓展的现状,对智能社会的复杂性问题与治理策略作初步的思考和探讨。
一、国产大模型突破与智能应用大规模拓展
杭州深度求索人工智能基础技术研究有限公司(DeepSeek)于2025年1月20日发布的DeepSeek-R1模型,以比肩美国Open AI公司o1模型的性能、远低于o1模型的训练成本、完全开源的特性,实现了国产大模型里程碑式的突破,引发全球广泛关注。据报道,DeepSeek仅用7天就完成了1亿用户的增长,并在2025年2月1日成为历史上最快突破3000万日活跃用户数的人工智能应用。与此同时,多家企业、高校和多地政务系统也宣布接入DeepSeek。国产大模型在个人和组织层面的迅速扩散,正在掀起新一轮智能应用大规模拓展的浪潮,加快我国经济社会智能化转型步伐。
(一)DeepSeek大模型的独特优势与赋能潜力
从目前公开的信息来看,DeepSeek大模型已经在多个方面展现出独特优势。一是高性价比。DeepSeek宣称其模型训练成本约合557.6万美元,不到OpenAI模型训练成本的十分之一。在应用程序接口(Application Programming Interface,API)定价方面,DeepSeek-R1模型服务对每百万输入词元(token)收取0.55美元,对每百万输出token收取2.19美元,而OpenAI最新版o1模型的相应收费分别为15美元和60美元,大大降低了用户的使用成本。二是强大的技术性能和中文适配性。DeepSeek综合运用群体相对策略优化(Group Relative Policy Optimization,GRPO)强化学习算法、混合专家(Mixture of Experts,MoE)架构、多头隐式注意力(Multi-Head Latent Attention,MLA)机制、多词元预测(Multi-Token Prediction,MTP)训练目标等一系列创新技术和算法架构[2],显著提升了模型的效率和性能,使得其在逻辑推理、多模态任务处理、编程辅助、长文本处理等方面表现出色,能够与其他领先模型相抗衡。特别是在中文处理能力方面的综合表现显著优于Open AI,对于中文环境下的用户具有更好的适配性。三是轻量级模型支持。DeepSeek提供多个蒸馏版本的小模型,能够在普通笔记本电脑和手机上运行,进一步扩大了模型的适用场景范围。四是完全开源的特性。DeepSeek将R1等模型基于MIT协议开源,允许开发者自由使用、修改及商用,无需额外授权,并公开了模型推理过程。用户可以自行下载和部署模型,还能获取详细的使用说明和训练步骤,对模型进行再次开发和研究,为大模型的普及和应用提供了巨大便利。
上述优势为DeepSeek赋能不同的行业领域和应用场景奠定了坚实基础。一方面,DeepSeek的高性价比、本土化和轻量级模型支持,打破了大模型应用的成本、渠道和硬件限制。自主研发的技术架构、强大的技术性能和中文适配性,确保了DeepSeek在处理中文任务和复杂场景时的高效、准确、安全、可控,中小企业乃至个人开发者也能轻松、安心地接入和应用大模型技术,极大地拓宽了人工智能技术的应用边界。另一方面,其完全开源的特性,降低了智能应用开发和创作的技术门槛,使得全球开发者共同参与模型的改进优化,并在DeepSeek的基础上进行二次开发,定制符合自身需求的功能,有助于快速构建应用生态,促进技术创新和社区发展。
(二)DeepSeek掀起的“接入”热潮与应用拓展
凭借自身的强大优势和“国产化”叙事唤起的爱国情怀,DeepSeek-R1一经推出,就迅速掀起“接入”热潮。包括移动、联通、电信三大运营商和华为、阿里、百度、腾讯、京东等多家企业宣布接入DeepSeek大模型,广东、江苏、内蒙古、江西等地的政务服务系统,浙江大学、上海交通大学等高校,以及多家金融、医疗机构也表示已接入DeepSeek大模型。比亚迪、吉利等20余家车企宣布在智舱场景、智能运营等领域完成了与DeepSeek的深度融合。甚至微软、英伟达、亚马逊等世界级云计算巨头,也因为DeepSeek优异的技术表现和开源特性而宣布接入。
伴随“接入”热潮而来的是通信、云计算、商业服务、政务、教育、医疗、金融、交通、传媒等多个行业领域“内卷式”的应用拓展与深度智能化转型。据不完全统计,目前国内已推出超100款DeepSeek集成应用。以政务服务领域为例,深圳市福田区上线基于DeepSeek开发的首批70名AI“数智员工”,覆盖公文处理、民生服务、应急管理、招商引资等11大类政务场景。在AI“数智员工”帮助下,公文格式修正准确率超95%,审核时间缩短90%,错误率控制在5%以内;执法文书生成助手,将执法笔录秒级生成执法文书初稿;民生诉求分拨准确率从70%提升至95%,民情周报日报实现初稿一键生成;一些个性化定制生成时间从5天压缩至分钟级[3],实现了数字政府的智能化跃迁。
过去几年,Open AI等机构研发的大模型已经推动智能社会转型提速,但受限于高昂的应用成本、稀缺的算力资源,以及美国顶尖模型不向我国开放等因素,国内部署和应用大模型仍存在较高的壁垒,给细分行业智能应用的开发和拓展造成较大阻碍。而DeepSeek一举打破当前以追逐大数据、大算力、大模型、大能耗为特征的人工智能“闭源竞争”生态,推动全球人工智能竞争从“模型研发投入”的较量转向“场景落地效率”的比拼。DeepSeek普惠开源的运营模式,既直接为各类企业组织开发智能应用提供了更便宜、更便捷的基座和渠道,又势必会形成引领效应,迫使国际其他头部人工智能企业降低大模型定价,甚至走上开源免费的道路,从而大幅加快智能应用拓展和智能社会转型的进程。
二、智能社会的复杂性涌现
可以说,DeepSeek成功为智能技术应用打造出了一条平民化路径,有助于促进人工智能真正走进千家万户。然而,智能应用的大规模扩散在加速社会转型的同时,也会导致社会的复杂性涌现(Complexity Emergence)。复杂性涌现是系统科学中的核心概念,指简单要素通过非线性互动在宏观层面自发形成全新秩序或属性的现象,新形成的整体特性无法通过分解还原到个体要素,呈现出“整体大于部分之和”的本质。这种相变过程往往具有不可预测性,其中的复杂性可能超乎人类已有的经验知识,给个体认知、群体交互、系统秩序带来颠覆性影响,尤为值得重视。
(一)智能推理强化与主体性危机
不同于此前的GPT-3、GPT-4等通用大模型,DeepSeek-R1是一种推理模型,它借助强化学习技术,能够在没有人工监督的情况下从通用大语言模型中引出推理,拥有比通用大模型更强的逻辑推理、分析决策和问题解决能力。这意味着,DeepSeek-R1与不同领域智能应用的深度融合,将显著提高智能应用的自主推理和决策水平,甚至在很多应用场景下可以直接替代人,更加高效地作出行为决策。例如,前文中提到的深圳福田区上线的AI“数智员工”,不仅干的多、错的少,还具有很强的理解能力,可以根据任务情境超前配置解决方案。然而,需要注意的是,虽然AI“数智员工”在提高政务服务效率方面表现突出,其背后却潜藏着AI主体性增强与个人主体性走弱的隐忧。
在实际应用中,DeepSeek-R1赋能的智能推理并非简单替代人类决策,而是与人类认知系统形成双向塑造的关系。一方面,人类在体验到智能推理带来的高效率后,会倾向于把更多决策任务交由智能应用完成,人类大脑为适应智能应用带来的行为改变,可能会逐步发生生理性调整,导致人类自主思考和决策的主体性发生结构性退化。另一方面,智能应用在承担越来越多决策任务的过程中,会通过数据反馈持续优化服务表现。一旦人类与智能应用之间的这种协同演化突破临界点,就会涌现出系统性认知依赖,人类将陷入自身主体性不断退化,而智能应用主体性不断强化的下坠循环,最终爆发主体性危机。如果未能进行有效的干预和治理,人类可能失去知识生产、价值判断乃至文明传承的主导权。
(二)智能应用下沉与社会结构失衡
除了智能推理能力的增强,DeepSeek-R1在成本控制方面的成功也促使不同行业领域智能应用进一步向经济欠发达地区和弱势群体下沉。具体而言,DeepSeek的低成本部署模式解决了欠发达地区推广智能应用面临的最大阻碍,为其提供了“换道超车”的机会,深圳的AI“数智员工”这类成功案例,可以快速在这些地区进行复制,缩小区域间政务服务差异。但需要深入思考的问题是,在AI“数智员工”的高歌猛进中,原本不具备相应数字素养的群体,是否会陷入更深的技术鸿沟?AI“数智员工”高效率、高质量完成了原本应由人类完成的工作,人类又该何去何从?
智能应用的下沉并非简单的技术扩散,而是通过非线性的反馈循环重塑社会结构与运行规则。首先,在智能应用下沉过程中,如果不作干预,资源分配的正反馈循环不会减弱,只会越来越强。在欠发达地区和弱势群体内部,技术也会优先帮助数字素养相对高的个体获取更多红利,拉开其与其他个体的差距,但在这之后,按照技术提升效率的基本逻辑,差距不会被弥合,反而会向强者恒强、弱者愈弱的“马太效应”演变。一个便于理解的例子是,小微商家在流量竞争中往往陷入“越弱势→越少曝光→更加弱势”的死循环。其次,智能应用本身也会在市场规律的引导下,主动给不同地区、不同群体打标签,并进行有针对性的内容和服务输出。例如,短视频平台通过地理位置标签,将偏远地区用户锁定在“乡土内容亚空间”,很少为其推送有助于个人能力提升的教育培训类内容。尽管这些用户也接触到了智能技术,但推荐算法织就的“信息茧房”仍使他们难以弥补认知和能力的不足。再次,智能技术本已促使一部分被替代的劳动者向技术渗透度不高的欠发达地区转移,但随着智能应用的下沉,欠发达地区的劳动机会也将被侵占,进一步挤压被替代的劳动者的生存空间。因此,智能技术渗透也存在一个临界规模,一旦被突破,智能技术就将按照其自身的运行逻辑对社会结构进行重组,在效率目标导向下,消灭“中间层”,将人类社会的两极分化推向极致。
(三)智能技术过载与社会秩序失灵
DeepSeek火爆浪潮下的另一重隐忧是智能技术的迭代和应用速度远超社会系统适应能力。从DeepSeek-R1推出至今不到一个月的时间里,各地区、各企业的“接入”热情持续高涨,百余项集成应用纷至沓来。由DeepSeek所引发的智能应用浪潮俨然已演变成一场全民参与的“赛博狂欢”。然而,当技术变革突破社会管理的“刹车距离”时,规则、伦理、基础设施等“车身部件”很可能会因为过载而失灵,引发系统性失控。特别是在DeepSeek的开源生态下,模型接入和技术开发门槛大幅降低,智能应用大量增长,对开发者和用户的监管难度进一步提高,如何确保智能技术不被滥用或恶意利用,是智能社会转型过程中需要持续应对的难题和挑战。
从已有经验来看,智能技术过载的案例往往是出于好意,但在实践过程中,却因为过度追求效率目标而误入歧途。DeepSeek还处于快速成长的过程中,推出的模型在运行稳定性、模型幻觉等方面仍存在不足。当前,政务服务、金融、交通等领域接入DeepSeek的规模呈现出由点到面、交织成网的扩张态势,由于数据信息的融通性,各领域看似独立,实则暗藏联动风险。当智能应用的网络复杂度超过社会承载阈值,一个微小的扰动就可能带来连锁反应,引发复杂系统的“雪崩效应”。由模型幻觉带来的一次错误输出或一次“停摆”,在政务服务领域,可能会招致重大舆情,给政府声誉造成冲击;在金融领域,可能引发股市暴跌,严重破坏经济秩序;在交通领域,可能诱发交通事故,甚至危害驾乘人员生命。然而,当问题发生后,在缺乏相应法律制度安排的情况下,如何确定责任主体,如何合理划分责任,又将是困扰监管者的难题。因此,大模型的接入和部署,还需要更加谨慎和理性,尽可能与社会承载和治理能力保持平衡。
三、智能社会复杂性的治理策略
复杂性涌现的本质,是宇宙在熵增中通过自组织和自适应建立新的有序结构的过程。从这个维度上看,智能社会的转型不仅仅是技术工具的革新,更是人类文明存在方式的根本性转变。智能社会转型中面临的复杂性危机和挑战,并不来自于智能技术的不可控,而是由于人类还未能学会以不确定性思维与涌现秩序共存。对于智能社会复杂性的治理,需要明确的是:“控制”不是消除技术发展带来的不确定性,而是在混沌边缘构建动态平衡的智慧。
(一)重建人机共生的认知生态平衡
DeepSeek智能推理强化对人类主体性的潜在侵蚀作用,实则是人机复合认知系统在演化过程中出现的生态位错配:原本人类作为决策主体、技术工具作为被动客体的认知生态,错误扭转为AI成为决策中枢,而人类成为执行终端。这种错位导致人类从认知生态的“生产者”退化为“消费者”,引发人类社会系统的主体性危机。解决该问题的路径不在于抵制技术,而是要重建人机共生的认知生态平衡,在智能应用快速扩散拓展的过程中,我们要对认知主权保有清醒的边界意识,努力维护人类特有的认知方式。
对于这一复杂性问题的核心治理策略,是在人类主导价值观和伦理规则的前提下,超脱于人类中心主义,建立人机混合增强智能,赋予大模型价值和伦理规则之外的认知主权,实现人与智能的共生演化。一是要对现有大模型的“元价值观”展开系统测评,明确不同大模型的“元价值观”与人类主流价值观的差异[4];二是在明确价值观差异的基础上,借助AI宪法框架等形式,将人类价值观编码为算法涌现的约束条件;三是利用新构建的约束条件,反向对拟接入的大模型进行训练和优化,强化大模型的价值对齐,达成人机共生的认知生态平衡。
(二)构建具有动态韧性的社会架构
智能应用下沉引发的结构失衡,本质上是工业文明社会结构(树状层级体系)向智能文明社会结构(网状生态体系)转型过程中出现的组织化震荡。与之相对应的是社会流动性从渐进式流动转向量子化的跃迁。这要求我们在智能社会与智能文明的转型建设中,放弃对静态平衡的追求,转而构建具有动态韧性的社会架构,使其既能吸收技术冲击带来的动能,接受必要的混沌波动,又能不断通过结构微调,营造新的“中间态”,保持系统的完整性和进化活力。
对这一问题的核心治理策略是建立技术社会实验“沙盒”,通过持续社会学习,明确技术与社会融合交互的边界,形成适应性规制体系。目前,基于这一策略的人工智能社会实验工作已经在我国广泛开展。研究者和实践者或借助于自然实验和实地实验的操作路径,在智能社会治理实验基地和人工智能创新发展试验区的真实场景中引入智能应用,持续追踪观测人工智能的社会影响,评估治理政策的有效性[4];或通过计算实验的操作路径,积极搭建智能社会模拟器,对社会要素进行仿真模拟,推演智能应用对社会的系统性作用,检验并比较不同治理方案的效果,提炼最优政策设计[5]。
(三)建立基于溯因推理的治理系统
智能技术过载可能带来的秩序失灵,从根本上看,是技术系统与社会系统之间的能量和信息流动失序,突破原有稳定状态,导致系统的崩溃。还处于成长中的智能技术和相对滞后的监管制度同时遭遇了社会受众过高的采纳热情,技术的不完美和制度的不完备在大规模社会扩散中叠加放大,使得风险事件的发生概率激增。这需要我们突破传统线性的因果链治理思维,前瞻性预判风险和冲突点,建立基于溯因推理的治理系统,从潜在结果事件反推可能性路径,进行前置干预和治理。
对这一问题的核心治理策略是治理系统的冗余设计,避免陷入“绝对安全”陷阱,承认“黑天鹅事件”的必然性,在智能应用、基础设施、政策措施中预埋弹性冗余,构建风险缓冲带,允许局部失误或失效而不引发系统性崩溃。一是对智能应用进行分级动态预警和管控,明确划分不同智能应用的风险层级;二是在关键基础设施中预设应急机制,设置备份设备和人工接管模式,提升抗风险能力;三是推出智能应用风险准备金、智能应用风险评估标准等政策措施,超前制定应对未知风险的储备政策工具。
四、结语
作为全球智能技术应用起步最早、布局最广的国家,我国首次走在了新科技革命和社会变革的最前列。DeepSeek国产大模型所掀起的智能应用拓展浪潮,既使我们看到我国人工智能发展的光明前景,也让我们率先体验到智能社会转型变革的复杂性。未来,随着智能技术的不断进步和应用领域的不断拓展,智能社会的复杂性还将进一步加剧。我们需要紧抓当前复杂性涌现的历史机遇,积极探索智能社会治理的中国道路,以不确定性思维与涌现秩序共存,在混沌边缘构建动态平衡,从技术、社会、治理三个维度共同发力,推动建立一个既高效又稳定,既智能又人文的未来社会,实现人工智能技术与人类社会的和谐共生,为智能时代人类命运共同体建设贡献中国智慧。
↓↓了解更多资讯,请识别下方二维码↓↓
国脉集团是数据资产化专业服务机构,为数据资源拥有者提供专业、规范、合规的全流程数据资产化服务,包括培训、咨询和产品设计等,实现数据资源价值最大化。主要服务于政府数据管理机构、央国企数据运营企业、城市数据运营平台和数据富集型平台企业,打造数据资产网、数据资产研究院和产业专家网络等支撑体系,同时在营商环境与政务领域继续保持领先优势。 主要课程包括数据资产入表、数据经纪人、公共数据运营和政府CDO、数据精品等精品课程。 数据资产化服务:数据资产化战略布局、数据资产入表、数据产品开发及交易等关键任务; 数据要素×项目服务:政策扶持、案例奖项申报、金融支撑和市场变现; 数据产业园区和试验区咨询服务:园区规划、咨询、资源导入