近日,由中国信息通信研究院云计算与大数据研究所组织开展的政务领域人工智能大模型应用典型案例征集结果正式公布。网易易盾联合国家网络安全人才与创新基地(简称国家网安基地)开展的“国家网安基地大模型训推一体化项目”成功入选,成为政务大模型安全治理方向的典型实践案例之一。

作为国家网络安全战略布局中的重要组成部分,国家网安基地是中央网络安全和信息化委员会办公室指导下推进建设的重要国家级平台。基地聚焦网络安全关键技术攻关、高端人才培养与产业协同创新,致力于推动前沿技术成果在真实场景中的验证与落地应用。网易易盾作为技术能力提供方,围绕政务大模型内容安全、训练语料治理及推理运行评测等关键环节提供安全治理支持,双方协同推进政务大模型在真实环境中的安全运行与落地实践。
此次入选,体现了行业权威机构对网易易盾在政务大模型安全治理方向探索成果的认可,也为政务大模型在更大范围内安全、有序落地提供了可参考的实践路径。

1、政策持续加码,政务大模型进入“安全先行”阶段
随着人工智能大模型在政务服务、社会治理和机关办公等领域的应用探索不断推进,政务大模型正从前期试点逐步走向实际部署和运行阶段。与此同时,模型能力之外的问题愈发凸显:训练语料是否安全可控、生成内容是否合规可信、运行过程是否具备审计与评估能力,正在成为政务大模型能否真正落地的关键因素。
相较于通用场景,政务领域对大模型应用的安全性和规范性要求更高。模型在训练和推理过程中涉及大量政务数据和业务信息,其输出内容直接影响公共服务质量和社会治理效果。一旦出现不当输出或合规问题,影响范围和风险等级都将被显著放大。因此,仅依靠应用端的事后审核,已难以满足政务大模型规模化应用的现实需求。
在政策层面,《政务领域人工智能大模型部署应用指引》明确提出,要从应用场景、规范部署、运行管理和保障措施等方面,系统推进政务大模型安全、有序落地。这也意味着,安全治理需要贯穿政务大模型的训练、推理和运行全过程,成为部署应用的基础能力,而非事后补救手段。
在这一背景下,围绕政务大模型真实运行场景,如何构建可落地、可持续的安全治理能力,成为行业共同面对的问题。

《政务领域人工智能大模型部署应用指引》对政务大模型部署应用提出系统要求
2、三项核心能力,支撑政务大模型安全运行
在国家网安基地大模型训推一体化项目中,政务大模型围绕政务知识问答、业务辅助等场景开展应用探索,对模型在真实运行环境中的安全性、可控性和可持续运行能力提出了更高要求。在这一背景下,网易易盾围绕政务大模型训练、推理和运行管理等关键环节,提供安全治理能力支持,支撑模型在实际应用中的稳定运行。

大模型训练语料安全治理:把风险挡在模型“学会之前”
在政务大模型的安全治理实践中,风险往往并不只发生在输出阶段。如果模型在训练阶段引入了不准确、不合规或价值导向存在偏差的语料,后续再通过输出控制进行修正,往往难以从根本上解决问题。政务场景对模型输出的严肃性和准确性要求极高,这也使得训练阶段的语料质量,直接影响模型在实际应用中的稳定性和可信度。
针对这一问题,网易易盾在政务大模型应用中,将安全治理前移至训练阶段,提供针对训练语料的安全评测与治理能力。通过在模型训练前对语料安全性进行系统性把控,降低模型在学习阶段引入风险信息的概率,从源头减少后续运行中的安全隐患。
这种从源头入手的治理方式,使政务大模型在进入推理和应用阶段前,就具备更加稳定的内容基础和价值导向,为后续安全运行奠定基础。
大模型内容安全:让模型输出“有边界、可追溯”
在政务大模型的实际应用中,模型生成内容往往直接面向公众服务和政务业务场景,其准确性、合规性和价值导向具有高度敏感性。一旦出现不当输出,不仅会影响政务服务质量,还可能带来治理层面的风险。
与此同时,政务大模型的输出形态也更加多样,除了文本,还包括图像、文档等多种内容形式。单纯依赖人工审核或简单规则,难以支撑政务大模型在真实环境中的持续运行。
基于这一现实需求,网易易盾围绕政务大模型应用场景,提供了面向模型生成内容的安全治理能力,将内容安全作为模型运行的基础能力之一。通过对模型生成内容进行检测、记录与留痕管理,使模型输出在进入实际业务前具备清晰的安全边界,并在需要时能够进行回溯和复核。
这种能力并非简单的事后拦截,而是通过持续治理,帮助政务大模型在长期运行中保持稳定、可控的输出表现,为政务应用提供可靠的安全支撑。
大模型推理安全评测与运行管理:让模型状态“看得见、管得住”
当进入实际运行阶段后,模型是否始终处于安全、稳定、可控的状态,成为应用管理中的另一项关键问题。随着模型不断迭代、调整和扩展应用场景,如果缺乏持续评估机制,运行状况往往只能依赖经验判断,难以支撑长期应用。
围绕这一管理难题,网易易盾在政务大模型应用中,提供了推理安全评测与运行管理能力,对模型推理输出进行定期评测和分析,为模型运行状态提供可量化、可对比的参考依据。
通过评测结果,模型的运行表现不再是“凭感觉判断”,而是可以被持续观察和评估,从而支撑模型版本管理、运行调整和应用优化。这种持续评估能力,有助于政务大模型在长期运行过程中保持可控、可评估的状态,为稳定应用提供保障。
此次入选信通院政务领域人工智能大模型应用典型案例,是对网易易盾在政务大模型安全与训练推理治理方向阶段性实践成果的肯定。未来,网易易盾将继续围绕政务大模型应用中的安全与治理需求,结合政策导向与实际场景,不断完善相关能力,助力人工智能大模型在政务领域实现安全、稳妥、有序落地。