智能体正从执行工具向自主决策系统跨越,成为AI规模化落地的核心载体,但内容违规、算法偏见、权限滥用、责任归属模糊等风险也随之凸显,规范其行为安全与合规边界,已是行业健康发展的必答题。
近日,中国人工智能产业发展联盟(AIIA)安全治理委员会组织的 “智能体应用行为分级安全合规要求” 技术规范研讨会顺利召开,汇聚了来自中国联通、中国电信、网易易盾、华为、阿里、浪潮、美团、OPPO、荣耀、vivo、小米等企业的众多专家与行业代表,共同探讨智能体应用的安全合规发展之路。

网易智企旗下业务-网易易盾作为数字内容风控行业的领军者,受邀出席本次研讨会,网易易盾国央企行业负责人朱文涛参会,并分享了网易易盾在智能体内容安全领域的实践经验与技术成果。
以技术创新,构建合规防线
随着智能体技术的迅猛发展,其应用场景不断拓展,但同时也带来了诸多安全与合规挑战,如隐私泄露、算法偏见、内容违规等问题,这些问题不仅影响用户体验,还可能引发法律风险和社会争议。
朱文涛在研讨会上,以“智能体内容安全:从合规防御到主动免疫”角度切入,介绍了网易易盾在智能体内容安全领域的实践经验与技术成果。他指出,智能体内容安全面临着诸多挑战,如隐晦红线对抗、审核标准尺度难把握、价值观内容检测复杂、多轮交互分析难等,这些挑战需要行业共同努力来解决。
参与标准制定,助力规范发展
网易易盾一直以来积极参与行业标准的制定工作,此前已参编国家标准:GB/T 45654-2025《网络安全技术 生成式人工智能服务安全基本要求》,为生成式人工智能服务安全提供了治理框架指引。本次研讨会,网易易盾再次为智能体应用行为分级安全合规要求的技术规范贡献力量,与业内专家共同探讨智能体应用的安全合规标准,推动行业规范发展。

智能体应用的安全合规发展是大模型技术发展与应用中的重要课题,需要政府、企业、科研机构等多方共同努力。网易易盾作为数字内容风控行业的领军者,将始终以技术创新为核心,以行业标准为引领,为智能体应用的安全合规发展贡献力量,共同构建安全、可信、可持续的AI生态。