-
「大模型评测平台」发布,让AI安全看得见、管得住_网易易盾
网易易盾推出的「大模型评测平台」,旨在为企业提供从模型评测、风险预警到智能优化的全链路解决方案,帮助企业应对AIGC大模型的安全性挑战,实现从被动防御到主动治理的转变。「大模型评测平台」发布,让AI安全看得见、管得住
来自:动态资讯 -
网易易盾 GameSentry 正式开源,做游戏安全保障的尖兵利刃_网易易盾
网易易盾的 GameSentry 作为游戏安全战场上的“哨兵”,始终站在游戏安全的第一道防线,提前探知风险,并协同其他安全工具共同守护游戏安全与公平。网易易盾 GameSentry 正式开源,做游戏安全保障的尖兵利刃
来自:动态资讯 -
知物由学 | 内容安全小技巧:如何辨认人工智能生成的虚假头像_网易易盾
通过人工智能制造的人脸样本,不通过技术手段几乎很难辨认出到底是真人还是假人,本文就告诉大家如何通过一些技巧辨别真假人脸。知物由学 | 内容安全小技巧:如何辨认人工智能生成的虚假头像
来自:动态资讯 -
「译文」谷歌:用人工智能和集体智慧消灭“毒”评论_网易易盾
人工智能技术也被谷歌应用于解决内容型产品的成本、功能和可用性问题,其最新成果是借助机器学习模型评估网络会话影响的工具Perspective,第一个功能识别线上有毒(Toxic)评论已经上线。「译文」谷歌:用人工智能和集体智慧消灭“毒”评论
来自:动态资讯 -
文本检测v4_开发文档_文本检测类_文本在线检测_文本提交接口_网易易盾
网易易盾开发文档接口地址http://as.dun.163.com/v4/text/checkv3在线检测接口文档请点此查看接口描述建议您使用POST请求, 且仅接受 application/x-www-form-urlencoded 编码格式。根据发布的内容、发布者、ip、设备等信息来检测是否为需拦文本检测v4,开发文档,文本检测类,文本在线检测,文本提交接口
来自:帮助中心 -
CNCERT发布《2019年上半年我国互联网网络安全态势》_网易易盾
为维护我国网络空间的安全,保障互联网健康有序的发展,2019年上半年,我国持续推进网络安全法律法规体系建设,完善网络安全管理体制机制,不断加强互联网网络安全监测和治理,构建互联网发展安全基础。CNCERT发布《2019年上半年我国互联网网络安全态势》
来自:动态资讯 -
“吃播”被点名批评,敏感内容几时休?_网易易盾
视频直播平台相继看向美食区“吃播”内容,细化运营规则,整治相关不良内容。实际上,短视频直播平台面临着巨大的内容审核压力。治理敏感内容,不仅需要理念变化,更需要技术跟进。“吃播”被点名批评,敏感内容几时休?
来自:动态资讯 -
携安全大模型,网易易盾受邀出席2024京东云峰会_网易易盾
2024京东云峰会,网易易盾展示AIGC数字内容风控领域的创新实践。提出“AIGC内容合规建设体系”,旨在推动安全、健康和创新应用,塑造可靠的数字内容生态。携安全大模型,网易易盾受邀出席2024京东云峰会
来自:动态资讯 -
数字内容安全能力成熟度实践指南第二篇 | 制度和流程体系建设_网易易盾
网易易盾发布的《数字内容安全能力成熟度模型实践指南二:制度和流程体系建设》,旨在帮助企业建立完善的内容安全制度和流程体系,提升内容安全风险防范能力,并提供免费获取指南和专家咨询的机会。数字内容安全能力成熟度实践指南第二篇 | 制度和流程体系建设
来自:动态资讯 -
4 月第 3 周易盾业务风控关注 | 三部门整治网络直播短视频乱象_网易易盾
易盾业务风控周报每周报道值得关注的安全技术和事件,包括但不限于内容安全、移动安全、业务安全和网络安全,帮助企业提高警惕,规避这些似小实大、影响业务健康发展的安全风险。4 月第 3 周易盾业务风控关注 | 三部门整治网络直播短视频乱象
来自:动态资讯