-
「大模型评测平台」发布,让AI安全看得见、管得住_网易易盾
网易易盾推出的「大模型评测平台」,旨在为企业提供从模型评测、风险预警到智能优化的全链路解决方案,帮助企业应对AIGC大模型的安全性挑战,实现从被动防御到主动治理的转变。「大模型评测平台」发布,让AI安全看得见、管得住
来自:动态资讯 -
12月第2周业务风控关注 | 网信办约谈视觉中国、IC photo 网站负责人,要求暂停服务全面整改_网易易盾
网信办约谈视觉中国、IC photo 网站负责人,要求暂停服务全面整改;中移动:已拦截骚扰电话253亿次 封堵不良网站10万个;GE、Dunkin’Donuts、Forever 21等知名品牌敏感数据12月第2周业务风控关注 | 网信办约谈视觉中国、IC photo 网站负责人,要求暂停服务全面整改
来自:动态资讯 -
8月第4周易盾业务风控关注 |《互联网信息服务算法推荐管理规定》公开征求意见中_网易易盾
易盾业务风控周报每周报道值得关注的安全技术和事件,包括但不限于内容安全、移动安全、业务安全和网络安全,帮助企业提高警惕,规避这些似小实大、影响业务健康发展的安全风险。8月第4周易盾业务风控关注 |《互联网信息服务算法推荐管理规定》公开征求意见中
来自:动态资讯 -
让你知晓内容安全的边界:盘点2017、2018这两年的内容监管_网易易盾
2016年被称为我国的互联网UGC视频平台的元年,特别是直播平台、短视频平台快速发展,用户数量呈现井喷式增长,而与之相伴的则是内容过度娱乐化、低俗化。本文盘点了这两年的内容监管行动和相关事件。让你知晓内容安全的边界:盘点2017、2018这两年的内容监管
来自:动态资讯 -
更适合文本分类的轻量级预训练模型_网易易盾
本文将详细介绍一种基于预训练半监督的文本分类轻量型模型,即 VAMPIRE 模型,为解决由于大量数据和高昂计算力导致的资源不足问题提供一些思路。更适合文本分类的轻量级预训练模型
来自:动态资讯 -
知物由学 | 内容安全小技巧:如何辨认人工智能生成的虚假头像_网易易盾
通过人工智能制造的人脸样本,不通过技术手段几乎很难辨认出到底是真人还是假人,本文就告诉大家如何通过一些技巧辨别真假人脸。知物由学 | 内容安全小技巧:如何辨认人工智能生成的虚假头像
来自:动态资讯 -
一文了解内容检测性能测试自动化建设_网易易盾
网易易盾内容检测服务经常在线上做性能测试,在性能测试过程中遇到了哪些痛点?对于这些痛点,怎样通过自动化的手段来尝试改进?一文了解内容检测性能测试自动化建设
来自:动态资讯 -
网易易盾朱浩齐:人工智能催生第三方反垃圾市场_网易易盾
7月8日,网易易盾的产品负责人朱浩齐在面向全国百余家媒体的分享中,讲述了人工智能技术在互联网反垃圾方面的应用案例。网易易盾朱浩齐:人工智能催生第三方反垃圾市场
来自:动态资讯 -
图片检测_开发文档_策略接口_自定义用户名单_更新接口_网易易盾
网易易盾开发文档接口说明通过该接口可以修改已抄送的自定义用户名单状态信息,易盾会同步刷新信息。鉴权说明易盾内容安全服务使用签名方法对接口进行鉴权,所有接口每一次请求都需要包含签名信息(signature 参数),以验证用户身份,防止信息被恶意篡改。目前支持MD5,SHA1,SHA256,SM3几种加密算法,图片检测,开发文档,策略接口,自定义用户名单,更新接口
来自:帮助中心 -
图片检测v4_开发文档_新手指南_功能操作指引_网易易盾
网易易盾开发文档服务管理您可在此页面对使用内容安全服务的所有产品进行管理和操作,查看今日数据。产品相关:添加产品、修改产品信息、查看秘钥;业务开通:普通文本、用户资料、图片、视频直播、视频点播、点播音频、直播音频、直播电视墙等多种数据类型业务的开通及开通后的状态查看、开发文档查看;支持更改文本、图片类业务图片检测v4,开发文档,新手指南,功能操作指引
来自:帮助中心