中文站
  • 贯彻内生安全防御理念,网易易盾产品能力一览_网易易盾

    网易易盾推出内生防御体系,以应对AI时代的风险挑战,通过精细化安全标准、纵深内容检测和弹性安全运营构建全方位内容安全框架,预测、识别和管理风险,保障企业与用户的安全体验。贯彻内生安全防御理念,网易易盾产品能力一览

    来自:动态资讯
  • 移动开发必须要了解的易盾加固生态_网易易盾

    移动APP开发存在着APK被逆向、被破解、数据被窃取、外挂等众多风险,针对这些移动安全风险,网易易盾提供App全链路安全服务包含了安全开发、应用审计、安全加固、渠道检测四个周期。移动开发必须要了解的易盾加固生态

    来自:动态资讯
  • ESIM模型的“全能版”!网易易盾实验室研究员解读HIM混合推理模型_网易易盾

    ESIM模型只是本篇文章要介绍的HIM模型的阉割版,后者潜力很大,能应用在包括内容安全在内的多个领域。近日,网易易盾实验室的研究员撰写了此篇文章,对HIM模型进行简单解读。ESIM模型的“全能版”!网易易盾实验室研究员解读HIM混合推理模型

    来自:动态资讯
  • 面向 AIGC 的内容风控新技术_网易易盾

    大模型和AIGC等先进技术的发展为我们带来了许多新的应用红利,同时也带来了一系列安全隐患。结合易盾近期自身围绕 AIGC 的技术实践,围绕“用魔法打败魔法”的建设思路,分享相关能力的技术升级方案和细节面向 AIGC 的内容风控新技术

    来自:动态资讯
  • AI网络安全实战:生成对抗网络_网易易盾

    GANs是人工智能(AI)的最新思想之一。在AI的原始应用中,这个词指的是用来欺骗评估神经网络或另一个机器学习模型的样本类型。随着机器学习在安全应用程序中的应用越来越多,这个样本类型变得非常重要。AI网络安全实战:生成对抗网络

    来自:动态资讯
  • 如何检测ddos攻击?有哪些ddos防御的方法?_网易易盾

    当出现如下现象时就说明可能出现了DDOS攻击:1.检查网站后台服务器发现大量无用的数据包;2.服务器主机上有大量等待的TCP连接;3.网络流量出现异常变化突然暴涨;4.大量访问源地址是虚假的;如何检测ddos攻击?有哪些ddos防御的方法?

    来自:动态资讯
  • 如何检测过滤音频中违规内容?_网易易盾

    音频产品因为使用场景多元、伴随性和碎片化,在当下快节奏的社会中,受到越来越多的用户欢迎。然而对音频的内容审核存在多个难点,比如说语音识别和声纹识别难、数据标注成本大等,给很多音视频平台的发展带来困扰。如何检测过滤音频中违规内容?

    来自:动态资讯
  • 未来安全隐患:AI的软肋——故意欺骗神经网络_网易易盾

    对于很多计算机程序,在黑客眼中,他们不是想享受这些程序提供的服务,而是想如何利用这些程序获得一些非法的收入。带黑帽子的黑客通常会利用程序中最微小的漏洞进入系统,窃取数据并造成严重破坏。未来安全隐患:AI的软肋——故意欺骗神经网络

    来自:动态资讯
  • 文本分类在内容安全应用中的数据不平衡问题_网易易盾

    然而,作为内容安全检测的一个重要技术手段,文本分类在实际业务中还是有不少的挑战。文本分类在内容安全应用中的数据不平衡问题

    来自:动态资讯
  • AI之间的博弈,从造假视角看“深度伪造”对抗之道_网易易盾

    近年来,“深度伪造”成为显著的内容安全风险之一。易盾的算法小组成功自研了一种基于神经网络的多视角“深度伪造”识别技术,凭借对AI决策模型的创新,更高效地发现视频中不自然的篡改痕迹。AI之间的博弈,从造假视角看“深度伪造”对抗之道

    来自:动态资讯