-
杭研技术秀 | 短文本内容检测反垃圾技术_网易易盾
本文针对短文本数据,作者采用了一种基于二元文法双词共现的概率统计建模方法,在色情-辱骂分类问题上取得了比传统LDA主题模型更优的效果,并且准确率和召回率指标能够随着主题个数的增加而稳定提高。杭研技术秀 | 短文本内容检测反垃圾技术
来自:动态资讯 -
如何判断注册帐号是否是垃圾帐号?如何防止机器批量注册?_网易易盾
判断一个账号是否是垃圾账号,可以通过注册来源、注册信息、行为内容等维度进行判断。如何防止机器批量注册?
来自:动态资讯 -
一种新型自研白盒密钥算法,让攻击者无迹可寻_网易易盾
本文基于移动端密钥使用和存储的痛点,介绍了一种自研的白盒加密方案,为保障移动应用内敏感信息、本地数据和传输数据的安全提供设计与应用思路一种新型自研白盒密钥算法,让攻击者无迹可寻
来自:动态资讯 -
整治通过谐音变体传播不良信息,一站式“文本纠错”交给AI_网易易盾
长期以来,平台用户为了躲避平台监管,在内容上采取“谐音”与“变种”等方式发布不良有害信息。“变体字”“谐音字”乔装打扮,也为色情暴力内容传播提供了便利,为低俗暧昧内容的传播提供可乘之机。整治通过谐音变体传播不良信息,一站式“文本纠错”交给AI
来自:动态资讯 -
3月第1周易盾业务风控关注 | 国家网信办:不得炒作社会热点敏感事件_网易易盾
易盾业务风控周报每周报道值得关注的安全技术和事件,包括但不限于内容安全、移动安全、业务安全和网络安全,帮助企业提高警惕,规避这些似小实大、影响业务健康发展的安全风险。3月第1周易盾业务风控关注 | 国家网信办:不得炒作社会热点敏感事件
来自:动态资讯 -
社交风控中遇到的问题,可以用这些手段进行“围追堵截”_网易易盾
越来越多APP被注入了社交属性,随着用户活跃进一步提升,这些平台也面临着私信骚扰、垃圾评论、虚假粉丝等问题,要想杜绝此类问题,从内容上进行防控就更难发挥效果,本文介绍了几种社交APP内容风控的手段。社交风控中遇到的问题,可以用这些手段进行“围追堵截”
来自:动态资讯 -
「译文」谷歌:用人工智能和集体智慧消灭“毒”评论_网易易盾
人工智能技术也被谷歌应用于解决内容型产品的成本、功能和可用性问题,其最新成果是借助机器学习模型评估网络会话影响的工具Perspective,第一个功能识别线上有毒(Toxic)评论已经上线。「译文」谷歌:用人工智能和集体智慧消灭“毒”评论
来自:动态资讯 -
金山世游:找专业的人,做专业的事_网易易盾
在游戏中,如何确保包括青少年在内的用户处于一个安全环境中,一直是玩家大量聚集的多类型游戏产品的关注点。金山世游坚持创造一个公平、文明、有序的游戏环境,让用户远离良价值观。金山世游:找专业的人,做专业的事
来自:动态资讯 -
践行“清朗” | 网易易盾生活服务行业内容安全专项解决方案_网易易盾
“清朗”专项行动是由中华人民共和国国家互联网信息办公室部署开展的专项行动。自2020年起至今,每年开展一次,旨在让网络空间这个亿万民众的精神家园“天清气朗”。践行“清朗” | 网易易盾生活服务行业内容安全专项解决方案
来自:动态资讯 -
借AI之力,网易易盾构建面向未来的数字安全体系_网易易盾
网易数智副总经理、网易易盾总经理朱浩齐分享了网易易盾面向AI未来的数字安全体系建设经验,并带来了面向数字内容风控场景下的安全垂域大模型。借AI之力,网易易盾构建面向未来的数字安全体系
来自:动态资讯