-
NLP 模型“解语如神”的诀窍:在文本分类模型中注入外部词典_网易易盾
面对复杂多变的文本表述,NLP 模型往往无法从有限的训练数据中获得足够的支撑,寻求外部知识注入就成为了一条必经之路。本文将基于网易易盾的实践经验,分享在文本分类模型中注入外部词典的一些经验知识。NLP 模型“解语如神”的诀窍:在文本分类模型中注入外部词典
来自:动态资讯 -
4月第2周易盾业务风控关注 | 四类网上有害内容将被大排查大扫除 _网易易盾
四类网上有害内容将被大排查大扫除;官司未决、处罚不断,“懂球帝”iOS和安卓双下架;中央发布重磅意见,数据首次正式被纳入生产要素范围,将制定数据隐私保护制度和安全审查制度4月第2周易盾业务风控关注 | 四类网上有害内容将被大排查大扫除
来自:动态资讯 -
OCR探索_网易易盾
OCR即字符识别,通俗的说就是将图片中有意义的文本信息识别出来。对于图片验证码的识别,通常分为几个步骤:图片预处理(二值化、去除干扰点)、字符分割、字符识别。OCR探索
来自:动态资讯 -
易盾牵头、工信部批准的行业标准,究竟长啥样?| 权威解读(内附标准免费下载)_网易易盾
网易易盾牵头编写的《信息内容识别技术 第 1 部分:基于文本识别的内容检测服务系统指标要求和评估方法》行业标准,获得正式批复,并于 2023 年 11 月 1 日正式实施。易盾牵头、工信部批准的行业标准,究竟长啥样?| 权威解读(内附标准免费下载)
来自:动态资讯 -
当鉴黄师是怎样的体验?_网易易盾
互联网飞速发展,网络上涌现出海量的文本、图片、语音和视频信息,黄色内容自带流量,于是就有不法分子想借此走捷径。鉴黄师的职责就是净化网络中的涉黄内容,本文采访了一位资深的鉴黄专家当鉴黄师是怎样的体验?
来自:动态资讯 -
如何识别文本中敏感词内容?_网易易盾
文本中敏感词识别,常规的方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本中敏感词内容?
来自:动态资讯 -
精准打击!让违规图片无所遁形的秘密是什么?_网易易盾
相较于文本信息,图片信息的识别难度更大。因此,图片为许多恶意用户所利用,成了不良有害信息的藏匿之地,这些图片的传播破坏了文明和谐的互联网内容生态,也大大增加了平台的违规风险。让违规图片无所遁形的秘密是什么?
来自:动态资讯 -
剖析一种短文本内容安全检测技术_网易易盾
本文介绍了短文本内容安全检测其中一小块的技术,实际应用中,网易易盾采用了更加复杂的模型和多套组合拳。如果对内容安全检测能力要求比较高的客户,可以免费体验网易易盾高效、智能的内容安全服务。剖析一种短文本内容安全检测技术
来自:动态资讯 -
花椒敏感词系统架构详细_网易易盾
直播系统内容监管是必不可少的一个环节,需要拦截词语包括涉政、非法、宗教、暴恐、版权等,以及平台需要拦截的包括竞品挖人、低俗、广告等垃圾词,本文从文本内容的管控角度介绍下花椒敏感词服务的定制和应用。花椒敏感词系统架构详细
来自:动态资讯 -
再造巴别塔,我们如何进行NLP跨语言知识迁移?_网易易盾
在实际应用中,使用大规模的预训练模型和平行数据实现基础迁移,再配合少量目标语言业务数据微调,可以实现更好的跨语言迁移效果。借助这一技术,易盾能够将中文内容检测能力迅速扩展到其他语种,全方位拦截垃圾文本 再造巴别塔,我们如何进行NLP跨语言知识迁移?
来自:动态资讯