中文站
  • NLP 模型“解语如神”的诀窍:在文本分类模型中注入外部词典_网易易盾

    面对复杂多变的文本表述,NLP 模型往往无法从有限的训练数据中获得足够的支撑,寻求外部知识注入就成为了一条必经之路。本文将基于网易易盾的实践经验,分享在文本分类模型中注入外部词典的一些经验知识。NLP 模型“解语如神”的诀窍:在文本分类模型中注入外部词典

    来自:动态资讯
  • OCR探索_网易易盾

    OCR即字符识别,通俗的说就是将图片中有意义的文本信息识别出来。对于图片验证码的识别,通常分为几个步骤:图片预处理(二值化、去除干扰点)、字符分割、字符识别。OCR探索

    来自:动态资讯
  • 如何识别文本中敏感词内容?_网易易盾

    文本中敏感词识别,常规的方法是关键词识别和算法规则。算法规则也叫规则引擎,主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让审核方法也束手无策。如何识别文本中敏感词内容?

    来自:动态资讯
  • 剖析一种短文本内容安全检测技术_网易易盾

    本文介绍了短文本内容安全检测其中一小块的技术,实际应用中,网易易盾采用了更加复杂的模型和多套组合拳。如果对内容安全检测能力要求比较高的客户,可以免费体验网易易盾高效、智能的内容安全服务。剖析一种短文本内容安全检测技术

    来自:动态资讯
  • 当鉴黄师是怎样的体验?_网易易盾

    互联网飞速发展,网络上涌现出海量的文本、图片、语音和视频信息,黄色内容自带流量,于是就有不法分子想借此走捷径。鉴黄师的职责就是净化网络中的涉黄内容,本文采访了一位资深的鉴黄专家当鉴黄师是怎样的体验?

    来自:动态资讯
  • 精准打击!让违规图片无所遁形的秘密是什么?_网易易盾

    相较于文本信息,图片信息的识别难度更大。因此,图片为许多恶意用户所利用,成了不良有害信息的藏匿之地,这些图片的传播破坏了文明和谐的互联网内容生态,也大大增加了平台的违规风险。精准打击!让违规图片无所遁形的秘密是什么?

    来自:动态资讯
  • 更适合文本分类的轻量级预训练模型_网易易盾

    本文将详细介绍一种基于预训练半监督的文本分类轻量型模型,即 VAMPIRE 模型,为解决由于大量数据和高昂计算力导致的资源不足问题提供一些思路。更适合文本分类的轻量级预训练模型

    来自:动态资讯
  • 再造巴别塔,我们如何进行NLP跨语言知识迁移?_网易易盾

    借助这一技术,易盾能够将中文内容检测能力迅速扩展到其他语种,全方位拦截垃圾文本 再造巴别塔,我们如何进行NLP跨语言知识迁移?

    来自:动态资讯
  • 杭研技术秀 | 短文本内容检测反垃圾技术_网易易盾

    本文针对短文本数据,作者采用了一种基于二元文法双词共现的概率统计建模方法,在色情-辱骂分类问题上取得了比传统LDA主题模型更优的效果,并且准确率和召回率指标能够随着主题个数的增加而稳定提高。 杭研技术秀 | 短文本内容检测反垃圾技术

    来自:动态资讯
  • 花椒敏感词系统架构详细_网易易盾

    直播系统内容监管是必不可少的一个环节,需要拦截词语包括涉政、非法、宗教、暴恐、版权等,以及平台需要拦截的包括竞品挖人、低俗、广告等垃圾词,本文从文本内容的管控角度介绍下花椒敏感词服务的定制和应用。花椒敏感词系统架构详细

    来自:动态资讯