-
如何高效检测过滤文本中敏感违禁等不良信息?_网易易盾
文本检测是网站反垃圾系统中最为常见的部分。因为文本垃圾信息无孔不入,而且种类繁多,我们必须通过自动化的反垃圾技术体系来提高效率、降低成本;自动化技术体系升级,让工作更轻松一些。如何高效检测过滤文本中敏感违禁等不良信息?
来自:动态资讯 -
知物由学 | “找茬”不如交给AI算法,细说文本纠错的多种实现途径_网易易盾
顾名思义,文本纠错就是将文本中有错误的地方进行纠正,错误类型包含错别字、缺失字、冗余字、词语搭配错误和语法错误等。目前也有一些开源的文本纠错工具,但其效果距离真正应用还有较大的差距。知物由学 | “找茬”不如交给AI算法,细说文本纠错的多种实现途径
来自:动态资讯 -
使用Docker Swarm搭建分布式爬虫集群_网易易盾
本文使用的是一个模拟爬虫的例子,任何可以批量运行的程序都能够用Docker Swarm运行,无论你用Redis还是Celery来通信,无论你是否需要通信,只要能批量运行,就能用Docker Swarm使用Docker Swarm搭建分布式爬虫集群
来自:动态资讯 -
解密UGC板块垃圾信息过滤_网易易盾
针对UGC板块垃圾信息过滤的问题,网易易盾给出了完美的解决方案。解密UGC板块垃圾信息过滤
来自:动态资讯 -
知物由学 | 易盾自研文本实时聚类技术,一网打尽社交网络中的同类有害内容_网易易盾
实际业务场景中,每天文本内容的数据量都在亿级以上,为了高效处理如此海量的数据,文本聚类技术的运用是必不可少的。所谓文本聚类,指的是将文本按照类别进行聚合,然后以类别为单位对文本进行处理或使用。知物由学 | 易盾自研文本实时聚类技术,一网打尽社交网络中的同类有害内容
来自:动态资讯 -
文本内容安全领域 深度学习的六个主流应用方法_网易易盾
深度学习兴起之前相当长的一段时间内,基于机器学习的文本分类方法占据着文本分类领域统治地位。本文根据易盾文本算法团队在内容安全领域的实践经验,介绍一些深度学习模型以及对部分技术细节进行讨论。文本内容安全领域 深度学习的六个主流应用方法
来自:动态资讯 -
网站注册时为什么要设置输入验证码?_网易易盾
注册网站时,会需要通过短信验证码来验证用户真实性,防止机器批量注册。否则很多广告机器人会在社区、论坛型网站批量注册账号,然后发垃圾帖,给论坛管理造成很大的困扰,增添大量工作。网站注册时为什么要设置输入验证码?
来自:动态资讯 -
利用 DFA 算法实现文字过滤_网易易盾
在实现文字过滤的算法中,DFA是唯一比较好的实现算法。DFA 全称为:Deterministic Finite Automaton,即确定有穷自动机。DFA 算法实践敏感词过滤利用 DFA 算法实现文字过滤
来自:动态资讯 -
如何检测过滤音频中违规内容?_网易易盾
音频产品因为使用场景多元、伴随性和碎片化,在当下快节奏的社会中,受到越来越多的用户欢迎。然而对音频的内容审核存在多个难点,比如说语音识别和声纹识别难、数据标注成本大等,给很多音视频平台的发展带来困扰。如何检测过滤音频中违规内容?
来自:动态资讯 -
论坛管理如何高效过滤广告贴?_网易易盾
因此,广告贴过滤对社区论坛的运营非常重要。论坛管理如何高效过滤广告贴?
来自:动态资讯