批量文本过滤_网易智企·易盾

热门搜索：

如何高效检测过滤文本中敏感违禁等不良信息？_网易易盾

文本检测是网站反垃圾系统中最为常见的部分。因为文本垃圾信息无孔不入，而且种类繁多，我们必须通过自动化的反垃圾技术体系来提高效率、降低成本；自动化技术体系升级，让工作更轻松一些。如何高效检测过滤文本中敏感违禁等不良信息？
来自：动态资讯
知物由学 | “找茬”不如交给AI算法，细说文本纠错的多种实现途径_网易易盾

顾名思义，文本纠错就是将文本中有错误的地方进行纠正，错误类型包含错别字、缺失字、冗余字、词语搭配错误和语法错误等。目前也有一些开源的文本纠错工具，但其效果距离真正应用还有较大的差距。知物由学 | “找茬”不如交给AI算法，细说文本纠错的多种实现途径
来自：动态资讯
知物由学 | 易盾自研文本实时聚类技术，一网打尽社交网络中的同类有害内容_网易易盾

实际业务场景中，每天文本内容的数据量都在亿级以上，为了高效处理如此海量的数据，文本聚类技术的运用是必不可少的。所谓文本聚类，指的是将文本按照类别进行聚合，然后以类别为单位对文本进行处理或使用。知物由学 | 易盾自研文本实时聚类技术，一网打尽社交网络中的同类有害内容
来自：动态资讯
使用Docker Swarm搭建分布式爬虫集群_网易易盾

本文使用的是一个模拟爬虫的例子，任何可以批量运行的程序都能够用Docker Swarm运行，无论你用Redis还是Celery来通信，无论你是否需要通信，只要能批量运行，就能用Docker Swarm使用Docker Swarm搭建分布式爬虫集群
来自：动态资讯
解密UGC板块垃圾信息过滤_网易易盾

针对UGC板块垃圾信息过滤的问题，网易易盾给出了完美的解决方案。解密UGC板块垃圾信息过滤
来自：动态资讯
文本内容安全领域深度学习的六个主流应用方法_网易易盾

深度学习兴起之前相当长的一段时间内，基于机器学习的文本分类方法占据着文本分类领域统治地位。本文根据易盾文本算法团队在内容安全领域的实践经验，介绍一些深度学习模型以及对部分技术细节进行讨论。文本内容安全领域深度学习的六个主流应用方法
来自：动态资讯
如何检测过滤音频中违规内容？_网易易盾

音频产品因为使用场景多元、伴随性和碎片化，在当下快节奏的社会中，受到越来越多的用户欢迎。然而对音频的内容审核存在多个难点，比如说语音识别和声纹识别难、数据标注成本大等，给很多音视频平台的发展带来困扰。如何检测过滤音频中违规内容？
来自：动态资讯
利用 DFA 算法实现文字过滤_网易易盾

在实现文字过滤的算法中，DFA是唯一比较好的实现算法。DFA 全称为：Deterministic Finite Automaton，即确定有穷自动机。DFA 算法实践敏感词过滤利用 DFA 算法实现文字过滤
来自：动态资讯
网站注册时为什么要设置输入验证码？_网易易盾

注册网站时，会需要通过短信验证码来验证用户真实性，防止机器批量注册。否则很多广告机器人会在社区、论坛型网站批量注册账号，然后发垃圾帖，给论坛管理造成很大的困扰，增添大量工作。网站注册时为什么要设置输入验证码？
来自：动态资讯
论坛管理如何高效过滤广告贴？_网易易盾

因此，广告贴过滤对社区论坛的运营非常重要。论坛管理如何高效过滤广告贴？
来自：动态资讯

相关搜索：

产品 / 解决方案推荐