中文站

怎么实现图片鉴黄?

早期的图片鉴黄大部分是简单粗暴的人工审核,是劳动密集型工种。但是随着图像数量的增加,人工审核成本越来越高,因此采用机器+人工的方式鉴黄就成为了主流。


机器+人工的方式一般是先通过机器过滤出大部分一定正常和一定有问题的图像,剩下的再交给人工进行审核,这样可以大幅度降低人力成本,而且机器识别效果越好,人工审核成本越低。

机器鉴黄其实是比较宽泛的概念,可以是通过规则系统来实现,比如基于MD5、基于用户的IP等信息设置黑名单库,直接基于规则进行拦截。当然大部分还是会采用算法模型,也就是用算法模型判断一张图像中是否包含色情信息,本质上就是图像识别。图像识别作为人工智能热潮下的宠儿,这几年的发展可谓日新月异,主要经历了深度学习兴起前手工设计特征到深度学习时代通过网络学习特征的过程,目前在部分任务上的效果甚至超越了人类。

图像识别中最常见的就是图像分类算法,从AlexNet到VGG,从ResNet到DenseNet,目前的图像分类算法可以较为准确地区分ImageNet的1000类数据,鉴黄本身也是对输入图像做分类,因此采用图像分类算法就是顺其自然的事。其次,目标检测算法可以用来检测色情图像中的露点部位,也是比较可靠的手段。此外,还有基于业务层面构造的特征和逻辑,比如是否有人、皮肤的面积等,用来辅助判断,在一些情况下确实是有效的。

经过多年的数据积累和算法沉淀,目前智能鉴黄的识别效果可以做到非常准确了,今后需要做的更多的是针对边界数据的识别优化,比如色情挑逗、极度暴露、情趣用品等。比如网易易盾的内容安全服务,覆盖了图像、视频、文本、语音等各类形态的多媒体信息内容,通过先进人工智能算法对黄播信息进行全方位检测,2019年先后获得了两次最佳内容服务商奖,可以免费试用。点击免费体验网易易盾图片智能鉴黄服务

更多图片鉴黄相关内容,可以通过以下文章了解:

人工智能图片鉴黄原理和应用

智能鉴黄原理是什么?人工智能鉴黄靠谱吗?

「译文」YouTube鉴黄实践启示:技术升级不能停止

他们要消失了吗?探访人工智能浪潮下的鉴黄师

用网易易盾内容审核系统,修炼出的鉴黄师“读心术”