-
尝试用ChatGPT制造网络垃圾:从诈骗,谣言到黄暴_网易易盾
随着数字技术的开源开放,AIGC技术研发门槛、制作成本等不断降低,致使互联网内容生态更加鱼龙混杂,泥沙俱下。在ChatGPT走红掀起的新一轮的AIGC浪潮中,内容审核也应被推向新的技术高度。尝试用ChatGPT制造网络垃圾:从诈骗,谣言到黄暴
来自:动态资讯 -
「译文」Facebook:AI正在长大,对抗暴力直播仍需人海?_网易易盾
人工智能AI算法对Facebook较为成熟的内容安全系统贡献巨大。AI技术在暴力视频面前究竟能发挥多大的用处?Facebook针对AI失效的状况启动了哪些应对措施?对抗暴力视频,只能靠人海战术吗?「译文」Facebook:AI正在长大,对抗暴力直播仍需人海?
来自:动态资讯 -
论坛社区运营如何防止恶意发帖灌水?_网易易盾
社区将某一领域的人群聚集,出于某些目的,恶意广告发帖和灌水非常常见,本文介绍几种常见防恶意灌水的方法。论坛社区运营如何防止恶意发帖灌水?
来自:动态资讯 -
优惠券设置如何防止被薅羊毛?_网易易盾
1月20日,拼多多百元通用优惠券的营销推广出现重大漏洞,从多个渠道了解,此次漏洞,拼多多至少损失数千万。羊毛党已经进化成一个极其庞大的组织,侵害厂商和用户的利益。本文介绍了优惠券设置如何防止被薅羊毛。优惠券设置如何防止被薅羊毛?
来自:动态资讯 -
写在网易易盾八周年:我眼中的网络安全工作_网易易盾
“哪有什么岁月静好,不过是有人替你负重前行”。安全,就是这么一个静水流深,默默奉献的行业。写在网易易盾八周年:我眼中的网络安全工作
来自:动态资讯 -
《App违法违规收集使用个人信息行为认定方法》正式发布_网易易盾
近日,国家网信办秘书局、工信部办公厅、公安部办公厅、市场监管总局办公厅四部门联合印发了《App违法违规收集使用个人信息行为认定方法》,为监督管理部门认定App违法违规收集使用个人信息行为提供参考。《App违法违规收集使用个人信息行为认定方法》正式发布
来自:动态资讯 -
《中国信息安全》刊登网易易盾朱浩齐长文:技术驱动网络暴力治理_网易易盾
本文是网易易盾总经理朱浩齐在《中国信息安全》杂志上发表的专题文章,探讨了网络暴力的定义、成因、治理现状以及未来发展趋势,并提出了政企联动、技术应用和网络平台实践的可行方案,旨在构建清朗、健康的网络空间《中国信息安全》刊登网易易盾朱浩齐长文:技术驱动网络暴力治理
来自:动态资讯 -
等保2.0来了,你该为等保2.0做这些万全准备(一)_网易易盾
2019年5月13日,国家市场监督管理总局、国家标准化管理委员会召开新闻发布会,等保2.0相关的国家标准正式发布,它们都将于2019年12月1日正式实施。等保2.0来了,你该为等保2.0做这些万全准备(一)
来自:动态资讯 -
国家互联网信息办公室发布《互联网用户账号信息管理规定》_网易易盾
《互联网用户账号信息管理规定》已经2022年6月9日国家互联网信息办公室2022年第11次室务会议审议通过,现予公布,自2022年8月1日起施行。国家互联网信息办公室发布《互联网用户账号信息管理规定》
来自:动态资讯 -
内容审核,靠人工还是靠机器?_网易易盾
互联网的UGC内容审查方向均在走向人工强干预,真正靠AI审核内容可能还需要5-10年的窗口期。各类音视频、社交平台只有坚持以正确的价值观引导人工审核,辅之以机器协助,才能真正将自己的社会责任落到实处。内容审核,靠人工还是靠机器?
来自:动态资讯