[新闻简报] 中国AI审查系统开外挂:原来它是这样抓“敏感词”的
从农村贫困、官员腐败到讽刺军事演习,这些内容通通被塞进一个未具名的大型语言模型里。它不是拿来写作文的,而是用来识别对体制“不够友善”的言论。讲白了,就是用AI搞审查,而且效率比传统人工快上十倍以上。
为什么值得关注
这不仅是技术升级,更是AI被武器化的经典案例。对于想打进中国市场的科技公司来说,这类工具可能变成新的合规门槛;而对倡议言论自由的人来说,这背后的影响可能比“翻墙”还狠,甚至连讽刺都容不下。
关键点整理
- 数据集包含约13.3万条敏感内容样本,涵盖警察腐败、政治讽刺、军事信息外泄等。
- 所有数据被输入AI模型,用来训练其识别“政治敏感”内容的能力。
- 数据由安全研究员 NetAskari 发现,储存在未加密的百度服务器上,开放到任何人都能抓。
- 涵盖议题极广:台湾、污染抗议、食品安全、金融诈骗、宗教信仰,甚至连“树倒猢狲散”这种权力转移的成语都被列为审查目标。
- 部分输入内容使用与ChatGPT类似的提示语格式,显示该系统为现役运行中。