硅谷程序员日常(从露营到)(1)

文/Alexandra S. Levine

美国人越来越多地使用被称为“算法黑话”(algospeak)的暗号来逃避内容审核技术的检测,尤其是在发布有争议或可能违反平台规则的内容时。

如果你看到有人在社交媒体上发布关于“露营”的帖子,他们很有可能不是在谈论如何搭帐篷或去哪个国家公园。这个词最近成了一个“算法黑话”,在很多时候指的是跟它本意完全不同的东西:在最高法院推翻罗伊诉韦德案之后讨论与堕胎有关的话题。

美国的社交媒体用户正在越来越多地使用暗语、表情符号和刻意打错的单词——也就是所谓的“算法黑话”——来避免在发布敏感或可能违规的内容时被审核AI检测到。加拿大公司Telus International负责监督人工智能数据解决方案的Siobhan Hanna表示,“露营”只是被以这种方式改编的短语之一。该公司向包括TikTok在内的几乎所有主要社交媒体平台提供人工和AI内容审核服务。Siobhan Hanna说,“有人担心算法可能会检测到他们对‘堕胎’的提及。”

Telus International上个月对1,000个美国人进行的调查显示,有超过一半的美国人表示,随着人们对政治、文化或全球事件看法的两极分化,他们看到对算法黑话的使用有所增加。数据显示,在社交媒体和游戏网站上,有近三分之一的美国人表示,他们会“使用表情符号或替代短语来绕过被禁词汇”,比如那些带有种族主义色彩、性暗示或与自残有关的词汇。Siobhan Hanna说,算法黑话最常被用来规避禁止仇恨言论的规定,包括骚扰和霸凌,其次是关于暴力和剥削的政策。

自从“pr0n”和茄子表情符号出现以来,人们在算法黑话领域已经走过了很长一段路。这些不断演变的变通方法给科技公司及其雇佣的第三方承包商带来了越来越大的挑战。虽然机器学习可以发现明显的冒犯性内容,比如仇恨言论,但对于人工智能来说,要从一些人看来无伤大雅、但在另一种情况下具有更险恶含义的委婉表达或字里行间解读出它们的意思可能要困难得多。

例如,“芝士披萨”这个词已经在提供儿童露骨图片交易的账户中广泛采用,玉米表情符号则经常被用来谈论或试图引导人们观看色情作品。《福布斯》过去的报道也曾揭露过一些看似普通的句子中包含的双重含义,比如“触摸天花板”这个词会被一些人用来哄骗年轻女孩向她们的追随者抛媚眼和炫耀她们的身体。

Siobhan Hanna在接受《福布斯》采访时表示:“我们最关心的领域之一是儿童剥削和人类剥削。”这是因为它们是“算法黑话里发展最快的领域之一”。

但Hanna表示,某些算法黑话是否应该被删除或降级,并不是由Telus International公司决定的。她说,正是那些社交媒体平台“制定了指导方针,并就哪里可能出现问题做出了决定”。

“我们通常不会在内容上做出激进的决定。”她告诉《福布斯》。“他们实际上是由我们的客户推动的,而这些客户是社交媒体平台的所有者。我们真的是在代表他们行事。”

Siobhan Hanna举例称,Telus International在重大的政治或社会时刻不会取缔算法黑话,“露营”就是一个例子。该公司也拒绝透露是否有客户禁止了某些算法黑话。

Siobhan Hanna说,“露营”一词在最高法院裁决后24小时内出现,并在接下来的几周内激增,但它作为一种算法黑话的现象正在逐渐消失,“因为它变得如此无处不在,以至于它不再是一个真正的黑话了。”这就是算法黑话的典型演化方式:“它会激增,然后获得很多关注,之后开始成为一个梗,接着就会消失。”

Siobhan Hanna还指出,在俄乌战争期间,社交媒体上也出现了新的黑话形式,例如,发帖者会使用“unalive”这个词来避免在同一个句子中提到“killed”和“soldiers”,从而逃避人工智能对检测。她还说,在游戏平台上,算法黑话经常被嵌入用户名或“玩家标签”中,作为他们的政治声明。因此,尽管这可能看起来“有点晦涩,但在那些关系非常紧密的社区里,用你的用户名发表言论实际上可能是一个非常具有政治色彩的声明。”

Telus International预计,在即将到来的中期选举期间,网络算法黑话的使用将会增加。

其他避免被人工智能审查的方法包括故意拼错单词,或者用符号和数字替换字母,比如用“$”替换“S”,用数字0替换字母“o”。许多在TikTok上谈论性(sex)的人也会用“seggs”或“seggsual”来指代它。

Siobhan Hanna说,在算法黑话里,表情符号“非常普遍地被用来代表其最初没有指明的东西”。在某些情况下,这可能有些不怀好意,但也无伤大雅,例如螃蟹的表情符号正在英国流行起来,因为人们用它作为对伊丽莎白女王去世的一种乖戾反应的隐喻。但在其他情况下,一些算法黑话蕴藏着更大的恶意:据Siobhan Hanna透露,忍者表情符号在某些情况下被用作针对黑人社区的贬义词和仇恨言论。

用来监管社交媒体的法律很少,内容审核也是政府最具争议的科技政策问题之一。美国的两党分歧阻碍了《算法问责法案》(Algorithmic Accountability Act)这样的立法,而该法案旨在确保人工智能(如支持内容审核的人工智能)以一种道德、透明的方式得到管理。在缺乏监管的情况下,社交媒体巨头和他们的外部审核公司一直在单打独斗,但专家们已经对这种情况提出了担忧,并呼吁对其进行审查。

对Telus International来说,它同时提供人工和AI辅助这两种内容审核服务,而超过一半的调查参与者强调,让人工参与进来“非常重要”。

“人工智能可能无法察觉人类所能察觉的东西。”一位受访者写道。另一位受访者则写道:“人们非常善于避开内容过滤器。”

,