互联网将不会说英语的(亚裔美国)人排除在外 - iYouPort

2021-07-22 原文 #iYouPort 的其它文章

互联网将不会说英语的(亚裔美国)人排除在外

  • 这是一个重要的议题。但它绝对不能局限于亚裔美国人

我们从来都鼓励人们学习多种语言,这是为有助于打开您的思考方式的多样性。学习会充满乐趣。但是,人们必需能够享有不学习其他语言的权利,这一权利必需能满足人们的需求以获得平等的机会,而不依靠多语种能力的特权。

不论是维族人拒绝学习汉语、加泰罗尼亚人拒绝说西班牙语、还是互联网使用者拒绝学习英语,他们都应该获得与汉语、西班牙语、英语使用者同样的充分的服务和信息; 巴基斯坦人如果拒绝学习中文 也应该获得与中文使用者同等的工作机会。这就是人权。

这不是任何新想法,它是一场持久的运动,名为 “语言正义” 运动,在互联网时代它必需必然进入数字领域,成为 反数字殖民主义 的重要部分。

因为它是一个重要的议题。

本文来自MIT,在上述议题下这篇文章已经显得格外肤浅,它只是蹭了一个反亚裔种族主义浪潮的 “热点”,在触及到上述真正的问题方面,一带而过。

但您应该理解这一问题,做为反抗运动的战略重点之一。

詹妮弗·熊(Jennifer Xiong)用一个夏天的时间帮助在加州的苗族人在美国总统选举中登记投票。苗族是一个来自中国、越南、老挝和泰国山区的民族,但没有自己的国家,而熊女士是弗雷斯诺的苗族创新政治组织(HIP)的志愿者。

美国大约有30万苗族人,她花了几个小时打电话给银行,并在苗族广播和电视频道上做广告。这是一项鼓舞人心的工作。她说:“这对我来说是一件全新的事。年轻的、进步的、主要是女性在我们的社区做这种工作是非常罕见的,我知道这将是一个巨大的成就。” 从各方面来看,这确实是一个巨大的成就。在2020年的选举中,亚裔美国人的投票率普遍很高,观察家们说苗族公民的投票率是他们记忆中最高的。

但熊说,这也是难以置信地令人沮丧的经历。

虽然苗族人与美国有着长期的联系  — — 许多人在越战期间被招募来支持美国后被鼓励移民到太平洋彼岸,但他们往往被排除在主流政治话语之外。一个例子,在弗雷斯诺县的登记网站上,关于选民登记的页面有一个选项,可以将整个页面翻译成苗语,但是,熊说,很多信息都翻译错了。

而且,它从一开始就是这样的。她说,原本应该是 “你好” 或 “欢迎” 的苗语部分显示的却是别的东西,比如 “法官” 或 “女王” 或 “国王”。

看到如此简单的事情做不对,让人感到沮丧和反感。她说:“这不仅可能是通过谷歌自动翻译的结果,甚至没有经过同行的编辑和检查,以确保流畅性和连贯性。

熊说,这种粗心大意的情况在网上很常见,这也是她和苗族社区的其他人感到被排斥在政治之外的原因之一。

他们并不是唯一感觉到数字世界不是为他们而建的人。互联网本身就是建立在英语优先的架构之上的,在美国主持公共讨论的绝大多数大型社交媒体平台也都是英语优先。

随着技术成为在美国公民空间的代名词,英语的首要地位被放大了。对于亚裔美国人来说,向数字化的转变意味着对民主机构的访问 —— 从投票登记到当地新闻的一切 —— 都受到了语言障碍的阻碍。

这也是卫生保健方面的一个问题。在大流行期间, 当黑人、西班牙裔和原住民病人住院或死亡的可能性比白人病人高两到三倍时,这些障碍增加了另一个负担。 波士顿布里格姆妇女医院发现,不会讲英语的病人死于冠状病毒的可能性比讲英语的病人高出35%。 翻译问题并不是唯一的问题。熊说,当苗族用户试图进行疫苗预约时,他们被要求提供他们的星座作为一个安全问题 —— 尽管这个社区的许多人都不熟悉西方的占星术。

在正常情况下,克服这些挑战已经很复杂了,因为亚裔美国人是美国语言最多样化的族裔群体。但是,在经历了现实世界和网上对亚裔美国人的攻击急剧增加的一年后,这种情况以另一种方式变得紧迫。

“他们无法识别虚假信息”

促进亚洲人和太平洋岛民公民参与的非营利组织 APIAVote 的执行董事克里斯蒂娜·陈说, 在美国,政治生活对亚洲人来说一直是 “排他性的”,但 “有了数字空间,它甚至更具挑战性。被孤立无援是如此的容易”。

像 Facebook、Twitter 和 YouTube 这样的大平台在亚裔美国人中很受欢迎,像微信、WhatsApp 和 Line 这样的信息应用也是如此。人们使用哪种沟通渠道往往取决于他们的种族。在选举活动中,陈专注于建立一个志愿者网络,可以进出这些孤岛,以实现最大的影响。当时,针对亚裔美国人的虚假信息在微信群、Facebook 和 Twitter 上大行其道,而在这些地方, 非英语语言的事实核查效果很差。

APIAVote 的志愿者们会加入各个平台的不同群组,在鼓励成员投票的同时监测虚假信息。志愿者们发现,例如,越裔美国人成为了 “乔·拜登是社会主义者” 这一虚假消息攻击的目标,利用了他们对共产主义的恐惧;这与针对古巴裔美国人的政治信息类似。

陈说,虽然 Facebook、Twitter 和其他公司的内容审核政策成功地过滤掉了一些最明显的英语虚假信息,但当这些虚假信息以其他语种出现时,该系统往往会错过这些内容。这项工作不得不由像她的团队这样的志愿者来完成,他们接受了培训,寻找虚假信息、化解它,至少尽量减少其传播。她说:“那些旨在捕捉某些词语和东西的事实核查机制,在不同语种的情况下就不会有效了”。

谷歌的翻译服务和技术,如 Translatotron 和实时翻译耳机,使用人工智能来转换语言。但是,熊发现这些工具对于苗族人来说是远远不够的,因为苗语是一种非常复杂的语言,语境是很重要的。“我认为我们已经变得非常自满,太过依赖像谷歌这样的先进系统”,她说,“他们声称自己是 ‘语言无障碍’,而你读读就知道了,它说的是完全不同的东西。”

谷歌的一位发言人承认,小语种 “构成了更困难的翻译任务”,但他说,该公司已经 “投资于特别有利于低资源语言翻译的研究”,使用机器学习和社区反馈。

一路下滑

语言在线的挑战远非限于美国  — — 它必需从底层代码开始讨论。Yudhanjaya Wijeratne 是斯里兰卡智库 LIRNEasia 的研究员和数据科学家。2018年,他开始追踪僵尸网络,这些僵尸在社交媒体上的活动鼓励了针对穆斯林的暴力行为:当年2月和3月,僧伽罗佛教徒在安帕拉和康提等城市针对穆斯林和清真寺发生了一系列暴乱。他的团队记录了机器人的 “狩猎逻辑”,对数十万个僧伽罗人的社交媒体帖子进行了编目,并将这些发现带到了 Twitter 和 Facebook。他说: “这些大公司只会说各种好听的、善意的东西  — — 基本上是信口雌黄的声明。 比如在一份声明中,推特说它使用人工审查和自动系统来 “对服务中的所有人公正地应用我们的规则,无论其背景、意识形态或在政治光谱上的位置如何”。

当麻省理工学院技术评论联系时,Facebook 发言人说,该公司委托对该平台在斯里兰卡暴力事件中的作用进行了独立的人权评估,该评估于2020年5月公布,并在袭击事件发生后做出了改变,包括雇用了几十名讲僧伽罗语和泰米尔语的内容审查员。他们说:“我们在僧伽罗语中部署了主动的仇恨言论检测技术,以帮助我们更快速有效地识别潜在的违规内容”。

当机器人的行为继续下去时,Wijeratne 对这些陈词滥调产生了怀疑。他决定查看这些公司正在使用的代码库和软件工具,并发现监测大多数非英语语言的仇恨言论的机制尚未建立。

Wijeratne 说:“事实上,很多像我们这样的语言的研究根本还没有完成。我用三行英文 Python 代码就能做到的事,我花了两年时间研究2800万字的僧伽罗语,以建立核心语料库,建立核心工具,然后把它提升到能够进行文本分析的可能水平”。

2019年4月,自杀式炸弹袭击了斯里兰卡首都科伦坡的教堂后,Wijeratne 建立了一个工具,分析僧伽罗语和泰米尔语的仇恨言论和错误信息。该系统名为 Watchdog,是一个免费的移动应用程序,可以汇总新闻并对虚假消息附加警告。这些警告来自于接受过事实核查培训的志愿者。

Wijeratne 强调说,这项工作远远超出了翻译的范围。

他说:“许多我们认为理所当然的算法在研究中经常被引用,特别是在自然语言处理中,它们只是对英语显示出出色的结果。然而,许多相同的算法,即使用在只有几度之差的语言上 — — 无论是德语还是罗曼语系的语言,都可能得到完全不同的结果。”

自然语言处理是自动内容审核系统的基础。Wijeratne 在2019年发表了一篇论文,研究了它们在不同语言中的准确性之间的差异。他认为,一种语言存在的计算资源越多,如数据集和网页,算法就能更好地工作。来自较贫穷国家或社区的语言则处于不利地位。

“如果你要建造,比如说,英语的帝国大厦,你有蓝图。你有材料,你手头有一切,你所要做的就是把这些东西放在一起。而对于其他语言,你没有蓝图。你不知道混凝土会从哪里来。你没有钢铁,你也没有工人。因此,你将坐在那里一块一块地敲打,希望你的子孙可能完成这个项目”,他说。

根深蒂固的问题

提供这些蓝图的运动被称为语言正义,它并不新鲜。美国律师协会将语言正义描述为一个 “框架”,维护人们 “用自己喜欢的、觉得最能表达清楚和最有力量的语言来进行交流、理解和被理解” 的权利。

实现语言正义的道路是脆弱的。技术公司和政府服务提供商必须将其作为更高的优先事项,并投入更多的资源来实现它。而且,Wijeratne 指出,针对亚洲人的种族主义、仇恨言论和排斥,尤其是在美国,早在互联网出现之前就已经广泛存在。即使语言正义能够实现,也无法解决这些根深蒂固的问题。

但对熊女士来说,语言正义是一个重要的目标,她认为这对苗族社区至关重要。

选举结束后,熊在她的组织中担任了一个新的角色,寻求将加州的苗族社区与公共服务联系起来,如人口普查局、县政官员和疫苗登记。她的主要目标是 “满足社区的需要”,不管是在苗族电台还是通过 Facebook 的英语直播,然后将苗族人的观点放大到更广泛的公众。但是,她每天都要面对技术上的不平等,这种不平等将人们拒之于对话之外,并使他们无法获得资源。

平等将意味着 “在一个口译和笔译只是常态的世界里运作”,她说,“我们不问是否有足够的预算,我们不问它是否重要或有价值,因为当它出现在立法桌上和公共场所时,我们会优先考虑它。” ⚪️

The internet is excluding Asian-Americans who don’t speak English


文章版权归原作者所有。
二维码分享本站