谁在听?- 您应该小心音频转录服务 - iYouPort

2021-07-20 原文 #iYouPort 的其它文章

谁在听?- 您应该小心音频转录服务

  • 最好不要信赖那些隐私政策

很多人都在使用音频转录工具,而不仅仅是记者,甚至包括一些敏感人士在聚会讨论的情况下,本文希望提醒这件事有可能很危险。

当然,危险指数从来都是与您的个人 威胁模型 密切相关的 —— 如果与您对话的人是美国 吹哨人 ,您就绝对不应该使用硅谷公司的服务进行转录;如果与您对话的人是中国异议人士,您就绝对不应该使用中国的服务;公共人物如政客和明星,他们的风险指数是最低的,而反抗者、逃亡者等政府不喜欢的人,具有最高的风险指数。

同样的思考也适用于变声软件和照片编辑软件,您知道,毕竟您需要首先上传真实的声音和照片。

关于安全,您可以重温这里的介绍《 技术是愚蠢的 — 这就是为什么您应该格外小心:基本手册给行动者、敏感人士和任何期待安全的普通公民 》。

当迈克尔·利斯塔去马尼托巴省埃默森市一家孤独的单层汽车旅馆住了10天时,他的行李装得太多了。他的手提箱里装满了他最终没有穿的衣服。事实证明,他所需要的只是一点旅行必需品 — — 一条牛仔裤、一双靴子、一件风衣,以及最重要的,一台破旧的索尼录音机,其小型LED屏幕上有划痕,扬声器的缝隙里有灰尘。对于自诩为 “傻瓜” 的利斯塔来说,这个手掌大小的设备是他的宝贝;是他工作中最重要的一个工具。

他在汽车旅馆的房间地板上铺着一块磨损的绒毛地毯,米色的墙纸已经老化,脏兮兮的。不过利斯塔没有抱怨,原因有二:一是管理汽车旅馆的好心人每晚收费不到50美元。另一个原因是,枫叶汽车旅馆正是利斯塔想去的地方。他的目标是讲述他隔壁邻居的故事:寻求庇护者由于害怕特朗普的反移民制度,逃离美国,最终来到边境以北约200米的一个人口不到700的小镇。

利斯塔记录了像艾哈迈德这样的难民的故事。艾哈迈德是一名同性恋者,他在从厄瓜多尔到温尼伯南部的三年旅程中忍受了倾覆的移民船、致命的蜘蛛、被抢劫、还有监禁。他分享了一个名叫科菲的年轻人的故事,他担心被遣返回加纳。埃默森离美国边境如此之近,是一个充满了像这样的奥德赛式故事的小镇,这些人被迫越过法律的界限,以逃避他们祖国的危险。由于他们的故事经常涉及违反移民法,利斯塔有一个担忧:他是否会因为与他们交谈而使这些人处于危险之中?

这种担忧阐明了利斯塔的录音机的重要性。如果他在使用云存储的设备上录制采访,如手机或较新的笔记本电脑,利斯塔保存的数据,以及艾哈迈德的机密信息,可能最终会出现在硅谷的服务器上。如果美国政府选择传唤这些服务器上的信息,利斯塔将无能为力。简而言之,如果允许苹果(通过iCloud)或谷歌(通过Google Drive)访问他的采访,利斯塔认为他将无法履行作为一名记者的道德责任,无法保护其消息来源的机密性。

如果您错过了《 如何安全地留住证据:给真相的记录者一些技术技巧建议

他说,这种道德责任是记者和消息来源之间不言而喻的合同:作为分享他们的故事的回报,消息来源被承诺公平陈述和保护他们的信息。利斯塔说,无论披露的信息内容如何,记者对消息来源承诺的保密性,应该与牧师对忏悔者的保证或律师对其客户的保证没有区别。 自愿将这些信息提供给第三方公司是对这一承诺的放弃。随着最近数字工具的进步改变了新闻实践,利斯塔所描述的记者和消息来源之间的契约正在日益消退。

因此,利斯塔仍然坚信,作为一名记者,尤其是调查记者,他应该始终对他的录音设备采用隔离互联网的方法(类似 Whonix 的两个虚拟机的思考方式,在这里更简单,就是不让设备联网),其所有过程和存储方案都由设备本身完成。利斯塔的录音机就是一个例子: 它没有连接到互联网的能力,也不会自动与其他设备同步数据。

但是,隔离互联网只是保护源头机密性的一个步骤。利斯塔还有其他建议。如果可能的话, 他通过固定电话进行所有的电话采访,而不是手机,因为政府更有能力从手机中获取信息 (还因为固定电话的音质更高,可以进行更安静、更清晰、更亲密的对话,有助于与消息来源建立更多的友好关系)。 他避免使用基于云的文字处理器,如谷歌文档,而且他从来不会将他的采访上传到音频转录网站。

今天,转录是新闻工作的一个重要方面。把对话的全部内容写出来,或者打印出来,可以确保记者能够准确地引用消息来源,也就是逐字逐句地引用,并在被采访对象的原意范围内引用。对于记者来说,很少有像不准确的引用那样不可饶恕的罪过。为了使读者避免受到不准确的影响,作为职责所在,一些记者对自己的采访进行转录。

记者使用的转录方法是多种多样的。自由职业者伊莎贝尔·斯隆(Isabel Slone)戴着耳机回放整个录音,然后在键盘上打字;CBC的记者斯图·米尔斯(Stu Mills)更喜欢利用他的广播背景来发挥优势,他注意到他的采访对象什么时候说了一些适合做广播剪辑的内容,然后他提取那个特定的音频剪辑并进行转录。

这种多样性扩展到了一些新闻学的课堂。卡尔顿大学新闻学教授保罗·亚当斯(Paul Adams)教授了一项练习,给他的学生一长段采访内容,让他们逐字逐句地转录。但他并没有具体说明学生们应该如何去做。亚当斯注意到他的学生中有一个新趋势:他们对自动转录服务的依赖。

今天, 许多转录服务是基于人工智能的,用一种复杂的算法将语音解构为文本 。提供人工智能转录的公司,如 Trint、Otter.ai、Temi 和 Descript,使用机器学习来提高算法的准确性。

简单地说,这些服务通过解析用户数据来识别模式。他们要解析的用户数据越多,他们能识别的模式就越多,这导致了 “更好、更准确” 的最终结果。

关于音频转文字的小历史《 中国AI巨头让监视如此容易

通过这些平台进行转录有几个优势:它们可以在多种设备上访问  — — 记者可以在自己的电脑上上传采访,然后在手机上通过一个按钮访问转录。但人工智能转录的最大资产是它的速度:一小时的采访可以在几分钟内完全转录。

四年后,利斯塔还记得艾哈迈德的故事细节。艾哈迈德在他的祖国加纳因其性取向差点被殴打致死。他飞往厄瓜多尔,开始了前往美国的旅程,试图获得难民身份。在哥伦比亚,他被抢走了所有财物,只有一张出生证明的复印件和一点现金。当艾哈迈德最终到达美国时,他遭到监禁,并被命令返回加纳。 艾哈迈德的生活,以及利斯塔与之交谈的其他寻求庇护者的生活,是非常敏感的,如果利斯塔使用转录服务,就有可能让美国政府获得他的消息来源的身份。简单地点击一下 “上传” 按钮就能把艾哈迈德送回加纳,这并非不可能。

2017年初,艾哈迈德获得了难民身份,这将保护他在加拿大境外免遭迫害。利斯塔在报道这个故事时,也许是由于他坚定不移地认为来源信息必须得到保护,最终没有危害到他所采访的人的生命。 也许是利斯塔的方法 — — 他对录音设备进行了网络隔离,并拒绝在报道中使用联网的软件 — — 保护了艾哈迈德和其他人的人身安全。

可以避免这种风险吗?总部位于英国的人工智能翻译平台Trint向用户承诺,所有用户数据均采用AES 256加密,这是美国政府使用的一种众所周知的严格的加密算法。Otter.ai 在其隐私政策中包括,他们将 “不与他人分享个人信息或客户数据,除非客户按照书面指示或通过发送消息提出要求”。Descript 是一家位于旧金山的公司,承诺进行HTTPS加密,并声称雇用了一名 “数据保护官”。

利斯塔的索尼录音机 ……没有连接到互联网的能力,它不会自动与其他设备同步其数据。

但是,隐私和技术律师 Aaron Baer 警告说, 不要盲目相信公司作为其隐私政策和使用条款的介绍。Baer 说,问题有两个方面:首先,法律要求公司必需制定隐私政策,而使用条款几乎总是很宽泛,总是对公司有利;第二个问题是,不能保证公司遵守政策,甚至都不能保证他们知道自己的政策是什么,“现实是,你不知道你正在使用的任何应用程序或任何平台上,你的数据正在发生什么。”

2020年2月,据报道,美国官员表示,中国电信巨头华为通过后门访问,有能力从使用其设备的公司暗中获取数据。华为已经是世界上最大的电信硬件供应商之一,准备成为5G设备的全球领导者。这令人非常不安的原因是,基于人工智能的服务,如转录,很快将完全在5G网络和设备上进行,因为5G具有无与伦比的速度和效率。

华为总部设在中国,由于该国的情报法,华为在法律上有义务将获得的数据交给中国政府。除此之外,根据外交关系委员会的报告,中国政府 “对所有中国私营公司有相当大的影响力”,在2018年,甚至向华为提供了2.22亿美元的政府拨款。

换句话说,因为几乎可以肯定的是,像转录这样基于机器学习和人工智能的工具将很快完全在5G设备上运行,以及,华为正在宣称其在5G市场的主导地位,因此, 上传到这些服务的用户数据将面临被收集并交给华为和中国政府的风险。因此,转录服务的用户会合法地将源信息提供给华为和中国政府。 这就是为什么利斯塔将记者使用转录服务描述为疯狂的原因之一,他说,“这是对信息收集链的妥协 — — 允许华为进入5G网络,我无法相信人们还会使用转录服务。这是很不负责任的”。

对公司获取用户私人数据的担心并不只是一个未来主义的假设。 去年,谷歌承认,欧盟用户的1000多条私人对话被一家受雇分析语音片段的第三方公司泄露了。 这家科技巨头停止了在欧盟国家内通过其 Google Assistant 应用程序进行的语音转录。

这一事件揭示了数据隐私领域的复杂问题。 一家公司不仅泄露了仅为转录目的而上传的用户数据,而且还发现谷歌正在与隐藏的第三方分享未加密的信息。 这个案例体现了利斯塔的担忧:通过自愿或不自愿地允许访问来源信息,记者放弃了他们保护该来源的能力。更糟糕的是,在许多隐私政策中,包括 Otter.ai、Descript、Temi 和 Trint 的隐私政策, 都表示这些公司将遵守任何披露个人数据的法律义务。虽然这是隐私政策中的一个标准短语,但这恰恰是利斯塔所担心的:被当局传唤的可能性。

“记者需要比其他人更勤奋”,利斯塔说,“就像有人与他们的牧师、律师或医生交谈时一样,我们需要限定我们谈话的界限,不惜一切代价保护他们。”

世界领先的隐私专家 Ann Cavoukian 对自动转录的未来提出了一个更有希望的观点。Cavoukian 认为,消费者在使用数字公司提供的服务时,越来越意识到隐私问题。2009年,当她还是安大略省的信息和隐私专员时,她发表了一份文件,概述了隐私设计(PbD)的原则,这是一个工程概念,其中隐私是一个主要的关注点,并被嵌入到构建系统的每个阶段。她将PbD描述为能够为企业提供竞争优势,因为他们的客户积极寻求隐私。

隐私设计肯定会受到记者们的欢迎,因为它是一种保证政策 — — 他们的信息不会落入坏人手里。PbD是一个在现代网络数据系统中越来越流行的概念,包括转录服务。遵守PbD一些原则的转录服务的一个例子是 Descript。Descript 对他们的隐私保证过程是公开的,甚至在一个专门介绍其平台安全的网页上解释了该公司采用的加密方法。

同样,总部位于旧金山的 Otter.ai 的联合创始人兼首席执行官 Sam Liang 表示,他的公司致力于保护用户隐私。但是,正如 Cavoukian 和 Baer 所说,他承认, 使用该服务的记者最终只能依靠盲目的信仰,相信包括他在内的公司都在遵守他们制定的政策。当被问及他如何能真正保证用户的数据是安全的时,Liang 回避了这个问题,并将其与使用其他第三方网站如 Zoom 或 Dropbox 进行了比较(这等于承认不可靠)。 Liang 认为新闻业是作家、编辑和消息来源之间的合作媒介,在这种情况下,数据必须由不同方面不断快速传输和处理。由于这个原因,在新闻业使用第三方公司是一种常态。这也是事实。一些记者用第三方应用程序(如TapeACall)录制电话,或将录制的采访内容存储在 Dropbox 或 Google Drive 账户中。

因此,Baer 的警告是, 不管一个公司看起来多么值得信赖,用户永远无法真正知道自己的数据会发生什么。 转录服务中隐私的未来可能是光明的,但 Cavoukian 同意 Baer 的观点: 通过使用这些服务,记者将始终把他们与消息来源的对话留在那些大企业手中。 她回忆起一个早晨,她和《环球邮报》的一名记者秘密地交谈。Cavoukian 说:“如果我认为我对他说的话会被输入到一个转录服务中……我就不会和他说话!” 。“我不会给他任何信息。我为什么要那样做?记者和他的谈话对象之间必须要有足够的信任和尊重。”

如果 Cavoukian 和《环球报》的记者并不是在保密的情况下说话呢?如果他们谈论的是他们最喜欢的炒蛋方式或任何其他零敏感性的话题呢?敏感信息和非敏感信息之间的区别可能是由记者来决定的。亚当斯说,如果他采访一个 吹哨人 或处理一个性侵犯的报道,他会对隐私产生严重关切,但如果他采访一个像贾斯汀·特鲁多这样的公众人物,他的关切就会减少。

在采访主题甚至不在信息敏感度的假设范围内的情况下,使用转录服务的允许性就会从 “绝对不行” 减少到许多记者都熟悉的灰色地带。新闻问题往往可以被分解成关于道德的问题,而这些问题的答案往往是模糊的。Cavoukian 提出了一个关于同意的论点。她想知道,“为什么有人会向记者提供信息,如果这些信息可以在没有我同意的情况下传到任何地方?”

也许现在是时候让记者开始征求采访对象的同意了,如果他们打算将对话上传到第三方转录服务  — — 这是新闻业最佳做法清单上的另一个补充,就在确认采访将被记录在案之后。

如果您错过了《 您知道该如何培养和维持信任吗?- 管理信息源的有效方法:简易指南

或者,记者们应该寻求其他方法来准确引用他们的消息来源。他们可以使用 Slone 的方法,即拨号和打字。或者像米尔斯那样,把音频片段分离出来,只抄写某些内容。或者,他们应该更像利斯塔那样做,他根本就不转录。利斯塔是一个坚定的信仰者,他认为转录时会失去消息来源的语气和情感背景,他只是在他那台破旧的索尼录音机上按下回放按钮,将他想引用的内容直接输入报道。⚪️

Who’s Listening?


文章版权归原作者所有。
二维码分享本站