数据投毒以抵制监视资本主义:这肯定不是一步到位的斗争,但也许能作为一小部分战术 - iYouPort

2021-07-28 原文 #iYouPort 的其它文章

数据投毒以抵制监视资本主义:这肯定不是一步到位的斗争,但也许能作为一小部分战术

  • 套用一个中文网络的流行句式:没有我们的数据,这些监视资本家什么都不是

每天,您的生活都会留下一大串数字面包屑,科技巨头们用它来追踪您。不论是您发送一封电子邮件,订购一些食物,还是播放一个节目。您的一举一动都会让他们得到宝贵的数据包,以建立对您的喜好和心理弱点的了解。这些数据被输入到机器学习算法中,以便操纵您 —— 从操纵您购买某款牙膏,到 操纵您的选举投票 谷歌 将您的数据兑现为每年超过1200亿美元的广告收入。

这就是 监视资本主义 的工作方式。关于具体他们是怎么做的,见《 单向镜的背后:监视资本家和政府的联手一直在如何折腾你? 》。

越来越多地,我们无法再选择退出这种安排。2019年,时任 Gizmodo 记者的克什米尔·希尔 (Kashmir Hill) 试图将五大科技巨头从她的生活中剔除 ,这很有名。她花了六个星期的时间,苦于无法完成基本的数字功能。 与此同时,这些科技巨头甚至没有感觉到任何瘙痒。

现在,西北大学的研究人员提出了纠正这种权力不平衡的新方法,将我们的集体数据作为谈判的筹码。 科技巨头们可能有花哨的算法,但如果没有足够的正确数据进行训练,这些算法就毫无意义

在3月举行的计算机协会公平、责任和透明度 会议上 ,研究人员提出了公众可以利用这一优势的 三种方式

1、 数据罢工 :受劳工罢工的启发,涉及扣留或删除您的数据,以便科技公司不能使用它 —— 例如,离开一个平台或安装隐私保护工具。比如我们在 列表-1 “技术防身” 中介绍的保护性工具。

但是请注意,在反监视资本主义的大战略下,这仅仅是防御性和被动的。

2、 数据投毒 :这涉及到提供无意义或有害的数据。例如, AdNauseam 是一个浏览器扩展,可以自动帮您点击提供给您的每一个广告,从而混淆谷歌的广告定位算法。

并不止于此,包括我们推荐的 “分身术”,只要有足够多的人去做,都可以一定程度上实现拉低数据经济的可行性。但依旧不够。

3、 有意识的数据贡献 :包括向您想要抵制的平台的竞争对手提供有意义的数据,例如将您的 Facebook 照片上传到 Tumblr。

但我们认为这不是好的方法,鉴于这些垄断的监视资本家反竞争的标准方法就是用收购灭掉小型的竞争对手,所以,转向竞争对手不会是解决方案。关于这点, 这里的分析 是适当可参考的。

人们已经使用了许多这样的策略来保护自己的隐私。如果您曾经使用过广告拦截器或其他类似的浏览器扩展、 使用运算符修改您的搜索结果 以排除某些网站,您就已经参与了数据战反击,并对您的数据的使用重新获得了一些代理权。

但是,正如希尔所发现的那样, 像这样零星的个人行动并不能让科技巨头改变他们的行为。

但是, 如果数百万人协调起来,向一家科技巨头的数据井投毒,会怎么样呢?这可能会给人们一些筹码来坚持自己的要求。

这方面可能已经有一些例子了。今年1月,在 Facebook 宣布将开始与公司其他部门共享 WhatsApp 数据后,数百万用户删除了他们的 WhatsApp 账户,转投 Signal 和 Telegram 等平台。这场大逃亡导致 Facebook 推迟了其政策变更。

3月,谷歌也宣布,它将停止在整个网络上跟踪个人。虽然这并不是任何真正的变化(见《 别傻了,谷歌永远不会给你隐私 》),但有可能像 AdNauseam 这样的工具的使用增加,降低了公司算法的有效性,促成了这一决定。当然,这最终很难说。就如研究人员所说: “真正知道数据杠杆运动对一个系统的影响有多大的人是科技公司自己”。

研究人员认为,这些运动可以补充政策宣传和工人组织等战略,以抵制科技巨头。

要使这些活动更加广泛,仍有工作要做。例如,计算机科学家可以在制造更多像 AdNauseam 这样的工具方面发挥重要作用,这将有助于降低参与此类策略的门槛。政策制定者也可以提供帮助。当得到强有力的数据隐私法的支持时,数据打击是最有效的,比如欧盟的《通用数据保护条例》(GDPR),它赋予消费者要求删除其数据的权利。虽然 该法律还远远不够 。如果没有这样的法规,就很难保证科技公司会让您选择擦除您的数字记录,即使您删除了自己的账户,数据也还在他们手里。

而且有些问题还有待解答。数据反击战需要多少人参与才能破坏一个巨头公司的算法?什么样的数据能最有效地毒害一个特定的系统?例如,在一个涉及电影推荐算法的模拟中,研究人员发现, 如果30%的用户罢工,可能会使系统的准确性降低50%。但是每个机器学习系统都是不同的,而且公司也在不断地更新它们。研究人员希望机器学习界的更多人能够对不同公司的系统进行类似的模拟,并找出它们的漏洞。

Alkhatib 建议,学者们也应该对如何激发集体数据行动做更多研究。“集体行动真的很难,让人们跟进正在进行的行动是一个挑战。然后还有一个挑战就是,你如何让一群人非常短暂地 — — 在这种情况下,可能是那些使用搜索引擎5秒钟的人 — — 把自己看作是一个真正可持续发展的社区的一部分?”

他补充说,这些策略也可能产生下游的后果,需要仔细检查。 数据投毒最终会不会只是给内容审查员和其他负责清理和标记公司训练数据的人增加更多的工作?

但总的来说,这些研究人员乐观地认为, 数据杠杆可以变成一个有说服力的工具,以影响科技巨头如何对待我们的数据和我们的隐私。“人工智能系统是依赖于数据的。这只是一个关于它们如何工作的事实。最终,这是公众可以获得权力的一种方式。”

以下是对 AdNauseam 的测评。如上所述,这是目前为止一个相对典型的技术型数据投毒工具。

一些活动家对监管机构无法有效制约谷歌的行为感到失望,于是自己动手。早在2014年,Daniel Howe、Mushon Zer-Aviv、和 Helen Nissenbaum 就发布了一个名为 AdNauseam 的浏览器扩展,自动点击网络广告,以干扰监视资本家的行为跟踪和分析。Nissenbaum 是康奈尔科技大学一个研究小组的负责人。

AdNauseam 是一种混淆视听的工具。 混淆战术是一种针对缺乏隐私保护的游击战方法。由于不可能躲避谷歌的监控,于是这些战术通过引入不准确或过度的信息来混淆它,并最终破坏它。

这并不是一个新的想法。正如尼森鲍姆与芬·布鲁顿在2019年的 一篇文章 中写道的:“我们身边有很多混淆视听的例子, 它可以是一些很简单的事,如在药店的购物车中添加额外的物品,以分散对可能带来不必要的判断的注意力。Tor浏览器聚集了用户的网络流量,因此没有任何个人能够脱颖而出,这也许是系统性混淆的最成功例子之一。”

AdNauseam 就像传统的广告屏蔽软件,但有一个额外的层次。当用户浏览一个网站时,它不只是删除广告,还自动点击广告。通过使用户看起来好像对一切都感兴趣, AdNauseam 使监视者难以构建对特定目标人的档案。这就像用虚假信号来干扰雷达一样。而且它是可以调整的。用户可以选择信任尊重隐私的广告商而干扰其他广告商;还可以选择是自动点击某个网站上的所有广告,还是只点击其中的一部分。

不出所料,谷歌并不喜欢 AdNauseam。2017年,它从其 Chrome 网络商店禁止了该扩展。2019年,尼森鲍姆在加州大学伯克利分校发表了关于 AdNauseam 的演讲后,人群中的怀疑者 — — 包括谷歌员工 — — 都否定了她的努力。他们说,谷歌的算法将很容易检测到并拒绝非法点击 — — AdNauseam 将无法与谷歌复杂的防御系统相抗衡。

尼森鲍姆将此视为一种挑战。她开始了一项研究工作,以测试 AdNauseam 是否能按设计运行。他们将发布一个网站,并在同一网站上以 “每次点击成本” 的方式购买广告  — — 这意味着广告商在用户每次点击广告时都要付费,因此可以看到 AdNauseam 产生的点击量是否记入了发布者的账上,并向广告商收费。

测试表明,AdNauseam 确实有效,大部分时间都是如此。但随着实验的发展,它变得比解决这个狭隘的问题更重要。 研究人员想要尝试了解谷歌利润丰厚的广告销售平台的黑匣子里到底发生了什么,这是该公司以外的其他人从未做过的。

实验的第一步是建立一个网站和一个 AdSense 账户。谷歌 AdSense 是一项销售服务,为那些没有能力自己吸引广告商的小型出版商提供。为了获得32%的佣金,谷歌负责处理网站流量货币化的整个过程:它销售广告,计算印象和点击量,收集和支付款项,并保持对欺诈的警惕。如果尼森鲍姆演讲中的怀疑论者是对的,意味着 AdSense 应该嗅到 AdNauseam 点击量中的猫腻,并将它们扔回海里。

接下来,研究人员创建了一个活动,使用谷歌广告(Google Ads)在网站上做广告,谷歌广告对广告商的作用就像 AdSense 对出版商的作用一样。小广告商告诉谷歌他们想接触什么样的人以及他们愿意支付多少钱,然后谷歌监视所有人,并在目标人群浏览一系列网站时找到他们。在这种情况下,广告活动被设定为只在这个测试网站上运行,并出价超过任何竞争的广告商。之所以这样设置,是因为研究人员想要小心翼翼地避免从中获利,或将不知情的旁观者卷入这场实验。

现在研究人员站在广告交易的两边,准备从头到尾观察一次广告点击的生命周期。他们邀请了个别志愿者下载 AdNauseam 并访问那个实验网站。很快,研究人员记录了几十次成功的 AdNauseam 点击 — — 记入研究团队的广告商账户,并记入出版商账户。AdNauseam 正在发挥作用。

但这只能证明,谷歌并没有阻止专门为实验招募的全新的 AdNauseam 用户所产生的第一次广告点击。为了让怀疑者闭嘴,研究人员需要测试谷歌是否会随着时间的推移学会识别可疑的点击。

因此,开始对那些已经使用 AdNauseam 一段时间的人进行了实验。对于任何一个长期监视的人来说,这些用户就像一个大拇指一样突出,因为在 AdNauseam 的默认设置下,他们似乎对他们看到的广告进行了100%的点击。用户可以调整点击率,但即使是10%,他们也会超出常规;大多数人点击显示广告的时间只有1%的一小部分。

这项测试的目的是检查谷歌是否会无视来自浏览器的 AdNauseam 点击,该浏览器长期以来有天文数字的点击率记录。如果谷歌的机器学习系统如此聪明,他们应该不难完成这项任务。

由自动Selenium浏览器收集的AdNauseam广告拼图

研究人员以两种方式测试了这一点。

首先,用人:研究人员招募了 AdNauseam 的长期用户到这个实验网站;还邀请了 AdNauseam 的新用户在正常浏览网页的过程中使用点击软件一周,以便建立历史记录,然后参与测试。

其次,用软件:用一个叫 Selenium 的软件工具进行了自动测试,它可以模拟人类的浏览行为。使用 Selenium,研究人员引导装有 AdNauseam 的浏览器自动浏览网页,在各个网站和页面上导航,暂停、滚动,并在途中点击广告。

基本上,这让研究人员迅速建立起了大量点击活动的记录,同时严格控制可能与谷歌是否将点击归为 “真实” 有关的变量。研究人员设置了四个这样的自动浏览器,分别运行了一天、两天、三天和七天。

在每个时期结束时,研究人员将浏览记录发送到实验网站,看看 AdSense 是否接受它们的点击为合法。例如,运行了七天的 Selenium 浏览器,点击了900多个谷歌广告,总共有近1200个广告。如果谷歌的系统确实对可疑的点击行为很敏感,这应该是敲响了警钟。

大部分测试都很成功。谷歌通过运行了三天的自动浏览器过滤掉了对这个实验网站的点击;但是,它没有过滤掉绝大多数其他点击,无论是普通的 AdNauseam 用户,还是在自动测试中,浏览器每天点击超过100个谷歌广告。简而言之,谷歌的高级防御系统对 AdNauseam 的典型点击行为并不敏感。

很快,研究人员的 AdSense 账户中就有了100美元,足以让谷歌邮寄一张支票了。这笔钱并不是不义之财,无论如何。这只是拿回了研究者自己投资在广告商账户中的钱 — — 除去给谷歌的32%分成。研究人员决定不兑现支票,只要知道实验证明了至少现在 AdNauseam 是有效的就够了。这张支票就像一张成功的证书。

尽管如此,这次实验依旧无法回答其他一些重要问题。 如果你使用 AdNauseam,它的点击量如何影响谷歌在你身上建立的档案?AdNauseam 是否成功地屏蔽了个人,以及他们可能被分到的人群,使他们不被作为定位的目标?毕竟,即使你使用了这个扩展,谷歌仍然可以从你的电子邮件、搜索历史和其他来源收集大量的数据。 即使是回答这次实验简单的原始问题 — — 该软件是否有效,也需要大量的努力。要回答其他问题,则需要在网络广告的更多节点上进行内幕访问。

事实上,甚至不能确切地知道为什么这次测试有效 — — 为什么谷歌没有发现这些 AdNauseam 的点击。这是技术上的失败还是意志上的失败?

技术失败意味着谷歌对自动广告点击的防御措施没有该公司声称的那么复杂。然而,尽管得出研究小组战胜了历史上最强大的公司之一的结论会让人受宠若惊,但这似乎很牵强。

一个更可能的解释是意志的失败。每次广告被点击,谷歌都能赚钱。如果广告商发现他们被收取虚假的点击费用,这当然会破坏他们对在线广告业务的信心。但是,广告商自己无法验证这些怀疑,除非他们能像研究人员那样,从市场的两端同时观察。但即使他们可以, 谷歌的市场主导地位 也使他们很难将业务转移到其他地方。

谷歌女发言人莱斯利·皮特森在一份声明中写道:“我们检测并过滤了绝大多数这种自动伪造活动。从一个小规模的实验中得出的结论不能代表谷歌先进的无效流量检测方法,也不能代表我们专门的技术、政策和运营团队每天为打击广告欺诈所做的持续工作。” 她补充说:“我们在检测无效流量方面投入了大量资金 — — 包括来自 AdNauseum [原文如此]等扩展程序的自动流量 — — 以保护用户、广告商和出版商,因为广告欺诈损害了生态系统中的每个人,包括谷歌。”

如果与皮特森的说法相反,这次实验的结果在规模上确实成立,这对广告商来说可能是坏消息,但对互联网用户来说是好消息。这意味着 AdNauseam 是普通人目前拥有的为数不多的防范侵入性剖析的工具之一。

尽管如此,这只是一个暂时的、不完美的防御措施。如果谷歌找到一种方法、或者有意愿来消除 AdNauseam,那么它的任何效用都可能是短暂的。 AdNauseam 可能会适应谷歌的反击,但军备竞赛显然会有利于谷歌。

政府和监管机构通常未能制定或执行防止商业监控的规则。诚然,最近的一些法律,如欧盟的《通用数据保护条例》(GDPR)和《加州消费者隐私法》,在一定程度上限制了公司向第三方出售或分享个人数据的能力。但是,这些法律 并没有 限制谷歌最强大监视资本家的能力。 事实上, 谷歌反而会从这些隐私法中受益 ,因为它们限制了竞争对手和客户获取其获得的数据的能力。谷歌一直在监视所有人,而广告商则更加依赖谷歌所知道的。

AdNauseam 并不能阻止谷歌这样做,但它确实让个人可以抗议这些监视和行为定位的循环,这些循环已经使大部分网络世界成为了隐私的噩梦。

混淆是一种抵抗行为,有助于削弱对跟踪和定位的信心,并削弱数据资料的价值,希望广告商和广告技术公司可能开始发现监视人们是不切实际的和无利可图的。

使用 AdNauseam 的另一个重要好处是, 在它成功混淆的程度上,它有助于保护每个人的隐私,而不仅仅是使用它的人。这是因为个人信息并不是严格意义上的个人信息;关于我的信息可以反馈到关于与我有联系的人或与我有共同点的所有人的推断中。 如果你和我去了相同的网站,营销人员可能会利用他们对我的了解来对你做出判断,也许会给你贴上有价值、有风险、或可能点击某个广告的标签。AdNauseam 用户通过掩饰他们自己的偏好,使谷歌更难对他们轨道上的其他人进行分析和评估。因此,监控广告的剖析和预测引擎变得不太可靠。

但是,在某些方面,怀疑论者是对的: 少数程序员和研究人员无法与技术巨头交锋。闭门造车不能替代有组织、有活力的反抗运动。 值得庆幸的是,一些政府正在对谷歌和 Facebook 提起反垄断诉讼,对公司的数据行为进行调查,对违法行为进行罚款,并努力加强对隐私的保护, 虽然罚款无法解决问题 。但现在,像 AdNauseam 这样的游击战术是我们这些被剥削者所拥有的武器。⚪️

We tested a tool to confuse Google’s ad network. It works and you should use it.


文章版权归原作者所有。
二维码分享本站