谷歌得越多,你知道得越少 - iYouPort

2021-04-29 原文 #iYouPort 的其它文章

谷歌得越多,你知道得越少

  • 如果你服从于这个只有答案的世界,你可能永远都摆脱不了应试教育的流氓了

【按】“谷歌知道”,这句话是老牌互联网原住民最耳熟能详的;但是否有人曾经问过这样的问题:“谷歌为什么会知道一切?”,或者说,“谷歌出的答案究竟是怎么来的?”

这篇文章着眼于这个问题,再一次告诉您 为什么您不应该依赖谷歌

它从哲学意义 —— 无所不知只是一种幻觉、到现实意义 —— 谷歌的一言堂算法只是为排斥竞争者而操纵你的认知而来的,两方面来讲述这一问题。我们很高兴地看到中国社会讽刺应试教育的 “正确答案”,但现在需要的是走出高墙学堂的人们能认识到:如果你服从于这个只有答案的世界,你可能永远都摆脱不了应试教育的流氓了。

本文的作者 Megan Marz 是 Baffler 的作者,写过很多书,他主要关注技术和社会学。本文以第一人称呈现。

在我运营一家脑瘤研究机构的推特账号的一年时间里,我的工作自然是发布关于脑瘤研究的文章。由于对脑瘤研究一无所知,我做了我能做的事:复制和粘贴研究人员研究报告中的行文。任何时候,我想改任何一个字,我都得去谷歌一下。我会写下:“组蛋白去乙酰化酶”,我查了一下 “HDAC” 的意思,但还是完全不知道它的科学意义。

辨别一项研究的哪一部分表达了它的主旨总是很容易的。它会以这句话开始:“我们的结论”,然后以这句话结束:“需要更多的研究”。 认识和模仿知识的形式并不需要对其内容有任何理解。

不理解实际上使我想象中的研究人员产生的知识更容易口技化。如果我有能力辨别研究问题是否有价值、研究是否设计得不好、科学家是否受到与制药公司关系的不当影响,我就不必处理我可能感到的内部摩擦了。由于我根本没有涉足他们的知识库,我看到的只是一个玻璃般的、不受干扰的简单事实的表面。

“这里将只有答案” ,作家玛格丽特·杜拉斯(Marguerite Duras) 在1985年的采访中说 ,当时一个电视节目要求她对2000年做一个预测,她就是这样回答的, “需求将是这样的,将只有答案。所有的文字都将是答案 …… 关于[人的]身体、肉体的未来、健康、家庭生活、工资、休闲 …… 一切。这 离噩梦已经不远了。将没有人再读书了。

杜拉斯接着抱怨屏幕,她当时可能想到的是电视屏幕(而不是电脑)。但 没有任何媒介比搜索引擎更系统性地将文本转化为答案  — — 抹去某些种类的无知,伪装另一些种类的无知。

搜索 — — 每天 有数十亿次搜索  — — 意味着有问题存在,即使搜索不采取问题的形式。如果我搜索 “胶质母细胞瘤”,我可能会想知道那个东西是什么 (是最致命的一种脑瘤);一个人带着它能活多久?(通常不超过两年) ;它是一种什么感觉?(谷歌无法真正告诉我,尽管我的搜索发现了许多症状列表) …… 提供这些答案是有好处的,数以千计甚至数百万计的网页肯定已经被发布,主要或唯一的目的是作为 所谓热门查询的顶级答案 进行排名。最具代表性的例子之一是 HuffPo 在2011年发表的一篇极其简短的 文章 ,“超级碗什么时候开始?” — — 然后写下一个时间,仅此而已。然后让这句话成为谷歌搜索结果前位。果不其然,它一直是排名第一名的搜索结果。很讽刺吧?

这是个成功的策略,其他公司在后来的几年里也纷纷模仿。HuffPo 的文章 被称为 “trolling” 的行为,也是试图操纵系统。 其实,它是在完美地利用这个搜索系统。 比赛什么时候开始,缩写代表什么,那部电影里的演员年龄有多大: 意图明确的问题,除了事实之外,不要求更多的回应,这是谷歌最擅长的东西。

Google著名的算法将整个人类社会纳入其统计数据中, 并鼓励您依靠相同的逻辑去生活

当搜索的对象不那么可知时,搜索结果可能会和它们所揭示的一样隐蔽。2016年11月中旬,宾夕法尼亚州参议员尼基尔·萨瓦尔(Nikil Saval)发表了 一篇文章 ,论述了对大选过度自信的反应泛滥。

“作家们轻率地展开了琐碎的文章,论述选民想要什么,选票代表什么 …… 但证据在哪里?默不作声的选票如何 … 才能可读? ” 关于人们如何投票以及为什么投票的统计数据 — — 如果你在谷歌上搜索可能会找到一大堆那种东西 — — 将民意整理成整齐的栏目,但是,民调在敲门时的对话只是揭示了一个早期想法的 “混乱”,这些想法并非遥不可及或没有定论: “在这种情况下,现实社会并不适合统计的世界。”

谷歌的算法最著名的是将整个人类社会扁平化为统计,并鼓励你依靠同样的逻辑去生活。例如,它不能告诉你是否患有某种疾病,但它可能通过告诉你有多少其他人患有这种疾病来回答你的查询。 如果该疾病是罕见的,你可能会感觉好一些,好像你得到了一个 “有利的答案”,但实际上你不会对自己有任何新的了解 。如果你去看医生,他们也可能会谷歌一下再告诉你同样的事。罗德岛医学杂志最近的 一篇文章 认为, 医生能够轻易地上网查找医疗信息的现状,导致了过度自信,从而导致误诊。

作者写道,医疗已经 “从 ‘我知道什么?’ 蜕变为 ‘我在哪里可以找到它?”

令人欣慰的是,对于搜索者来说,这种蜕变隐去了答案是 “一无所知” 的可能性。但是, *不知道*,无论有多么不舒服或痛苦,都是生活的内在因素 。科学、艺术、宗教实践、与他人的关系、理解政治或历史的尝试:都源于我们要求谷歌释放的那种好奇心。 Google在某种程度上掩盖了未知的事实,并鼓励人们将世界的多元性看作是我们可以略过的东西,它就是这样减少了人们的生活真正所需的装备。

随着谷歌吞吐越来越多的数据,*理论上*它可知的范围应该扩大。“我们正处于从信息引擎向知识引擎转变的早期阶段”,2012年,谷歌产品经理约翰娜·莱特(Johanna Wright) 。她当时正在拍摄一段介绍所谓的知识图谱的视频,这是一个利用其他数据库直接在搜索结果页面上提供答案的数据库,你无需点击任何东西。

知识图谱的来源包括维基百科、中情局世界概况、体育比分、股票价格、天气预报等授权数据,以及其他所谓的 “经验证” 机构。当你在谷歌上搜索一个名人、一部电影或一种常见疾病时,它提供了许多显示在屏幕顶部或右侧的方框和面板。 这些方框和面板不是告诉你在哪里可以找到答案,而是直接给你答案  — — 准确说是谷歌所认为的答案

去年,Markup 的 一项调查发现 ,谷歌将其移动搜索结果首页的41%内容用于自己的产品 ,包括知识图谱和 Google Flights、Google 翻译和 YouTube 等谷歌产品所提供的 “答案”。 这就将竞争对手推倒或淘汰出局了

在谷歌开始在搜索结果页面上显示歌词后,Genius.com 的搜索流量大幅下降;TripAdvisor 在失去与谷歌竞争服务的流量后不得不裁员了200人。

“当长期来看,谷歌能让搜索者对他们的平台上瘾时,谷歌就能赚到最多的钱”,SEO专家兰德·菲什金 (Rand Fishkin) 告诉 Markup。“如果谷歌能训练你,让你不要去 Genius.com、不要去 TripAdvisor、不要去餐厅的网站,只要来谷歌  — — 总是来谷歌,永远来谷歌 — — 那么他们就稳赢了“。 只要他们赢了,可 “谷歌” 的范围,实际上就只会收缩。简单说,你的认知就只会被收缩。

如果说搜索一开始是通过系统地将文本还原成答案,那么谷歌现在则是进一步将这些答案还原成一个个 *确定的答案*

但它仅靠自己的产品是无法做到这一点的。正如SEO专家 Pete Meyers 所指出的那样 ,人类策划的知识图谱 “永远跟不上我们可以提出的近乎无限的问题”。他猜测,这就是为什么谷歌在2014年推出了 “特色摘要”。

特色摘要出现在一个方框里,通常是在页面的顶部,这让它们看起来和它们经过更多审核的表兄弟们一样 “权威”。 然而人们可能忘了,这段文字只是谷歌的算法从某个地方找到的。

在写这篇文章的过程中,我遇到的第一个特色摘要,是对 “搜索引擎优化行业市场有多大” 这个疑问的回答。谷歌显示了一个大大的粗体字 “800亿美元”,下面还有几行字体较浅较小的字,出现在我屏幕上方的方框里。在大多数情况下,我都会很满意。很多人都会和我一样。而2019年6月, 第三方数据首次显示 大部分在网页浏览器中进行的谷歌搜索并没有导致任何点击。

我发现,800亿美元这个摘要来自一家咨询机构的 博客文章 ,其中有这样一句话,“福布斯的SEO统计数据引用 Borrell Associates 的数据强调,到2020年,美国企业在SEO服务上的支出将高达800亿美元”。 这句严重套路的话语只是看起来像事实而已,如果你不真正去读原文的话。

有多少次,我理所当然地认为的一个 “事实” 可能根本不是事实,或者把我对事实的了解误认为是理解?有多少次我误以为自己知道,因为它是以一种我认为是知识的形式呈现给我的?

在《谷歌化的反思》(2011)一书中,Siva Vaidhyanathan 引用了2008年的 一项研究表明 ,随着1998年到2005年之间越来越多的期刊开始在网上发表,科学文献作为一个整体,引用的来源越来越少。用他的话说就是, 研究人员更有可能 “呼应主流共识,缩小他们研究的知识基础”。

当我用法语给法国朋友写邮件时,我会在谷歌上搜索许多表达方式。如果有成千上万的结果,我就觉得自己写对了那句话。如果没有结果或者只有几个结果,我就会重新调整措辞  — — 尽管这并不代表我弄错了。大多数可能的词语组合还不存在于谷歌上,但我无法抗拒将自己限制在那些存在的词语上所获得的 “自信” 和避免尴尬的庇护。

Maël Renouard 在2016年出版的《无限记忆的碎片》一书的开头就回忆了一个晚上,当他走在大街上时,他有一种冲动,想谷歌一下两天前下午5点他自己在做什么。琳达·贝斯纳(Linda Besner)在2019年为 Real Life 撰写的 一篇文章 中,讲述了类似的经历。“我走在街上的时候,突然想到我奶奶是否做过隆鼻手术?我回家后就去谷歌了一下”。 她瞬间意识到,和之前的 Renouard 一样,她其实做不到这一点,她把这种现象称为 “无法谷歌”。

有很多无法 google 的东西,我们还是会去 google。在《每个人都在撒谎》(2017)中,塞斯·斯蒂芬斯·达维多维茨(Seth Stephens-Davidowitz)写道,“人们很烦人” 和 “我很悲伤” 这样的事每年都有成千上万的搜索。 他将这些搜索描述为试图将搜索 “作为一种告白”,是一种 “将未经审查的想法发泄到谷歌中,而对它能否帮助我们不抱太大希望” 的方式 。但忏悔往往是一种请求帮助的方式,是在希望康复的情况下提出的(雅各书5:16:你们要彼此认罪,互相代求,使你们可以得医治)。有时它也是一种自我认识的尝试。忏悔式搜索意味着的问题是:我是谁?我出了什么问题?我可以被救赎吗?谷歌无法回答这些问题,但它可以将这些问题还原成可回答的形式。

有多少东西只是我错误地认为自己知道的,只因为它们是被以已经确定的 “知识” 形式呈现给我的?

在我搜索 “我很伤心” 的结果中,第一页包括:“当你真的很悲伤时要做的7件事”;“6个强大的快乐小贴士”;“5种感觉快乐的方法” …… 谷歌不能解决伤心的问题,但它可以通过不同的逻辑来重构这个问题,让 “伤心” 看起来不那么像一个存在的问题,而更像是一个DIY的家庭维修查询。 它可以鼓励你放弃不可 google 的东西,而选择可 google 的东西。你的悲伤并没有消失,但你有了一个 “答案” — — 或者至少你知道有一个 “答案” — — 这感觉很好。

诗人和哲学家几乎永远都在警告这种自我安慰的危险 。苏格拉底有一句名言:他的智慧来自于知道自己什么都不知道。约翰·济慈把 “消极能力” — — 他把这种品质归结于 “有成就” 的人 — — 定义为 “在不确定、神秘、疑惑中停留的能力,而没有任何烦躁地达到事实和理由之后”。

唐纳德·巴塞尔姆 (Donald Barthelme) 在1985年的文章《非知觉》中认为, 这是 “允许艺术被创造的原因” 。乔治·巴代伊 (Georges Bataille) 认为 “不知道” 是一种固有的人类状态 。他在《内心体验》(1943)中写道,宇宙 “不可知的巨大”,“无限地躲避着寻求它的个人”; “知道” 只是 “人类试图以自己为整个宇宙的手段”。

谷歌旨在将世界简化为它所能提供的答案,它掩盖了(或试图掩盖了)宇宙的无限不可捉摸性。

4月,一位年长的亲戚在我们的家庭群组里发了一篇文章,讲的是两个急诊医生质疑 Covid-19 严重性的视频。这两位医生的评论后来受到了美国学术急诊医学会和美国急诊医师学院的 指责 ,因为他们认为这种疾病并不比流感更致命。我花了几个小时的时间在家庭群组里发文,试图说服我的家人不要相信这个。我疯狂地上网搜索,在群里发了一篇又一篇的文章,试图诋毁那两位医生。“我认为你不明白他们所做的统计论证”,我的亲戚回应道。

的确,虽然我确信医生们是错的,但我并不完全确定什么是对的。这场大流行使我无法忽视我所引用的权威机构的错误性。

在1月和2月,《纽约时报》和《华盛顿邮报》 都刊登了 淡化病毒危险性的文章,只是在几周后才把它作为危机来报道。3月,疾控中心说大多数人不需要戴口罩,4月 才决定 人们应该戴口罩。公共卫生专家 多次未能充分解释 低风险和高风险活动之间的差异。大学、医学期刊和制药公司推动了一项又一项的研究,记者们也报道了这些研究。在提供答案的巨大压力下  — — 再加上为了吸引眼球的 “常规” 压力  — — 这些消息来源中的许多人 把结果说得 比真正的结论更加言之凿凿。他们这样做的方法之一是不在其他研究结果的背景下介绍每项研究结果。

导致这一失败的原因不胜枚举,其中包括新信息的数量。从5月到8月,平均每天有400份关于 Covid-19 的新研究报告发表。按照这个速度,即使是做研究的人也不可能跟得上。当他们必须搜索,以了解外面的情况时,他们 很有可能 会依赖 Google Scholar。

10月,两位研究人员发表了 一篇文章 ,建议其他研究人员不要去谷歌 。虽然谷歌学术以其 “高效、简洁” 的界面、“完全适合” 有明确目标的 “查找搜索”,但是, 它在帮助研究人员综合已知内容方面 “失败得很惨”。就像我们其他人使用的搜索一样,Google Scholar 可以让你觉得自己在很久之前就已经学到了你需要知道的东西。

“不幸的是”,作者写道,它似乎不是专注于 “研究人员在所有搜索任务中需要完成的任务”, 而是专注于 “让用户更快满足(而不是更聪明) ”。但有一些系统,比如 PubMed, 更适合 研究人员需要做的工作。

【注:PubMed 是主要用于检索MEDLINE数据库中生命科学和生物医学引用文献及索引的免费搜索引擎。该系统属于美国国立卫生研究院下属的国家医学图书馆维护的 Entrez 信息检索系统的一部分。 】

从某种意义上说,玛格丽特·杜拉斯要回答的问题仍然是开放的。对于一个电视采访来说,这是一个奇怪的问题,因为她的回答是断然的,“人们总是需要答案”,采访者 开始说 ,“ 即使有一天,这些答案被证明是假的,或者只是临时的 ”。 他想知道的是,在未来,答案会在哪里?

⚪️

Easy Answers


文章版权归原作者所有。
二维码分享本站