“话不投机”的百度与谷歌
“话不投机”的百度与谷歌
#互联网 #美国
搜索引擎几乎已经成为我们日常生活中不可或缺的工具。根据雅虎2012年的市场报告,谷歌与百度在中国搜索引擎市场上分别占有15%与78%的份额。2010年1月,谷歌宣布停止按照中国政府的要求进行内容审查,并将服务器移至香港。如今三年过去,这个决定对中国的搜索引擎表现造成了怎样的影响?北卡罗来纳大学夏洛特分校传播学系副教授 蒋敏 近日在 《新媒体与社会》 (New Media & Society)上发表论文,通过比较谷歌与百度在中国的搜索结果,用数据印证了搜索引擎可以通过人为控制来服从于特定的政治与商业目的。
蒋敏及其研究团队选取了发生于2009年的316起中国热点事件,于同一时间段内分别在中国与美国打开百度与谷歌进行搜寻,并记录每次搜索的前十位搜索结果进行对比分析。作者指出,过去的研究往往着眼于网络审查,而忽视了普通网民的日常搜索体验;因此,该研究的事件样本并不仅限于政治敏感话题,也包括其他能够吸引网民眼球的事件,涉及流行文化、互联网业内热点、国际新闻、爱国主义等多个方面。作者提出的主要研究问题是:对中国大陆的搜索引擎用户而言,百度与谷歌对网络热点事件的搜索结果在可得性、重叠度、排序和偏差四个方面究竟有何不同?
可得性是指在搜索发生的地点能否打开搜索结果。作者将信息过滤分为三级:防火墙、搜索引擎和本地内容/服务供应商。防火墙过滤是集中化的,百度和本地内容/服务供应商的过滤则是分散化的。墙的过滤有多种方法,包括封锁IP、屏蔽关键词和数据包过滤等,通常会出现“连接已被重置”的警告。作者在中国与美国比较了无法打开的链接,若在两地皆无法打开,则认为是网页本身的问题;若在美国可以打开,则认为是经过了防火墙或百度的过滤。
百度的过滤方法分为屏蔽页面(不返回搜索结果)或部分过滤(返回少于十个结果)。研究中,若返回结果少于十个,则将缺失数目计为经过百度过滤的链接数目。谷歌的安全搜索则会过滤色情内容。然而作者指出,本研究无法证明搜索引擎是否将某些结果预先全部过滤,或人为降低了其排序。
研究者发现,谷歌搜索结果中有400个链接无法打开,其中299个是由于防火墙过滤,共涉及19个话题,其中包括“贾君鹏”、“李开复告别谷歌”等并不敏感的话题。相比之下,百度在中国的3160个搜索结果有171个无法打开或缺失,其中只有24个是由于防火墙过滤,22个是由百度自行过滤。作者指出,相比谷歌中敏感内容被完全封锁,百度偶尔会允许搜寻者连接到原本应该被封锁的海外异议网站;有时百度也能打开与敏感话题相关的链接,但这些内容大多采用中性口吻或表示支持政府。相比谷歌,百度多了一层自我审查的过滤方式。因此,自从谷歌将服务器迁出中国大陆,其搜索结果遭到了更严重的防火墙过滤,而百度的过滤效果则更加微妙且难以觉察。
在重叠度与排序方面,研究团队发现,在3160对搜索结果中,相同的URL仅有216对,也就是说,百度与谷歌的前十位搜索结果仅有6.8%指向同样的链接。这其中,没有任何一起事件有超过5对相同的结果。仅有44对搜索结果具有同样的排序,其中22对排在第一位;若放宽限制至前三位,则有61对入围。这在3160对搜索结果中所占比例仅为0.7%和1.9%。即使考虑到无法打开的链接,这个比例也仅能达到2.4%与3.2%。作者认为造成如此低的重叠度的原因可能是多方面的,包括不同的搜索技术、抓取原理与过滤原则等。
最后,作者还研究了搜索引擎对其自身旗下内容及竞争对手内容的处理方式。结果发现,百度搜索结果中有89项指向其自身旗下内容,包括百度知道、百度百科、百度空间、百度贴吧等;谷歌搜索结果中有98项指向百度。此外,百度搜索结果中虽有10项指向百度百科,却仅有一项指向互动百科,且完全没有指向中文维基百科的链接;谷歌则搜出了10个百度百科页面、31个互动百科页面和16个中文维基页面。研究进行时,互动百科的条目内容比百度百科多出66%,可见百度的搜索结果很有可能经过了一定程度的刻意操纵。
作者最后指出,搜索引擎处于信息发布与流通的中心位置,在用户与社会现实之间搭建桥梁,具有揭示、重构、夸大和扭曲现实的力量。不同的搜索引擎建构着不同的社会现实,各自塑造出争议性社会话题的不同维度。由于搜索引擎的技术特点决定了其可调整与可操控性,因此也极易受到政治权威与商业力量等利益团体的影响。用户由于缺乏选择,往往倾向于盲目信任搜索引擎,这一现状值得我们忧虑与警醒。
本研究的主要缺陷在于事件样本偏小,收集数据的方式较为单一,研究结果的可重复性较低。尽管对比结果看似差异明显,但未经统计分析,因此说服力相对有限。面对这一关乎每个网民日常生活的话题,我们期待更具突破性的研究与数据出现。
【参考文献】
Jiang, M. (2013). The business and politics of search engines: A comparative study of Baidu and Google’s search results of Internet events in China. Upcoming in New Media & Society.
文章版权归原作者所有。