到底有多少跟踪器在盗窃你的隐私？谷歌以其惊人的跟踪量位居榜首

最近的文章显示，嵌入在许多网站上的追踪器增加了 Facebook，Google（和其他公司）可用来了解我们的信息 – 即使你根本没有登录（甚至你可以完全没有账户！）也同样可被它们窥视。 我开始考虑有多少个不同的网站可能会跟踪我在网络上的浏览。

我们如何知道公司跟踪我们的地点和数量？

有多少网站使用 Facebook 跟踪 API？ Twitter 的 API？亚马逊？公司/追踪者的数量可能是无穷无尽的，但本文只关注一小部分 – Facebook，Google，Twitter，LinkedIn 和亚马逊。用 url，HTTPArchive 可以做到。

方法是这样的。在“Facebook隐私”上进行 Google 搜索，选择了前 6 篇文章：

https://www.chronicle.com/blogs/profhacker/firefox-add-on-protects-against-most-facebook-tracking/65281

https://www.thequint.com/tech-and-auto/tech-news/prevent-facebook-data-access-with-this-firefox-web-extension

http://www.thedailystar.net/world/limiting-facebooks-data-brokers-wont-stop-tracking-1555630

https://globalnews.ca/news/4110311/how-to-stop-targeted-ads-facebook-google-browser/

https://www.cbsnews.com/news/how-facebook-was-able-to-collect-android-phone-and-text-logs/

https://www.makeuseof.com/tag/facebook-tracking-stop/

然后，使用 Ghostery （Chrome 浏览器插件，即 ID 跟踪器/广告等）来识别这些页面上的跟踪器。例如这里有两个 Facebook 追踪器：

现在，我标记的某些网址可能无害，并且无法通过网络跟踪用户。我没有深入了解每个 API 或他们收集的数据，我为 Facebook 建立了以下查询：

SELECT pages.rank, pages.url, requests.url, ext FROM httparchive.runs.latest_requests_mobile requests JOIN ( SELECT rank, pageid, url FROM httparchive.runs.latest_pages_mobile) pages ON pages.pageid = requests.pageid WHERE (requests.url CONTAINS “ facebook.com/tr ”|| requests.url CONTAINS “ graph.facebook.com ”|| requests.url CONTAINS “ facebook.com/impression ” || requests.url CONTAINS “ facebook.com/connect ”|| requests.url CONTAINS “ connect.facebook.net ”|| requests.url CONTAINS “ connect.facebook.com ”|| requests.url CONTAINS “ facebook.com/brandlift ” ) ORDER BY rank ASC

所以，Facebook 跟踪了你多少？

我在数据库中发现了超过 147.5k 站点的 805k Facebook 追踪请求。这意味着 平均每页5个 Facebook 追踪者，约占整个互联网的 33％。

有趣的是，按排名显示，排名前100位的网站使用远远低于 Facebook 的追踪数据（11％） – 可能是因为 Facebook 的许多竞争对手都位列前100名。