Tech
majer @ 2020.08.31 , 10:09
每个人的历史浏览记录都是独一无二且稳定的
网页浏览历史很敏感
历史网页浏览记录非常敏感。有些网友甚至声称,宁愿担下未曾犯下的罪,也不愿意向法庭展示历史浏览记录证明清白。
它们蕴藏了有关用户的丰富信息,达到提取心理计量或人口统计见解的可能水平。它们不会随时间发生重大变化(即由于经常固定的偏好而稳定)。它们对用户而言是唯一的(用户通常倾向于浏览符合兴趣的特定站点)。
在某些方面,由于历史记录的独特性和稳定性,它们类似于生物特征。
每个人的网页浏览历史都是独一无二的
在2009-2011年,就有研究表明,浏览历史可能对用户而言是唯一的。通过观察访问的网站集辨识出特定用户的准确性高达97%。此外,浏览器指纹是时间稳定的(在38%的分析例中)。我们还发现,即便将网址限定在50个最受欢迎的网站,其唯一性特征仍然非常明显。
到2020年,情况又有所不同。如今,用户私人数据的处理规模比2010年大了一个数量级。幸运的是,已有新的研究再次印证了相关结论。
确认:网络浏览历史是唯一的
事实证明,Mozilla最近的研究(2020年)(Sarah Bird, Ilana Segall, and Martin Lopatka)通过非常精细的数据再现了原始研究。这项工作可以更严格地评估用户访问列表的真实程度。
该团队检查了大约52000位Firefox用户两周内的网络浏览历史。收集到的数据提供了深入分析的潜力。
使用与之前类似的方法,可以确认,浏览器指纹的唯一性率为99%。他们指出,在80%的情况下,可以通过这种指纹来识别用户。
此外。Mozilla团队的工作完全证实了以前的一些见解。例如,仅考虑50个最受欢迎的站点就足以获得唯一的指纹。
研究报告:https://www.usenix.org/system/files/soups2020-bird.pdf