@ 2023.08.13 , 07:07

互联网不是永恒的:CNET删除旧文章以应对谷歌算法

CNET是网络科技新闻的元老之一,但今年以来一直过得不太顺利。首先,它的人工智能写作的文章引发了争议,然后裁员震动了这家出版社。现在,Gizmodo报道称,这家有着28年历史的网站为了在谷歌搜索中获得更好的排名,已经删除了数千篇旧文章。

删除过程从小批量文章开始,到7月下旬大幅增加,导致近几周删除了数千篇文章。虽然CNET向Gizmodo确认了删除文章的事实,但具体删除的文章数量尚未披露。

CNET的市场营销和传播高级总监Taylor Canada说:“我们不轻易从网站上删除内容。我们的团队分析了许多数据点,以确定CNET上是否有当前没有为受众提供有意义内容的页面。这是像我们这样主要依靠SEO流量的大型网站的行业最佳实践。在理想的情况下,我们希望将所有内容永久保留在我们的网站上。不幸的是,对于将所有先前发布的内容保留在我们的网站上,现代互联网会对我们进行惩罚。”

SEO(搜索引擎优化)是一种通过改变网站内容来有意地提高搜索引擎排名的做法。支持SEO技术的人认为,在谷歌搜索结果中获得更高的排名可以显著影响访问量、产品销售或广告收入。许多公司为了取悦谷歌的排名算法而不惜一切代价。

提高页面排名的一个理论是“内容修剪”(content pruning)。Gizmodo获得了CNET的一份内部备忘录,其中提到删除旧URL“向谷歌发出信号,表明CNET是新鲜、相关且值得在搜索结果中排名高于我们的竞争对手的网站”。然而,在删除文章之前,据报道,CNET会保留一份本地副本,将文章发送到互联网档案馆的Wayback Machine,并提前至少10天通知可能受到影响的当前雇用的作者。

然而,一些专家表示CNET极端的内容修剪例子是错误的。网站Search Engine Land指出,虽然谷歌曾经建议(在2011年)删除“低质量页面”可能会提高排名,但它也表示谷歌从未建议人们仅因为内容过旧就删除内容。事实上,谷歌的SearchLiaison X账号在周二发推文说:“你是否因为某种原因认为谷歌不喜欢“旧”内容而从网站上删除内容?这是不存在的!我们的指导不鼓励这样做。旧内容仍然可以有帮助。了解更多关于创建有用内容的信息。”

网络的长期衰败

曾经有一种普遍认识是“互联网是永恒的”,意味着你在网上发布的内容将永远存在。我们通过谷歌图书和谷歌的非正式搜索可以发现,这个短语起源于2005年左右,但在2008-2009年社交网络繁荣时期变得非常流行。

然而,随着时间的推移,越来越清楚的是,互联网是短暂的。链接失效每天都在威胁着网络上的内容,而在线上找到的内容远非永久存在。哈佛大学在2021年进行的一项研究调查了1996年至2019年间《纽约时报》的55万多篇文章中的超链接,发现25%的特定页面链接无法访问。如果没有互联网档案馆,许多早期的网站将会完全消失。

导致链接失效的原因包括网站关闭、服务器迁移、转换到新的内容管理系统等。现在我们可以将内容修剪为SEO的行为列为另一个罪魁祸首。这或许是谷歌搜索结果变得如此糟糕(充斥着算法生成的垃圾网站)的又一个迹象,以至于像CNET这样的出版物不得不采取极端措施来保持在噪音海洋之上。

互联网不是永恒的:CNET删除旧文章以应对谷歌算法
缺少图片的 PCWorld文章的屏幕快照

即使网站不完全删除内容,某些存档也可能随着时间而受到其他方式的损害。在过去的十年中,版权流氓的泛滥威胁许多出版物,以侵权的方式使用图片,如果在法庭上进行测试,这种使用很可能构成合理使用。但是审判是昂贵的,所以版权流氓通过获得现金赔偿而获胜。作为回应,许多网站删除了文章中的旧图片,而不是逐个整理数百万张图片。IDG的一些网站,如PCWorld和Macworld,的存档就受到了这种图片修剪的影响。

从古至今,保护历史内容都需要在未经授权的情况下制作许多副本,无论文化或商业力量如何,这在互联网时代没有改变。档案管理员在一个平行的知识产权世界中运作,借用现实的碎片并将它们保存下来,直到短视的商业决策和版权保护主义平息下来。希望尽管链接失效,未来的历史学家能够拼凑出我们脆弱数字时代的准确历史。

本文译自 Ars Technica,由 BALI 编辑发布。

赞一个 (11)