为什么那么多网站要你证明“不是机器人”

自动化程序正在悄悄占据互联网，从访问量到互动数据都被污染，甚至可能超过真实用户，改变整个网络生态。

很多人以为，互联网的主要问题是内容变差、广告变多。但更深层的问题是，你以为在和人互动，其实很可能是在和机器打交道。一种越来越明显的趋势是，自动化程序，也就是“机器人”，正在占据互联网的各个角落，而且规模远超大多数人的想象。

首先是数量上的变化。过去，机器人流量大约占互联网的20%左右。但到了2024年，这个数字已经超过50%。甚至有预测认为，在2027年前后，机器人流量将正式超过人类。这意味着什么。意味着你每天看到的访问量、点赞、评论，甚至用户行为数据，很大一部分并不是来自真实的人。更隐蔽的是，这些机器人已经不再是简单的“爬虫”。它们开始伪装成人类。它们使用真实的浏览器标识，模拟点击节奏，甚至会控制访问频率，让自己看起来像一个普通用户。

有的攻击甚至动用了几十万不同的IP地址，在短时间内分布式访问网站，每个IP只访问几次，看起来完全正常。这种行为几乎无法用传统方法识别。

结果是网站的数据开始“失真”。你以为用户喜欢某个功能，其实是机器人在频繁触发。你以为某篇文章很受欢迎，其实是自动化程序在刷访问。当企业用这些数据做决策时，本质上是在根据“机器行为”优化产品。

问题不止于数据。这些机器人背后，很大一部分来自人工智能公司。它们通过大规模抓取网页内容，用来训练模型。

这种行为带来了一个连锁反应。网站需要付费购买内容、维护服务器、生产信息。但机器人抓走数据后，用户可能直接在AI工具里获取答案，不再访问原网站。结果就是，网站失去广告收入，甚至无法继续运营。

换句话说，生产内容的人，反而被“绕开”了。

更极端的情况是，机器人访问本身也在制造成本。大量无意义请求占用带宽，增加服务器负担，迫使网站投入更多资源防御。一些站长甚至发现，自己的流量突然暴涨，但这些“访客”来自奇怪的地区，行为也完全不像真实用户。

与此同时，AI系统的运行方式也在放大问题。一个人完成一个任务，只需要访问几次网页。但一个AI代理可能会访问上千次网页来完成同样的任务。

当这种行为规模化后，互联网的基础设施开始承压。于是，一个奇怪的局面出现了。一边是越来越多的机器人在生产内容、抓取内容、消费内容。另一边是真实用户的比例在下降。

这也是为什么有人提出“互联网正在变死”的说法。虽然这不是严格意义上的事实，但它反映了一种真实趋势，机器正在逐渐占据原本属于人的空间。

更微妙的是，这种变化几乎是无感的。你刷到一条评论，看不出它是人写的还是机器生成的。你看到一篇文章，也无法确定它是否由AI生成。你甚至无法确定和你互动的账号是不是一个真实的人。

互联网仍然看起来很“热闹”，但这种热闹，越来越像是一种自动运转的系统。

一些网站已经开始反击，比如设置登录门槛、增加验证、甚至故意向机器人提供错误信息。但这本质上是一场长期的对抗。

机器人变得更聪明，防御也必须不断升级。这场变化的关键不在技术，而在结构。

互联网原本建立在一个简单的前提上，人生产内容，人消费内容，人之间互动。而现在，这个循环正在被机器打破。

本文译自 Glade Art，由 BALI 编辑发布。