AI开发者发现：原本让Claude写代码的，它竟然摸鱼看图片

最近，连人工智能也无法逃脱拖延症。

在其开发者尝试录制编码演示时，最新版本的Claude 3.5 Sonnet(Anthropic的旗舰人工智能)偏离了轨道，产生了一些“有趣”的时刻。公司在公告中表示，尽管将机器学习模型拟人化很危险，但如果Claude是人类员工，我们可能会诊断它为严重的工作无聊症。在一段视频中，Claude决定不再写代码，打开谷歌， inexplicably地浏览黄石国家公园的美丽照片。

在另一轮演示中，Claude意外停止了正在进行的长时间屏幕录制，导致所有录像丢失。我们相信这并非AI的故意行为。

升级后的Claude 3.5 Sonnet是Anthropic开发“AI代理”的尝试，这是一个广义术语，描述了旨在自主执行任务的生产力导向型AI模型。许多公司正在努力将他们的AI模型扩展至不仅仅是聊天机器人和助手，包括刚刚发布AI代理功能的微软。

Claude可以“像人一样”使用计算机，例如移动光标、输入击键和鼠标点击。这意味着Claude有潜力控制你的整个桌面，与安装的软件和应用程序互动。

但它显然还远未完美。像任何AI模型一样，可靠性仍然是个问题，而频繁的幻觉也成为常态，正如Anthropic自己所承认的。

“尽管这是目前的最先进技术，Claude的计算机使用仍然缓慢且常常出错，”公司表示。“许多常规计算机操作(如拖动、缩放等)Claude还无法尝试。”

虽然Anthropic分享的错误示例大多是无害的，但考虑到Claude自称拥有的自主性，关于其安全性的问题也显得更加合理。如果AI代理的偏离不是因为浏览照片，而是打开社交媒体，那将会发生什么？

当然，人类滥用它的潜力也是显而易见的——这也是Anthropic希望用户了解并正在解决的问题。

“由于计算机使用可能为更熟悉的威胁(如垃圾邮件、虚假信息或欺诈)提供新的途径，我们采取了主动措施以促进其安全部署，”Anthropic表示。这包括实施新分类器，以识别AI是否被用于执行被标记的活动，如在社交媒体上发帖和访问政府网站。

随着越来越多的人尝试新的改进版Claude，我们预计将看到更多它计算机使用出现问题的例子。

本文译自 futurism，由 BALI 编辑发布。