@ 2024.10.31 , 07:06

AI开发者发现:原本让Claude写代码的,它竟然摸鱼看图片

最近,连人工智能也无法逃脱拖延症。

在其开发者尝试录制编码演示时,最新版本的Claude 3.5 Sonnet(Anthropic的旗舰人工智能)偏离了轨道,产生了一些“有趣”的时刻。公司在公告中表示,尽管将机器学习模型拟人化很危险,但如果Claude是人类员工,我们可能会诊断它为严重的工作无聊症。在一段视频中,Claude决定不再写代码,打开谷歌, inexplicably地浏览黄石国家公园的美丽照片。

在另一轮演示中,Claude意外停止了正在进行的长时间屏幕录制,导致所有录像丢失。我们相信这并非AI的故意行为。

升级后的Claude 3.5 Sonnet是Anthropic开发“AI代理”的尝试,这是一个广义术语,描述了旨在自主执行任务的生产力导向型AI模型。许多公司正在努力将他们的AI模型扩展至不仅仅是聊天机器人和助手,包括刚刚发布AI代理功能的微软。

Claude可以“像人一样”使用计算机,例如移动光标、输入击键和鼠标点击。这意味着Claude有潜力控制你的整个桌面,与安装的软件和应用程序互动。

但它显然还远未完美。像任何AI模型一样,可靠性仍然是个问题,而频繁的幻觉也成为常态,正如Anthropic自己所承认的。

“尽管这是目前的最先进技术,Claude的计算机使用仍然缓慢且常常出错,”公司表示。“许多常规计算机操作(如拖动、缩放等)Claude还无法尝试。”

虽然Anthropic分享的错误示例大多是无害的,但考虑到Claude自称拥有的自主性,关于其安全性的问题也显得更加合理。如果AI代理的偏离不是因为浏览照片,而是打开社交媒体,那将会发生什么?

当然,人类滥用它的潜力也是显而易见的——这也是Anthropic希望用户了解并正在解决的问题。

“由于计算机使用可能为更熟悉的威胁(如垃圾邮件、虚假信息或欺诈)提供新的途径,我们采取了主动措施以促进其安全部署,”Anthropic表示。这包括实施新分类器,以识别AI是否被用于执行被标记的活动,如在社交媒体上发帖和访问政府网站。

随着越来越多的人尝试新的改进版Claude,我们预计将看到更多它计算机使用出现问题的例子。

本文译自 futurism,由 BALI 编辑发布。

赞一个 (5)