人形机器人视频爆火网络,专家提醒演示与真实能力之间存在巨大鸿沟。

科技公司频繁展示人形机器人完成杂技、跑酷或家务的视频,看起来它们几乎无所不能。但多位顶尖机器人专家指出,这些精心编排的演示与证明机器人能在真实世界中可靠、重复地完成同样任务之间,仍然存在显著差距。最新一波机器人视频之所以具有迷惑性,很大程度上是因为人类天生倾向于将人形物体拟人化。Agility Robotics 联合创始人 Jonathan Hurst 解释道,人们会不自觉地外推,认为一个长得像人的机器人,就应该能做那个人能做的所有事情,从跳舞直接跳跃到可以做任何家务。他指出,许多初创公司恰恰利用这种心理来筹集资金,而实际技术水平远未达到视频所暗示的程度。

加州大学伯克利分校的 Sergey Levine 表示,让机器人像人类一样跨环境泛化技能是最大挑战之一,但这在单次演示中几乎无法体现。他举了一个直白的例子:机器人也许能在某个精心设定的场景下倒一杯酒,但它能否从任何形状的瓶子、往任何大小的杯子、在任何光照和布局的环境中完成这个动作?真正的进步应该用真实环境中的定量、大规模评估来衡量,而非一段精心剪辑的短视频所能呈现的。

Purdue 大学的 Dipam Patel 提醒观众,许多演示仍然依赖人类通过远程操作直接控制机器人。他说得很直接:除非研究论文或公司明确声明机器人是完全自主的,否则你应对这些视频持高度怀疑态度。此外,还需要判断演示是否在全新的、机器人从未见过的测试环境中进行,还是仅仅重复在已反复训练过的特定房间和特定物品前的固定任务。只有前者才能体现真正有价值的自主泛化能力。

观看视频时还有一个容易被忽略但至关重要的细节:播放速度。出于安全和稳定性考虑,机器人通常动作非常缓慢。公司有时会在视频角落注明以2倍或4倍速播放,这意味着机器人完成同样任务的实际耗时可能是人类的两倍到四倍。但并非所有视频都做此标注,有些纯粹就是供社交媒体病毒传播的娱乐内容或面向投资者的募资宣传片。

演示视频的信息价值和透明度差异巨大。有些会提供训练过程的幕后视角,坦然展示机器人一次次的失败和碰撞;有些则是精心剪辑的无瑕疵表演。但即使这段演示来自最知名的实验室且确实令人印象深刻,它仍然只是整幅图景中极其微小的一角。衡量机器人真实能力的进步指标,并不容易包装成一段好看的互联网短视频。

本文译自 arstechnica,由 BALI 编辑发布。