Nvidia让编程智能体自主设计实验并训练机械臂完成精细任务。

把一组AI编程智能体放进装有机械臂的实验室,提供计算资源和充足的令牌预算,它们能否自行想出训练办法?Nvidia的机器人研究团队给出的答案是肯定的。智能体设计训练流程后,机械臂学会剪断扎带,还能把GPU准确插入主板上狭窄的插槽。这些动作需要感知物体位置、规划接触路径、控制力度,并根据失败不断调整。

机器人不再等人写教程,AI智能体能自己设计训练它

实现这一过程的系统名为ENPIRE。它不是单一模型,而是一套围绕模型搭建的智能体框架,为AI提供工具调用、记忆、上下文、约束和反馈循环。多个编程智能体可以分工检查机器人状态、编写或修改训练代码、分析实验结果,再提出下一轮方案。人类给出目标和安全边界,系统则在真实设备与模拟环境之间反复试验。

传统机器人训练很依赖专家。工程师要手动设计奖励函数,决定什么动作算进步,处理相机、夹爪和控制器的接口,并为大量失败查错。每换一个任务,许多步骤都要重做。ENPIRE尝试把这类工程工作交给擅长读写代码的AI,让它根据实验反馈自动生成训练课程。扎带和GPU任务尤其有代表性,前者包含工具使用和材料变形,后者需要毫米级对齐,轻微偏差就可能损坏接口。

自主并不等于完全没有人参与。研究人员仍需准备机器人、定义任务、限制危险动作,并判断结果是否具有实际意义。智能体也会消耗大量计算和模型调用成本,可能写出看似合理却不稳定的代码。真实机械臂的失败还会造成磨损和安全风险,因此模拟验证、急停机制和动作范围限制不可缺少。

这项工作展示了AI编程能力的一种新出口。代码不再只控制屏幕上的软件,而是直接改变机器学习身体技能的方式。若这种框架能够稳定推广,仓库、工厂和实验室为新任务配置机器人的周期可能大幅缩短,小团队也能训练原本需要专门机器人部门才能完成的动作。真正的突破不只是机器人会安装GPU,而是训练者本身正在变成能够观察、编程、实验和修正的AI团队。

原文:https://arstechnica.com/ai/2026/06/ai-coding-agents-can-autonomously-direct-robot-training/