机器人不再等人写教程，AI智能体能自己设计训练它

Nvidia让编程智能体自主设计实验并训练机械臂完成精细任务。

把一组AI编程智能体放进装有机械臂的实验室，提供计算资源和充足的令牌预算，它们能否自行想出训练办法？Nvidia的机器人研究团队给出的答案是肯定的。智能体设计训练流程后，机械臂学会剪断扎带，还能把GPU准确插入主板上狭窄的插槽。这些动作需要感知物体位置、规划接触路径、控制力度，并根据失败不断调整。

实现这一过程的系统名为ENPIRE。它不是单一模型，而是一套围绕模型搭建的智能体框架，为AI提供工具调用、记忆、上下文、约束和反馈循环。多个编程智能体可以分工检查机器人状态、编写或修改训练代码、分析实验结果，再提出下一轮方案。人类给出目标和安全边界，系统则在真实设备与模拟环境之间反复试验。

传统机器人训练很依赖专家。工程师要手动设计奖励函数，决定什么动作算进步，处理相机、夹爪和控制器的接口，并为大量失败查错。每换一个任务，许多步骤都要重做。ENPIRE尝试把这类工程工作交给擅长读写代码的AI，让它根据实验反馈自动生成训练课程。扎带和GPU任务尤其有代表性，前者包含工具使用和材料变形，后者需要毫米级对齐，轻微偏差就可能损坏接口。

自主并不等于完全没有人参与。研究人员仍需准备机器人、定义任务、限制危险动作，并判断结果是否具有实际意义。智能体也会消耗大量计算和模型调用成本，可能写出看似合理却不稳定的代码。真实机械臂的失败还会造成磨损和安全风险，因此模拟验证、急停机制和动作范围限制不可缺少。

这项工作展示了AI编程能力的一种新出口。代码不再只控制屏幕上的软件，而是直接改变机器学习身体技能的方式。若这种框架能够稳定推广，仓库、工厂和实验室为新任务配置机器人的周期可能大幅缩短，小团队也能训练原本需要专门机器人部门才能完成的动作。真正的突破不只是机器人会安装GPU，而是训练者本身正在变成能够观察、编程、实验和修正的AI团队。

原文：https://arstechnica.com/ai/2026/06/ai-coding-agents-can-autonomously-direct-robot-training/