波士顿动力也搞端到端 ai 了!
这次升级,Atlas不仅能理解自然语言指令,还能自主规划动作并应对突发状况。
只见操作员故意合上箱盖,机器人依然能识别变化并顺利打开箱子。
即使箱子被人为移动位置,它也能精准感知环境变化并调整行动路径。
当周围有遗漏的部件时,Atlas也能主动发现,并准确将其放入指定箱内。
据悉,此次更新由波士顿动力联合丰田研究院共同推出,基于大型行为模型(LBM),推出了全新版本的 Atlas MTS。
新成果一经发布便引发热议,官方在 YouTube 发布的演示视频观看量迅速突破十万,点赞数超一万。
不少网友还注意到,机器人已能自然弯曲膝盖,纷纷表示:“这下背部不会受伤了。”
点赞高达 2.4K,看来大家对机器人“身体健康”也很关心呢~
关于这项全新能力的技术细节,官方也发布了详细报告。
给 Atlas 装上大脑
报告指出,通过端到端的语言条件策略,机器人可充分发挥自身潜力,实现稳健行走、精确落脚、下蹲、重心转移,同时有效避免自体碰撞。
该策略构建包含四个关键步骤:
收集具身行为数据;
处理、标注与整理数据;
训练神经网络模型;
通过测试任务评估策略表现。
更引人注目的是,此次大型行为模型采用了拥有 4.5 亿参数的扩散 Transformer 架构,并结合流匹配目标,能够将 30Hz 图像、本体感知信息及自然语言指令等多模态输入,实时转化为控制 Atlas 动作的精准指令。
通俗来说,Transformer 充当“全局之眼”,统筹整体动作结构与细节关联;扩散机制负责逐步细化,将模糊指令转化为具体动作;流匹配损失则提供真实参照,确保动作既符合物理规律,又能灵活适应多样场景。
在此过程中,波士顿动力的关键突破是将 Atlas 的模型预测控制器与 VR 操作界面深度融合,从而覆盖从指尖级精细操作到全身运动、伸展与位移等各类复杂任务。
这让远程操作员能够充分释放机器人潜能,实现人机动作与感知的高度同步。
尤为值得一提的是,此次升级让 Atlas 具备了自主处理意外的能力。
当出现零件掉落或箱盖未关等情况时,机器人能智能判断并做出恰当响应。
这简直如同为 Atlas 赋予了“大脑”!
不仅如此,官方表示,只要人类能够演示的动作,Atlas 都具备学习能力,例如系绳结、折叠椅子、翻转轮胎等皆可掌握。
不得不说,这种泛化学习能力令人惊叹。
告别液压,电驱机器人更适配 AI
提到波士顿动力机器人,不得不回顾 Atlas 的液压版本。
该版本已于 2024 年 4 月正式退役,并在 24 小时内被全电动新版本取代。
原因在于液压系统成本高昂、响应延迟,且难以与现代 AI 框架协同。
相比之下,电机驱动系统响应更快、能耗更低,且天然契合 AI 学习架构。
自转向电驱路线以来,波士顿动力持续推出新技能。
去年 8 月,Atlas 在机器人顶会 RSS 上展示了标准俯卧撑动作(当时尚无手指,可称“拳卧撑”)。
动作之流畅令人印象深刻。
两个月后,它已能胜任工厂任务,只需输入搬运起止坐标,即可全自动完成物品分装。
今年 5 月,波士顿动力再次升级,赋予机器人 3D 空间感知与实时物体追踪能力,可独立执行更复杂的工业流程。
此次大型行为模型(LBM)的引入,标志着其全面拥抱新一代智能控制技术。
在看完了波士顿动力从液压到电驱的转型后,再来看看国内始终坚持电驱路线的宇树科技。
从四足机器狗 Go 系列,到人形机器人 H1、G1、R1,宇树始终坚持“小而美”的电驱理念,凭借快速迭代在全球崭露头角。
如今,连能跳“芭蕾舞”的 180 型机器人也已亮相。
未来,随着电驱硬件与 AI 算法的深度融合,电驱机器人的时代才真正拉开序幕。
参考链接:
[ 1 ] https://www.php.cn/link/e672848731d3b73445e638650520c9c9
[ 2 ] https://www.php.cn/link/c46aa3e64c16b0ecf6bf60161a1e1c76
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
希望了解 AI 产品最新趋势?
量子位智库「AI 100」2025 上半年
「旗舰产品榜」和「创新产品榜」
给出最新参考
点亮星标
科技前沿进展每日见
以上就是波士顿动力机器人终于有脑子了!人类故意使绊子也不怕的详细内容,更多请关注其它相关文章!
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。