今天小编分享的互联网经验:国家队出手,通用人形机器人打响第一枪,欢迎阅读。
人形机器人距离下场干活,又往前迈进了一步。
3 月 12 日,北京人形机器人创新中心对外发布了首个 " 一腦多能 "、" 一腦多机 " 的通用具身智能平台 " 慧思开物 "。通过该平台,这家公司试图将人形机器人的通用化能力拆解成单个的技能模块,通过组合这些技能模块,让通用人形机器人的开发门槛大幅降低,并且还能让不同形态的机器人也能适配这些能力。
" 具身智能在‘智能化’方面仍处于初级阶段,行业亟需一个具备多本体兼容性、多场景适应性和强大泛化能力的通用智能平台。为了替具身智能产业补上通用軟體系统这块重要拼图,创新中心研发了全球首个支持多本体多场景应用的通用具身智能平台‘慧思开物’。"
创新中心总经理熊友军表示,在 " 慧思开物 " 的支持下,优必选在全球范围内首次把群腦网络(BrainNet)用于人形机器人执行整条产线的工业级任务。
AI 大模型 + 元技能库,组建 " 大腦 " 与 " 小腦 "
具体而言," 慧思开物 " 由 AI 大模型驱动的任务规划 " 大腦 " 以及数据驱动的端到端技能执行具身 " 小腦 " 构成。
其中," 大腦 " 具备自然互動、空间感知、意图理解、分层规划和错误反思等能力," 小腦 " 分为具身操作和具身运控两个子平台:具身操作涵盖元技能库、泛化抓取、技能拆解和错误处理等功能,而具身运控负责实现全身控制、双臂协作、稳定行走和移动导航等任务。
由具身 " 大腦 " 进行任务规划,再调用具身 " 小腦 " 技能库执行具体动作,并将执行反馈传递给具身 " 大腦 ",形成任务闭环。
基于高效协同的具身 " 大腦 " 与具身 " 小腦 " 架构," 慧思开物 " 可以精准解析自然语言互動指令,通过多模态信息融合与上下文理解,将复杂任务分解为可执行的子任务序列,并在任务执行过程中实时监测状态,通过自适应纠错机制和动态路径规划,确保任务的高效推进与准确完成。
同时," 慧思开物 " 内置多场景适配引擎,支持从工业制造到家庭服务等多种场景,结合高效的资源调度与并行计算能力,能够精准满足特定场景下的工作节拍与精度标准,为机器人在复杂场景的应用提供可靠的技术保障。
" 现在慧思开物的技能库中已经具备了 30 多种技能,可以覆盖大部分的任务类型。" 创新中心 CTO 唐剑表示,整个端侧运动控制的输出功率为 200 赫兹,可以让机器人的整个运动非常平滑。
而在人形机器人的数据训练方面,目前业界主流的训练方式有两种。其一,是让机器人在仿真环境中训练,然后将训练结果迁移到真实环境中;其二,则是让机器人直接在真实环境中训练,根据真实环境的训练过程进行 AI 的直接调教。
宇树科技创始人曾向钛媒体表示,随着端到端的 AI 模型进一步完善,仿真数据对于人形机器人将不再重要。而在与创新中心的交流中,唐剑则向钛媒体表示,他们更倾向于虚实结合的数据训练方式。
" 我们一贯坚持虚实结合的训练,才能达到最好的效果。" 唐剑称,在虚拟环境中能够非常好地去泛化和随机化场景,比如改变环境光线、物体形状、颜色等。而在实际场景中,这些多样性并不容易实现。
根据创新中心提供的数据,当混合数据比例达到真机数据:仿真数据为 100:400 时,机器人的执行成功率接近 100%。
距离 " 下场干活 ",越来越近
基于虚实结合的训练模式和以技能库为核心的运动执行方式," 慧思开物 " 此次也展示了工业分拣、积木搭建、桌面清理和物流打包四个场景的真机操作。通过语音互動、APP 直连等多种方式,用户能够与机器人自然互動,并通过模糊指令让机器人完成操作任务。
在工业分拣任务中,通过 " 慧思开物 "APP 直连,UR-5e 机械臂能够精准解析语音指令,将复杂的技术能力(如推理、规划、技能调用)封装为简单易用的操作流程,并通过双臂协同的方式完成分拣操作,显著降低了用户使用门槛。
同时,平台支持自定义模型和技能的快速添加,能够灵活适配不同场景的应用需求,为工业自动化领網域提供便捷、高效的解决方案。
在积木搭建中," 慧思开物 " 通过大模型思维链能力,首次实现了复杂任务的智能化拆解与执行。基于随机搭建的积木样例," 天工 " 利用视觉大模型(VLM)对样例进行拆解,精确规划每一层的搭建顺序,准确拾取相应积木,并按次序完成了 3 层积木的毫米级精准搭建。
在桌面清理场景中,人形机器人 " 天工 " 展现了双臂协作的高效性与动态环境下的自适应能力,流畅地整理桌面餐具,将垃圾收进锡纸盘并放入垃圾桶。整个过程中,机器人在多次任意随机的人为打断和移位干扰的情况下,仍能自主纠错、重新规划并完成任务。
在物流打包场景,基于 " 慧思开物 " 平台," 天工 PRO" 首次实现了全尺寸人形机器人物流打包全流程的自主作业。
通过上半身 29 个自由度的配合," 天工 PRO" 使用左右手分别拿起物品和扫码枪,通过头部相机确认物品條碼位置,双手协同完成扫码、装箱、封箱及粘贴快递标签等一系列操作。
" 目前,创新中心正在将这些能力逐步实现商业化落地。" 唐剑称,现在主要探索的方向为教育科研、健康养老、特种作业以及工业制造。(本文首发于钛媒体 APP,作者 | 饶翔宇 编辑 | 钟毅)