今天小编分享的科技经验:稚晖君人形机器人全家桶发布:穿针拧螺丝搓麻将,机器娃没满月就干活,开源大招杀疯了!,欢迎阅读。
作者 | 香草 云鹏
编辑 | 心缘
打麻将、拆快递、纽扣穿针,还能做 30KG 重物提拉!
沉寂一年,稚晖君带着他的二代机器人全家桶重磅回归,秀出的各种新技能令人眼前一亮。
智东西 8 月 18 日报道,今日," 野生钢铁侠 " 稚晖君一连亮出5 款智元人形机器人,全程整活儿,前有机器人开瓶盖、倒可乐、搬重物,后有机器人上场主持、穿针、搓麻将、推销卖车,最后还有老父亲稚晖君陪伴 " 夹子手机器娃 " 蹒跚学步的感人成长 Vlog,并甩出 "0 元购" 终极大招。
智元不仅首次定义具身智能的五级技术演进路线图,而且公布了最新商业化进展:团队面向量产做了大量的正向设计分析、系统方案重构、核心部件自研;远征系列产品规模量产正在进行,接收到来自制造业、互動服务行业等不同客户的大量订单,整个团队都在加班加点准备批量交付。
稚晖君还秀了一波大格局,化身 " 赛博源神 ",从数据集、设计图纸、軟體框架、中间件源码到运控算法,通通开源,要让人人可造人形机器人。
智元机器人此次发布了 "远征" 与 "灵犀" 两个系列,共 5 款商用机器人新品,包括远征 A2、远征 A2-W、远征 A2-Max、灵犀 X1以及灵犀 X1-W。
发布会一开场,稚晖君直接和远征 A2 机器人家族的几位成员演了一出 " 人机小品 "。
远征 A2 系列秀出不少新技能,比如远征 A2-W 机器人用开瓶器开可乐瓶、操作榨汁机做出一杯 " 葡汽可乐 "、精准将榨汁机中的饮料倒入杯中。
" 大力士 " 远征 A2-Max 则原地抱起 80 多斤的重物。整体来看,机器人的肢体动作流畅灵巧,相比去年 8 月首次出场时,显然娴熟了许多,但动作属实有点太过缓慢,光是做饮料就花了整整 3 分钟。
演完小品后,稚晖君转身走入发布会现场,一台远征 A2 机器人直接登台当主持人,介绍了远征 A2 系列机器人家族。
远征 A2 系列包括远征 A2、远征 A2-W和远征 A2-Max三款机器人,分别针对互動服务、柔性制造和重载特种场景,内嵌大语言模型,可实现超拟人音色语音对话,各种技能都可以持续学习。
▲远征 A2 语音互動现场演示
作为今天发布会的 "One More Thing",稚晖君亮出自家的首款模块化机器人灵犀 X1,它个头不大,可以看作是 " 青春版 " 机器人,在成本方面有大幅优化。
稚晖君带领不到 10 人的团队,在不到 3 个月的时间里,就把灵犀 X1 从概念做成了整机。灵犀 X1 从组装完成到今天,还不到两周的时间,因此是 " 还没满月就出来干活了 "。
值得一提的是,灵犀 X1 有个 "机机模式",手机可以直接放到机器人里,做机器人的 " 大腦 ",这个 " 腦洞 " 确实够大。
灵犀 X1 的螢幕可以定制画面,比如显示稚晖君自己的脸,颇有一种机器人带上了 Vision Pro 的既视感。
为了避免 " 价格战 ",稚晖君直接给灵犀 X1 定价为 "0 元 ",全面开源。
在应用场景方面,远征 A2 可以在 4S 店内作销售导购,多语言交流,了解用户需求,例如听到顾客想喝水就去拿水,路上可以自动避障;在工厂里,远征 A2 基本可以完成质检上料、货架摆放货物等工作。
一、全身40+主动自由度,灵巧手19自由度,四大子網域核心系统
人形机器人远征 A2全身采用外骨骼设计,身高体重都与成年人类相仿,可续航超 2 小时,行走速度每秒 1 米。
在外形方面,远征 A2 比上一代远征 A1 更像人了,腦袋更圆、四肢比例更协调,腿部形态从 A1 的反屈膝设计变为了正屈膝。
远征 A2-W由一个人形上半身和背后的机械身体组成,主要用于工业制造领網域,其主动自由度 22 个,续航超过 5 小时,每秒可行走 1.5 米以上。双臂写作、多模态感知、持久作业等是远征 A2-W 针对制造场景进行的针对性优化。
远征 A2-Max最大的特点就是力大无穷,其主动自由度达到 53 个,双臂可称重 80 斤以上。
远征 A2 系列产品的工业设计采用了家族化 ID 语言,有助于实现量产以及独特的视觉识别特征。
在核心零部件上,远征 A2 系列借鉴新能源汽车的系统,将机器人的核心系统划分为动力網域、感知網域、通信網域、控制網域四个子網域。
在动力網域方面,远征 A2 的关节模组在上一代的基础上面向量产做了大量的优化和测试,其中部分关节电机的峰值扭矩可以达到 512 Nm。
视触觉灵巧手也全面更新,拥有 19 个自由度,其中 12 个为主动关节。
基于灵活的手部关节和视觉、触觉感知,灵巧手现在可以轻松拧螺丝、拆快递。
通用的物品抓取更是不在话下,还能双手配合倒水。
纽扣穿针这样的精细活,灵巧手也能轻松实现。
远征 A2 拥有 7 自由度双臂,单臂自由度达到 3+2+2+N,臂展 60 厘米。双臂内置六维力传感器,可以配合实现更复杂的操作。
感知網域方面,远征 A2 增加了激光雷达、全景相机等传感器,可实现全網域安全、局部避障。基于自研的系统算法,机器人对环境的理解也大幅提升。
通信網域方面,智元团队自研了一套轻量化、高性能的智能机器人通信框架 AimRT,可以完全不依赖第三方中间件。
值得一提的是,这一框架将在下个月底全面开源。
控制網域方面,远征 A2 在去年 Model base 的基础上增加了数据驱动的 Learning base,使用两种方式共同驱动机器人的行为优化,行走起来更稳定自然。
在运动算法层面,智元构建了一套由自然语言指令集驱动,可以适配不同机器人硬體的 AgentOS。
基于机器人本体,AgentOS 定义了技能库,通过多模态大模型去定义机器人的状态,再由任务执行器来驱动各种原子技能去进行任务操作,然后再进行反馈来获取这信号。
AgentOS 目前还在预研初期,不过从开头的自制饮料等演示来看,它已经实现了比较好的任务编排效果。
远征 A2 的整体框架参考强化学习来构建,整个机器人是一个软硬體非常复杂的系统,既涉及到内部各个硬體模块的协同和部署,也需要軟體跟算法做高效的配合
智元构建了开放软硬體平台 AIMA,将远征 A2 的复杂系统的二次开发能力,开放给外部更多的开发者,共同去构建整个生态。
二、互動服务、柔性制造领網域落地,自研数据采集全流程开源
稚晖君首次公布了智元机器人的具身智能技术演进路线图,从 G1 到 G5 分别对应基础自动化、通用原子技能、端到端操作技能、端到端操作大模型以及最终的AGI,类似自动驾驶领網域的 L1、L2、L3 分级。
去年一年,智元机器人在 G2、G3 阶段并行研发,其中基于 G2 的原子能力已经实现实际场景的落地应用。
例如在互動服务场景中,远征 A2 可以针对客户进行精准营销。在汽车 4S 店内,它可以作为导购为客户提供服务。基于记忆能力,远征 A2 能够知道顾客上次看中的是哪款车,并主动推荐体验。
基于多模态大模型,远征 A2 能对不同意图指令精准识别。比如当小朋友说口渴了,远征 A2 会主动询问需要什么饮品,并取回来交给她。
在行进的路上,远征 A2 还能智能避障,躲开碰到的人或物品。
基于语言动作大模型,远征 A2 可以端到端生成自然动作,比如说 "1 万现金优惠 " 时,它非常自然地比了个 1 的手势。
虽然从人形机器人演进的角度来看,远征 A2 已经实现了很大的进步,但仅凭其现在慢吞吞的说话和做事效率,离替代人类销售还差得远。
在柔性制造场景中,远征 A2-W 可以基于多模态感知、双臂协作、原子模块化等能力,实现工件投料、上下料、质检、搬运等,还能在不同工序间自动转场。
智元具身智能数据系统 AIDEA是稚晖君放出的另一个关键大招,包括仿真平台、机器学习平台、功能部署平台、数据平台,可以说是智元机器人从实验室到工厂再到量产商用的关键基础。
具身领網域有一个很大的痛点,就是真实场景数据稀缺。它不像大语言模型有海量的互联网免费数据,也不像自动驾驶每天有上百万汽车在路上采集到的真实数据。
为了解决这一痛点,智元自研了具身智能数据系统 AIDEA,形成了一套全流程稳定可靠的数据采集方案。
AIDEA 将在今年 Q4 全面开源百万条真机、千万条仿真数据集,此外,今年下半年智元将会落地百台以上机器人专门用于数据采集。
三、首个模块化机器人灵犀 X1 亮相,团队不到 10 人,2 个月从概念到整机
在发布会临近尾声的时候,稚晖君还带来了一个One more thing:智元机器人首个模块化机器人灵犀 X1,就藏在发布会开头远征 A2-Max 举起的箱子里。
灵犀 X1 由智元 X-Lab打造,这是智元于 6 月新成立的一个实验室,也叫 "稚晖君实验室",专门做一些前沿技术创新类研究。这台灵犀 X1,是由不到 10 个人,在两个多月的时间内从无到有自研得到的。
灵犀 X1 身高 133 厘米,体重不到 66 斤,十分小巧。其手臂使用串并联混合结构,整臂重量只有 2kg,这使得它可以支持更灵活的运动、更高效的控制。
灵犀 X1 还创新推出 "机机模式",也就是机器人 + 手机,把手机放到机器人的 " 头 " 里来做大腦,让手机本身的麦克风、扬声器、螢幕等硬體,以及网络、AI 算力等軟體能力,为机器人带来新的突破。
通过在远征系列上积累的各种研发经验,灵犀 X1 上也自研了两款全新的关节,其全身 30 多个自由度,均由这两款关节提供支持,做到了极致的标准化。
灵犀 X1 也推出了用于数据采集的机器人灵犀 X1-W,相比远征 A2-W 成本更低。
就像稚晖君本人一样,智元机器人可谓是将开源贯彻到底。灵犀 X1 的本体设计图纸、軟體框架、中间件源码,以及基础运控算法都将全面开源。
四、沉寂一年,华为天才少年 " 闷声干大事 "
自智元机器人首款人形机器人远征 A1 发布,刚好过去一整年的时间。如果说远征 A1 是从零到一的突破,那么这次发布的远征 A2,则是在从 1 到 100 的 AGI 之路上,迈出的重要一步。
智元机器人成立于去年 2 月,致力于研发具身智能机器人产品及应用生态。带着创始人之一稚晖君的光环,智元机器人从诞生之初就备受科技圈关注。
稚晖君本名彭志辉,本硕均毕业于电子科技大学,毕业后曾在 OPPO 研究院 AI 实验室担任算法工程师,随后在 2020 年加入 " 华为天才少年计划 ",从事昇腾 AI 芯片和 AI 算法相关研究工作。
那一年的华为天才少年,总共有 6 名。
▲稚晖君华为天才少年签约纪念
稚晖君的另一个身份,是科技圈知名 up 主,因在 B 站发布的一系列硬核科技产品视频而闻名。
视频中的他软硬體 " 通吃 ",从写代码、画电路图,到建模、装配全部 DIY,独立制作了给葡萄缝针的钢铁侠机械臂、" 能够自己行走 " 不摔跤的自行车、模块化机械键盘等有趣的项目。
▲稚晖军 B 站主页
2022 年 12 月,稚晖君宣布已从华为离职创业,次年 2 月就正式成立了智元机器人(上海智元新创技术有限公司),作为联合创始人之一担任 CTO 和首席架构师。
智元机器人也备受资本青睐,目前已完成 A3 轮融资,投资方包括比亚迪、BV 百度风投、红杉中国、高瓴创投等知名企业或机构,估值也早在去年就超过 10 亿美元,晋升独角兽。
结语:人形机器人明星独角兽重磅 " 回归 "
就在上周,美国人形机器人创企 Figure 刚刚发布第二代机器人 Figure 02,要做 " 地表最强人形机器人 "。Figure 02 第四代手部拥有 16 个自由度,比特斯拉的擎天柱二代多了 5 个,而远征 A2 则更胜一筹达到 19 个。
在自媒体时代,稚晖君就时常 " 闷声干大事 ",半年做一个项目惊艳全场。在过去一年中,智元机器人一直比较低调,此次时隔一年再办发布会,稚晖君果然没让大家失望,不仅甩出超强远征 A2 全家桶,还带来了灵犀 X1 这一惊喜新品。光是现场演示,就已经打败了一大半同类产品。
在生态方面,智元看起来是要走和稚晖君本人同样的开源路线,让更多开发者参与进来,共同为远征 A2、灵犀 X1 的迭代添砖加瓦。