今天小编分享的科技经验:人形机器人将进宝马工厂「实习」,之前它还只会冲咖啡,欢迎阅读。
它的技能是看人类演示视频学会的!
前段时间,名为 "Figure 01" 的机器人因会冲咖啡而走红。这两天,它还找到了新工作,要去宝马的美国工厂 " 实习 ",干得好的话,一两年后就能到流水线上参与 " 造车 " 了。
Figure 01 是创业公司 Figure 的大作,该公司仅成立一年,主营开发和制造人形机器人,估值已经超过 4 亿美元。最近,Figure 与知名车企宝马达成重要協定,将在今年晚些时候将 Figure 01 机器人引入到南卡罗来纳州斯巴达堡的宝马工厂。
斯坦福的机器人能炒虾,特斯拉的擎天柱机器人能在人类的操纵下做家务,而 Figure 01 的特别之处在于超强的自主学习能力,它能看着视频学会操作技能,这意味着,它的技能会在学习中变得越来越丰富。
如果 2023 年的科技前沿是 ChatGPT 引领的人工智能自然语言大模型,那么 2024 年的前沿很可能是 AI 模型加持下的机器人,各种具备服务人类能力的机器人将不断涌现,它们不再是狗、蛇、属这些仿动物形态,而是直接仿人造型,协助甚至替代人类执行体力劳动。
Figure 01 看个视频就掌握了技能
刚刚进入 2024 年,各家身怀绝技的人形机器人一个接一个的冒了出来。前有斯坦福炒虾机器人,后有特斯拉的叠衣机器人,最近,会冲咖啡的机器人 Figure 01 也来了。
打开机盖、放入咖啡包、按下开始按钮,Figure 01 一整套动作十分流畅。与其他机器人做家务的视频不同,Figure 01 冲咖啡的视频并没有做加速处理。
当然,Figure 01 还远不如钢铁侠的 " 贾维斯 " 那么厉害,但 " 小贾 " 毕竟只存在于电影里,而 Figure 01 已经随着人工智能的发展走进了现实。
它完全由 AI 驱动。别小看了这一点,因为有了 AI 后,要求 Figure 01 完成事务时已无需事先预设程式,AI 为它注入了强大的学习能力。官方说法是,Figure 01 只需要看一看人类示范的演示视频,再加上 10 小时端到端的训练,就能学会视频里的操作技巧,然后完全自主地搞定任务。
冲咖啡只是证明 Figure 01 具备自学能力的第一步,开发公司 Figure 表示,只要给它足够的时间,它还就能攻克更复杂的任务。复杂到什么程度呢?Figure 公司直接用一单合作给出了答案。
今年 1 月 18 日,Figure 表示,将会把这款机器人送入宝马斯巴坦堡的工厂进行试点应用,主要替代人类从事一些危险度高的任务。
Figure 与宝马达成合作将 Figure01 引入汽车工厂
宝马的斯巴坦堡工厂位于美国的南卡罗来纳州,是宝马 X 系列和 Z 系列的主要组装工厂,BMW X6 的车身制造就在这个工厂里用到了 300 多个机器人,其中,车窗玻璃安装都是机器人在执行操作,只有侧窗玻璃由人工安装,如此一来,加工时间缩短了一半以上。
而即将进宝马工厂 " 上工 " 从事危险作业的 Figure 01,身高 5 英尺 6 英寸,也就是 1 米 67 的个头;可承重 19.95 公斤,差不多是饮水机用的一大桶桶装水的重量;充电后,它可以运行 5 小时,行走速度为 4.3 公里 / 小时。
" 通用目的机器人的潜力完全未被发掘。"Figure 的首席执行官兼创始人布雷特 · 阿德科克表示, 他们的机器人能让公司提高生产力、降低成本,并创造一个更安全、更一致的工作环境。
据悉,初期阶段,Figure 01 将从 " 少量工作 " 开始,随着时间推移,这些由 AI 驱动的人形机器人将加入更多的制造工作,包括箱子搬运、拾取和放置任务、托盘装载,以及汽车制造商一直难以留住人工工人的其他岗位。
如果达到目标,Figure 01 的部署数量将会增加,预计需要 12-24 个月的时间真正集成到宝马的制造流程中,包括车身车间、钣金和仓库等工区。
一大批人形机器人已在路上
Figure 01 不过是众多人形机器人中的一款,2024 年,更多的仿人机器人正在来的路上。
今年刚刚成立的中国公司 MagicLab 推出了运动型的纯电动机器人,它已经能完成后空翻落地、优雅起身这样的体操运动员动作了。
挪威的人形机器人初创企业 1X Technologies 今年直接带来了 EVE 和 NEO 两款产品。EVE 已在美国和欧洲部分地区投入商业化应用,能巡逻,能搬运,能导航,能放哨,相当于机器人保安;而 NEO 目前仍处于研发阶段,据称,它会像人类一样柔软、轻巧,可以通过面部表情与人类沟通。
1X Technologies 推出两款人形机器人
机器人赛道的元老 DeepMind 当然不甘落后,持续在仿人机器的 " 大腦 " 层面做开发,其有关机器人的三个关键研究 AutoRT、SARA-RT 和 RT-Trajectory,将有效提高机器人的数据收集效率和泛化能力。
其中,AutoRT 是机器人训练系统,能够同时指导多台机器人在不同环境中执行多样化任务;SARA-RT 是提升机器人 Transformer 模型效率的系统;RT-Trajectory 则是实现机器人泛化能力的模型,能让机器人从 2D 轨迹影像中学习控制策略。
强调自身定位是 " 人工智能 / 机器人公司 " 的特斯拉,最近带火的视频是旗下人形机器人 " 擎天柱 " 叠衣服的画面。视频中," 擎天柱 " 站在桌子前,从盒子里取出一件黑色 T 恤,然后缓慢地将之叠好。
不过,这段视频遭到质疑。有网友指出,马斯克使用了 CGI(三维动画)技术伪造了视频;还有人发现视频里露出了机械臂,据此,网友称这一系列叠衣动作可能并非完全由机器人自主完成,而是外部遥控操作的结果。
特斯拉机器人叠衣服视频中出现机械臂
被 " 打脸 " 后,马斯克也老老实实承认," 擎天柱 " 目前还不能自主执行叠衣服操作,但 " 未来肯定行 "。
如果单从技术性看," 擎天柱 " 还是有所进步,它新增了触摸传感器,对接触对象的形状、大小、位置和方向等信息能实现精准获取和分析,尤其是对压力有了更好的判断,从而精准控制力度,比如,机器人用 " 手 " 拿起鸡蛋也不会捏碎。
在自主执行操作层面,其实大多数机器人都还做不到。
比如,前段时间在视频平台爆火的斯坦福家务机器人 Mobile ALOHA,它采用的是自动 + 遥控的学习模式,需要人类先操控机械臂为它打个样,然后 Mobile ALOHA 才能 " 照葫芦画瓢 " 学习类似的动作。
而且,不是只要演示过后 Mobile ALOHA 就能全部学会。根据论文,它学会擦红酒渍的成功率为 95% ,推椅子为 80% ,炒虾只有 40%。此外,我们看它操作时也会发现,视频是倍速播放的,可以想象,在真实场景中,Mobile ALOHA 做家务的速度一定十分缓慢。
到了 Figure 01,自主学习能力在 AI 的加持下得到了提升。Figure 公司称,他们的机器人完全由 AI 驱动,能够处理通用任务,并最终实现机器人与环境的学习和互动。据说,Figure 01 冲咖啡就是通过观看视频后上手执行的,并没有人类远程操作。
英伟达高级研究科学家 Jim Fan 曾预测,2024 年将是 " 机器人年 ",而从去年热到今年的 AI,将是人形机器人智能化的加速器。