今天小编分享的互联网经验:动察:探索Figure AI的Helix模型:让机器人更聪明、更高效,欢迎阅读。
具身机器人的发展,技术上来说已经进入到百家争鸣的新阶段,各个厂商都在试图用更好的技术来驱动机器人。而如何让机器人看起来更聪明,处理事情更加有效率,是要解决的一个难点。我们通过追踪不同机器人厂商的技术前沿,可以感知具身机器人进化的脉搏。这次我们来认识下 Figure AI 的 Helix 人工智能模型,以及采用这个新技术的具身机器人 Figure 02,未来有望提升人类生产力。
老龄化冲击下,人类社会需要机器人来提高生产力
谈起,Figure AI,就不能不提起创始人兼首席执行官 Brett Adcock。他是一个连续创业者,他认为,人类正面临前所未有的劳动力短缺。仅在美国就有超过 1000 万个不安全或不受欢迎的工作岗位,人口老龄化只会让企业扩大劳动力规模变得越来越困难。而在这个时期,多个国家和地区出现了人口老龄化,包括中国。
因此,本世纪劳动力供应增长将逐步停止。如果人类社会想要继续增长,就需要提高生产力——这意味着更多的自动化。
Figure 的目标是:开发通用人形机器人,为人类带来积极影响,为子孙后代创造更美好的生活。这些机器人可以满足对不安全和不受欢迎的工作的需求,从事危险和重复性的体力劳动——最终让我们过上更快乐、更有意义的生活。
值得庆幸的是,我们正处于人工智能和机器人革命的早期阶段。这为大幅提高我们的生产和生活水平提供了独特的机会。
随着自动化继续大规模融入人类生活,我们可以预测,我们所熟知的以劳动力为基础的经济将发生转变。能够思考、学习、推理并与环境互动的机器人最终将能够比人类更好地完成任务。
Figure AI 在具身机器人的硬體及成本上精打细算
那么要如何构建功能齐全的具身机器人,执行类似人类的操作,并将人形机器人融入劳动力之中。这是一个三步走的路径,只有把这三个路径完成,才能形成生产力。
而在具身机器人的硬體方面,Figure AI 团队已经推出了 2 款全电动机械人形机器人,具备双手,而最新的产品是 Figure 02。与 Figure 01 不同,新品外观看过去更拟人,五个手指更加灵巧多变。据介绍,迭代后的 Figure 手部具有 16 个自由度,能够承受与人类相当的力量。Figure 02 配备了 6 个 RGB 摄像头,用于感知物理世界,同时还有麦克风和扬声器用来和人类进行互动。
Figure AI 目标是开发具有人类身体能力的硬體。正在根据运动范围、有效载荷、扭矩、运输成本和速度来衡量这一点,并将通过快速的开发周期不断改进。同时,通过高产量生产降低单个机器人的部門成本,努力实现可持续的规模经济。
Figure AI 在人工智能以及机器人神经网络上取得突破
机器人要实现人类的一些动作,如果只是模仿,那不足以形成自主行为能力,这时候引入 AI 人工智能是很好的解决方案。Figure AI 的第一代产品,Figure 01 学会了搬箱子,能够完成简单的体力任务。随后,通过观看人类示范视频就学会了冲咖啡,还会自己纠正错误。紧接着,Figure 宣布同 OpenAI 签署合作協定,为其人形机器人开发生成式 AI,但这只是第一个阶段。
最大的突破来自于 Figure AI 自身,他们断开和 OpenAI 的合作,推出了 Helix,这是一种通用的 " 视觉 - 语言 - 动作 " ( VLA ) 模型,它将感知、语言理解和学习控制统一起来,以克服机器人技术领網域的多项长期挑战。
Helix 是个极大的突破,是第一款对整个人形上身(包括手腕、躯干、头部和各个手指)进行高速率连续控制的 VLA 模型。这就意味着可以实现多个机器人之间的协作,共同完成一项需要连续操作的任务。
另外,它有了一些自主学习决策的能力,配备了 Helix 的 Figure 02 机器人现在只需按照自然语言提示,就能拿起几乎任何小型家居物品,包括数千种它们从未遇到过的物品。
这就需要赋予机器人思考的灵魂,Helix 使用一组神经网络权重来学习所有行为(挑选和放置物品、使用抽屉和冰箱以及跨机器人互動),而无需任何针对特定任务的微调。并且是第一款完全在嵌入式低功耗 GPU 上运行的 VLA 模型,可立即进行商业部署,在未来的成本上也有一定优势。
Figure AI 的机器人已经可以执行包裹分类和处理任务
将人形机器人引入劳动力队伍是 Figure 使命的核心。而最新的 Figure AI 的机器人已经可以进行物流包裹处理和分类。这项任务需要人类级别的速度、精度和适应性,突破了从像素到动作的学习操作的界限。
这个能力是 Helix System 1 大模型迭代来的,其具有丰富的 3D 理解能力,可以实现更精确的深度感知运动。每个 Figure 机器人现在都可以自我校准,从而实现跨机器人无缝传输。使用简单的测试时间加速技术,Helix 实现了比演示者更快的执行速度,同时保持了较高的成功率和灵活性。
在以往传统的具身机器人模拟中,需要对物品进行描绘和界定。而物流包裹是变化的,由于环境永远无法完全预测,因此系统必须能够自我纠正。此外,它还需要跟踪连续移动的传送带上大量包裹的动态流动并保持高吞吐量。Helix 视觉运动策略现在将两个摄像头的特征合并到多尺度立体网络中,然后再进行标记,多尺度特征使系统能够解释精细细节以及更广泛的上下文线索,共同促进视觉控制的可靠性。
最后,通过利用学习校准和视觉本体感受模块,Figure AI 能够将最初在单个机器人数据上训练的相同策略应用于多个其他机器人,这就是协同工作的核心能力。也就是这个能力,使得其上流水线能够发挥更大的生成效能。
Figure AI 的官方视频展示了如何利用高质量的数据集,结合立体多尺度视觉、在线校准和测试时间加速等架构改进,在现实世界的物流分拣场景中实现比演示者更快的灵巧机器人操作——所有这些都是在使用相对适量的演示数据的情况下实现的。物流分拣线的机器人视频已经发布,也就是说,Figure AI 在机器人转化为劳动力上已经取得了成就。
Figure AI 不断获得融资,是对其技术路线的肯定
最新消息,Figure AI 正在洽谈新一轮 15 亿美元融资,公司估值高达 395 亿美元,比上一轮高了 15 倍左右。预计将由 Align Ventures 和 Parkway Venture Capital 领投。
而在这之前,2024 年 3 月,Figure AI 宣布完成 6.75 亿美元,估值 26 亿美元,投资方包括微软、OpenAI Startup Fund、Nvidia(英伟达)、亚马逊工业创新基金、在科技界响当当的另一个人物杰夫 · 贝索斯(Jeff Bezos)、Parkway Venture Capital、英特尔投资、Align Ventures 和 ARK Invest,都是有份量的投资人。
Figure AI 创始人兼首席执行官 Brett Adcock 近期称,Figure 已签约第二位(目前还处在保密阶段)商业客户,并有望出货 100,000 个人形机器人。而实际上,它的第一个客户是宝马公司,其具身机器人已经在宝马工厂测试一些简单的工作。
Figure AI 的融资如果能够再度落实,那就意味着其技术路线受到行业肯定。不过全新的 Helix 模型驱动的机器人能力还处在早期阶段,后面会进化到什么程度,能不能批量商业化成会思考能决策自主进化的劳动力机器人,我们拭目以待。