今天小编分享的互联网经验:华为“天才少年”创业首秀:AI大模型+人形机器人,欢迎阅读。
来源:猎云精选,文 / 王非
获百度高瓴经纬等多轮投资," 爆肝 " 近半年,原华为 " 天才少年 " 创业首秀来了!
8 月 18 日上午,人称 " 稚晖君 "、" 野生钢铁侠 " 的彭志辉,作为智元机器人(Agibot,下称:智元)联合创始人正式发布——智元具身智能机器人 " 远征 A1(RAISE A1)"。
据介绍,远征 A1 身高 175cm、体重 55kg、最高步速可达 7km/h、全身 49 个自由度、整机承重 80kg、单臂最大负载 5kg,不仅在形态上与人类相似,更在双足行走、智能任务、人机互动等领網域展现出了强大的能力。
据悉,智元计划将整个机器人硬體成本控制在 20 万元以内,并在明年快速切入商业化落地,首先应用于工业智造领網域,随后逐步走向家庭,协助工人、科研人员和家庭成员完成各种任务。
" 爆肝 " 半年,人行机器人实机亮相
4 月 1 日,稚晖君在 B 站上传了他最新自制的机器人 "neZHa(哪吒)" 制作视频,这也是他离开华为创业后发布的第一个视频。
根据稚晖君在 B 站账号上公布的信息,他正在开发一款结合足式机器人和轮式机器人优点的轮足式机器人。他不仅负责硬體模块的设计,还涉及机械、电控甚至部分 AI 方面的开发,几乎实现了全栈自研。
而这,也被认为是智元新产品的雏形。随后,就是疯狂赶工。稚晖君在 5 月 21 日发布的微博中就曾写道:" 这几天全员爆肝中,大概就差把家搬到公司了。"
而在 " 爆肝 " 不到半年后,智元具身智能机器人 " 远征 A1" 迈着稳健的步伐登上发布会舞台完成亮相。
发布会现场,稚晖君介绍了智元自研的一系列核心组件及其技术指标:
核心关节电机 PowerFlow
就像人体的关节决定了人做各种动作的灵活性,机器人的 " 关节 " 执行器同样如此,一台行动精准敏捷的机器人,其关节必须做到体积小、重量轻、高功率密度、高能量利用效率、高响应带宽、耐冲击等一系列特性。核心关节模组的自研不仅是让人形机器人更灵活、更自由的关键,同时也是让其实现规模化量产、低成本应用的重要门槛之一。
智元自研的 PowerFlow 使用了准直驱关节方案,实现了低齿槽转矩设计,搭配 10 速比以内的高力矩透明度行星减速器、共轭同轴双编码器、一体液冷循环散热系统,以及自研的矢量控制驱动器,峰值扭矩超过 350Nm,而重量仅为 1.6kg。
稚晖君表示,他们还没有测到扭矩的真正上限,估计潜力比想象中高。而且,由于水冷散热的加持,它可以保持更长时间的峰值扭距输出。
灵巧手 SkillHand
远征系列机器人旨在融入生产场景并发挥作用,另一个十分重要的核心部件就是灵巧手。智元也发布了面向下一代机器人的高自由度灵巧手 SkillHand,这款灵巧手将拥有 12 个主动自由度和 5 个被动自由度,成本低至 1 万元以内;所有驱动内置,并集成了基于视觉的指尖传感器,专门面向精密操作,这款灵巧手会在后续进一步迭代后成为远征系列的标准配件。
值得注意的是,如果场景需要,远征系列机器人甚至可以自主更换灵巧手,比如把手换成螺丝刀。稚晖君表示,这是模块化设计思想在他们机器人中的体现。类似的模块化设计还可以让机器人由腿式变成轮式,这是它通用性的一个体现。
统一軟體框架 AgiROS
AgiROS 是智元自研的一套机器人运行时中间件系统。AgiROS 秉持轻量、易用、高性能、高扩展性等原则,遵循现代的开发范式,提供多种语言的接口,以插件形式兼容主流生态,包括 ROS、ROS2 等机器人开发生态、GRPC、HTTP 等云服务生态。
后续,AgiROS 将开放源码与社区共建,提供详细的文档与多样的 demo,与开发者共建新一代机器人开发生态。
AI 大模型加持,参数达百亿级
根据 4 月初发布的招聘信息,智元开放的社招岗位就包括算法工程师一一大模型 LLM。
在招聘信息中,智元还表示,公司的三大吸引力之一就是激动人心的方向:人工智能正在迎来新一轮产业剧变,往 AGI 圣杯的方向加速迈进,LLM+Robotics 的组合已是必然趋势,机器人将在不久的未来迎来应用场景爆发的拐点。
在 8 月 17 日举办的媒体沟通会上,智元再次明确表示:" 近段时间涌现出很多家人形机器人(公司)。硬體本体因为电驱形式受物理限制,已经到了一个瓶颈期。今后真正的比拼,就是机器人是否更聪明,就是大模型的人工智能能力。"
于是,大模型加持下的远征 A1,也成为了外界关注的焦点。
语言任务模型 WorkGPT
结合 LLM 和 VLM 等 AI 技术带来的重大突破,智元使机器人能够自主感知环境、理解任务、编排动作成为可能,实现了从 ChatGPT 到 WorkGPT 的扩展。
据悉,WorkGPT 是一个百亿级参数的大模型。
与传统 AI 技术不同,智元的 WorkGPT 充分应用了语言和影像大模型庞大的先验知识库和强大的通识理解能力,你不用告诉它什么是垃圾,它就能自己分辨出来;并实现了复杂的语义多级推理能力,也就是所谓的 " 思维链 ",它可以把复杂的指令抽成一个一个的步骤。
稚晖君表示,在大模型时代到来之前,机器人都是专用设备,我们需要针对性地对每一个任务进行调试和部署。现在利用大模型的各种通识能力和举一反三的推理能力,我们可以看到解决这些问题,然后最终走向通用机器人的一道曙光。
具身智腦 EI-Brain
智元的具身智腦 EI-Brain 架构中,把机器人的思维系统分为云端的超腦、端侧的大腦、小腦,以及腦干几层,分别对应机器人任务级、技能级、指令级以及伺服级的能力。
具体而言," 大腦 " 负责跟我们人类一样进行抽象思考、多级推理," 小腦 " 负责运动控制方面的一些指令生成," 腦干 " 负责电机控制、伺服等硬體底层任务。
基于任务数据反馈,EI-Brain 具备在机器人任务执行过程中不断自我学习强化的能力。如果端侧模型泛化能力不够,系统可以去连接云端,实现更复杂的任务调度;另一方面,偏向于硬體底层的电机控制等工作都在本地甚至模块中完成。
稚晖君表示,我们定义了一系列 Meta skill,在语言操作库范围限定的有限泛化的场景内,机器人可以实现自主的推理决策,然后完成端到端的任务编排。随着能力库不断扩充,机器人能够胜任的任务空间也将指数级增长,最终可以实现全场景的覆盖,切入千行百业。
半年速成 " 独角兽 ",马斯克雷军成竞对
1993 年于江西安吉出生的稚晖君,在电子科技大学求学期间就通过视频记录下自己的动手能力。而这,也见证了他一步步收获科技圈知名 KOL、B 站百大 UP、" 野生钢铁侠 "、华为 " 天才少年 " 等光环的旅程。
大学毕业后,稚晖君先是进入 OPPO 研究院 AI 实验室担任算法工程师,差不多干了两年。然后便顶着 " 天才少年 " 的名号于 2020 年 11 月进入华为,拿的年薪是三个档位中最高的 201 万元,他的对外公开 Title 是华为昇腾 AI 边缘计算专家。
在华为,稚晖君差不多也是干了两年。2022 年 12 月,他发文称,在华为的几年非常开心,永远都会视自己为华为的一员,但 " 君子战虽有陈,而勇为本焉 ",所以他要去追求自己热爱和梦想的事业了。
2023 年 2 月 27 日,上海智元新创技术有限公司正式注册成立,法定代表人为舒远春,稚晖君作为联合创始人之一,担任公司 CTO、首席架构师。
工商变更记录显示,智元在创立一个半月后,就吸引了高瓴资本、奇绩创坛入局。随后,差不多又在一个半月后,新增 BV 百度风投、经纬创投、鼎晖投资、高榕资本等为股东。
值得一提的是,智元还吸引到一批地方国资入股,包括上海焕新一期私募投资基金合伙企业(有限合伙)、上海司南园科私募基金管理有限公司。
截至目前,智元已经完成了天使轮、A 轮、A1 轮、A1+ 轮等多轮融资。
伴随高瓴、百度等知名机构的入股,智元的市场估值被曝已达近百亿人民币,约十几亿美元左右,妥妥的 " 独角兽 "。
天眼查 App 信息显示,稚晖君最终受益股份约为 6.6%,以此计算,其身价超 6 亿元。
英伟达 CEO 黄仁勋曾表示,"AI 的下一个浪潮将是具身智能 ";美籍华裔人工智能学者李飞飞也曾表示,具身智能将会成为 AI 领網域的下一个 " 北极星问题 " 之一。
具身智能 + 人形机器人的 " 风口 " 已然到来,站在风口的稚晖君,还要面对马斯克旗下的特斯拉人形机器人 Optimus、雷军旗下的小米人形仿生机器人 CyberOne 等一众竞争对手。
稚晖君表示:" 远征 A1 是智元的第一代通用型具身智能机器人,基于创始团队在机器人和 AI 行业多年的经验积累在半年内所打造,这款机器人未来将可以在各种复杂场景下自主完成移动和操作任务。我们致力于将先进的机器人和 AI 技术与人类生活以及生产制造紧密结合,未来让机器人成为人类的得力助手。"
为了让远征 A1 适配不同的应用场景,智元在远征 A1 设计上采用了上下肢分体的模块化设计,上肢支持灵活更换末端工具,从而满足多种任务的需求。下肢采用双足,轮式,轮足等不同的设计,可实现不同应用场景下最优的机器人配置和扩展。
目前,智元已推进与多家制造业头部企业对接,将远征 A1 应用于各种实际场景,并计划在未来几年内推广远征 A1 至更多领網域。
未来,智元会逐步开放其开发平台,通过开放协同模式、开放平台接口与能力、开放工具和云平台,为科技开发者提供一个全新的创作平台,鼓励和吸引更多开发者和企业参与其生态系统的建设。