今天小编分享的汽车经验:大模型之战,商汤押宝智能座舱?,欢迎阅读。
如果说 2020 年是智能驾驶的元年,那么 2023 年就是大模型的元年。今年 2 月份,由 OpenAI 开发的 ChatGPT 在国内一夜爆火,被 AI 震惊的同时大家都在问什么时候国人能有自己的 ChatGPT,于是百度扛起大旗率先发布文心一言,紧接着各大科技公司相继发布大模型。
AI 公司商汤科技也紧跟队伍,发布了名为 " 日日新 SenseNova" 的大模型体系,并赋能于智能展示车舱。
当我体验完就感受到大模型为什么在车圈儿这么火,它或许意味着,智能座舱的元年要真正到来了。
除了视频里展示的 " 唇语 / 唇动 "、" 智能救援 "、"Air touch(隔空手势)"、"AR K 歌 " 以外,座舱还兼有 " 哨兵模式 " 和 " 智能屏保 " 功能。
怕车被刮花?打开哨兵模式,车辆就会开启环视监测,通过人工智能算法,甄别车辆四周存在的威胁性行为,当人员或者物体靠近车辆一定安全距离以后才进行报警。
并且可以根据設定的敏感度进行不同级别的警告,然后通过亮屏、闪灯,或者直接发送消息到用户手机进行提醒。同时应用深度学习和光流检测技术,在夜间等低可视度场景下也能实现功能。
最关键的是,车辆还会记录下画面。在没有摄像头的路段," 手欠的嫉妒狂 " 也不能逍遥法外。
智能屏保则是采用 3D 技术引擎和人工智能感知相配合,通过主动推荐更换屏保样式,以手势、视线、表情等无感式互動打造沉浸式体验。
比如当朋友第一次搭车坐在副驾驶的位置上时,表情被系统检测到后屏保会做出相应的互动。后排入座儿童的时候,系统可以检测并且推荐适合儿童的屏保,如知识问答或卡通片。
以上功能已经在二十多款量产车型上实现落地,例如极氪 X 就搭载了哨兵模式、乘客行为检测、手势识别等功能,这些场景的实现正是因为与 " 日日新 SenseNova" 大模型体系进行了深度融合。
商汤 " 大模型超市 "
" 日日新 SenseNova" 大模型体系虽然才公布一个月左右,但是其研发过程可以追溯到 5 年前,目前已构建了计算机视觉、自然语言处理、AI 内容生成、多模态、决策智能(AI 文生图创作、2D/3D 数字人生成、大场景 / 小物体生成)等多个领網域的大模型。
就如其名字的寓意一样:" 苟日新,日日新,又日新。" 这套大模型体系的能力会一直持续演进,并为我们开放各种应用体验,比如:
1." 秒画 " 文生图创作平台,我们可以通过设定关键词、尺寸、清晰度来获得一张原创图,直接摆脱做檔案时的找图困扰,也不用担心版权。在这里,自己天马行空的想象力也可以得到实现。
2." 如影 "AI 数字人视频生成平台,仅需一段 5 分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
这个平台哪个二次元星人能拒绝?不过话说回来,这个功能在我看完一条 " 数字人直播带货一个月成本仅需 200 元 " 的新闻以后,确实有点引发职业焦虑。
3." 琼宇 " 和 " 格物 "3D 内容生成平台,可以生成大规模三维场景和精细化的物件。
这就和当下流行的 " 元宇宙 "、" 虚拟世界 " 有关了。举个例子,你在游乐园或科技馆高价体验到的刺激、惊奇、怪诞的 3D 画面,这个平台就能快速生成。大概未来在车里戴上 AR 眼镜你就能 " 穿越黑洞 " 了。
4." 商量 " 中文语言大模型应用平台,支持语言理解、文本生成、情感分析、文本摘要等功能。会议记录员、百科全书甚至是编辑,它都可以胜任。
无论是语言大模型,还是文生图或数字人生成,都离不开大规模 AI 基础设施的算力支持。为了应对 " 大算力、大数据、大模型三位一体 " 的 AI 发展方向,商汤打造了 AI 大装置 SenseCore。
商汤 AI 大装置
商汤 AI 大装置 SenseCore 以人工智能大模型开发、生产、应用为核心,打造一站式、自主研发 AI 云、AI 平台、AI 服务解决方案。简单来说就是推动所有軟體功能实现的载体。
为了将大规模技术带来创新带动商业模式发展这条路走通,商汤持续扩建 SenseCore AI 大装置。
目前完成了 2.7 万块 GPU 的部署,可最多支持 20 个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练;算力方面最大可输出 5000P 算力。
满足算力需求并不够,想要运转起来,还需要以数据挖掘为起点和终点的数据闭环。简单来说,由于商汤 TO B 的本质,这些算法需要跑起来,为客户比如车企赋能。
基于 AI 大装置 SenseCore 和 " 日日新 SenseNova" 大模型体系,商汤可以为行业伙伴提供全套的自动数据标注、隐私保护和数据安全能力,并可选择需要回流的数据,进行自动标注和模型更新。
不仅是智能座舱,这些能力同样可以开放给智能驾驶。以智能驾驶能力的持续拓展为例:快速自主为智能汽车生产 AI 模型,存储、提炼数据、进行仿真训练,打通基于数据驱动的算法生产全流程,就能加速高阶智能驾驶技术的迭代。
举个例子,通过 AI 对学校路标图片的识别和语义的理解,我们就能在智能驾驶功能中设定在学校处减速的逻辑。
也就是说在训练的过程中,商汤以人机共智的生态来推动任务的进展,人和 AI 一起用人类的思维去推算逻辑,而 AI 甚至可以提供更高的效率,使得成本大大降低。
大模型的 " 诸神之战 "
ChatGPT、百度文心一言、阿里 " 通义千问 "、商汤 " 日日新 SenseNova"...AI 大模型赛道突然展露出 " 诸神之战 " 的局势,更难得的是,这项技术在普通人的生活圈也迸发出极高的热度。
企业纷纷入局会导致未来出现大模型行业过度饱和的现象吗?大模型之争只是三分鐘熱度口的产物吗?大模型为什么如此火爆,我们会成为这阵浪潮的韭菜吗?
首先我们需要知道大模型的落地十分艰难,动辄成千上万的算力、超千亿万亿参数的模型开发,对技术水平和资金规模的要求都极高,比如 ChatGPT 就烧了 OpenAI40 亿美元才被创造出来。
所以也许会有企业在这条赛道上半途弃赛,但是 " 赛道挤不下 " 倒是不太现实,毕竟 " 报名费 " 就挺高的。
第二个问题,大模型国内玩家的入局绝不只为 ChatGPT 的爆火,也不是临时能诞生的产物。
事实上,供应商们早就有所布局,例如百度文心大模型开发于 2019 年,不过当时那套大模型更面向企业们服务。想必百度文心大模型为航天公司训练出的系统,应该也不会进入大家的视野。
且相对于 ChatGPT 来说,国内的大模型开发稍晚几年,能力也稍有逊色,如李彦宏所说,ChatGPT 的能力如果是 90 分,文心一言的能力就是 59 分。不过不得不承认的是,ChatGPT 确实推动了国内这些大模型的亮相。
最后一个问题,大模型行业的诸神之战为什么能吸引我们普通人的关注。对我来说,大模型的核心词汇就是 "AI",意味着类人。
我们惊叹于人工智能带来的便捷,同时也恐惧于 " 类人 " 凌驾 " 人类 " 的可能性,这也是为什么大模型爆火的原因,它展示出的空前进展甚至引发了万人抵制 AI 研发的事件。
而对乐观派来说,这大概无异于科技改变生活的信号。就拿智能车来说,大模型的上车,能带来效率、成本、突破三个方面的进展,打通座舱和元宇宙的壁垒,使自动驾驶更具人类思维,它将带来智能车新一轮的变革。