今天小编分享的互联网经验:生成式AI迎来視窗期,阶跃星辰加速冲刺,欢迎阅读。
(图片来源:跃问视频 demo)
生成式 AI 领網域的技术竞赛不断加剧,已进入到 " 白热化 " 阶段。
今年以来,OpenAI 接连发布 Sora、GPT-4o、o1 系列等多款模型,引发关注。此外,Runway 发布全新影像模型 Framer、Midjourney 准备发布 V7 版本、Claude 3.5 模型更新,而英伟达公布全新 AI 音频模型 Fugatto。
回到国内,字节跳动、百度、腾讯等大厂接连公布大模型技术和产品进展,开始用大模型实现 " 卖云 " 的增值。
国内大模型创业公司也在加速狂奔。
钛媒体 App 获悉,11 月 27 日,专注于通用人工智能大模型(AGI)研发的公司 " 阶跃星辰 "(StepFun),日前已悄然开启视频生成模型 Step-Video 内测,用户可通过 " 跃问 " 官网的 " 跃问视频 " 产品进行点击申请,且第二版视频生成模型已经在研发中。
公开资料显示,这家行事低调的大模型独角兽,在 8 个月内接连发布了至少 6 款基座模型,且近期多款模型因为强悍的技术实力在国际上大放异彩。
短短一周内,阶跃星辰多模态理解大模型 Step-1V、万亿参数语言大模型 Step-2 分别跻身全球权威大模型评测基准榜单 LMSYS 大模型竞技场 Chatbot Arena 和 LiveBench 前列,皆位列中国大模型第一。
其中,Step-1V 在 LMSYS Chatbot Arena 上,总分跟 Gemini-1.5-Flash-8B-Exp-0827 持平;Step-2 在 LiveBench 榜单上的成绩逼近 OpenAI 的 o1-mini-2024-09-12,超越 gpt-4o-2024-08-06 等国际主流模型,也是唯一进入榜单前十名的中国语言大模型。
(图片来自 LiveBench 官网,截至今年 11 月 19 日数据)
" 狂飙 "600 余天,阶跃星辰建立全面模型矩阵
11 月 30 日,OpenAI 将迎来 AI 聊天机器人 ChatGPT 发布两周年之日。
回顾过去两年,ChatGPT 引爆了全球新一轮 AI 大模型 " 造模 " 热潮。《全球数字经济白皮书(2024 年)》报告显示,目前,全球 AI 大模型数量已达 1328 个,其中美国占比最多达 44%,中国占 36%,这两个国家已经牢牢占据大模型领網域的第一梯队。
全球 AI 大模型市场的竞争格局日益激烈。
在这一轮生成式 AI 热潮中,国内最先起跑的是创业公司。成立于 2023 年 4 月的阶跃星辰,在 600 多天的时间里,已形成行业领先的综合技术实力。
包括近期低调内测的 Step-Video 在内,阶跃星辰已经推出了 Step 系列通用大模型矩阵,涵盖从千亿到万亿参数、从理解到生成、从语言到多模态的全方位能力:
Step-1 千亿参数语言大模型:两个月一次性训练成功,已完成充分打磨,在逻辑推理、中文知识、英文知识、数学、代码方面的性能全面超越 GPT-3.5。
Step-1V 多模态大模型:性能比肩 GPT-4V,可以精准描述和理解影像中的文字、数据、图表等信息,并根据影像信息实现内容创作、逻辑推理、数据分析等多项任务。
Step-2 万亿参数语言大模型:采用 MoE 架构,聚焦深度智能的探索,这是国内首个由创业公司发布的万亿参数语言大模型。Step-2 在语言生成上对细节有极强的控制力,模型能够更好地理解和遵循人类指令。
Step-1.5V 多模态大模型:在 Step-1V 的基础上进行了迭代,具备更强大的多模态理解能力,实现了从影像理解到视频理解的跨越更新。
Step-1X 影像生成大模型:具有强大语义理解与影像创意实现能力,可用于各种影像创作和设计任务。
Step-Video 视频生成大模型:支持文生视频,可生成 1080P 长达 10s 的高清视频,在语义理解、指令遵循、运动、中国风美学生成上效果突出。目前模型已经接入 " 跃问视频 " 并开始内测。
从上述两个 demo 片段中,我们可以看到,无论是语义理解能力,细节运动符合物理规律,还是清晰度,阶跃星辰的 Step-Video 视频生成模型均达到业界先进水平。
事实上,在大模型 " 六小虎 " 中,阶跃星辰以多模态模型技术实力强劲著称。根据阶跃星辰创始人、CEO 姜大昕的规划,阶跃星辰实现 AGI 的技术路线是:" 单模态 — 多模态 — 多模理解和生成的统一 — 世界模型 — AGI"。
他曾多次强调,只有解决了多模态理解生成一体化,才能彻底建立一个世界模型,再往后才能跟具身智能结合,最终实现 AGI,以此提升社会、经济产业的能力与价值。
2028 年超 4 万亿规模,大模型加速技术落地
据研究机构 IDC 最新数据显示,预计到 2028 年,全球 AI 产业支出将达到 6320 亿美元(约合人民币 4.58 万亿元),几乎是当前的两倍,5 年间复合年增长率 ( CAGR ) 达 29%。
其中,生成式 AI 成为最大的增长引擎,到 2028 年该领網域投资支出高达 2020 亿美元,占整个 AI 支出的 32%,CAGR 达 59.2%。
不过,当前生成式 AI 产业仍处于非常早期的阶段。
中国工程院院士、北京大学博雅讲席教授、鹏城实验室主任高文认为,如果以 " 人 " 来相比,AGI 现在可能还是刚刚会走路的幼儿状态。但从使用角度看,AI 已经能解决生产、社会、服务的问题,可以先用起来,没有必要等到十全十美再去用,要把它逐步的开发、完善、迭代。
越来越多的开发者和企业开始基于阶跃星辰的大模型矩阵打造 AI 应用。阶跃星辰开放平台逐渐形成了一个大模型 " 生态伙伴圈 "。金融财经、内容创作、消费娱乐等领網域的头部机构纷纷跟阶跃星辰达成技术合作。其中,财联社跟阶跃星辰共同打造了国内首个千亿参数多模态金融大模型 " 财跃 F1 金融大模型 "。
开发者则通过阶跃星辰的 Step 系列大模型尝试新的产品形态。独立开发者赵纯想将包括网红 AI 应用 " 胃之书 " 在内的三款产品都接入了阶跃星辰 Step 系列大模型,原因是胃之书早期对国内所有大模型做了产品 AB test 测试,他发现使用阶跃星辰的模型,用户付费率最高;AI 心理疗愈应用 " 林间聊愈室 " 则是基于阶跃星辰多模态大模型的图片理解能力,上线了呼声已久的 AI 识图功能,用户可以跟小动物分享自己的生活场景、状态等,林间聊愈室 CEO 李神龙表示,接入新功能之后,比较明显的是付费率确实上涨了。
下一步,我们相信,阶跃星辰这类坚持 AGI 底层技术探索,加速模型应用落地的公司,将成为 AGI 时代的关键 " 推手 ",同时也是 AGI 产业的技术领先者。
智能阶跃,十倍每一个人的可能。
(本文首发于钛媒体 App,作者|林志佳,编辑|胡润峰)