今天小编分享的科技经验:三个清华校友,争抢大模型一哥,欢迎阅读。
图源:Pixabay
仅仅过了一年,大模型竞争就出现了分野。
近期,有媒体报道称,由王小川创立的百川智能进行新一轮数亿美元融资,将成为国内 2024 年最大 AI 领網域融资之一。来自参与的投资人证实,百川智能今年以来估值已超 18 亿美元(约 130 亿元)。对此,百川智能方面回应时代财经表示,报道存在一定误差,具体信息有待官方进一步宣布。
如果上述融资消息落地,这意味着又一家清华系大模型公司跻身百亿估值俱乐部。
据时代财经不完全统计,2019 年 -2023 年至少有 30 位清华校友下场创业,投入大模型产业,创办公司超过 15 家,累计融资超过 150 亿元。这些由清华校友创办的企业,在业内被称为 " 清华系 "。
随着清华系大模型企业估值走高,一场行业内的 " 三国杀 " 默默上演。
大模型绕不开清华系
三年前,两位初代互联网创业大佬先后宣告退圈。
2020 年 12 月,美团发布内部信宣布,美团联合创始人、高级副总裁王慧文已经顺利完成交棒,按计划正式退出。半年后,搜狗被腾讯收购,曾经在搜索领網域叱咤风云的王小川也逐渐远离互联网舞台中央。
此时的大洋彼岸,AI 学术界正升起一颗耀眼的新星。OpenAI 推出的 GPT-3 横空出世,在学术界掀起不小波澜,其参数规模高达 1750 亿,不仅能做语言生成,而且对语言的理解能力也有了很大的提升。
对外界而言,GPT 还远没有爆发出潜在的能量。但是一群清华大学的顶尖学者迅速做了一个重大的决定:追赶 GPT3、投入大模型训练中。
三年后,GPT-4 通过一款对话产品将大模型的风吹到全球各地。王慧文率先发起了 AI 大模型人才的招募令,紧接着,王小川、李开复等互联网明星创业者纷纷登场。王慧文、王小川这对昔日的清华校友,因为大模型再次交汇于竞技场上。只是这一次,他们离开舒适区后,还要面临着更多来自 " 学术圈 " 的对手。
图源:Unsplash
在百模大战的核心风暴中,清华系毫无疑问地成为举足轻重的一方势力,他们如同一条奔腾的江河逐渐分流成各具特色的溪流,有的是在互联网时代身经百战的老法师,有的已经在大模型研究领網域中蛰伏多年。
" 如果你做大模型或者芯片,那你最好是清华的。" 一位芯片行业从业者向时代财经表示。诸多科研人才、创业公司与技术储备,共同构建起一张叫做 " 清华系 " 的人脉之网,这似乎已经成为某种行业共识。
过去一年里,大模型独角兽企业技术人员每天熬夜,为了追赶 OpenAI 前仆后继。
光年之外和智谱 AI 都把根据点选在了清华东门外的搜狐大厦;隔着一条街是赛尔大厦,王小川在此创立了百川智能;搜狐大厦南侧的成府路上也有两家清华系创业公司,分别是聆心智能和深言科技。
一场新的造富运动正轰轰烈烈开展," 清华系 " 成为绕不开的历史钢印。
1 位先锋串起半部创业史
多年后,当外界追忆起这段烈火烹油的大模型创业潮时,智源研究所无疑会成为一个标志性的符号。这里距离清华大学南门步行只要 5 分钟,如今,清华主校区三公里以内都是大模型创业的根据地。
2020 年,人工智能普遍陷入了进退两难的困局,AI 四小龙市值跌落谷底,巨额的研发投入和低效的落地产出,使得一批投资人纷纷撤退。西南证券的一份研报显示,AI 企业融资次数从 2019 年开始,出现了大幅下滑,九成 AI 公司处于亏损状态。
与外界浓重的悲观情绪相反,智源研究所正在默默酝酿着一场变革,该研究所齐聚了孙茂松、唐杰、刘知远、杨植麟等一众大模型先锋人物,他们一致认为大模型训练能够带来一场颠覆性的变革。
数百人将自己的热情和精力投入大模型的炼丹炉中,开启了一段漫长的开荒期。
2021 年初,命名为悟道 1.0 的大模型登场,该系列大模型呈现了 3000 万图文数据对训练的多模态模型 BriVL 1.0、百亿参数中英双语大模型 GLM-10B 与多模态模型 CogView 1.0 等成果。
在此基础上,身为带队老师的唐杰做了一个更大胆的尝试,他调用外部资源,训练了几个百万亿级别的大模型。3 个月后,悟道 2.0 系列大模型亮相。作为对标 GPT-3 的国产大模型系统,悟道 2.0 以 1.75 万亿的参数量,创造了当时全球最高纪录,超出了 GPT-3 近 10 倍,这也成为中国大模型初创阶段标志性的里程碑。
唐杰的另一个身份是智谱 AI 的创始人之一,公司成立于 2019 年 6 月,清华大学计算机系知识工程实验室是其摇篮,团队核心成员几乎都是清华血脉。
悟道系列大模型一战成名后,清华系创业的氛围被推向了一个小高潮。一批清华校友逐渐从实验室走出来,探究大模型商业化的路径。
图源:Unsplash
2021 年 11 月,黄民烈创立了聆心智能;2022 年 3 月,孙茂松的博士生岂凡超创立了深言科技;2022 年 8 月,刘知远创立了面壁智能,专注于法律领網域;2023 年,同样师从孙茂松的朱军建立了生数科技。
此时,大模型创业团队再次面临一个困局:找不到大模型与市场的连接点,愿意吃螃蟹的企业并不多,甚至不知道怎样调度大模型的能力。
直到一个核爆点的出现,这批早期的开荒者才抢到了通向下一个技术变革的入场券。
学院派 VS 创业派
2022 年 11 月,OpenAI 推出的 ChatGPT 横空出世,自动生成文字的功能震撼了全球科技圈,用户规模在短短 2 个月内突破 1 亿,大模型开始进入大众视野。
如同一夜春风袭来,默默耕耘数载的清华系大模型收获了资本的青睐,最先抢占了风口。时代财经整理发现,2023 年,清华系大模型的融资逐渐迎来了快车道,超过一半的清华系大模型第一笔上亿级别的融资发生在 2023 年。
" 过去几年,AI 投资基本为 0,在大家觉得满眼雾霾的时候,突然 ChatGPT 出来了,给人带来了光。" 澜舟科技创始人周明发出了这样的感叹。
这是一场深不见底的资源投入,训练一款高质量的大模型,需要数以万计的芯片集群和云计算调度,并且还要夜以继日的追赶被 OpenAI 叠高的行业指标,一旦开启,就意味着启动了庞大的碎钞机。
据国盛证券研报,GPT-3 仅训练一次的成本就高达 140 万美元,对于一些更大的 LLM,一次训练成本介于 200 万美元至 1200 万美元之间。智谱 AI CEO 张鹏也曾在公开场合表示,25 亿元的融资根本不够,不管融多少、挣多少钱,都是通向 AGI 这条路上的盘缠。
2023 年 10 月,智谱 AI 宣布完成超 25 亿元融资(估值过百亿元);也在同一时期,百川智能迎来了新一轮的融资,金额超过 3 亿美元;月之暗面则在去年接连完成了两轮共计近 20 亿元的融资。
相比学院派艰难低调的蛰伏,互联网明星创业者通常更加果断坚决,他们对应用产品和市场有更为敏锐的判断力。2023 年年初,在见证 ChatGPT 的问世后,身为互联网连续创业者的王小川嗅到了技术变革的气息,他激动地发了一条朋友圈:"OpenAI 的胜利,是技术理想主义的胜利。"
先成立公司、再招募技术团队的路径,是创业者快速抢占市场目光的最佳方式。思考了两周后,王小川便放下了手头的智慧健康项目,转而进攻大模型。
不到半年,百川智能的团队便搭建起来了,王小川拿到 5000 万美元启动资金,正式宣布进入 AI 模型创业赛道。此外,他还拉来了旧部下——前搜狗 COO、清华 1998 级校友茹立云,新的创业公司有一半成员来自原搜狗团队。
经历了长达半年的横冲直撞,独角兽大模型名单逐渐浮出水面——智谱 AI、月之暗面、百川智能、MiniMax 和零一万物,其 2023 年公开披露的融资约为 100 亿元,占全国 AI 投资的 40%,清华系大模型再次赢得了半壁江山。
图源:Unsplash
然而,从整体的融资规模来看,大模型概念的火爆并没有引发投资热潮。根据晚点报道,2023 年 AI 领網域的总融资额同比减少 4.5%,为 257 亿元,不到 2021 年的一半。
" 这个市场目前处在募资难、投资难、退出难的形势下,所以对于大模型,大多数机构还都是看为主,真正出手的话,也不像以前我们经常说的 FOMO(fear of miss out),是出于‘担心错过’的情绪。" 梅花创投创始合伙人吴世春此前接受时代财经采访时表示。
谁是清华系大模型一哥?
如果没有智能助手 Kimi 的爆火,月之暗面可能不会快速站在聚光灯下。过去一年,创始人杨植麟几乎隐匿于同门师兄声势浩大的追逐中,获得的曝光度并不多。
2024 年开年,文生视频应用 Sora、长文本概念走红,短暂熄火的大模型投资得以再次回温。月之暗面最先被资本抬高身价,传出完成新一轮超 10 亿美元的融资,这是 ChatGPT 出现后大模型赛道最大一笔融资,估值达到 25 亿美元(约 180 亿元),投资方包括阿里、红杉中国、小红书、美团等。
1992 年出生的杨植麟成为整个大模型领網域的焦点人物,入局大模型之前,杨植麟已经构思了两个问题,一是创业筹备的第一笔资本,二是构建创业的方向——通过与人类互动找到应用机会。
2023 年 10 月,月之暗面推出了智能助手 Kimi,成为大模型创业公司的首个爆款项目,3 月 19 日,月之暗面宣布把长文本能力从 20 万字提升至 200 万字,其当周访问量达到了 394 万次,略高于文心一言的 338 万次,一度跃升为国内网页端周度访问量最高的 AI 应用。
在部分行业人士看来,月之暗面弯道超车的武器在于绑定了长文本的标签,并且定位比较垂直。" 面向 C 端的产品更容易赢得市场关注,但同时也会因为缺乏技术壁垒容易被超越。"AI 创业者张维向时代财经说道,他认为,大模型的发展方向依然比较模糊,大家都在摸着石头过河,面对的是一个完全未知的世界。
作为大模型行业的布道者,唐杰创立的智谱 AI 频繁对外投资,出现在 13 家大模型公司的融资队伍中,包括了算力、软硬體、应用、医药、保险等多个方向。
图源:Unsplash
不过,当技术像烟花一样盛放光芒时,身在局中的人很难分清楚这是虚晃的幻术还是可以碰触的真实世界。
" 以为得到一把万能的锤子,看见什么都觉得是钉子,但其实发现,业务场景很难切入。面向 B 端去做企业资源不够,选择做 C 端推广和成本都是问题。" 张维向时代财经说道。
即便是生态较为成熟的百度,也尚未在大模型领網域找到光明的出口。根据公开披露的数据,2023 年最后一个季度,大模型为百度云业务仅带来 6.6 亿元的增量收入。
" 掌握模型核心技术的团队会在竞争中脱颖而出,推出相应的应用产品,进行多次的迭代和优化,找到合适的路线。如果只单纯开发应用产品,没有自己掌握的核心技术,基本上只有一次试错机会。" 启明创投合伙人周志峰近日在公开场合表示,在他看来,具备大模型技术水平的公司终将会走向模型应用一体化的公司。
如果把视线放在清华系竞技场的核心地带," 三国杀 " 也开始步入正题。
智谱 AI、月之暗面和百川智能快速跻身 100 亿美元估值俱乐部,只是三者使用的武器并不相同:拥有学院派背景的智谱 AI,在寻找企业与大模型的融合场景;月之暗面创始人杨植麟是极致的技术理想主义,他相信技术 " 暴力美学 " 能够改变世界;而在两种路线踌躇的王小川更想在理想主义和现实主义中找到另一种视角。
和大多数从业者一样,混沌与彷徨几乎贯穿了张维创业的一整年,不知道接下来行业走向何方的他,还在等待一个坐标系的出现。
(欢迎转载,开白请添加微信,ID:rafe0101)