今天小编分享的互联网经验:对话王小川:理想主义和现实主义,都只是AGI的二维投影,欢迎阅读。
访谈 | 邓咏仪 杨轩
文 | 邓咏仪
编辑 | 杨轩
涌现(Emergence),是生成式AI浪潮的一个关键现象:当模型规模扩大至临界点,AI会展现出人类一般的智慧,能理解、学习甚至创造。
「涌现」也发生在现实世界——硅基文明一触即发,AI领網域的创业者、创造者,正在用他们的智慧与头腦,点亮实现AGI的漫漫征途。
在新旧生产力交替之际,《智能涌现》推出新栏目「涌现36人」,我们将通过与业界关键人物的对话,记录这一阶段的新思考。
欢迎关注
很难想象,近十年里有哪个尖端技术的普及速度能像大模型一样快:从ChatGPT横空出世,到如今国内热烈讨论落地和商业化,仅仅过去一年多的时间。
但对承载了巨大期待的一个行业而言,现在的进展很难说令市场满意。多数AI应用或者项目都尚在襁褓之中,又或是昙花一现——目前国内流量最高的AI应用,DAU不过百万级别;靠AI收割第一波财富的不是从业者,而是卖199元AI课的"卖课大师"李一舟。
这种失意随着近期的商业化讨论不断发酵。不少投资人认为,埋头做AGI(通用人工智能)希望渺茫,一旦国外有新一代模型开源,很多投入就是徒劳。
选择摆在创业者们面前:是一路直冲,将Scaling Law(规模定律)拉到最高,无限接近AGI;还是"见好就收",尽快让技术落地赚钱,快速投身到中国的商业社会里?这两派观点随着投资人朱啸虎、月之暗面创始人杨植麟的近期发言,在业内引发了争议。
王小川所创立的百川智能,试图找到一条更"立体"的路径。
"我觉得每一种主义都是看待世界的一个视角,一个投影,但他不代表全部的真相。"王小川将其概括为八个字"盲人摸象,小马过河"。
王小川的许多观点,有着上一代中国互联网竞争的影子:他的上一个公司搜狗,从诞生起就面临百度、360等对手的围追堵截,因此要快速想明白如何落地、生存。
上一次36氪与王小川对话时,百川刚刚成立,当时他就极为强调要"双轮驱动",技术和应用要并行地做。
在王小川躬身入局整整一年后,我们看到他更多的新思考。他的核心观点在于:AGI的最终目的是要"造人",所以单纯找个场景,造一个工具或产品,意义不大。
同时,考虑到国内市场的现实情况——无论是人才还是资金都有限,短期用巨量资金砸出规模巨大的模型,这并不现实。
"AGI的理念肯定要有,但在爬AGI的高山时,也要考虑找好'补给站’。"王小川表示。
医疗是现在百川押注的重要方向,百川智能希望能利用大模型真正造出AI医疗助手,从而实现生命模型的目标。这是王小川想出的当下中国AGI的可行路径:既和AGI的目标同频,数据和场景也都还没有被大公司所垄断。
王小川对技术和商业都保持乐观,也希望市场能够给这个赛道更多耐心。他认为,中国大模型的进展远比大家想象的要进展迅速。"去年这个时候,大家都特别担心中国能不能跟上GPT-3.5。但今天大家在问:什么时候能到GPT-4?"
一切看起来都还为时尚早。2024年元旦期间,王小川收到朋友的祝福信息,他乐呵呵地回复:"智能纪元贰年快乐!"
"去年是智能纪元元年,今年是第二年,"王小川说,"我认为我是看到了未来的模样。"
以下为36氪与王小川的对话,经整理编辑:
高看或俯视技术,都会错失很多机会
36氪:最近AI圈还挺热闹,金沙江的朱啸虎最近公开表达的观点引起了广泛的反响,里面也提到了你,最近看这篇专访了吗?第一反应是什么?
王小川:好多朋友转给我,转给我还说:哈哈,这是在夸你,夸百川。我也看了,里面提到我三四次。
其实他也没有对我个人的,或者对百川的负面情绪,这个不代表朱啸虎完全没有AGI理想,只是他对今天大模型这个事情是非常悲观和负面。文章里的语言表达也比较率真,这还挺有喜剧感和冲突的。
36氪:他抛出很多观点,包括大模型这件事创业公司没有资格做,也许终局是卖给大公司,不赚钱的公司不投等等。按百分比来看,你多大程度同意他这些观点?
王小川:我80%是同意的,场景确实很重要,有场景才有生意的本质。这是很率真、真实的表达,逻辑很自洽。第二,这也是对他自己的LP负责任的做法。在他的生意本质里面,他现在只能投他觉得靠谱的事情,不能投太高风险的事情了。
他(朱啸虎)说看不见,想不清楚,那让他相信的唯一办法,就是做出来给他看。那我也接受部分投资人有这样的想法。
36氪:那不同意的部分是什么?
王小川:他对大模型并没有直接的体感。
我觉得做技术投资有两种角度,一种是高看技术,觉得技术有一种光环,能干这个能干那个。
另一种视角是俯视技术,更多是看技术的价值、场景、PMF,能不能解决具体的问题。这种投法不会犯大错,不会投出一个特别不成功的企业。但在生成式AI会带来颠覆性机会的时代里,我认为这可能会错失很多机会。
36氪:今天你感受到业界最关心、最应该讨论的问题是什么?
王小川:就是能否做出超级应用。
你如果没有超级应用就投那么多钱,没有超级应用出来,怎么办?所以朱啸虎就说不投,然后月之暗面就说scale,模型好了以后应用就自然有了。但我觉得他们都没有谈场景本身。
36氪:你觉得你偏向哪一派?
王小川:我觉得每一种主义都是看待世界的一个视角,一个投影,但他不代表全部的真相。
我更愿意用一个人生哲学来解读,就八个字:盲人摸象、小马过河。他们都是只看到各自世界的投影。
36氪:怎么解释?
王小川:我觉得我会更完整地看到这只象。
这是个升维的概念,比如我们画个图,一个圆柱体,你从上往下看,它是个圆。但你平视着看,是个方形,你非要说方对还是圆对呢?它到底是哪个东西?其实它是个圆柱体。
小马过河的意思是,每个公司、投资机构都有自己的角色和选择,我们也不是上帝,而是要做自己。
去年我去美国的时候,我看到OpenAI的登月计划,是要把1000万张GPU连在一起做计算。英伟达一年生产的高端芯片也才100万张,所以美国想的是未来能源会不会不够用。
那么中国有自己的定位,比如朱啸虎就更像是看小花小草,我不求你做多大,但你能尽快找到场景,尽快赚钱。
企业供图
36氪:朱啸虎的观点多大程度代表现在的投资人的意见?你觉得他们为什么会那么想?
王小川:我觉得挺正常的。做大模型的颠覆性变化在于,一是模型越大效果越好,它能掩盖掉小模型,所以投资不是说一个固定投入,就可以开始有收益,而是要持续不断地投入。
二是模型和应用的关系发生了变化。随着模型体量越大,很多应用也被碾压了。对于投资来说,如果你没有对某个场景很有把握,那投资就是个无底洞。
甚至美国也没有给我们带来什么榜样。以前我们的习惯性做法是,美国把技术解决完了,技术已经不是问题了,我们再去做场景,但现在不是。
这种情况下,投资人不适应是正常的,投资方法也确实会发生变化。
36氪:朱啸虎是上一波移动互联网时代里,坚定投To C方向,注重规模的那波投资人。所以他今天讲出这样的观点,会更让人出乎意料。
王小川:他是我很尊重的投资人,但不同时代有不同的投资选择。
上一个互联网时代,大家都是做让生产关系有变化的平台,滴滴、抖音,都是做连接匹配的,这是生产关系的变革。但今天的大模型,是直接提升生产力的。所以改变投资方法,我觉得也特别正常。
36氪:对创业者,上一个时代的打法也不适用了。
王小川:不行的。有的公司说我现在拿这个大模型,学习之前字节的那种APP工厂的做法,看哪个跑出来,那我觉得反而是走得更偏了。很多东西是不能复制的。
包括我们这次创业发现,在很多技术定义上,3年、8年的这种经验没用。现在做大模型最好的就是刚刚毕业的博士生,而且之前就是参与大模型研究的。经验越多,可能变得包袱越大,需要更多变化调整。
模型即应用,核心是找到TPF
36氪:做大模型也做了一年了,你这一年下来整体感觉怎么样?
王小川:有种市场的"推背感",技术发展太快了,每天都有新的论文,从Pretrain(预训练)到SFT(监督微调),数据从公开网络数据到合成数据,研发节奏非常快。
36氪:这一年的商业化情况怎么样?
王小川:现在商业化远不在我们这样的关键词体系里面。
36氪:你去年去美国考察完之后,说目标要变成"技术上慢OpenAI一步,应用上快三步",技术要提速。和你刚刚说的相悖吗?
王小川:落地不等于商业化。你得更有应用导向、场景,在场景端先把价值创造出来,这就叫落地。无论是百度还是抖音,第一天也不是先商业化。
我们今天最要解决的问题,就不是Money这个事,是TPF(Technology Product Fit),而不是PMF(Product Market Fit)。
36氪:这和以前说的PMF区别在哪?
王小川:讲PMF,是因为我们以前默认技术不是事儿了,已经可以用了。但大模型是之前的时代没发生过的问题。哪怕在美国,现在也还是只能让技术解决一切问题。技术有了,场景自然也有了,这是不同的做法。
36氪:国内几乎所有做大模型场景都在说,我们要做模型,我们要做应用,双轮驱动。百川也说双轮驱动,你们跟市面上的厂商有什么不一样?
王小川:我们认为模型即应用,同时我们定义的三个价值观(健康、创造、快乐),对应三个世界(生命世界、真实世界、虚拟世界),你们应该没听到第二家这样讲的。
36氪:具体投入到什么样的领網域,决定了大家轮子的不一样?
王小川:我一直避免用场景这个词。生命模型是一个场景吗?
场景只是对应PMF(Product Market Fit)里的M,这是用户需求的概念,但这不是等于我们所认为的世界模型,我们说的这个模型是一个数学概念,是我们对世界的建模。
我们现在更多要谈的是TPF(Technology Product Fit),把TPF打穿了,先要回答大模型本质上是个什么东西。
36氪:能不能举个例子?
王小川:比如,一个模型如果是一个生命模型,那我认为健康服务和它是一体的,我就在里面做顾问、做助手。但如果是一个虚拟世界的模型,我就做娱乐。
36氪:"生命世界"、"虚拟世界""真实世界"这三个世界的思考是怎么来的?
王小川:我是从AI怎么投影到我们所处世界的角度出发的。
我们是活在现实世界里的,但我们也知道,人有精神上、情感上的需求,是会有梦境的,这是虚拟世界。
最后一个是生命世界。它有别于真实世界,物理世界是熵增的,但生命是熵减的。
所以,创造、健康、快乐是这三个世界对应的价值观。
(36氪注:熵增、熵减皆为热力学原理,熵增现通常喻指一个封闭的孤立系统里,事物从有序走向无序——比如衣服穿久了会变旧,最终走向不可用、消亡。但据物理学家薛定谔的观点,生命是熵减的,生命的本质是一个负熵系统,人类可以通过摄取外部的能量来让自己的生命延续,让身体重新健康起来)
36氪:TPF的这个T(Technology),现在有什么可以提供10倍好于以前的能力?
王小川:大模型核心是在造"人",不是在造工具。人和动物的区别是:第一,人会语言,这是最本质的事情,第二,人会创造使用工具。
昨天还有朋友和我聊,说大模型特别蠢,连7位数的乘法也不会做。我就说,那人也不会呀?
大模型不是精确严谨的计算器,也不是只帮你寻找信息的搜索引擎。大模型是一个智力引擎,从推理到决策,帮你做决策的。
36氪:但我们也观察到一个现象,现在AI应用整个生态里,除了ChatGPT等极少数头部产品之外,很多产品的月活可能就只有百万左右,离"超级应用"很远。
王小川:像朱啸虎讲的,现在很多应用只是"世界"里的一个零部件。现在好多应用,我认为都还没有能够产生真实的用户价值。
36氪:中间的gap主要在哪?
王小川:因为今天的模型很多都是工程师推动的,他们还是从技术去想,所以从技术到产品到marketing这些事上,之前的这样一种思考、沉淀和探索还是不够的。
36氪:所以需要不同的团队吗?比一个团队想做超级应用,应该具备什么样的素质?
王小川:每个公司情况不一样,也有人在小场景里,用小模型,也有不少人赚钱的。
今天的问题不是在于大模型无法赚钱,而是要找到通向AGI的道路上,沿途有什么好场景可以赚钱。我们不是没有场景,而是要想明白:AGI和场景的关系是啥?
36氪:如果说你觉得超级应用还没达成共识,那你自己想明白了吗?
王小川:我觉得模型即应用,这是一体的。模型代表了是你所创造的数学模型对世界的反映。第二是,现在这个模型为什么样的价值去服务?我觉得我们要回答这两个问题。
在AGI的路上,要找到同频或更高的场景
36氪:你说大模型核心是在造"人",那你怎么思考AGI当前的实现路径?你对实现AGI有多坚定?
王小川:AGI的理想是不可绕过的一个话题,必须要有。
我觉得实现AGI有两个路径,一是把技术做足够好、足够大之后,问题都解决了,不需要Prompt了。
第二是,在模型还没到那么大规模的时候呢?在爬这座山的时候,我们还要在中间找补给站。
我们并不是只走研究技术问题的路线,而是更希望让技术来支持我们"造人"这个目标。
我举个例子,写广告文案不需要特别大的模型,模型做大反而会拖住你的。你再投几亿美金到GPT-4、GPT-5干嘛呢?投入产出就变成负的了。
36氪:什么样的场景才算和AGI的目标有关系?
王小川:第一,这个场景要足够终极,成长性足够大,要让大模型走到AGI的时候,才能让这个场景的实现达到完美的程度。
但同时这个场景的起点又要相对比较低,哪怕没有达到AGI,这个场景也已经可以产生价值,切入广泛人群了。
36氪:那你们要做什么方向?
王小川:原来我们想做的方向有法律、医疗,但后面我们认为做医疗是我们最懂、最心动的,法律就先放弃。
36氪:为什么这么看好医疗?百川是国内大模型厂商里对医疗场景强调最多的。
王小川:我2021年把搜狗卖给腾讯,写告别信的时候就讲了,往后20年要做大众健康和医学,其实我当时是希望做生命的数学模型。
我们知道,把物理学变成数学模型这个工作,是牛顿做的。今天的大语言模型(LLM)是把语言变成了数学,今天我讲的把生命变成数学这个事情,是不低于大模型的,它能帮助我们更好地通向更远的生命世界。
36氪:是什么让你觉得可以做得好医疗?上一个移动互联网时代,无论是巨头还是AI公司,无论To B还是To C,在医疗场景上都不能说做得成功。
王小川:我觉得大家对医疗的本质没有太理解,现在的关键是要造有医疗知识的"人"。
上一代互联网的本质,是在解决信息传递、改变生产关系的问题。医疗领網域最缺的资源是医生,但医生的供给是有限的,医疗系统无法有更大的供给,所以上一代互联网做挂号什么的,也没有意义。
我们就谈需不需要的问题,我们需要更多医生吗?如果需要,那剩下的就是技术问题。
36氪:上一代AI也有做很多影像识别辅助诊断,所以你觉得也没有解决核心问题。
王小川:不work,上一个时代的AI并没有解决机器的认知问题。一个医生要和病人正常沟通,需要将学习到的知识和后来的经验融会贯通,靠以前的技术,在影像里学经验,AI是理解不了后面的概念和逻辑的。
36氪:这些人类经验知识的数据是公开的吗?数据获取的门槛会很高吗?
王小川:医疗是各个行业里数据量最充分的行业,没有之一。
医生其实就是初级的科学家,每天都要做科研写论文的,论文还不像物理学论文,给一个最底层的推导,而是要做临床干预性的实验,只要有几十例病人在里面,就是很好的论文。
从case study、RCT再到后面的Meta分析,以及大量的论文、医疗指南、专家共识等这些医学领網域知识的总结都能够成为大模型的数据,这些数据以前机器是看不懂的。
36氪:相当于大模型补足了"AI医生"上学、在医院积累经验的部分。
王小川:能看论文能看指南,可以说有60分起步了。
36氪:接下来,最有可能迅速发生改变的几个功能或者场景,是什么?
王小川:我们可能还要一段时间才能给大家展示产品。但我提个很好的场景,问诊。
大模型能够有效地降低误诊率,这在很多小地方的基层医院,是个大问题。如果你颈椎有问题,如果医生经验不够,可能会诊出不同的结果,影响治疗。但有了大模型,它可以按照诊断的SOP(标准化流程)来提问,这可以充分展现它的能力。
36氪:再具体一点,你觉得你想做的这个产品,是什么?
王小川:就是助手。
36氪:在这些行业里,颠覆大厂的可能性有多少?
王小川:你得想,什么场景、数据不在大厂手里。医疗场景在大厂手里吗?要按这种逻辑来思考。
36氪:现在也有很多讨论说,大模型在To B落地,成本太高又太卷,但To C现在也没看到真正爆发的应用,有一些AI生成图片类的应用,大家会觉得昙花一现。
王小川:如果我们盖个摩天大楼,你就不能指望它三个月盖完。你盖个草棚子是很快的。等我们在这个楼里面了才会看到,这可能是个游乐场,再上面会是个医院。
36氪:现在国内大模型厂商在商业化上思路已经有分化,有的侧重To B,还有的就只做To C应用。百川To B和To C都做,有侧重吗?
王小川:我们现在主要To C,To B占20%左右,很小的一个比例。
36氪:现在国内私有化部署的大模型,单价从原来千万元级已经打到了百万元甚至更低。我们可以说,国内To B市场天花板就是很低吗?
王小川:To B确实比To C天花板低很多,现在大模型那么卷,所以这个结论是对的。
另一个对我们的启发是,如果你是模型厂商,没有独有的价值,这个游戏就变成了拼价格的事情。
快速让场景达到可用,才能成为壁垒
36氪:一年前百川刚成立时我们问过你,现在想再问一遍:现在中美在大模型上的差距有多大?
王小川:从0到1阶段的一些创新,我认为差距是在拉大的。但已经突破了从0到1,技术接近可用的时候,我们是跟进得够快的。
去年初,大家都特别担心能不能跟上GPT-3.5,但今天,大家在问,什么时候能到GPT-4?
无论是中国还是美国,大家的进步速度都不是跟中国公司相比。在美国,哪怕是Google等公司都有点跟不上OpenAI的状态。OpenAI是现在人才、算力、资金的制高点。
36氪:这一年以来,你对AGI的实现路径,或者认知和想法有什么大的迭代?
王小川:理解没有太大的变化。我们认为语言为中心,现在依然是。
我觉得更多是从愿景走到实际的体感了。原来做模型的时候,你会有一种冲动和惯性,在模型之上,把我们原有的一些能力放进去,外挂一些应用。但现在很清楚,是要把这些能力要训到模型里面去。
36氪:可以展开讲讲吗,把什么样的能力挂进去?
王小川:比如搜索,原来是像把搜索引擎挂到模型上,现在更多是想让模型懂得怎么用好搜索引擎。
36氪:用开源模型会是个问题吗?国内无论是做AI应用还是说模型层,都有基于开源模型去做的。这会导致我们整体技术上落后吗?
王小川:这不叫落后。美国很多公司也在用开源模型,开源、闭源,这两件事都是生态里很重要的事。在美国,如果不是Meta的LLAMA发布,让开源这个生态打起来了,他们也只有闭源模型。比如我们自己的开源模型,Baichuan2-13B,也让很多中国企业受益,用小模型+数据去做产品。
并不是开源落后的问题,而是需要去计算,到底什么公司能够既把模型scale(规模化)到接近OpenAI的水平,同时还能保证自己活下去,这是一个关键问题。
36氪:这一代生成式AI技术发展的瓶颈,或者说现在遇到的最大问题,会有哪些?
王小川:如果沿着Scaling Law继续走,确实对能源消耗太大了,必须把成本降下来。
第二,现在有人提压缩即智能,压缩已有的数据,我们称为分布内的数据,但分布外的知识、能力,要怎么用进来?这是以OpenAI旗下Sora为代表的技术所不够的地方。Sora虽然能力强,但计算能力要求高,而且处理的只是一种快思考,缺乏慢思考的基础。
36氪:对于大模型,接下来你们要重点投入的资源会是什么?
王小川:第一,要scale的话,大家都有共识,要数据、要算力。
并且,我们所说的三个世界里:真实世界、虚拟世界,还有生命世界。每个世界里,我们要去获取和构造这个世界里面需要的这些数据,更有针对性。
36氪:什么才能造就壁垒,数据本身吗?
王小川:是能够更快地使场景达到可用状态,而不是数据本身。
现在,大家每三个月到半年,你用一半的数据训模型,只要是高质量好的数据,就能达成一样的效果。
数据质量越高的时候,对规模的要求就变小了,那训练成本也至少小一倍了。
36氪:钱也是重要资源。现在大厂的投资策略是广撒网,谁都投,你怎么看这种做法?
王小川:我觉得这就是大厂做贡献,能推动进步的方式啊。一开始有人问我们为什么不做人民币架构,做美元架构,也是有这个原因——我们一开始就觉得CVC(Corporate Venture Capital)是最该争取的,他们比纯VC能更长久地支持这个赛道,政府的角色可能没那么快进来。
36氪:今年遇到的投资人里,关心的问题会有什么不一样?
王小川:大厂更多关心算力够不够,VC关心场景咋样。
36氪:2023年以前,大模型领網域融到大钱的公司就只有屈指可数的家,百川是其中之一。当时大家的融资规模大概都在3亿美金上下。最近月之暗面的10亿美金融资消息出来,是否意味着战事规模更新了?
王小川:这是正常逻辑。大家都是认为往下是需要逐步去提升这个融资规模的,是行业共识。
36氪:对百川来说,融大钱也是很重要的下一步?
王小川:如果往AGI走,你是需要大钱的。但对我而言,我可能更看重超级应用,至少让大家看到这个事,是有画面感的。
36氪:就是没有超级应用,这个大钱其实也不会来。
王小川:其实我们融的钱,按照现在的进度,也足够支撑很长时间了,我觉得你比我焦虑多了。
36氪:这是我们感觉到的业界情绪。从去年下半年开始,投资人对大模型的态度变得更冷静。你觉得呢?
王小川:肯定的。大家开始想超级应用在哪儿,否则一股腦地融资,如果没超级应用,之后融钱也很难。
36氪:现在大模型在国内拿钱已经很不容易,你怎么说服投资人再继续给你投钱?
王小川:传统VC确实很难继续投钱,风险高、看不清。我觉得往后有两拨力量,一是大厂,其实美国也是,Google、亚马逊、微软都这样。二是政府,这不是靠风险投资逻辑驱动的。
36氪:今年,国内大厂会开始并购大模型公司吗?
王小川:我觉得今年还不会。
36氪:但大厂都全都投了,还投了好多。
王小川:今天能入大厂眼的厂商,如果你做好了,你还能发展下去。但你做不好的话,人家也看不上你。
36氪:去年,全球AI圈里,你觉得发生的最重要的事儿Top 3是什么?
王小川:GPT-4发布是重大的里程碑,比GPT-3.5有巨大的提升,而且后续每一代还会有。
其次是竞争对手起来了,比如Anthropic、还有马斯克的X.AI,不再是OpenAI一家独秀。
还有一个事情是OpenAI内乱,这背后代表的是两种技术思想的分歧,而且大家都不知道AGI什么时候来,会造成多大影响。
36氪:这些事对国内来说是什么信号?
王小川:首先对中国来说我们必须跟进,如果市场上只谈商业化,那我们就完蛋了。
Sora不在AGI主线上,语言才是中轴
36氪:最近Sora让全世界都又震撼了一次,你对Sora怎么看?之前听说团队里很多人和你说要去做Sora,你还发火了。
王小川:对啊,智力是藏在语言里的。Sora既不是AGI,又不是应用。
大家肯定都有技术好奇心,有新东西总是想参与。但我坐在CEO的位置上,就是要做战略道路选择,决定做不做。
36氪:所以你觉得普遍已经超过GPT-3.5这个线了?
王小川:头部这几家大模型公司,包括大厂和创业公司,已经超过了。
36氪:你对Sora怎么看?这对做LLM(大语言模型)的人来说,有什么意义?
王小川:意义不大。
36氪:为什么?
王小川:大家有一个误解在于,觉得Sora好像比GPT又高级了,对吧?原来是文字的,啪一下,又变视频了。
语言所表达的是概念层面的"空间",但视频所表达的是肉眼可见的空间。语言对空间实体的表达能力,是远高于视频的。本质上,语言描述的概念,代表着对世界更多的认知。
Sora的突破在于,让视频上的表达和语言空间去统一编码(即让大模型将语言和物理意义上的空间表达进行匹配),而且还没有完全解决这个问题。
36氪:毕竟视频所对应的多模态技术,看着比较Fancy。
王小川:你讲得特别对,Fancy。Sora的冲击力更多来自于感官上的冲击,但这并不代表技术是更强的。
GPT的技术难度,以及它可以实现的规模是远高于Sora的。现在大模型到了万亿参数级别,Sora是百亿级别,还是差很多的。
并且,OpenAI是要做AGI的,以后会陆续发GPT-4.5、GPT-5,但Sora只是OpenAI的side project(子项目),并不是主线。
36氪:人类所接收到外部信息里面,语言当然是很大一部分,但影像这类视觉信息,不也是很重要的一部分吗?
王小川:狗是会看视频的,但狗会说话吗?人类的智力是在语言里面的。在实现AGI(通用人工智能)这件事上,视觉不是关键。
36氪:Sora的训练其实也基于很多LLM(大语言模型)的技术,百川自己也有对多模态投入,会往Sora这个方向做吗?
王小川:我们不会做。Sora既不是AGI这个方向的事,也不是一个具体可见的应用方向。现在Sora生成一分钟视频需要20分钟,60美金,做电影可能有点用,但做C端一些互动性的东西,是不太实用的。
36氪:如果Sora不是你们的主线业务,那是谁的主线业务?字节吗?
王小川:特别适合。这个事既没有语言需要那么多智力,又适合直接来跟进。
36氪:而且还特别耗钱。
王小川:哈哈哈哈。
大模型的未来不是工具,而是伙伴
36氪:我看到你在今年春节发了一个新年愿景,是说造一个大模型时代的新物种,不会要求它像工具一样,而是达到人类对伙伴的要求。这个新物种的载体会是什么?
王小川:我觉得载体不是本质问题,但它以后一定会依附某种硬體,比如手机、眼镜、耳机,都可以做。
36氪:如果复盘过去一年,你觉得做的最重要的事是什么?
王小川:做得足够早,和时代脉搏同步了。我们先是把团队搭建起来了,并且现在模型能力接近GPT-4,在中文领網域很多任务是超过的。
我们对开源社区也有贡献。去年9月份,我们发布了百川的开源模型,很多大厂还有创业公司都在用。我们得到的数据是,现在报备底层模型的200多家新公司里,有一半以上都是用我们的模型。
并且技术主张和愿景都没有走偏,包括去年我提的"双轮驱动",大模型和超级应用要一起做,以及增强搜索、强化学习等等方向,今年也会开始一一兑现。
36氪:你怎么想象未来AI能做到的事情?
王小川:今年元旦,有朋友发消息给我说,小川元旦快乐。我就回复:智能纪元贰年快乐。
在我眼里,去年是智能元年,今年是第贰年。我认为我是看到了未来的模样。
去年4月我下场的时候,当时我就在讲,AI一方面是提升这种生产力,另一方面能成为我们的伙伴,甚至还能创造出虚拟世界,成为大家娱乐的天地。
36氪:那些没有被AI学到的数据,那就是AI的盲點,我想这对人类的创造力提出了全新的需求,我们也许不能创造出一个和AI差不多水平,或者人类已有知识库里存在的东西。
在现在AI的水平下,我们人类有价值的地方,或者应该发展价值的地方是什么?
王小川:不同人选择不一样,比如创造力这个现在还是暂时取代不了。所以我觉得就做好两个事情,一个是用好AI,你不会用,你就可能被淘汰。二是投身做AI,把智慧放进去,比如来百川做AI,哈哈。
去年我说了句有点争议的话,我说程式员也是自己的掘墓人,把自己融入进去了,从"小我"变成"大我"。
36氪:但融入之后,我们就会失业了?
王小川:人早晚都会死掉的,怕啥呢?
36氪:大家肯定想的是,死掉之前不要失业……
王小川:但你失业不失业,都要死掉,只有生死才是大问题嘛。
36氪:比如像真正做大模型的人,对未来可能创造出来的东西,你会有恐惧吗?
王小川:没有恐惧。我官宣下场的时候写了句话:发展AGI,帮助繁荣和延续人类文明。这两个任意选一个,都挺好的呀。
36氪:所以这两个是可以分开看的。
王小川:对的。
36氪:想过有失败的可能性吗?
王小川:现在想的是解决各种困难。腦子确实里没有失败这个念头,最好也不要想这个事。
36氪:对于现在的AI行业,您最想知道的一个问题,或者看到的事情,是什么?
王小川:我想看到GPT-4.5或者GPT-5到底有什么大的变化,有多大的进步。
36氪:2024年,你对AI行业会有什么预测吗?
王小川:第一,我觉得美国还会不断地冒出让我们吃惊的进展。
第二,我觉得我们国内市场既不要狂妄,也不要妄自菲薄。我们已经能长出自己的能力来,GPT-3.5,GPT-4,我们是能跟上的。今年,各个厂商都会开始做差异化,我对这个比较乐观。
欢迎交流
>