今天小编分享的互联网经验:对话智谱AI CEO 张鹏:让追赶OpenAI成为可能,欢迎阅读。
1 月 16 日,智谱 AI 发布新一代基座大模型 GLM-4。
GLM-4 在基础能力上相比 GLM-3 性能全面提升 60%,支持最高 128K 长文本,原生支持自动联网、图片生成、数据分析等复杂任务,并在多模态能力上有了长足进步。据智谱 AI 透露,在内部测评中,GLM-4 在性能上逼近了 GPT-4。GLM 模型智能体和智能体中心也在 GLM-4 发布当天同步上线。
此前,去年 6 月 ChatGLM-2 发布,去年 10 月 ChatGLM-3 发布,而去年 3 月 GLM-4 已经完成第一个版本。CEO 张鹏认为三到四个月完成一次基础模型迭代是正常的研发速度。
去年年初,这家中国最重要的基础模型公司定下了朝 GPT-4 追赶的目标,之后一年基础模型继续快速发展,Meta 把持着开源生态,领头羊 OpenAI 拿出了 GPT-4,谷歌带着 Gemini 姗姗来迟。基础模型的竞争者逐渐收敛到少数几家,而观察中国公司在其中的位置时,目前中国唯一估值超过百亿人民币的智谱 AI 或许是那个锚。
在 GLM-4 发布之际,我们与智谱 AI CEO 张鹏进行了一次独家对话。
以下为对话实录:
什么最重要?模型,模型,还是模型
硅星人:我们先聊聊 GLM-4 本身。智谱 AI 对标 GPT-4 去做自己的更新和演进,这个整体思路是怎么样的,如何让追上 GPT-4 这件事看起来可行,并且可能还会有一些超预期的东西?
张鹏:首先肯定是模型能力方面差距的追赶,比如多模态能力,GPT-4 在 3 月份发布的时候其实已经带来多模态能力了。我们判断对于 AGI 来说,多模态这件事情可能是必须要去解决的,所以这个能力你必须有。包括模型本身能力提升所带来的像 CoT 这样的高阶能力,它其实根植于你底层的基础模型的能力。
第二件事是,有了大腦,需要眼睛和耳朵,手和脚——需要要把这些基础模型的能力辐射出去,跟外界系统产生更密切的互動,而不是简单的做文本和影像的输入输出。这个事情就偏向应用了。
硅星人:基础模型能力的辐射,这是关于 Agent(智能体)的想法了。现在人们谈起 Agent,正在陷入一个概念的陷阱里,智谱 AI 对于 Agent 的有什么自己的理解?
张鹏:Agent 在人工智能或者说计算机科学史上是个 " 老概念 ",有一套相对完整的解释体系。大模型下 Agent 找到了一个新的视角。但 Agent 的本源仍然是大模型的基础能力,大腦的智力水平足够高,才能去谈理解、推理、以及规划和执行这些事。
智谱 AI 还是从技术角度的的定义和演进来理解 Agent 的。然后从大模型角度来看,Agent 应该怎么去演化,怎么去提供这个能力。以及它跟需求语言之间应该如何相互翻译,找到通路去对应上。
硅星人:Agent 和所谓的 AI 原生应用(AI Native App),这两者之间是什么关系?
张鹏:首先 AI Native 这个范畴还是太大,我们更愿意叫做大模型的原生应用。
首先说大模型原生应用,它实际上是指的我们希望说从大模型的原生能力出发,去设计和开发的应用,我们期待它是一种新的东西,而不是说把原来的应用拿来做一个更新。
这个是有的,比如 ChatGPT,这个产品在工程化层面其实很简单,核心就是一个模型。而对于 Agent,我们的理解始终是它是模型某种能力的外化,你可以把这种能力做成某种大模型原生应用。
但 Agent 本身也会给应用的开发过程带来一些变化。当 Agent 能力被用在开发阶段,它又变成一个赋能原生应用开发的过程,Agent 和大模型原生应用之间的逻辑应该是这样。
硅星人:就是可能大模型原生能力本身体现了 Agent 的能力,Agent 某种程度上也在帮助大模型原生能力开发的自动化,这样一种关系。
张鹏:对。
做垂直领網域最终是为了以后不做
硅星人:智谱 AI 在垂直领網域的商业化很早,给外界的感觉一直是比较 to B,GLM 模型智能体会是一个跟 GPTs 很像的东西吗,还是不一样?
张鹏:商业化落地这件事还是围绕着我们模型价值本身。我们早期的模型能力不太够,那可能就需要去为了填补模型本身的能力和最终业务需求之间的 gap,而去垂直领網域多做一点事情。
你不去做,你不知道客户在想什么,也就不知道你的技术最终帮助客户提升的用户价值到底有多少。
这实际上是我们去寻找 Best Practice(最佳实践)的一个过程。我们希望把这个路径蹚通,回过头来把这些东西沉淀下来之后赋能给生态。
硅星人:比如说 RAG(Retrieval Augmented Generation,检索增强生成),智谱 AI 应该是国内最早把 RAG 用到垂直领網域了的一个。
张鹏:算是比较早,因为 LangChain 整个开源项目里头就有我们。RAG 是很典型的一个例子,就是从垂直领網域沉淀出通用型的需求,以及一套方法。这套方法可以成为一种标准化的解决路径和产品。
硅星人:所以可以这么理解,我们做很多垂直领網域的事,其实是为了反哺通用模型的基础能力提升。做的目的是为了以后不做。
张鹏:对。GLM 模型智能体就是在探索一种更通用的路径。
传统互联网爆款产品经理不理解最新的 AI 技术
硅星人:智谱 AI 一直以技术能力见长,你怎么看现在智谱 AI 的产品能力,比方说我们能够支持多少个开发者在上面,怎么提供好的工具,甚至让开发者能得到更多曝光?
张鹏:如果我们现在真的进入到了大模型的应用半场的话,产品能力是大家都很关注的一件事。
智谱 AI 之前也有自己的一些产品化的东西,其实用户量都还不错,我觉得产品能力应该来说还不算差,当然我们会持续的在这方面去加强。
但是反过头来讲,你看 ChatGPT,作为一个产品本身没有什么特别复杂的东西。所以——我个人感觉,因为我不是做产品出身——所谓产品力这个东西,在这个时代它变成了一种对需求的敏锐感知能力和对于新技术的领悟能力的兼顾,在这个基础上,考验的是如何揉合这两种能力,去产生一种新的产品表达形态的这样一种复合的能力。
硅星人:这跟移动互联网时期的小步快跑、快速迭代和敏捷开发这些东西可能是不一样了。
张鹏:这一套沉淀下来的产品开发逻辑还在,尤其是 ToC。但为什么现在大家说要找一款所谓的 Killer App 这么难,好像所有的产品经理都没有头绪。
我个人觉得其实矛盾在于,原来传统的互联网爆款的产品经理,他对于现在最新的技术没办法理解。真正懂技术的这些人,对于所谓的用户需求和产品需求又没法理解。
硅星人:那当一个基础模型开始面对开发者了,也就存在一个模型的技术和产品适配问题(technology product fit)。你们要如何跟开发者去讲,你能够做什么不能做什么?
张鹏:好像现在只能开发者自己去尝试,但在这之外,其实有一些本质的东西做产品的人可以在间隙思考一下。
回到第一性原理,大模型本质上解决了什么样的问题,找到这个点,然后你把你所有需求写出来,然后你去找到这两者间的连线。
比如我反问你,Chatgpt 解决的是什么问题?你第一天用上,它就直接告诉你这是个不一样的东西,从来没有人想过这个问题——虽然他帮你解决了很多问题。
硅星人:所以 ChatGPT 解决了什么问题?
张鹏:我个人认为它最本质上解决的还是人机互動的问题。机器终于有一天能够比较像样的能听懂人说什么,然后说出来的话也让人能听懂。这个是个本质的问题,它弥合了人和机器之间的距离,这是他第一性要解决的问题。
顺着这个思路,哪些场景可以被这件事情解决掉,很容易判断出自动客服这类的需求。
这是大模型解决的第一件事。第二是大模型在经过大量语料数据训练之后,具备超越一般人积累的知识和数据量,能很好的去解答人们日常生活当中的问题。这件事本质上解决的是我们人类社会当中人与人之间的信息和知识传递的成本和范围问题。
硅星人:那些让人被迫为了一份工作要学习一堆无用知识的问题,或者说是知识的快速消化的处理的问题,现在都可以处理了。
张鹏:对,我有更低的成本,更大的范围去获取知识了。所以这个事情又可以 cover 掉教育、员工内部培训这些事情。所以如果按这种逻辑分析方式的话,其实还是能找出来一些大模型应用产品具体的方向的。
硅星人:那这样其实对做产品的人的要求是非常高的。过去互联网时期中国的产品经理群体里,设计师出身的人很多,做互動做 UI 的人很多。那时候美国的产品经理,一看全是 MBA 背景。那时我们会嘲笑这帮人做 MBA 的怎么做好产品,现在你发现还真得靠 MBA 去做产品经理。
张鹏:对,我特别赞同你这么说。这背后其实是大家在对于 " 一个产品需要满足什么需求 " 这件事的着眼点不一样。
设计美术出身的产品经理居多,是因为我们认为移动互联网是一个注意力经济,我要做到的事情是抓用户的注意力,只要有人关注它、点开它,我的目的就达到了。因此整个产品、招的人也都会围绕这个目标构建。
如果更在意的是整个互联网经背后的经济逻辑和价值逻辑,那就不会是这样。
生态好才是真的好,不要在摩擦中消耗力量
硅星人:再度回到 GLM 模型发布的智能体,智谱 AI 希望给到开发者或者第三方怎样的一个开发环境。现在有两种方向,一种是往开发平台里边去堆各种各样的工具和能力,降低开发门槛,吸引更多人。另一种就是 OpenAI 这样只提供一个很简单的 instruction,反正我有什么你都知道。
张鹏:我们比较接近 OpenAI 那种思路,首先还是强调基础模型本身的技术能力。模型能力足够强,你才有可能让大家真正用起来。
在这个时间发布智能体,还是因为我们觉得我们模型的能力到了这个水平了,所以就开放给大家。至于工具是可以慢慢增加的。问题的根本并不在于说你工具多少,工具少的时候我能解决少的问题,工具多了能解决更多问题了。
硅星人:国外 OpenAI 已经通过 ChatGPT 走向大众了,国内一些入局大模型的大厂有自己的流量资源优势。目前智谱 AI 的姿态仍然是面向业界的,有没有想过转变成真正的面向公众的一个 AI 品牌,这个问题重要吗?
张鹏:首先这个事儿我认为还是挺重要的,我们有我们自己的理念和终极目标,但这个过程当中,作为一个创业公司要活得好,其实还是比较依赖一个良好的生态,生态这个事情就是需要去发声,需要跟大家去讲我们怎么想。
做一场 DevDay,做很多活动,一是希望大家多互动,也是希望把生态发展的理念传递给大家。大家好才是真的好,很多时候我们在摩擦中消耗了太多力量了。
硅星人:那再进一步,智谱 AI 有没有可能成为一个面向世界的,而不是仅仅是面向中国的 AI 公司 ?
张鹏:我们没有给自己设这个限制。智谱 AI 的目标是要做到全世界最好的水平,我们做的所有事情都是朝着这个大目标去的。