今天小编分享的科技经验:大模型与程式员,谁吃了谁,欢迎阅读。
一名失业中的程式员,因为一次大胆的求职之举登上了微博热搜。
向瑶函花费 999 元,在广州地铁珠江新城站购买了一个广告位 5 天的使用权,用来投放自己的简历二维码,扫码就可以了解这名程式员 " 飘零的前半生 "。
向瑶函是在 2023 年 5 月 " 主动失业 " 的。去年 3 月 15 日凌晨 GPT-4 发布,兴奋之余,他和很多其他程式员隐隐感到不安——面对生成式 AI 技术的爆发,是当一名旁观者,还是主动拥抱新变化?
此时的向瑶函还在广州一家粮食企业当数据经理,热衷于 AI 比赛的他总是自诩为 "AI 狂热分子 ",业余在广州的互联网行业咨询圈子也干得有声有色。
2023 年 5 月,举办了 4 场小范围 AI 讲座后,向瑶函明显感到大模型的热度已经不能简单地用 " 陡然上升 " 来形容。
来参加讲座或来咨询的广州老板们陷入了 AI 焦虑,不论是哪行哪业,企业多大多小,都琢磨起了建大模型的主意。
但向瑶函当时的东家——一家把泰国的大米卖到中国的上市公司,似乎对做 AI 并不感兴趣。"AI 是大方向 "" 我要做 AI"" 指不定成为中国 AI 界一颗冉冉升起的新星 "…… 抱着这样的想法,雄心勃勃的他计划转型去当一名算法工程师。
大模型呼啸而至,互联网已经很久没有经历这样的技术冲击了。互联网时代的技术岗打工人,和前线大模型公司,这两块拼图要完全吻合,难度超乎想象。
01
消失的产品经理
事情没有向瑶函想得顺利," 门槛确实太高了,很多招聘要求是能开发底层大模型 "。
向瑶函自认在写代码这件事上是有天赋的,在 AI 比赛上靠写中小模型也获过不少奖项,但对大模型经验寥寥。
更糟糕的是,毕业于湘潭大学企业营销专业的他,曾经靠自学 Python 闯入技术圈,但 " 英雄不问出处 " 的法则在大模型行业失灵了," 学历上就卡死了 "。
市场达成了自己的共识,这个共识就是追求确定性,以实现不确定性。
要在大模型行业有一席之地,人才密集和资金密集与否,是唯二决定生死的核心要素。
大家多少清楚如今大环境下投资人的谨慎,至于人才,情况要令人困惑得多——从大厂高管、创业公司老板,再到投资人、猎头,没人了解方向,都在从零摸索起。
作为大模型初创公司共生团队负责人,张林最近做了一个决定,暂时搁置招聘产品经理的工作。
创办共生团队几个月后,市场给忙于吸纳人才的张林上了最新一课——大模型公司很难在互联网体系内找到可以经验复用的产品经理。放弃招聘后,他和几位 AI 工程师出身的创始团队成员,兼起了公司产品经理的职责。
" 我们筛选过很多产品经理的简历,做 UI 的、产品的等等,但他们的共同问题是,不了解大模型项目的底层机制,导致没有办法很快迁移经验。" 张林说道," 如果理解程度是‘画一个界面’,那最后基本一塌糊涂。"
国产大模型已经卷了一年半,但张林至今没有看到 " 比较高质量 " 的产品经理出现。他产生了巨大的紧迫感。
他告诉 36 氪,创办公司几个月的时间里,团队更加坚定了这样的认知:" 我们尝试从原子化角度来看,如果一个新技术让单个个体角色发生根本性变化,那么由这样一个个体所组成的部門和系统,自然也逃不过变化。"
大模型猎头 Louis 则感觉" 所有人都在追逐同一拨人 ",就是清华帮那十几个," 如果追求对底层大模型的认知,国内只有他们。"
" 无论创业公司还是大厂都在问我同样的事情:唐杰老师(智谱 AI 首席科学家、清华大学计算机系教授)的减一(直属下级)能不能挖来?岂凡超(深言科技创始人、清华大学人工智能研究院教授孙茂松的学生)的减一能不能挖来?"
短时间内,清华帮十余人成了国内大模型人才市场唯一的确定性,要招他们之外的人,大家几乎连招聘要求怎么写都没有头绪。
资深猎头肖恩曾接过几个互联网大厂的大模型招聘需求,只不过对接的过程令他有些哑然失笑。
"某头部大厂根本不知道想要什么,还异想天开想从 OpenAI、Meta 什么的挖人。"" 有些大厂大模型团队办公室都开到国外了,但是也没做出什么水花,也不知道未来要干什么。"
投资人也在雾里看花。曾经有投资人问张林,是不是国内(大模型公司)已经泛滥了,这让张林感到无奈。" 根本不可能,真正能打底层大模型的始终只有那一拨人,无非是几个团队间绕来绕去,这个技术很难短期内扩散。"
眼下,优秀的 AI 工程师就像上世纪九十年代的程式员,匮乏且抢手。技术招聘平台 CoderPad 近期发布的报告显示,"AI 专家 " 成为最难填补的职位第二名,而即使在十年前的上一轮 AI 革命,AI 专家的招聘难度都未曾进过前三。
去年 Louis 为一家大模型团队招聘一系列技术岗位,包括数据清洗和 SFT(有监督微调)等。和所有人一样,她最开始的路线是专找圈内 " 掐尖儿 " 的技术人员,但很快这些候选人被验证 " 又贵又不好用 "。
很大一个原因在于,大模型时代,技术岗位边界在变得模糊。
张林的技术团队不到 10 个人,除去一两位专打底层大模型的工程师,其他人绝大部分精力用来做系统设计和产品设计,写代码的比重越来越小。" 落地时,谁写的代码谁就自己做项目经理。"
HiDream.ai 的研发人员同样覆盖全流程,公司创始人兼 CEO 梅涛博士告诉 36 氪:" 工程师做完模型自己封装,才跟得上迭代的速度。"
36 氪走访了解到,行业普遍的预测是,未来程式员和产品经理两个岗位将合体。
要找到符合这样要求的复合型人才是件难事。一方面,如张林的经历,现阶段市场里没有现成的人选,另一方面,需要跟时间赛跑的大模型公司们,也不被允许等待市场培养出成熟人才后再收割,大模型迭代,晚一天都是万亿参数训练的落后。
经过一年摸索后,Louis 感觉国产大模型人才需求进入阶段性稳定期,呈现出一种 " 哑铃状 " 格局,要么追求头部技术大咖,要么招应届或在读的学生。
" 有些公司的心态是,大模型极大地降低了编程门槛,那对于一些非核心技术岗,利用开源大模型也可以迅速学会,应届生又便宜、技术又新,Why not?"Louis 说道。
张林在碰壁后也发现,通过招聘的方式,已经很难找到技术和产品的多面手,他选择另辟蹊径,从源头培养。
他告诉 36 氪,共生团队已经开始广泛跟高校合作," 我自己在带硕士和博士的科研项目,在这个过程中发掘足够强的候选人,将来自然而然进入公司工作。"
张林的做法并不少见,学术和工程边界加速弥合,是大模型公司带来的新变化。以 Midjourney 为例,11 人团队中,9 人是研发人员,没有产品经理,且 9 位研发人员中,有 4 位都是尚未毕业的大學生。
而 " 工业界与学术界融合 " 最为成熟的标杆,自然是 OpenAI。
过往,新的技术突破总是最先诞生在学术界,但 ChatGPT 成为一个节点——一个独立于大公司之外的研究型组织,引入一批 " 年轻甚至在读的顶尖学者 ",将科学和产品、商业结合,才最终诞生了 ChatGPT 这样伟大的系统。
" 过去把研究型组织安插在大公司,这样的 AI Lab 模式已经成为历史了。" 月之暗面创始人杨植麟日前在接受腾讯新闻采访时表示,AGI 的生产方式跟互联网不一样,科研或教育系统会转变职能,变成培养人才为主。
这一轮技术革命中,经验的重要性被不断降级,取而代之的是 " 拥有足够新的知识 ",越来越多科技领網域学者,在学术生涯早期便介入工业界。
在此背景下,大模型老板们自然也是下手多早都不为过。" 大學生我们都不放过 ",据张林观察,在大模型时代,大學生甚至比博士生更容易出东西," 没有(旧技术的)负担很重要 "。
02
并非取代那么简单
大模型或许是属于技术追求者的最好的时代,它更单纯、更聚焦、更长期主义。产品是否受欢迎,比拼的几乎只有技术。
这也造成了一种技术焦虑——新一轮技术冲击下,跟不上就会被抛弃吗?
地铁站求职广告发布后,有 50 多家企业找到向瑶函,这本该令人高兴,但 30 多次面试下来,靠谱的工作还是偏数据分析。他不得不告诉自己,自己的 " 大模型梦 " 可能很难实现了。
" 感觉大模型出来后,之前学了三年 python 都白费了。"
在他身边,案例也逐渐变得两极化,有人因为在高精尖行业做大模型如鱼得水,也有以 "AI 可以取代你 " 为名而被迫离职的案例。
向瑶函眼下的职业困境,或许和大模型编程能力的完善有关,这听上去简直是个悖论。
编程是从计算机诞生起就存在的概念,是构建互联网最基础和底层的工作。与此同时,编程语言一直在进化,从最初的二进制,到后来的机器代码、汇编语言,再到高级语言,诸如 C 语言、JAVA、Python 等当下流行的编程语言都已有三四十年的历史。
2021 年时,OpenAI 就开发出了 Codex 系统,Codex 可根据程式员的自然语言输入进行简单的代码编写支持,被看作是 AI 编程的开端,这之后便开始有声音讨论 " 大模型取代程式员的可能性 "。
直到最近,类似产品开始井喷,一批 " 码农大模型 " 密集诞生。比如初创公司 Cognition 发布的首个 AI 軟體工程师 Devin、蚂蚁集团 CodeFuse 平台推出的 " 图生代码 " 技术、微软根据 OpenAI 的 Codex 模型开发的代码建议工具 GitHub Copilot……
今年年初,技术招聘平台 CoderPad 的一份调查显示,超过 80% 的开发者正在工作中使用 ChatGPT 或 Copilot。CSDN 的一份调查则显示,35% 的开发者每天使用代码生成工具,其中 36% 的人认为开发效率得到极大提升。
相比于过去一段日子大模型学会画画、做视频和作曲," 学会编程 " 这件事之所以更具有颠覆意味,在于互联网的生产方式围绕编程展开。编程之外,还有需求分析、测试运维、数据洞察等成体系的开发流程,改变了基础编程,就改变了互联网的生产方式。
用英伟达 CEO 黄仁勋的话说," 现在世界上每个人都是程式员 " ——过去需要编程语言完成的工作,如今使用自然语言就可以完成。
" 从早期的 COBOL 语言到现在的 Java、Rust、JavaScript,编程语言之父们发明了数百种编程语言,只为让开发更容易。"CSDN 创始人兼董事长蒋涛说,如今大模型允许自然语言生成代码后," 我们预计在未来 3 年至 5 年,全球开发者会从现在的 1 亿增长至 10 亿规模。"
当个体开发者增长到一定规模后,蒋涛预测会出现一批超级程式员个体,会像视频的 up 主一样,提供类似 freelancer 的軟體开发服务。
当然,硬币永远有另一面。
" 把编程能力看作是一个金字塔形状的话,大模型吃掉的是最下面一两层、门槛最低的写代码能力,比如代码辅助和生成,市场对开发者的需求会向上层能力转移。" 蒋涛说道,"这一调整过程中,一定会经历一个阶段,是程式员失业期。"
Motherboard 和 Blind 此前展开了一项有 9388 名工程师参与的调查,数据显示有 66% 的人认为找工作变得更加困难了,而从岗位供给来看,Motherboard 表示人工智能将导致程式员招聘人数减少。
作为前沿试验场,硅谷大模型公司的人才结构说明了一切。Midjourney 只有 11 名全职员工,Magnific AI 只有 2 名全职员工,Sora 只有 13 人。
36 氪受访者中,共生团队同样只有十余人,HiDream.ai 则只有不到 30 人。
与此对应的变化是,虽然大模型公司的全职开发团队在精简甚至缩编,但 " 零工 " 体量在变大。
CoderPad 数据显示,去年近六成招聘方为了满足技术需求,会招聘临时工或实习生技术岗。Midjourney 同样是个典型的例子,在 11 人全职团队外,其外包人员达 60 余人。
拉长时间看,这样的变化和 " 取代 " 发生在一次又一次的技术迭代之中。
25 年前,蒋涛创办 CSDN 的上世纪 90 年代,他们这群 " 国内第一批互联网程式员 " 还曾需要自己 " 画視窗 "。
蒋涛告诉 36 氪:" 程式员的工作,几乎每天都在经历自动化。过去几次自动化,是给程式员提供了‘框架’,如何使用框架,还需要程式员的能力,但如今这一能力被大模型掌握了。"
90 后軟體工程师苏奇试用了几次大模型后,并未引发他过多的职业焦虑。" 可以取代一部分重复工作来提升效率,比如 idl 和一些 POJO 代码,但本身壁垒不深的技术岗,比如测试、SRE、前端,可能会最早受到冲击。"
他的焦虑不来自于取代本身,而是来自于如何确定自己是否会被取代。
" 假设大模型取代了简单工种,原来的程式员只保留了头部的 30% 到 50%,但我如何判断自己是否是前 30%?" 苏奇说," 比如一个应届生刚工作,没有经验,基本无法判断自己的身位。"
03
开发者更好的时代?
技术开发所需要的核心人员越来越少,过去互联网时代堆人头的开发方式,在大模型时代不再奏效。
大模型是互联网之外的一个新底座,互联网旧系统很可能已经不再适用,大模型之上的生产方式与组织方式要被重构。
比如 " 螺丝钉 ",这一诞生在互联网时代的名词,张林觉得会在技术行业消失。
" 即使未来共生团队扩张,业务增加,我们技术团队的人数也不会暴增。不管哪个做大模型的公司或机构,如果哪天突然人数暴增,我觉得都是不正常的。"
蒋涛抱有类似的看法。虽然互联网三十年,庞大的軟體程式是靠每一位程式员的每一行代码建立,但从另一个角度看," ‘程式员’同样是过去軟體开发最大的阻碍 "。
" 一个没有编程知识的人,即使有想法,也无法落地成应用。所以即使几十年过去,程式员数量仍然远远小于需求量。" 蒋涛说道,"而对于公司而言,如果想开发任何軟體,算一下调用和雇佣程式员的 ROI,大部分应用可能就被放弃了。"
杨植麟此前在腾讯新闻采访中被问及,如果 Sam Altman 是在微软内部领导微软旗下的人工智能团队,会和 OpenAI 有什么不同。他直言,要在旧文化里产生新组织,难度很大。
苏奇曾先后在中美的三家互联网大厂做軟體工程师,在应聘过程中,他发现国内各个阶段的互联网公司招聘,都很喜欢要 " 速赢人才 "。
" 一家公司要做 A 业务,就要把竞对大厂做 A 业务很多年的人直接挖过来,能带点 PPT 和代码就更好了。这导致什么?整个行业的技术框架高度同质化。比如搜推都是百度的架子,订单、支付、对账都是阿里的。"
" 速赢人才 " 能最大程度促进扩张,这自然对追求规模效应的互联网公司至关重要。当然,算法好坏也很关键,但仍然比不上在当地铺了多少地推、发了多少补贴、办了多少拉新活动重要。
不管是 " 速赢人才 " 还是 " 螺丝钉 ",互联网公司的生产逻辑,是尽可能细得切割个人能力,然后将个体固定在某一环节进行生产。但 36 氪的多个受访者看来,大模型将不再奉行这一逻辑。
梅涛的体会是,哪怕是跟上一代 AI 四小龙时期比,大模型为代表的 AI 技术也更为技术导向。" 以前一个人脸识别单子下来,十几个供应商都在那里投标,这里面看的不是模型,而是公司的综合解决方案能力。"
他举例,小区闸门的人脸识别、工厂的人脸识别和关口的人脸识别本质都不一样,性能差别很大,无法基于同一个模型底座,最终就变成传统企业的服务现象——需要大量的 BD 和交付,有 N 个项目就需要招 N 倍的人。
" 今天的 AI,它在任何时候都不是一个商业模式,也不是一个行业,它是一个自己能闭环的技术。" 梅涛说。
张林同样遇到过类似的问题。经常有投资人一见面就问他 " 你们是做哪个行业的 ",但这是属于互联网时代的 " 问法 "," 什么是行业 " 在大模型公司要重新定义。
他一遍遍解释," 和上一代技术不一样,今天很难定义什么叫行业。比如不管是服装设计还是建筑设计,对于大模型来说,它们二者是一样的,因为计算方式一样。大模型有很强的牵引性。"
张林最近跟朋友聊起《人月神话》——这本书被视作軟體开发行业的圣经,经历了一段时间大模型创业后,他对这本书的理解更深了。
书中写道,当軟體组织体量很大,开发的难度并不是线性增长的关系,而是指数级增长,最后导致重要的开发问题变得异常复杂,像一个 " 焦油坑 ",让所有开发人员深陷其中。
" 为什么会这样?很重要的一个原因是,过去的軟體开发绝大部分是体力劳动,就是敲代码,当公司越来越大,代码和人员越来越多时,一个组织中需要有 1/4 甚至更多的人去做管理,这个系统才能运转起来。" 张林说道。
《人月神话》更具体地描述了这种困境:比如一个项目需要 4 个开发,可能需要配 2 个测试,1 个项目管理,2 个产品经理等,最终下来,团队中的研发比例只剩不到 30%。这本书最终推论,一窝蜂的作业方式无助于軟體生产,且会制造麻烦,产生出更差的軟體。
在这样臃肿的 " 旧文化 " 里,技术创新的空间便愈发逼仄。
苏奇对《人月神话》序章那句 "success without applause,diligence without reward." 深有同感," 代码写得好不好、有没有实际价值、是否产生新效益,全凭开发人员主动的自我要求。"
但现实是大部分开发人员都是被动支持系统的 " 螺丝钉 "。苏奇回忆供职的上一家大厂,时常发生的情况是,开发方案 A 改 B 晋升了一波人,走之后,方案 B 改 A 又晋升了一波人。
" 有时为了争取资源,技术人员不得不做点简单问题复杂化但能汇报的东西。" 苏奇说," 很多人自己做的产品自己都不用。"
《人月神话》已经是 22 年前出版的作品,如今軟體工程发展了几十年,我们拥有了更快的硬體、更完善的框架、更方便的语言,然而这本书中描述的几十年前的问题,至今都没有被解决,依旧困扰着每一个程式员——
他们依旧无法评估工作量,难以进行合理的进度安排;他们很少能自己控制工作环境和工作目标,而是他人来提供目标和资源;项目落后时,只能被动延长工作时间或者增加人力 ……
所以軟體工程几十年来没有进步吗?原因的源头自然不是技术,而正是几十年未变的生产链条。
GPT4.0 发布一年了,求职者向瑶函仍旧百分百对 AI 保持热忱," 人 " 才是他不相信的环节。
那个因为 AI 被裁员的朋友,没过几个月就发现是新人填补了他的空缺而不是大模型。"AI 没有取代这个岗位 ",向瑶函甚至怀疑,这仅仅是一个冠冕堂皇的理由。