今天小編分享的科技經驗:大模型與程式員,誰吃了誰,歡迎閱讀。
一名失業中的程式員,因為一次大膽的求職之舉登上了微博熱搜。
向瑤函花費 999 元,在廣州地鐵珠江新城站購買了一個廣告位 5 天的使用權,用來投放自己的簡歷二維碼,掃碼就可以了解這名程式員 " 飄零的前半生 "。
向瑤函是在 2023 年 5 月 " 主動失業 " 的。去年 3 月 15 日凌晨 GPT-4 發布,興奮之餘,他和很多其他程式員隐隐感到不安——面對生成式 AI 技術的爆發,是當一名旁觀者,還是主動擁抱新變化?
此時的向瑤函還在廣州一家糧食企業當數據經理,熱衷于 AI 比賽的他總是自诩為 "AI 狂熱分子 ",業餘在廣州的互聯網行業咨詢圈子也幹得有聲有色。
2023 年 5 月,舉辦了 4 場小範圍 AI 講座後,向瑤函明顯感到大模型的熱度已經不能簡單地用 " 陡然上升 " 來形容。
來參加講座或來咨詢的廣州老板們陷入了 AI 焦慮,不論是哪行哪業,企業多大多小,都琢磨起了建大模型的主意。
但向瑤函當時的東家——一家把泰國的大米賣到中國的上市公司,似乎對做 AI 并不感興趣。"AI 是大方向 "" 我要做 AI"" 指不定成為中國 AI 界一顆冉冉升起的新星 "…… 抱着這樣的想法,雄心勃勃的他計劃轉型去當一名算法工程師。
大模型呼嘯而至,互聯網已經很久沒有經歷這樣的技術衝擊了。互聯網時代的技術崗打工人,和前線大模型公司,這兩塊拼圖要完全吻合,難度超乎想象。
01
消失的產品經理
事情沒有向瑤函想得順利," 門檻确實太高了,很多招聘要求是能開發底層大模型 "。
向瑤函自認在寫代碼這件事上是有天賦的,在 AI 比賽上靠寫中小模型也獲過不少獎項,但對大模型經驗寥寥。
更糟糕的是,畢業于湘潭大學企業營銷專業的他,曾經靠自學 Python 闖入技術圈,但 " 英雄不問出處 " 的法則在大模型行業失靈了," 學歷上就卡死了 "。
市場達成了自己的共識,這個共識就是追求确定性,以實現不确定性。
要在大模型行業有一席之地,人才密集和資金密集與否,是唯二決定生死的核心要素。
大家多少清楚如今大環境下投資人的謹慎,至于人才,情況要令人困惑得多——從大廠高管、創業公司老板,再到投資人、獵頭,沒人了解方向,都在從零摸索起。
作為大模型初創公司共生團隊負責人,張林最近做了一個決定,暫時擱置招聘產品經理的工作。
創辦共生團隊幾個月後,市場給忙于吸納人才的張林上了最新一課——大模型公司很難在互聯網體系内找到可以經驗復用的產品經理。放棄招聘後,他和幾位 AI 工程師出身的創始團隊成員,兼起了公司產品經理的職責。
" 我們篩選過很多產品經理的簡歷,做 UI 的、產品的等等,但他們的共同問題是,不了解大模型項目的底層機制,導致沒有辦法很快遷移經驗。" 張林說道," 如果理解程度是‘畫一個界面’,那最後基本一塌糊塗。"
國產大模型已經卷了一年半,但張林至今沒有看到 " 比較高質量 " 的產品經理出現。他產生了巨大的緊迫感。
他告訴 36 氪,創辦公司幾個月的時間裡,團隊更加堅定了這樣的認知:" 我們嘗試從原子化角度來看,如果一個新技術讓單個個體角色發生根本性變化,那麼由這樣一個個體所組成的部門和系統,自然也逃不過變化。"
大模型獵頭 Louis 則感覺" 所有人都在追逐同一撥人 ",就是清華幫那十幾個," 如果追求對底層大模型的認知,國内只有他們。"
" 無論創業公司還是大廠都在問我同樣的事情:唐傑老師(智譜 AI 首席科學家、清華大學計算機系教授)的減一(直屬下級)能不能挖來?豈凡超(深言科技創始人、清華大學人工智能研究院教授孫茂松的學生)的減一能不能挖來?"
短時間内,清華幫十餘人成了國内大模型人才市場唯一的确定性,要招他們之外的人,大家幾乎連招聘要求怎麼寫都沒有頭緒。
資深獵頭肖恩曾接過幾個互聯網大廠的大模型招聘需求,只不過對接的過程令他有些啞然失笑。
"某頭部大廠根本不知道想要什麼,還異想天開想從 OpenAI、Meta 什麼的挖人。"" 有些大廠大模型團隊辦公室都開到國外了,但是也沒做出什麼水花,也不知道未來要幹什麼。"
投資人也在霧裡看花。曾經有投資人問張林,是不是國内(大模型公司)已經泛濫了,這讓張林感到無奈。" 根本不可能,真正能打底層大模型的始終只有那一撥人,無非是幾個團隊間繞來繞去,這個技術很難短期内擴散。"
眼下,優秀的 AI 工程師就像上世紀九十年代的程式員,匮乏且搶手。技術招聘平台 CoderPad 近期發布的報告顯示,"AI 專家 " 成為最難填補的職位第二名,而即使在十年前的上一輪 AI 革命,AI 專家的招聘難度都未曾進過前三。
去年 Louis 為一家大模型團隊招聘一系列技術崗位,包括數據清洗和 SFT(有監督微調)等。和所有人一樣,她最開始的路線是專找圈内 " 掐尖兒 " 的技術人員,但很快這些候選人被驗證 " 又貴又不好用 "。
很大一個原因在于,大模型時代,技術崗位邊界在變得模糊。
張林的技術團隊不到 10 個人,除去一兩位專打底層大模型的工程師,其他人絕大部分精力用來做系統設計和產品設計,寫代碼的比重越來越小。" 落地時,誰寫的代碼誰就自己做項目經理。"
HiDream.ai 的研發人員同樣覆蓋全流程,公司創始人兼 CEO 梅濤博士告訴 36 氪:" 工程師做完模型自己封裝,才跟得上迭代的速度。"
36 氪走訪了解到,行業普遍的預測是,未來程式員和產品經理兩個崗位将合體。
要找到符合這樣要求的復合型人才是件難事。一方面,如張林的經歷,現階段市場裡沒有現成的人選,另一方面,需要跟時間賽跑的大模型公司們,也不被允許等待市場培養出成熟人才後再收割,大模型迭代,晚一天都是萬億參數訓練的落後。
經過一年摸索後,Louis 感覺國產大模型人才需求進入階段性穩定期,呈現出一種 " 啞鈴狀 " 格局,要麼追求頭部技術大咖,要麼招應屆或在讀的學生。
" 有些公司的心态是,大模型極大地降低了編程門檻,那對于一些非核心技術崗,利用開源大模型也可以迅速學會,應屆生又便宜、技術又新,Why not?"Louis 說道。
張林在碰壁後也發現,通過招聘的方式,已經很難找到技術和產品的多面手,他選擇另辟蹊徑,從源頭培養。
他告訴 36 氪,共生團隊已經開始廣泛跟高校合作," 我自己在帶碩士和博士的科研項目,在這個過程中發掘足夠強的候選人,将來自然而然進入公司工作。"
張林的做法并不少見,學術和工程邊界加速彌合,是大模型公司帶來的新變化。以 Midjourney 為例,11 人團隊中,9 人是研發人員,沒有產品經理,且 9 位研發人員中,有 4 位都是尚未畢業的大學生。
而 " 工業界與學術界融合 " 最為成熟的标杆,自然是 OpenAI。
過往,新的技術突破總是最先誕生在學術界,但 ChatGPT 成為一個節點——一個獨立于大公司之外的研究型組織,引入一批 " 年輕甚至在讀的頂尖學者 ",将科學和產品、商業結合,才最終誕生了 ChatGPT 這樣偉大的系統。
" 過去把研究型組織安插在大公司,這樣的 AI Lab 模式已經成為歷史了。" 月之暗面創始人楊植麟日前在接受騰訊新聞采訪時表示,AGI 的生產方式跟互聯網不一樣,科研或教育系統會轉變職能,變成培養人才為主。
這一輪技術革命中,經驗的重要性被不斷降級,取而代之的是 " 擁有足夠新的知識 ",越來越多科技領網域學者,在學術生涯早期便介入工業界。
在此背景下,大模型老板們自然也是下手多早都不為過。" 大學生我們都不放過 ",據張林觀察,在大模型時代,大學生甚至比博士生更容易出東西," 沒有(舊技術的)負擔很重要 "。
02
并非取代那麼簡單
大模型或許是屬于技術追求者的最好的時代,它更單純、更聚焦、更長期主義。產品是否受歡迎,比拼的幾乎只有技術。
這也造成了一種技術焦慮——新一輪技術衝擊下,跟不上就會被抛棄嗎?
地鐵站求職廣告發布後,有 50 多家企業找到向瑤函,這本該令人高興,但 30 多次面試下來,靠譜的工作還是偏數據分析。他不得不告訴自己,自己的 " 大模型夢 " 可能很難實現了。
" 感覺大模型出來後,之前學了三年 python 都白費了。"
在他身邊,案例也逐漸變得兩極化,有人因為在高精尖行業做大模型如魚得水,也有以 "AI 可以取代你 " 為名而被迫離職的案例。
向瑤函眼下的職業困境,或許和大模型編程能力的完善有關,這聽上去簡直是個悖論。
編程是從計算機誕生起就存在的概念,是構建互聯網最基礎和底層的工作。與此同時,編程語言一直在進化,從最初的二進制,到後來的機器代碼、匯編語言,再到高級語言,諸如 C 語言、JAVA、Python 等當下流行的編程語言都已有三四十年的歷史。
2021 年時,OpenAI 就開發出了 Codex 系統,Codex 可根據程式員的自然語言輸入進行簡單的代碼編寫支持,被看作是 AI 編程的開端,這之後便開始有聲音讨論 " 大模型取代程式員的可能性 "。
直到最近,類似產品開始井噴,一批 " 碼農大模型 " 密集誕生。比如初創公司 Cognition 發布的首個 AI 軟體工程師 Devin、螞蟻集團 CodeFuse 平台推出的 " 圖生代碼 " 技術、微軟根據 OpenAI 的 Codex 模型開發的代碼建議工具 GitHub Copilot……
今年年初,技術招聘平台 CoderPad 的一份調查顯示,超過 80% 的開發者正在工作中使用 ChatGPT 或 Copilot。CSDN 的一份調查則顯示,35% 的開發者每天使用代碼生成工具,其中 36% 的人認為開發效率得到極大提升。
相比于過去一段日子大模型學會畫畫、做視頻和作曲," 學會編程 " 這件事之所以更具有颠覆意味,在于互聯網的生產方式圍繞編程展開。編程之外,還有需求分析、測試運維、數據洞察等成體系的開發流程,改變了基礎編程,就改變了互聯網的生產方式。
用英偉達 CEO 黃仁勳的話說," 現在世界上每個人都是程式員 " ——過去需要編程語言完成的工作,如今使用自然語言就可以完成。
" 從早期的 COBOL 語言到現在的 Java、Rust、JavaScript,編程語言之父們發明了數百種編程語言,只為讓開發更容易。"CSDN 創始人兼董事長蔣濤說,如今大模型允許自然語言生成代碼後," 我們預計在未來 3 年至 5 年,全球開發者會從現在的 1 億增長至 10 億規模。"
當個體開發者增長到一定規模後,蔣濤預測會出現一批超級程式員個體,會像視頻的 up 主一樣,提供類似 freelancer 的軟體開發服務。
當然,硬币永遠有另一面。
" 把編程能力看作是一個金字塔形狀的話,大模型吃掉的是最下面一兩層、門檻最低的寫代碼能力,比如代碼輔助和生成,市場對開發者的需求會向上層能力轉移。" 蔣濤說道,"這一調整過程中,一定會經歷一個階段,是程式員失業期。"
Motherboard 和 Blind 此前展開了一項有 9388 名工程師參與的調查,數據顯示有 66% 的人認為找工作變得更加困難了,而從崗位供給來看,Motherboard 表示人工智能将導致程式員招聘人數減少。
作為前沿試驗場,矽谷大模型公司的人才結構說明了一切。Midjourney 只有 11 名全職員工,Magnific AI 只有 2 名全職員工,Sora 只有 13 人。
36 氪受訪者中,共生團隊同樣只有十餘人,HiDream.ai 則只有不到 30 人。
與此對應的變化是,雖然大模型公司的全職開發團隊在精簡甚至縮編,但 " 零工 " 體量在變大。
CoderPad 數據顯示,去年近六成招聘方為了滿足技術需求,會招聘臨時工或實習生技術崗。Midjourney 同樣是個典型的例子,在 11 人全職團隊外,其外包人員達 60 餘人。
拉長時間看,這樣的變化和 " 取代 " 發生在一次又一次的技術迭代之中。
25 年前,蔣濤創辦 CSDN 的上世紀 90 年代,他們這群 " 國内第一批互聯網程式員 " 還曾需要自己 " 畫視窗 "。
蔣濤告訴 36 氪:" 程式員的工作,幾乎每天都在經歷自動化。過去幾次自動化,是給程式員提供了‘框架’,如何使用框架,還需要程式員的能力,但如今這一能力被大模型掌握了。"
90 後軟體工程師蘇奇試用了幾次大模型後,并未引發他過多的職業焦慮。" 可以取代一部分重復工作來提升效率,比如 idl 和一些 POJO 代碼,但本身壁壘不深的技術崗,比如測試、SRE、前端,可能會最早受到衝擊。"
他的焦慮不來自于取代本身,而是來自于如何确定自己是否會被取代。
" 假設大模型取代了簡單工種,原來的程式員只保留了頭部的 30% 到 50%,但我如何判斷自己是否是前 30%?" 蘇奇說," 比如一個應屆生剛工作,沒有經驗,基本無法判斷自己的身位。"
03
開發者更好的時代?
技術開發所需要的核心人員越來越少,過去互聯網時代堆人頭的開發方式,在大模型時代不再奏效。
大模型是互聯網之外的一個新底座,互聯網舊系統很可能已經不再适用,大模型之上的生產方式與組織方式要被重構。
比如 " 螺絲釘 ",這一誕生在互聯網時代的名詞,張林覺得會在技術行業消失。
" 即使未來共生團隊擴張,業務增加,我們技術團隊的人數也不會暴增。不管哪個做大模型的公司或機構,如果哪天突然人數暴增,我覺得都是不正常的。"
蔣濤抱有類似的看法。雖然互聯網三十年,龐大的軟體程式是靠每一位程式員的每一行代碼建立,但從另一個角度看," ‘程式員’同樣是過去軟體開發最大的阻礙 "。
" 一個沒有編程知識的人,即使有想法,也無法落地成應用。所以即使幾十年過去,程式員數量仍然遠遠小于需求量。" 蔣濤說道,"而對于公司而言,如果想開發任何軟體,算一下調用和雇傭程式員的 ROI,大部分應用可能就被放棄了。"
楊植麟此前在騰訊新聞采訪中被問及,如果 Sam Altman 是在微軟内部領導微軟旗下的人工智能團隊,會和 OpenAI 有什麼不同。他直言,要在舊文化裡產生新組織,難度很大。
蘇奇曾先後在中美的三家互聯網大廠做軟體工程師,在應聘過程中,他發現國内各個階段的互聯網公司招聘,都很喜歡要 " 速赢人才 "。
" 一家公司要做 A 業務,就要把競對大廠做 A 業務很多年的人直接挖過來,能帶點 PPT 和代碼就更好了。這導致什麼?整個行業的技術框架高度同質化。比如搜推都是百度的架子,訂單、支付、對賬都是阿裡的。"
" 速赢人才 " 能最大程度促進擴張,這自然對追求規模效應的互聯網公司至關重要。當然,算法好壞也很關鍵,但仍然比不上在當地鋪了多少地推、發了多少補貼、辦了多少拉新活動重要。
不管是 " 速赢人才 " 還是 " 螺絲釘 ",互聯網公司的生產邏輯,是盡可能細得切割個人能力,然後将個體固定在某一環節進行生產。但 36 氪的多個受訪者看來,大模型将不再奉行這一邏輯。
梅濤的體會是,哪怕是跟上一代 AI 四小龍時期比,大模型為代表的 AI 技術也更為技術導向。" 以前一個人臉識别單子下來,十幾個供應商都在那裡投标,這裡面看的不是模型,而是公司的綜合解決方案能力。"
他舉例,小區閘門的人臉識别、工廠的人臉識别和關口的人臉識别本質都不一樣,性能差别很大,無法基于同一個模型底座,最終就變成傳統企業的服務現象——需要大量的 BD 和交付,有 N 個項目就需要招 N 倍的人。
" 今天的 AI,它在任何時候都不是一個商業模式,也不是一個行業,它是一個自己能閉環的技術。" 梅濤說。
張林同樣遇到過類似的問題。經常有投資人一見面就問他 " 你們是做哪個行業的 ",但這是屬于互聯網時代的 " 問法 "," 什麼是行業 " 在大模型公司要重新定義。
他一遍遍解釋," 和上一代技術不一樣,今天很難定義什麼叫行業。比如不管是服裝設計還是建築設計,對于大模型來說,它們二者是一樣的,因為計算方式一樣。大模型有很強的牽引性。"
張林最近跟朋友聊起《人月神話》——這本書被視作軟體開發行業的聖經,經歷了一段時間大模型創業後,他對這本書的理解更深了。
書中寫道,當軟體組織體量很大,開發的難度并不是線性增長的關系,而是指數級增長,最後導致重要的開發問題變得異常復雜,像一個 " 焦油坑 ",讓所有開發人員深陷其中。
" 為什麼會這樣?很重要的一個原因是,過去的軟體開發絕大部分是體力勞動,就是敲代碼,當公司越來越大,代碼和人員越來越多時,一個組織中需要有 1/4 甚至更多的人去做管理,這個系統才能運轉起來。" 張林說道。
《人月神話》更具體地描述了這種困境:比如一個項目需要 4 個開發,可能需要配 2 個測試,1 個項目管理,2 個產品經理等,最終下來,團隊中的研發比例只剩不到 30%。這本書最終推論,一窩蜂的作業方式無助于軟體生產,且會制造麻煩,產生出更差的軟體。
在這樣臃腫的 " 舊文化 " 裡,技術創新的空間便愈發逼仄。
蘇奇對《人月神話》序章那句 "success without applause,diligence without reward." 深有同感," 代碼寫得好不好、有沒有實際價值、是否產生新效益,全憑開發人員主動的自我要求。"
但現實是大部分開發人員都是被動支持系統的 " 螺絲釘 "。蘇奇回憶供職的上一家大廠,時常發生的情況是,開發方案 A 改 B 晉升了一波人,走之後,方案 B 改 A 又晉升了一波人。
" 有時為了争取資源,技術人員不得不做點簡單問題復雜化但能匯報的東西。" 蘇奇說," 很多人自己做的產品自己都不用。"
《人月神話》已經是 22 年前出版的作品,如今軟體工程發展了幾十年,我們擁有了更快的硬體、更完善的框架、更方便的語言,然而這本書中描述的幾十年前的問題,至今都沒有被解決,依舊困擾着每一個程式員——
他們依舊無法評估工作量,難以進行合理的進度安排;他們很少能自己控制工作環境和工作目标,而是他人來提供目标和資源;項目落後時,只能被動延長工作時間或者增加人力 ……
所以軟體工程幾十年來沒有進步嗎?原因的源頭自然不是技術,而正是幾十年未變的生產鏈條。
GPT4.0 發布一年了,求職者向瑤函仍舊百分百對 AI 保持熱忱," 人 " 才是他不相信的環節。
那個因為 AI 被裁員的朋友,沒過幾個月就發現是新人填補了他的空缺而不是大模型。"AI 沒有取代這個崗位 ",向瑤函甚至懷疑,這僅僅是一個冠冕堂皇的理由。