今天小編分享的科技經驗:30個大模型,搶着落地,歡迎閲讀。
在 2023 年上海人工智能大會(WAIC)逛一圈,如果你想找大模型廠商,無需思考——找人扎堆的地方就可以。
作為國内 AI 界當之無愧的風向标,WAIC 這次的主題前所未有地清晰—— AI 大模型。本屆 WAIC 邀請超過 400 個企業參會,主辦方甚至特設了 AI 大模型展區,大模型參數在 10 億以上的 AI 廠商數量,就超過 30 家。
" 大模型太多了!如果有哪家 AI 公司不做大模型,都不好意思露面了。" 人聲鼎沸的大模型展區中,一位投資人對 36 氪如此感嘆。
無論是大廠還是垂直廠商,AI+ 多個行業解決方案已是标配。大模型展區宛如一個大型超市,專屬解決方案琳琅滿目,陳列其中:大模型 + 雲計算、大模型 + 金融、大模型 + 教育……
但火熱表象下,國内大模型產品 " 大同小異 " ——是 36 氪得到的普遍反饋。這既是技術發展初期的無奈,也同樣是一種理性的現實。
百度文心一言企業級平台展區 拍攝:36 氪
錯位
ChatGPT 火爆全球大半年後,如果説還有什麼東西成為共識," 先落地 " 可能算第二個。
AI 廠商再也不吹概念,迅速尋求在 B 端落地,這和 2015 年的 AI 浪潮全然不同。比如,騰訊雲至今沒有公布通用大模型 " 混元 " 的進展,但在 6 月中旬先高調公布了 " 行業大模型 " 的路線,一口氣抛出 10 大行業超過 50 個解決方案。
這明顯是國内客户更感興趣的方向。
在百度文心一言、阿裏通義千問的展位上," 企業級平台 "、" 專屬大模型 " 被圍了裏三層外三層,來詢問的企業客户絡繹不絕。
一位文心一言員工告訴 36 氪,來咨詢的客户,最關心的問題在于價格,其次是數據安全。" 都直接問賣多少錢,什麼時候能開始用。"
但大模型私有部署和使用成本還是太高,再加上算力供不應求。大部分企業其實暫時很難用上大模型,這種錯位可能還要持續一段時間。
比如,阿裏和騰訊如今都還是只定向邀約客户使用,标準化的 API 服務還沒有全面開放。
一位外企 IT 從業者對 36 氪表示,他在日本的老板 " 很着急,很希望能盡快把大模型放到產品裏,6 月專門來國内找 AI 大模型服務商,8 月還打算再來一趟。"
但在 WAIC 逛了一圈,上述從業者發現,現在的模型體量還是太大,部署太貴," 我們還是希望先找一個小的切入點,比如用較小的模型做智能客服,嵌入到業務當中。"
另一位阿裏雲員工則告訴 36 氪,現在做一個行業或者專屬大模型,一般需要千萬級别以上的預算,更适合業務體量較大的央國企和大公司。" 部署成本比較高,我們也希望盡快把模型壓縮到大家能接受的水平。"
為了解決 " 貴 " 的問題,阿裏雲也在通過開源模型、做生态來補足。阿裏發起的大模型開源社區 " 魔搭 ",就想做成一個大模型超市,陳列出更偏行業化的專屬模型,目前已經聚集了 900 多個 AI 模型。
大會上,阿裏雲也發布了新產品 " 魔搭 GPT"(ModelScopeGPT)。用户通過輸入指令,可以一鍵調用其他的 AI 模型,用多個模型協同完成復雜任務,這也是降低大模型使用門檻的方式。
AI 落地難,大模型要再經歷一次
從年初業内驚嘆 ChatGPT 的湧現算起,AI 大模型的熱度也不過半年。國内 AI 廠商離 ChatGPT 仍有不短的距離,但随着國内廠商迅速選擇落地,不少難點已經顯現。
本質上,AI 大模型訓練仍然昂貴,即便是大廠,也不可能不求回報地一直投入。這意味着,國内廠商剛開始做大模型,就面臨着更殘酷的生存考驗。搶着在行業落地,也是希望能盡快商業化,再投入到 AI 模型的開發和訓練中。
但資金只是入門券。搶先在行業落地,廠商們更多的是想搶占數據 " 高地 "。
如果是做模型是烹饪,數據好比是食材,大模型對高質量的 " 食材 " 需求更高。但在公開互聯網中,中文的高質量數據本就偏少,大模型廠商其實很難建立起數據壁壘。在國内廠商尚在追趕 GPT-3.5 的情況下,沒有誰能顯著拉開差距。
在很長一段時間中,數據會是更難的一環。一位頭部社交公司戰略人士告訴 36 氪,ChatGPT 出來後,公司團隊迅速就将國内大模型看了一遍,也都進行相應測試," 但他們既沒有這個賽道的高質量數據,通用大模型能力又尚不足以支撐業務需求,測試下來,大家效果都一般般。"
為了拿到數據,一位大廠的大模型產品負責人對 36 氪表示,在其合作模式中,如果企業客户願意提供數據(越有行業屬性越好),他們願意在商務權益上做出極大讓步,甚至願意免費為提供數據的客户部署大模型。
想要大模型順利落地到場景中,難度也絲毫沒有減小。
" 企業需要的,是在實際場景中真正解決某個問題,而不是在 100 個場景中解決了 70%-80% 的問題。" 騰訊雲副總裁吳雲聲在 WAIC 演講中表示。
問題在于,上一波以視覺識别(CV)為首的 AI 浪潮裏,廠商們更先發展的是單點 AI 能力——比如用 AI 進行人臉識别,以 API 形式單次收費是更普遍的形式。但随着技術走向同質化,AI 廠商們到後來只能開始做大項目、私有化部署。由于難标準化,賬其實很難算得過來。
将大模型用在業務裏,AI 模型會和客户的核心數據結合得更加緊密。這意味着,想要真正解決客户最核心的業務問題,私有化必不可少,程度可能還會更深——廠商們也許需要幫助客户,從頭對核心數據進行标注、訓練,再進行模型訓練。
談及私有化大模型的投入產出比,賬能算得過來嗎?騰訊副總裁、騰訊雲智能負責人吳運聲對 36 氪坦承:" 從現在的時間節點上看的話,确實會有比較大的挑戰。"
如今,騰訊采取一種較為折中的辦法——上個月,騰訊推出面向文旅、政務、教育、金融等十大行業,超過五十個解決方案。相當于 " 前進半步 ",客户并不需要從頭提供行業數據進行訓練。在這些模型的基礎上,客户只需要加入自己的場景數據進行精調,就可以快速生成 " 專屬模型 "。
歸根到底,AI 大模型技術仍然在快速發展中,成本上的博弈其實尚無定論。大模型的核心技術,以及算法、芯片等上遊產業鏈都在快速迭代,成本下降其實很快。以百度為例,百度在今年 3 月發布 AI 大模型,到了 5 月,調用文心一言的成本,就已經降低到剛發布時的 10%。
而在另一邊,AI 大模型會帶來更大的應用層機會,用户付費意願也會更高,這會帶來更大的收入增量。比如,近期行業裏就冒出了不少針對營銷場景的 AI 產品,有了 AI 大模型加持後效果顯著,比如 AI 數字人——近期,不少數字人公司因此煥發新機,產品也迅速帶來公司收入提升。