今天小編分享的科學經驗:Llama3.1根本賣不動!業内人士:開源模型成本反而更高,歡迎閲讀。
Meta 的開源大模型 Llama 3 在市場上遇冷,進一步加劇了大模型開源與閉源之争的關注熱度。
據外媒 The Information 報道,Meta 的開源大模型 Llama 3 一直難以在全球最大雲廠商——亞馬遜的 AWS 上獲得關注,AWS 的企業客户更傾向于使用 Anthropic 的閉源大模型 Claude。
據微軟内部人士透露,Llama 也并非微軟的銷售首選,他們更傾向于将 Llama 推介給具備數據專業知識的公司,如内部有工程師和數據科學家的公司。
Meta 現面臨挑戰,或将激發 Meta 自建 AI 產品的銷售團隊,直面企業需求。而這一系列問題也突顯了開源大模型在商業化過程中的困難。從市場選擇來看,開源模型的實際效果和商業回報或許均未能滿足企業客户預期。
面對 "開源還是閉源" 的問題,國内的各大模型廠商根據自身的技術路線和商業戰略,形成了截然不同的立場。那麼,企業應如何選擇大模型,以及在兩者之間如何找到最佳平衡點?
在此背景下,百度智能雲 AI 與大模型平台總經理忻舟接受了媒體采訪,詳細解析了開源與閉源之争的底層邏輯、商業策略,以及對未來市場的預判。
忻舟認為,大模型的開源和軟體開源有本質區别——開源模型因其并未開放訓練源代碼、預訓練和精調數據等影響模型效果的關鍵信息,所以無法像開源軟體一樣,靠社區開發者一起參與來提升效果和性能,而基座模型的訓練只能掌握在廠商自己手裏。
談及 " 開源模型和閉源模型誰更貴 " 時,忻舟表示,開源模型免費,給人一種低成本的印象,但大模型的應用并不僅僅是單一的技術,而是涵蓋 " 技術 + 服務 " 的完整解決方案,企業要算 " 總賬 "。在業務實際落地時,開源模型若想達到與閉源模型相同的效果,需要後續投入大量的人力、資金和時間,綜合成本反而更高。
開源模型和閉源模型分别适用于什麼場景?忻舟認為,開源模型更适合用于學術研究,但不适合對外提供服務的大型商業項目,在一些百萬甚至千萬投入的嚴肅項目中,閉源模型仍然是主角。
以下為訪談精編全文:
1、大模型市場中,各家模型廠商都扮演着什麼角色?商業模式是怎樣的?
忻舟:在這場大模型盛宴中,每個廠商的定位和商業模式是不一樣的,大致可以分為三類:
第一類角色,對于雲廠商來説,商業模式其實還是賣算力資源。通過規模化來降低成本、提升資源彈性能力,從而實現盈利,這是雲廠商持久不變的模式。不管是開源模型還是閉源模型,只要托管在雲廠商這裏,雲廠商就可以賺到錢。
第二類角色,既是雲廠商又是模型廠商,他們希望通過模型的調用帶動業務上雲。目前只靠模型 API 調用的利潤還很低,他們目前期望在市場上占據有利份額,在大模型的牌桌上,不斷尋找新的拓展機會。
第三類角色,對于創業的模型廠商來説,在各大雲廠商宣布模型降價以後,他們的調用量下跌很厲害。大模型領網域很快就會變成幾大雲廠商之戰,大模型創企要麼專注到特定行業、要麼做 toB 的私有化項目、要麼轉型做 toC 產品。
2、為什麼説 " 開源模型并不便宜,而且技術會越來越落後 "?
忻舟:先説技術落後的問題。
第一、大模型的開源并不能帶來模型效果的提升。
對比開源軟體,比如像手機作業系統安卓、數據庫軟體 MySQL,這些開源軟體是所有的源代碼都開放出來,全社會的開發者都可以參與代碼的開發。這不僅可以降低軟體的研發成本,還能加快軟體迭代速度,提升軟體安全性,這是開源對于軟體的價值。
而開源模型要復雜很多,它可以開源的包括模型訓練源代碼、參數權重、訓練數據等。但目前模型廠商通常僅僅開源參數權重,而訓練源代碼、訓練數據等均未開源,這就導致開發者無法去改進它,也就無法對開源模型的效果做貢獻。
比如對于 Llama 來説,它每一次模型效果的進步,其實都是 Meta 自己訓練的結果,而不是開發者參與的結果。Llama2 和 Llama3 在網絡結構上沒太大區别,它優化的是什麼?一方面優化了訓練階段的流程,比如説多階段訓練;另外就是加了很多數據,Llama2 和 Llama3 的數據相差一個數量級,更多的數據和訓練時間為模型帶來更好的效果。
但這些好的效果都是 Meta 自己搞的,沒辦法把開發者的力量都用起來的,更不會像開源軟體一樣有社區反哺的過程。
第二、開源模型會越來越落後是因為沒有良性的商業模式保證模型持續迭代。
模型訓練、數據标注是非常貴的,除非像 Meta 這樣有強大的公司資源用來支撐開源模型持續發展,如果是一個開源模型的創業公司,他就沒法形成商業閉環。同時,開發者又不能對你的模型效果做貢獻,所以創業公司來做這個一定是越來越落後。再從結果上來看,最好的模型其實還是 Open AI,現在評測榜排在最前面的模型都是閉源模型。
再説開源模型為什麼并不便宜。大模型的應用是涵蓋 " 技術 + 服務 " 的完整解決方案,企業應用大模型需要 " 算總賬 "。總賬怎麼算?
第一層,要算硬體資源成本。因為閉源的商業模型會配套相應的工具鏈,包括訓練工具鏈、推理工具鏈,這些工具鏈的性能要比開源的好,對于客户來説,訓練就能省大概 10~20% 的硬體成本,推理的時候省得更多,業務規模越大,省得越多。
第二層,看模型帶來的業務收益。同等參數規模的模型,閉源效果更好,一些客户對于 90% 還是 95% 的準确率敏感度沒那麼高。但是有一些業務,比如説商業廣告,在 CPM、CTR 差一個點,對廣告平台來説一天就可能有上千萬的出入,這種時候對模型的效果要求越高的企業,就更願意去買一個效果更好的閉源模型。
第三層,還有機會成本、人力成本。用閉源商業模型收斂得更快,就比競争對手更快推出新的產品。在閉源的商業模型中,廠商把模型和硬體都适配好了,調到了最優狀态,客户直接復制成熟經驗就可以。但如果你用開源,還要自己去适配調,投入的算力成本、工程師的成本更高。
所以我們説企業應用模型要 " 算總賬 ",這個總賬算出來就會差很多。
3、為什麼在硬體成本上,開源比閉源貴那麼多?
忻舟:大多數企業客户都會采買兩種或者兩種以上的硬體,因為他要考慮供應鏈的安全性和靈活性,開源模型如果要在每個硬體上去做适配的話,它的成本會非常高。
這就體現出閉源商業模型的優勢了,因為它可以通過規模化售賣,來分攤軟硬體适配帶來的成本。而且,多芯适配是一個非常有技術含量的事兒,百度的百舸異構計算平台專門為多芯異構做了很多優化,對各種硬體都适配。百舸本身就可以屏蔽掉硬體層各種各樣的差異,有很多的加速庫、推理庫、訓練庫,百舸也為文心大模型提供了端到端的優化。
這對于客户的好處是,不管用什麼硬體都可以快速跑起來,省下來的時間和人力成本是非常高的。
4、開源模型和閉源模型分别适用于哪些場景?
忻舟:總體的思路是:你想在個别業務場景中做嘗試、做驗證,可以先用閉源模型跑起來,開箱即用,快速驗證;在一些動辄百萬元、千萬元級别的嚴肅商業項目中,對規模化、精度要求高的業務中,閉源的商業模型還是企業的最佳選擇。只有在一些對效果和性能要求不高,但要求必須私有化部署,且對價格又特别敏感的業務場景下,考慮使用開源模型。
開源對于學術和研究的推動是有價值的,比如推理的工程性能優化、預訓練和精調數據對結果的影響等,如果他能夠開源更多的東西,比如説訓練代碼、訓練數據、指令微調的數據等也開放出來,它對于學術研究和技術發展的價值會更大。哪怕只開放了模型權重,也為研究者提供了一個很好的基座模型。
5、有些廠商希望開源閉源兩條路同時走通,即開源模型吸引用户做大生态,閉源模型專門負責商業化,這個邏輯走得通嗎?
忻舟:如果沒有實踐過的話,看上去貌似是可行的。但實際情況是:
在公有雲上,各廠商公布的調用量中,閉源模型調用量遠高于開源模型,説明開源模型其實在公有雲上并沒有起到吸引用户做大生态的作用。而且在公有雲上做微調,開源或閉源模型都可以實現,所以在公有雲上客户會直接選擇最好的模型。
在私有化部署上,這個邏輯在一定程度上是講得通的。很多企業最開始起步是拿開源模型測試,之後覺得效果不錯要買了,會選擇開源模型對應廠商的閉源模型,因為同源的模型對于 prompt 的适應性更好,這種情況這個邏輯是成立的。但這種價值正在逐漸的縮小。因為各廠商的模型通用能力都在快速提升,切換成本越來越低,逐步就抹平了這種模型的傳承性。
還有一些廠商推出開源模型是為了推廣硬體,比如英偉達推出開源模型,它的商業邏輯非常簡單,用模型要買卡。
6、百度為什麼一直沒推出開源模型?
忻舟:從各家廠商的調動量上其實已經明确看到,公有雲上調用量大的都是商業閉源模型,開源模型對公有雲并沒有太多影響。
而在私有化市場中,随着客户對大模型認知不斷提升,開源閉源逐漸不再成為關鍵因素。我在和很多大型企業客户交流後發現,業務負責人要不要用一款模型有很多因素,按優先級排序通常是:效果、性能、安全、價格。模型開源閉源并不是決定性因素。
7、您提到企業在選擇模型時最看重的是效果、性能、安全、價格,百度雲推出的 " 千帆大模型一體機 " 是否正在嘗試一種新的軟硬一體的商業模式?
忻舟:目前,企業使用大模型還處在探索階段,非常需要低成本、開箱即用的產品來快速驗證大模型的使用場景和效果。" 千帆大模型一體機 " 很适合當下的階段,因為在國内有很多私有化部署的需求,我們的一體機是開放的,各種各樣的硬體都可以做适配,集成了市面上所有主流芯片和模型。百度智能雲的千帆大模型一體機提供兩個能力:
第一,提供軟硬體适配的一體化平台,這個平台内置了文心大模型和業界主流的開源大模型、場景應用模範間。對于熱門的開源模型也都做過适配和優化,用户可以直接在一體機上面跑,無需自己去調模型了。同時,千帆大模型一體機可以提供從基礎管控、AI 框架、模型訓練、預測推理、場景應用于一身的大模型軟硬一體解決方案,為客户提供全流程的軟硬體服務。
第二,千帆大模型一體機因為做了端到端的性能優化,能夠把所有硬體性能都榨出來,所以性價比相當高。客户可以以一個較低的成本快速使用。
在整體價格上,千帆一體機的價格遠低于分别采購伺服器和大模型及平台,對于客户來説能夠開箱即用。
8、現在很多人覺得,光用基礎大模型不行,大家還是要做行業模型才能真正實現大模型的產業落地。那目前企業自己訓練一個行業模型要多少成本?
忻舟:成本很高。首先取決于要訓練模型的參數規模,這個成本是線性增加的。其次,取決于數據量有多大。最後,是你的數據标注成本。
你如果要從頭開始訓一個 70b 的模型,用雲的彈性資源可能需要 3000 萬。如果要訓參數量更大一點的模型,成本上億都有可能的。這還是有經驗的人去訓,如果沒經驗,中間走了一些彎路,成本就更高了。
9、這麼高的成本,企業如何判斷是否需要做行業模型?
忻舟:我們不建議客户不管三七二十一的從一開始就做行業基座模型,收益怎麼樣另説,成本一定非常高。我們會幫助客户先做需求分析。
比如説,畫一個坐标系,橫坐标是任務的敏感性,縱坐标是對行業數據的需求性。所謂任務的敏感性,是指場景是否與行業和業務強相關,比如醫療領網域,都是相當專業的問題。縱坐标是對行業數據的需求性,行業越封閉、在公開網絡上的數據越少,就越需要做預訓練。比如醫療領網域,需要把一些脱敏後的病歷信息預訓練到模型裏面。
通過分析,在這個坐标軸中,左下角既沒有行業特性,又不需要行業數據,就可以直接用通用模型,但右上角對這個行業的業務屬性有敏感性,又需要很多的行業數據,這個時候就需要做行業模型。
我們通常是建議企業分三步走。
第一步,價值驗證。初步建設大模型軟硬體基礎設施,構建初步的行業大模型。結合相對成熟的生成式 AI 的應用,快速見到效果。比如通過千帆大模型平台輕量版加上智能客服、企業知識管理、數字人等成熟的應用。
第二步,深入對接企業的各種應用。進一步完善大模型基礎設施,更新為千帆大模型旗艦版,除了大模型相關的訓練調優外,也包含了應用構建的平台。百度及生态夥伴深度參與到企業内部大模型相關培訓和運營中,構建技術氛圍、培訓相關人才,與企業一起攻堅深入業務的難題,給企業帶來更多價值。
第三步,全面創新和自主可控。企業已經掌握了大模型和應用開發的相關技術,也有了相應的人才梯隊,能夠更好的自主可控發展并開始全面創新。百度會作為長期技術支持和顧問,協助發展,并不斷為企業帶來新的技術和方案。
10、您對未來一年的大模型市場如何判斷?
忻舟:對于未來一年的發展趨勢我有三個判斷:
第一,多模态會成為市場新的熱點。
第二,基于大模型的應用會有一個大爆發,非常重要的方向就是 Agent(智能體)。大模型如果只做 " 輸入、輸出 " 的規定動作,那會大大限制它的價值發揮,他應該更像人,可以使用工具、互相協同、規劃思考、反思迭代。它要跟各種各樣的組件、插件結合,才能滿足特定業務場景的需求,所以 Agent 會成為接下來各家模型廠商起量的關鍵。
第三,做企業應用的機會會變多,像知識庫、客服、數字人、輔助代碼編寫等場景。比如用大模型做代碼編寫,百度有一個產品叫 " 文心快碼 ",在百度内部已經大規模應用了,采納率能達到 46%,新增代碼中生成的比例達到了 30%,可以幫助企業大幅提升開發效率。同時,大量做 AI 應用開發的企業将湧現出來,這些企業能夠将應用的部署和復制成本降到足夠低,只要運營效率夠高,就能脱穎而出。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>