今天小編分享的科技經驗:用AI發願,垂直行業廠商逐夢“大模型圈”,歡迎閱讀。
圖片來源 @視覺中國
文|正見 TrueView,作者|koorvoa,編輯|TV.
" 十倍于移動互聯網的平台革命 ",不僅吸引着國内眾多科技大廠投身 AI 新浪潮,或自研通用大模型,或推出相關產品和解決方案,向企業服務、金融、工業等行業加速滲透,同時也引發細分領網域的諸多垂直廠商積極占位,深耕領網域内的 " 一畝三分地 "。
某種程度上而言,大模型是垂直廠商們 " 不得不為之 " 的 " 跟風 " 選擇,即便在資金、技術、人才等硬體條件上與科技大廠相比不具優勢,但面對新興技術浪潮的衝擊,不進則退,且極容易被新進入者颠覆。
這個新進入者,既包括新興的大模型創業公司,也指向 " 借機 " 扎根產業深處的科技巨頭。
以小博大,在夾縫中找機會
繼百度、阿裡、華為等第一梯度玩家陸續發布大模型相關產品、方案,騰訊雲也于近日正式公布行業大模型技術方案,加之今日發布大模型服務平台 " 火山方舟 " 的火山引擎,國内 " 頭号玩家 " 們的大模型技術方案和商業路徑終于全部 " 浮 " 于台面之上。
" 基本可以判斷,所有行業都值得用大模型重做一遍。當然重做的方式可能有很大的差異,有些行業只需要用通用大模型做 finetune 或者對齊,但有些行業可能需要從頭開始訓練,有些行業甚至連模型結構都要換掉。" 毫末智行數據智能科學家賀翔對大模型的商業前景判斷,與當前市場上的主流聲音一致,認為大模型正成為人工智能浪潮的重要拐點。
盡管大模型是片藍海,蘊藏着 " 萬億級商業價值 ",但 " 百模大戰 "、" 千模競帆 " 并非戲言,產業側則是更具确定性的商業标的,競争激烈程度不言而喻。
百度、阿裡、騰訊等具有技術積累、團隊優勢和資金支持的科技大廠率先搶跑,并加速應用落地,開啟新一輪行業客戶之争。
百度曾宣稱與超過 300 家企業成為生态夥伴;4 月阿裡雲也宣布與七家企業推動大模型在油氣、電力、交通等行業落地;華為早前就已發布盤古金融、電力、藥物分子三個垂直領網域大模型;而剛剛公布 MaaS 解決方案的騰訊已和數十個行業的 22 家企業達成大模型共建合作;火山引擎則透露抖音集團内部已有十多個業務團隊試用 " 火山方舟 ",首批邀測企業包括金融、汽車、消費等眾多行業客戶。
而剛剛發布私網域大模型的傳統 ICT 廠商新華三、将于 7 月發布大模型的京東等等,都關注大模型與產業融合,直接瞄準垂直賽道。
大廠綜合實力更強,一旦模型與場景 " 飛輪 " 轉起來,更快的掌握優質數據并搭建起服務生态,垂直行業廠商們想再要追趕只會難上加難。
但并非沒有一搏的資本。綜合了專家經驗、組織能力、工程能力的產業 knowhow,是業界普遍認為垂直行業廠商構建大模型的資源壁壘與護城河。長期根植于一線客戶,深入的需求理解和豐富的落地場景優勢,也是垂直行業廠商可貴的 " 籌碼 "。
押注專業化,行業數據大比拼
" 大模型這個賽道還是太早期了,如果說 GPT-4 和 Bard、LLaMA、Claude(編者注:分别是谷歌、Meta、OpenAI 前員工創立的 Anthropic 發布的大模型)等國外不同技術棧的大模型還存在比拼的話,那麼國内的大模型還沒有進入賽場(過于早期,沒有商用,無法比較),所以目前不存在國内通用大模型之間的比拼。而在作為基石的國内通用大模型還沒有真正進入賽場的情況下,垂直大模型也不存在太多的可比性,一切都還在早期。"夥伴雲董事長兼 CEO 戴志康對正見 TrueView 表示。
他進一步舉例補充," 某個用于 Text2SQL(編者注:将自然語言文本 Text 轉換成結構化查詢語言 SQL 的過程)的垂直模型,可能還比不上 LLaMA 通用開源模型的 Text2SQL 能力。"
目前大模型開展雖轟烈,卻還處于初級階段。百度、阿裡等較早公布大模型技術路徑和架構全景的頭部公司,產品也均未進入公測,屬于垂直行業廠商的時間視窗尚未關閉。
" 垂類行業只要緊跟潮流,精準解決用戶需求,不會脫離 AI 大模型。"某股權投資機構副總裁史松坡向正見 TrueView 分析了垂直行業廠商在大模型時代的機會點,"大模型的落地和應用離不開掌握着流量和用戶的垂類廠商,它們需要解決的是如何緊跟大模型,并利用相關技術解決尚未滿足的行業客戶需求。"
加快大模型項目共創,由單點測試擴散至規模化商用,積累垂直領網域數據和業務 know-how,進而優化大模型訓練和調優能力,挖掘和解決行業客戶尚未被顧及,或被充分改造的痛點,将數字化延伸至產業的 " 神經末梢 " 處,這也許是當前視窗期内垂直行業廠商們的機會所在。
當前越是傳統的行業,對大模型產品和解決方案越是有針對性、專業性和精準度的高要求。專業的訓練數據和行業知識庫是領網域大模型的難點,也是垂直行業廠商的優勢。
" 假定大家訓練和調優能力都差不多,那麼誰有最大量、最高質量的垂直領網域數據集,誰就擁有了產出更優質垂直模型的能力。即便現在訓練和調優能力稍弱,但長期來講技術能力是能夠被追平的,而數據集的鴻溝則不一定能被追平。" 在戴志康看來,"真正影響垂直廠商的差距點只有一個,即用于訓練垂直模型的數據集。"
賀翔同樣認為垂直與通用大模型 " 隔行如隔山 "。" 在純語言相關的垂直領網域,可能存在垂直大模型與通用大模型的競争。但是在自動駕駛這種獨特的垂直領網域,不管是語料、任務、還是測評标準,都與通用大模型完全不一致,只能夠用自動駕駛大模型來解決。"
新的馬拉松賽跑,在嘗試中找出路
目前大模型技術和產品密集發布,卻尚未有成熟案例和成功路徑借鑑,垂直廠商們只能摸着石頭過河,是 MaaS(Model-as-a-Service,模型即服務),還是 " 完全沒有必要去卷大模型,而是應該投身到應用層創新 ",标準答案尚未生成。
火山引擎總裁譚待判斷,"企業使用大模型,未來可能會呈現 "1+N" 的模式:"1" 是通過自研或深度合作,形成 1 個主力模型;由于成本和場景復雜多元等原因,在這個主力模型之外,還會有 N 個模型同時應用。"
" 企業所需的并非僅僅是一個大模型,而是多個大模型。"竹間智能創始人兼 CEO 簡仁賢持相同觀點," 坦率來說,目前絕大多數的生成式 AI 都是基于谷歌開發的 Transformer 開發出來的模型 ",他認為大模型是不是自研已經不重要了," 真正重要的是,最後用大模型驅動做出的產品是否有實際應用價值。" 竹間智能提供的是 MaaS 服務模式,并設定目标要讓企業在 99 萬的預算内即可打造一個企業自有的大模型。
" 中國不太注重生态,一般都是把别人全‘滅’了、全‘殺’了,其實自己也沒有發展起來。" 自研大模型的 Pre-A+ 輪企業瀾舟科技創始人兼 CEO 周明号召行業廠商應該有一種平和的心态,"To B 存在很多新的創業機會,包括對客戶、行業的理解,客戶與大模型團隊的互動,形成某種意義上的戰略合作夥伴,或者形成所謂數據飛輪、功能飛輪,做得越深,相應的壁壘就越高。任何一個公司進入到該領網域,包括巨頭公司,都要花同樣的功夫進行積累。"
雖路徑不一,垂直行業廠商卻目标一致。皆是用好大模型這一新的生產力工具,更新原有的生產方式,建立新的生產關系。而這也将是垂直廠商和在互聯網及兩次 AI 浪潮期間崛起的明星企業間,一場新的馬拉松賽跑。
" 垂直模型的底座仍然是通用模型,最終決定市場格局的,是底座通用模型的能力和上層垂直模型的優化。而現在通用模型的發展日新月異,所以垂直模型也面臨剛發布不久就需要更新底座的情況。" 戴志康解釋說," 基于 ChatGLM-6B 研發的垂直模型,即便當下效果不錯,但當三個月後 ChatGLM-6B 被 xxx-6B 超越,垂直模型也面臨重新洗牌的局面。" 他直言,"如果認為現在憑借垂直模型就能構成拐點,可能只是一種市場營銷手段。"
在長期競争中,沒有穩固不變和一蹴而就的市場格局。這場新的馬拉松賽跑,匆忙開局,終點未知。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App