今天小編分享的科技經驗:騰訊雲大模型新更新:保持節奏,一切為了「落地」,歡迎閲讀。
落地與否成檢驗大模型能力的唯一标準。外界之前普遍認為騰訊在大模型上的動作慢了,但實際上騰訊一直踩在自己的節奏裏。
文|徐鑫
編|周路平
經歷三個月的行業落地應用探索後,騰訊雲行業大模型迎來了三大更新。
底層能力層面,騰訊一方面公布了自研大語言模型混元的新進展,另一方面宣布MaaS 平台全面接入 20 多個主流開源模型。這意味着,騰訊雲正基于業界的需求和動向,及時做出了自己的反應。
平台能力層面,針對過去大半年國内產業客户在大模型 ToB 落地摸索中,遭遇成本高、門檻高等普遍難題,騰訊雲繼續更新大模型訓練、精調工具鏈,覆蓋大模型開發全生命周期,進一步幫助企業降低大模型應用落地門檻。
在應用層,騰訊雲更新更新了包括騰訊企點分析 · AI 助手在内的10 款智能應用和解決方案,展示了這些產品在用户體驗提升和效率更新上的價值。
當下,業界有觀點認為大模型在行業化落地缺乏亮眼的應用,價值有待進一步彰顯。
騰訊雲此次能力更新延續了實用路線,繼續從產業需求和當下的應用實踐出發,着眼于解決行業内在大模型訓練或應用場景中遇到的現實問題。
01
市場需求催生三大更新
企業裏的 " 表哥 "" 表姐 " 應該都嘗過這種痛,明明只想簡單了解 " 最近業務的銷售情況 ",卻要花費大量精力和時間。對指标、拉數據,鏈路長,流程復雜,可能還需要拜托隔壁的專業數據分析團隊,才能得到結果。
如果有一個智能分析助手,只需在對話框輸入想了解的信息,馬上就能調取數據、分析,提取結論,并且一鍵生成報告,顯然能大幅提升工作效率。
大模型時代,這樣的智能小助手離普通用户并不遙遠。9 月 7 日,騰訊全球數字生态大會上,騰訊雲宣布,基于行業大模型技術,更新更新近 10 款智能應用和解決方案,加快大模型在產業落地。上述的騰訊企點分析 AI 助手就是更新的其中一個應用,目前已向大客户開放内測申請。
它的智能能力來自分析大模型的加持,融入了專業的數據分析知識、不同行業的分析指标體系,可依據行業特點進行意圖理解、思路拆解、數據推理并生成結論,大大降低了數據獲取和分析門檻。這是騰訊雲行業大模型改變軟體應用,切實帶來效能革命的典型案例。
目前,騰訊雲行業大模型在金融、零售、文旅、政務等各個領網域已初步應用,應用場景涵蓋了對話類客服、營銷内容生成、跨模态檢索、風控等企業核心的生產經營環節。
除了智能應用更新,本次大會上,騰訊雲沿襲產業應用為先的思路,還從技術底座、平台能力維度更新 MaaS 能力。
湯道生最近接受采訪時提到 ," 很多人知道大模型是個風口,很想抓住這個千載難逢的機會,但實際上用大模型來解決什麼問題,以多大成本來獲得什麼價值、多少價值,其實還沒想得很清楚。"
大模型 ToB 如火如荼,當下正從狂飙期向理性應用轉變。許多企業在思考大模型能解決什麼問題,需要耗費多大的成本,獲得怎樣的價值等問題。此次騰訊雲 MaaS 的三大更新,實際是從不同層面回應這些問題。
技術底座上,騰訊正式公布了自研通用大模型混元大模型,并宣布全面支持 20 多個行業最新的主流開源模型。
騰訊混元大模型的參數規模超千億,預訓練語料超 2 萬億 Tokens,具備強大中文創作能力,復雜語境下的邏輯推理能力,以及任務執行能力。目前,騰訊内部的 50 多個產品和業務已接入,未來行業客户可直接通過 API 調用,也可将騰訊混元大模型作為基底模型,構建專屬大模型應用。
平台能力上,更新後的 TI 平台工具鏈性能更強,騰訊雲 HCC 高性能計算節點、星脈高性能計算網絡等覆蓋大模型開發、應用全生命周期,客户只需加入自己獨有的場景數據,即可短時間内精調出專屬的模型方案。
外界觀察,底層模型能力更新,解決了用户對不同場景裏大模型的需求和靈活配置的問題。而平台能力更新,則進一步降低用户使用大模型的門檻。
至于一系列智能應用發布,則回應了用大模型獲得什麼價值的問題。過去幾個月裏,行業客户經歷了挖掘、尋找和适配的過程。一位電力行業的資深人士告訴數智前線,大模型 ToB 目前場景不少,但缺乏比較亮眼的應用。但在業内看來,行業落地本就不是一件性感的事,大模型對原有場景的智能化提升效果明顯。
騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲在接受采訪時提到,做應用層才能帶來直觀的反饋。比如在文旅行業場景裏,要注入的數據和要理解的東西就不太一樣,大模型要具備的能力也不太一樣,有些需要有推理能力,有些需要有通用能力。做了應用層後,打穿從客户反饋到模型提升的鏈路,能針對性解決模型效能的一些問題。
騰訊雲智能負責人吳運聲
總體來看,騰訊雲 MaaS 的三大更新是圍繞大模型如何落地,更好滿足客户需求的應時之舉。
02
行業落地考驗技術儲備
過去半年,大模型 ToB 的落地應用摸索已經度過嘗鮮期。
騰訊雲副總裁、騰訊企點研發負責人吳永堅介紹,在跟一些金融行業投顧領網域的客户接觸過程中,他們發現,客户的認知從原來的" 覺得大模型什麼都能做 "的階段,已經收斂到" 大模型能夠給自身業務帶來什麼價值上了"。
產業界對模型落地的态度也在逐漸回歸理性。模型廠商們察覺到,大模型的應用還在初期,企業在模型選擇、模型可靠性、應用成本、使用門檻等層面,存在各種考量和顧慮。
一位電力行業資深服務商告訴數智前線,當下企業基于這些開源或閉源的模型來做行業化落地,還遠沒有到開箱即用的程度,會遇到不少困難,比如訓練行業模型時高質量的數據來源問題,以及如何在提示詞工程環節給出高質量反饋等。
騰訊雲也服務了不少行業客户,他們基于自身的實踐,拆解了整個模型訓練鏈條後發現,從需求判斷到模型選擇,到最終幫助客户行業化訓練落地,整個過程涉及非常復雜的流程和機制,也需要強大的底層技術支持。
吳運聲用一個教育行業的案例展示了大模型訓練背後的復雜程度。這位客户希望通過企業的既有錄音檔案來判斷用户是否具備某種屬性,從而方便企業定向運營。它涉及拆解需求、選擇基底模型、試模型、開始訓練、中間評測、訓練結束、模型部署和反饋回傳等多個環節,其中任何一個節點出問題,都大大影響模型出來的效果。
以基底模型選擇環節為例,目前可選的模型很多,要參考因素也不少,比如訓練的數據量大小,客户是否自己提供機器,用什麼類型的數據(格式、中英文等)訓練,預算多少,希望訓練時長等多個因素。
有了初步選擇,到要 " 試一試 " 環節,也很考驗模型廠商的能力。" 試的過程怎麼試?部署要求不能很復雜,要能通過三五個模型,快速驗證出初步的觀點。" 吳運聲介紹。
這一復雜流程裏,騰訊雲并非只是簡單從算力層面提供支持。騰訊雲 TI 平台提供了整個模型訓練的完整工具鏈,來保障訓練任務高效、穩定和順利進行,并能評測和部署調用。
比如,針對訓練時間和成本高的問題,騰訊雲更新後的太極 Angel 大模型加速框架,可通過異步調度優化、顯存優化、計算優化等方式,相比行業常用方案,性能提升 30% 以上。這些能力來自于過去騰訊在深度學習領網域多年積累。
高速網絡和向量數據庫也為大模型訓練提供重要的底層支撐能力。騰訊雲此前打造的星脈網絡是業内網絡傳輸速度最高的網絡之一。今年 7 月,騰訊雲發布了 AI 原生向量數據庫 Tencent Cloud VectorDB,也是國内首個從接入層、計算層、到存儲層提供全生命周期 AI 化的向量數據庫,最高支持 10 億級向量檢索規模,延遲控制在毫秒級。吳永堅認為,這些都是相比其他廠商,騰訊雲所具備的差異化關鍵技術能力。
模型的評測也是目前業界關注到的大模型應用的短板點。一位能源行業人工智能業務的高管提到,行業模型訓練時他們發愁從哪裏找高質量的問題,來判斷大模型的性能。" 提示工程做不好,可能會非常影響模型的效果。" 另外,業界人士也發現,大模型訓練和落地的鏈條很長,僅評測單點效果,很難評測整體表現。
目前,騰訊雲與中國信通院開展了行業大模型标準體系及能力架構的研究,共同發布了行業大模型标準體系,參考騰訊雲在行業大模型產業應用領網域的實踐和經驗,為客户構建行業大模型提供了标準化流程、綜合評估方法,幫助大模型在產業更快落地。
03
騰訊雲的三步走
在騰訊混元大模型正式亮相之前,外界普遍認為騰訊太慢了。但從騰訊雲過去半年多的動作,大體能看到騰訊雲發展大模型的三條路徑。
首先,不難發現,相比于百度、阿裏等廠商先發通用大模型,騰訊雲選擇了先從行業大模型路徑切入。
這與植根于其基因中的產業視角有關。技術并不是單一的割裂存在,而是在技術研發階段就會與產業應用平衡。例如,騰訊雲的技術團隊在做識别技術研究時發現,棧道識别、山火識别的需求很分散。同時山火這類場景裏的數據掌握不夠,很難識别出來。後來騰訊研究了萬物識别的思路,構建一個更大的知識圖譜,通過發現物體之間的關系來組成事件。這種抽象方式一方面有很好的學術價值,同時也是從之前的解決場景裏問題的視角出發,在解決實際問題積累的經驗與研究進步之間形成了良性循環。
產業落地實效是騰訊雲評判大模型價值的唯一指标。吳運聲提到,大模型技術要能最終產生價值,才是他們最關注的要素。基于這一标準,他們最先從行業大模型起步,把技術聚焦到行業。随着行業大模型應用經驗的積累,垂直場景裏深入了解用户的使用方式和需求,還能幫助廠商沉澱出更豐富的解決方案,增加新的產品方向。
其次,從打造大模型應用商店到接入開源模型。這也是目前行業内的普遍做法。
湯道生在采訪中提到,市場上大模型的選擇很多,往往有不同側重的場景,最近各種開源大模型發展也很快,客户需要選擇與更新大模型的靈活性。
業界也認識到,不同類型的任務及場景對模型的要求不一樣。以常規的文本摘要任務為例,十億級和百億級模型在這些任務上有不錯表現。而一些帶強推理屬性比如雞兔同籠為代表的任務,則需要更大的模型。在這一背景下,單一模型已經無法滿足客户場景的需求。
行業也在順應這一趨勢。最典型的就是微軟,它從最初的投資并提供 OpenAI 閉源大模型服務,轉而和 Meta 牽手上線開源的 Llama 2。國内包括騰訊雲在内的雲廠商們在上個月也紛紛宣布支持接入開源大模型。
再次,從打造标杆案例到規模化復制。随着大模型底層能力日漸完善,目前大模型廠商們面向企業的服務模式也變成了兩類:一類是自己的研發能力比較足,通過精調來訓練自己的行業大模型;一類是調用 API,成本相對更低,能快速使用。
在這兩類服務方式下,前一類客户是騰訊雲希望作為标杆打造的客户。例如一些金融投顧類客户,他們研發能力強、經費足,對新技術的投入能力和意願更充分。針對這類客户,騰訊雲會與這些客户做更多場景合作打磨,最終形成标杆型的行業樣例。
他們是大模型策略上的第一步。随着前一類發展到更成熟階段,騰訊雲的能力沉澱到產品層面,就要面向腰部客户做產品的規模化復制。
随着打法的明晰,騰訊雲在行業場景上的偏好和選擇也已經明了。數智前線獲悉,騰訊雲目前會綜合考量市場空間、騰訊雲自身的產品技術積累,同時與已有產品的配合程度等多種因素來選擇行業模型的布局領網域。最終,他們希望打造的行業大模型,一方面能形成一定的準入門檻,另一方面能真正解決客户的痛點問題。吳運聲介紹,具有端到端能力的產品,未來會是騰訊雲重點發力的方向。
結語
經歷了前段時間的大模型狂飙之後,業内已經意識到技術的應用還要面對諸多困難:既有幻覺、成本高、部署難等現實苦惱,也有一些非技術層面的挑戰需要克服。
而落地與否成了檢驗大模型能力水平的唯一标準。只不過,相比于外界的熱鬧和喧嚣,騰訊一直在保持自己的節奏和做事思路,正在基于客户的真實需求,專心打磨落地場景。
© 本文為數智前線(szqx1991)原創内容
進群、轉載或商務合作聯系後台
文章精選