今天小編分享的互聯網經驗:一體機是大模型行業側落地的重要“棋子”麼?,歡迎閱讀。
2024 年,大模型的產業落地開始顯著提速。據統計,2024 年上半年,大模型可統計到的得標金額約 9.38 億元,已經遠超 2023 年全年大模型得標項目披露金額(7.89 億元)。
如果說 2023 年是大模型元年的話,那麼 2024 年就是大模型在行業側應用爆發之年。
大模型從 " 大 " 到 " 專 "
今年以來,随着大模型技術的不斷完善,能力不斷增強,大模型也受到了 ToB 行業的關注,大模型的能力在越來越多的行業場景中應用落地。
對于大多數產業以及企業主體來說,如何實現 AI 賦能現有的技術、業務,是最現實的命題,也是企業是否能在新一輪技術周期中保持活力的要素之一。在浪潮信息產品方案開發部總經理魏健看來,要實現大模型的廣泛落地與深入行業應用,沒有大模型不行,但只有大模型也不行," 大模型在行業側落地的關鍵在于如何有效提高 AI 應用創新的質量和效率。" 魏健強調。
目前大模型在行業側應用過程中仍存在諸多挑戰。首先,硬體層面,大模型的訓練過程需要龐大的硬體算力資源支撐,随着模型參數規模的持續擴張,對算力的要求也越來越高。這不僅增加了成本,也對硬體設備的性能提出了更高要求。包括 GPU 在内的諸多大模型訓練、推理的硬體設備價格昂貴,又因大模型在行業的應用仍處于初期階段,效果還不可量化,在企業都注重 ROI(投資回報率)的大背景下,對于硬體設備的采購成為行業應用大模型的第一道坎,對此,青雲副總裁沈鷗告訴钛媒體 APP,很多企業出于 ROI 的考慮,不願意在一開始不知道效果的情況就投入大量的财力和人力," 企業大多選擇小投入的方式先‘試水’,這就需要業務部署的速度快,見效快。" 沈鷗如是說。
魏健也有着相似的看法,她告訴钛媒體 APP,要實現大模型與行業場景的深度結合,實現高效、高可靠、高質量的模型應用效果,涉及復雜的開發環節,技術門檻高且開發周期長,而且更難以回避的問題是:在大模型爆火的當下,搭建 AI 開發和實施團隊的成本變得極高。
其次,從現階段應用上看,企業在使用模型賦能業務的過程中,選擇參數量小的模型效果要好于大參數量的模型," 巨大參數量級的通用大模型,很難直接用于復雜、離散的行業場景,各行業知識專業化程度高,可遷移性低,通用大模型本身難以覆蓋,所以經常出現大模型 " 幻覺 " 或是 " 胡言亂語 " 的問題,這是企業大模型無法承受之重,因此必須結合行業專業數據進行再學習。" 魏健告訴钛媒體 APP。
除此之外,企業用戶在大模型開發和應用的過程中還面臨着,在部署本地化、私有化大模型時,部署經驗不足、性能優化瓶頸、算力資源利用不合理等挑戰,難以在保障數據與業務隐私的條件下構建和使用本地化大模型應用。
面對這些挑戰,企業在大模型應用初期更需要一套一站式的解決方案來部署大模型,通過軟硬體協同的一體化設計,具備快速交付、開箱即用、極致性能、安全高效的大模型開發的能力的一體機就成為當下企業在部署行業模型過程中的極佳選擇之一。
一體機成為行業大模型落地新寵
公開數據顯示,在 2023 年和 2024 年上半年,大模型項目中硬體、軟體和服務的占比分别為:硬體占比 60% 和 61%,軟體占比 11% 和 5%,服務占比 17% 和 30% 以上。這一數據表明,在大模型項目中,硬體和服務占據了主要地位。
魏健告訴钛媒體 APP,從一些數據中可以看出,硬體和服務目前是大模型項目中投入最大的部分,而對于一些傳統行業企業來說,如何能快速的讓大模型落地,已經成為了當下最關鍵的一個問題,而一體機是一個很好的選擇。
無獨有偶,青雲科技 CEO 林源也對钛媒體 APP 表示,當行業面臨一項新技術的時候,大家會更傾向于軟硬一體的解決方案,就好像在企業數字化轉型之初,大家不惜重金購買 IBM 的大型機,而随着技術的發展,當一項技術變得更 " 通用 " 的時候,就形成了标準化的產品。才出現了當下的伺服器廠商、軟體廠商、數據庫廠商等等細分化的廠商。" 這點在大模型時代亦是如此,當企業對于大模型在行業的應用好處于較初級的階段時,一體機是一個能讓企業快速落地大模型應用的好方式。" 林源指出。
目前市面上常見的一體機產品主要面向的場景是:端側的微調和推理的場景。從技術發展的規律上不難看出——每一輪技術的變革,技術的使用門檻、開發門檻都在降低,對此,林源告訴钛媒體 APP,這也就意味着用戶群體更多,需求也會變多,也就會消耗更大的算力,"AI 變革也需要多樣的互動模式,一體機是必不可少的一種。服務商可能也有會不同的側重點,青雲更聚焦軟體與應用層面,比如針對醫療行業搭載幫助場景落地的應用。" 林源強調。
從用戶群體角度出發,魏健告訴钛媒體 APP,根據浪潮信息對客戶的觀察發現,浪潮信息發布的元腦企智一體機主要的客戶可以分為三類,一類是傳統行業的用戶," 諸如制造業用戶,他們有一定的數據和人才的積累,通過一體機可以以較低的成本,快速的實現模型應用開發。" 魏健指出。
第二類是 ISV(獨立軟體開發商)公司,随着大模型應用的爆發,傳統的 ISV 公司也從原先的觀望狀态,逐漸開始布局大模型相關產品,而這個過程中,對于大模型軟體開發而言,一體機的出現也能讓這些公司以更低的成本,更快的速度開發出具備大模型能力的軟體,從而快速的搶占市場份額。
第三類則是大模型應用開發團隊,以智譜華章為代表,一體機加上這些企業本身的產品化能力,軟體硬體的產品化能力、工程化能力,以及是面向企業客戶的服務能力、交付能力,形成互補,從而能幫助這些初入大模型行業的新晉玩家快速發展。
" 除此之外,還有很多 SI 集成商也是訓推一體機的閱聽人," 魏健指出," 客戶需要對大模型專門的調優能力,而市場上能提供這類服務的企業少之又少。"
另一方面,從場景的角度出發,在林源看來,當下一體機更适合于一些标準化的小場景," 對于復雜業務場景的用戶而言,定制化肯定還是最好的選擇,但是對于一些标準化的小場景來說,一體機提供的标準化的服務能讓他們更快、更便宜的開發出自身需要的專有小模型產品。" 林源告訴钛媒體 APP。
雲廠商、硬體廠商,紛紛入局
當下,一體機已經成為企業完成大模型應用開發,落地行業大模型應用過程中重要的一環,據钛媒體了解,目前市面上已經有包括硬體設備廠商、雲廠商等在内的 20 餘家企業布局一體機產品,業内期望通過軟硬一體的產品解決方案,填平大模型應用現狀與預期之間存在鴻溝,彌補生态培育的時間差,加速企業應用步伐。
硬體廠商方面,以浪潮信息為例,在前不久浪潮信息就剛剛推出了元腦企智 EPAI 一體機,該一體機融合了元腦企智 EPAI 企業大模型開發平台和元腦伺服器。元腦企智 EPAI 一體機通過軟硬體一體化設計,提供一站式大模型生產及應用全流程開發工具鏈,同時支持嵌入各夥伴在大模型訓練、微調和優化方面的算法和模型能力,共同設計、聯合開發、協同上市、持續迭代,共同為終端客戶提供更全面的 AI 原生應用開發 " 超級工作台 "。
魏健向钛媒體 APP 介紹,此次推出的一體機產品共包含基礎版、标準版、高級版、創新版和集群版五個版本,主要面向制造、金融等行業客戶、ISV 合作夥伴以及大模型應用開發團隊三類用戶提供一站式大模型生產及應用全流程開發工具鏈," 用戶可以根據自身需求,選擇不同版本的產品,‘豐儉由人’。" 魏健如是說。
聯想也于近期發布了全新的智能體一體機產品,在硬體方面 , 智能體一體機基于聯想 ThinkStation PX 旗艦工作站打造 , 采用桌面級安裝部署 , 避免了伺服器需要專門機房運維的復雜性 , 大大簡化了維護管理的工作量 , 極大地方便了運維操作。軟體層面,聯想智能體一體機配備了 " 聯想智能體平台 ", 集成多種開源大模型、智能體樣例及開發評估工具 , 并提供零代碼開發功能 , 支持用戶在短時間内以低門檻的方式創建智能體。
除了浪潮信息、聯想這些在伺服器領網域的領軍者之外,其他諸如中興通訊、趨境科技等企業也都紛紛入局,部署大模型訓推一體機。
另一方面,雲廠商們也在今年紛紛加入到了一體機的市場中。以青雲科技為例,青雲科技基于早先退出的雲易捷一體機,推出了 AI 智算一體機,也是為用戶提供了一個開箱即用的 AI 環境,幫助用戶快速構建、訓練和部署 AI 模型。
優刻得也推出了大模型一體機產品,該一體機基于一雲多芯且自主可控的 UCloudStack 全棧私有雲平台,提供虛拟化、存儲、網絡及 MaaS 模型的私有化一體交付方案,支持 Alpaca-LoRA、ChatGLM、T5、MiniGPT-4、Stable Diffusion、LLaMA2 及 Milvus 向量數據庫等開源模型的部署及算力調度,用戶可在本地或自有數據中心内,輕松部署針對特定場景的大模型服務。
與硬體廠商的一體機不同的是,雲廠商推出的一體機主要将能力重心放在本就擅長的軟體和雲平台層面,沈鷗告訴钛媒體 APP,在硬體層面,青雲科技還是通過 ODM(原始設計制造商),而将更多的精力放在雲廠商本身擅長的領網域——軟體和平台。
無論是硬體廠商推出的一體機,還是軟體廠商推出的一體機,除了各自的側重點略有不同以外,其核心的能力還是相對一致的。
魏健和林源都曾向钛媒體 APP 表示,作為一體機產品,首先要具備的就是開箱即用的能力," 這個開箱即用的能力并不是說像手機那樣直接讓終端用戶使用,而是面向 ISV 和應用開發者的開箱即用。" 林源告訴钛媒體 APP。
其次,無論是浪潮信息推出的元腦企智 EPAI 一體機,還是青雲科技推出的 AI 智算一體機,都為用戶提供了一個開源開放的大模型平台,用戶通過使用一體機可以對接到國内絕大多數主流的開源大模型,并任意調用這些大模型的能力來實現企業級模型軟體和產品的開發,并且也都可以通過 OTA 等方式實現模型的迭代。(本文首發于钛媒體 APP,作者|張申宇,編輯丨蓋虹達)