今天小編分享的互聯網經驗:AI大模型激烈混戰!一天之内,華為、阿裡、騰訊等巨頭紛紛出手,歡迎閱讀。
最近幾個月,國產大模型的内卷激烈程度可以用 " 神仙打架 " 來形容。本周五,大模型混戰又達到了新高度,據華爾街見聞不完全統計,僅在今天,就有華為、阿裡、騰訊、商湯、京東等企業發布或更新大模型。
" 百模大戰 " 的盛況中,誰最有可能造出中國版 GPT-4?
華為雲盤古大模型 3.0 正式發布
7 月 7 日,華為雲在開發者大會 2023 上發布盤古大模型 3.0。華為常務董事、華為雲 CEO 張平安表示,盤古大模型 3.0 是完全面向行業的大模型,包括 "5+N+X" 三層架構。
張平安在會上表示,盤古大模型不會作詩,只做事,将圍繞 " 行業重塑 "" 技術扎根 "" 開放同飛 " 三大創新方向,持續打造核心競争力,為行業客戶、夥伴及開發者提供更好的服務。
三層架構分别為:
L0 層包括自然語言、視覺、多模态、預測、科學計算五個基礎大模型,提供滿足行業場景中的多種技能需求。盤古 3.0 為客戶提供 100 億參數、380 億參數、710 參數和 1000 億參數的系列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業多樣化需求。同時提供全新能力集,包括 NLP 大模型的知識問答、文案生成、代碼生成,以及多模态大模型的影像生成、影像理解等能力,這些技能都可以供客戶和夥伴企業直接調用。無論多大參數規模的大模型,盤古提供一致的能力集。
L1 層是 N 個行業大模型,華為雲既可以提供使用行業公開數據訓練的行業通用大模型,包括政務,金融,制造,礦山,氣象等大模型;也可以基于行業客戶的自有數據,在盤古大模型的 L0 和 L1 層上,為客戶訓練自己的專有大模型。
L2 層為客戶提供了更多細化場景的模型,更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、台風路徑預測等具體行業應用或特定業務場景,為客戶提供 " 開箱即用 " 的模型服務。
盤古大模型采用完全的分層解耦設計,可以快速适配、快速滿足行業的多變需求。客戶既可以為自己的大模型加載獨立的數據集,也可以單獨更新基礎模型,也可以單獨更新能力集。
在 L0 和 L1 大模型的基礎上,華為雲還為客戶提供了大模型行業開發套件,通過對客戶自有數據的二次訓練,客戶就可以擁有自己的專屬行業大模型。同時,根據客戶不同的數據安全與合規訴求,盤古大模型還提供了公用雲、大模型雲專區、混合雲多樣化的部署形态。
阿裡 AIGC 應用 " 通義萬相 "
在 2023 年世界人工智能大會上,阿裡雲正式推出 AI 繪畫新品 " 通義萬相 "。
基于阿裡研發的組合式生成模型 Composer,通義萬相提出了基于擴散模型的「組合式生成」框架,通過對配色、布局、風格等影像設計元素進行拆解和組合,提供了高度可控性和極大自由度的影像生成效果。
用戶可以在通義萬相中輸入提示詞,以輸出相應影像。除文生圖以外,通義萬相也推出了包括風格遷移、相似圖生成等功能。
從此,圖片設計的門檻将大幅降低,無論是藝術設計、遊戲,還是文創,都将迎來一場變革。
目前,通義萬相具有以下三大功能:文生圖、相似圖生成、風格遷移。
文生圖功能為基本的形式,只要輸入 prompt,選定創作風格(水彩、油畫、中國畫、扁平插畫、二次元、素描、3D 卡通等),通義萬相就可以自動生成海量的創意靈感。通義萬相已正式上線,對外提供服務。
相似圖生成則可以讓用戶根據現有素材,快速地批量擴展相似素材。只要用戶提供一張參考影像,就可以獲得一張與之内容、風格類似的影像。
而風格遷移,則是為一張原圖生成一幅指定風格的新圖。
下圖為來自 " 新智元 " 的測試,使用通義萬相将下圖穿着白紗女性,改成法國印象派畫家雷諾阿的風格。
遷移完成後,得到了這樣一幅印象派的人物肖像。
據 " 新智元 " 測評表示,通義萬相的部分作圖能力,已經在逼近全球最牛 AI 作畫神器 Midjourney。
騰訊 MaaS 平台更新
世界人工智能大會期間,騰訊雲宣布更新 MaaS 平台,将行業大模型能力應用到金融風控、同傳翻譯、數智人客服等新場景中;其中,首次公布的金融風控大模型,相比傳統風控有 10 倍效率提升。
在技術底座領網域,自研星脈高性能計算網絡、向量數據庫,為大模型的行業應用提供更充沛的算力基礎設施。其中,最新更新的騰訊雲自研星脈高性能計算網絡,能提升 40% 的 GPU 利用率,節省 30%~60% 的模型訓練成本,為 AI 大模型帶來 10 倍通信性能提升。基于騰訊雲新一代算力集群 HCC,可支持 10 萬卡的超大計算規模。騰訊雲 AI 原生向量數據庫,最高支持 10 億級向量檢索規模,延遲控制在毫秒級,相比傳統單機插件式數據庫檢索規模提升 10 倍,同時具備百萬級每秒查詢(QPS)的峰值能力。
在應用創新方面,騰訊雲行業大模型能力應用到金融風控、互動翻譯、數智人客服等場景中,極大提升了智能應用效率。
行業大模型加持的金融風控解決方案,相比之前有了 10 倍效率提升,通過騰訊積累超過 20 年的黑灰產對抗經驗和上千個真實業務場景,整體反欺詐效果比傳統模式有 20% 左右的提升。企業可以基于 prompt 模式,迭代風控能力,從樣本收集、模型訓練到部署上線,實現全流程零人工參與,建模時間也從 2 周減少到僅需 2 天。即便樣本積累有限的情況下,也可以完成快速搭建,跳過 " 冷啟動 " 過程。
在互動翻譯領網域,基于行業大模型技術加持,同傳技術不再需要百萬級的訓練數據,僅需 " 小樣本 " 訓練就能實現較好效果,專業領網域的翻譯也能減少人工調優的參與,保障翻譯效果,在多個垂直行業落地。其中,騰訊同傳已經連續六年為世界人工智能大會主論壇提供 AI 同傳服務。
在數智人領網域,今年騰訊雲推出了小樣本數字人工廠,僅需少量數據、24 小時内即可復刻 2D 數字分身,讓企業應用數智人服務成本大大降低。現在,依托 AI 生成算法,數智人 3D 形象的復刻速度得到大幅提升,通過生成式動作驅動,結合行業大模型能力,可讓企業獲得更 " 個性化、專業、自然逼真 " 的數智員工,讓 " 面對面 " 專業服務成為可能。
商湯大模型全面更新
世界人工智能大會期間,在 " 大愛無疆 · 日日新 " 人工智能論壇上,商湯科技宣布 " 商湯日日新 SenseNova" 大模型體系将多方位全面更新,以及在該體系下的一系列大模型產品更新和落地成果。
作為千億級參數的自然語言處理模型,商湯商量 SenseChat 2.0 版本突破了大語言模型輸入長度限制,并推出不同參數量級的模型版本,可完美适配移動端、雲端等不同終端及場景的應用需求,降低部署成本。商湯的自研生成式大模型商湯秒畫 SenseMirage 3.0 的模型參數從今年 4 月首次發布以來的 10 億提升至 70 億量級,能夠實現專業攝影級的圖片細節刻畫。
不僅如此,商湯如影 SenseAvatar 2.0 數字人生成平台相較 1.0 版本的語音和口型流暢度提升 30% 以上,實現 4K 高清視頻效果,并帶來 AIGC 生成形象及數字人歌唱功能。此外,商湯瓊宇 SenseSpace 2.0 的空間重建效率提升 20%,渲染性能提升 50%,每 100 平方公裡場景的建圖時間僅需 38 小時即可完成(1200 TFLOPS/ 秒算力支持);而商湯格物 SenseThings 2.0 對小物體的紋理及材質還原達到毫米級精細度,并突破對高反光和鏡面物體的采集難題。
在金融領網域,商湯與銀行、保險、券商等客戶展開合作,利用數字人進行智能客服、智慧營銷等工作,并通過接入大語言模型能力,提供投研分析、研報撰寫等新功能,實現降本增效。此外,挂載金融知識庫後,還能 100% 基于客戶的產品說明進行内容問答輸出,并實現信息及時更新。
在醫療場景,商湯基于海量醫學知識和臨床數據打造了中文醫療語言大模型 " 大醫 ",提供導診、問診、健康咨詢、輔助決策等多場景多輪會話能力,未來也即将支持醫學影像、文本、結構化數據等多模态綜合分析,并可不斷提升醫療語言理解和推理能力,持續賦能醫院診療效率及患者服務提升。
其他 AI 企業進展
本土 AI 獨角獸出門問問發布 " 序列猴子 "
出門問問攜内測探索大模型 " 序列猴子 " 及 AI CoPilot 解決方案亮相世界人工智能大會。據介紹," 序列猴子 " 是一款具備多模态生成能力的大語言模型,模型以語言為核心的能力體系涵蓋 " 知識、對話、數學、邏輯、推理、規劃 " 六個維度,能夠同時支持文字生成、圖片生成、3D 内容生成、語言生成和語音識别等不同任務。" 序列猴子 " 具備自然語言理解、知識、邏輯以及推理等能力,并可以基于這些能力進行對話。
京東:正在訓練大模型,對其前景很有信心
京東集團副總裁、探索研究院院長何曉冬表示,目前訓練時間在兩個月左右的基礎通用大模型,成本估計在幾千萬元,對大模型的商業前景和落地場景很有信心。他建議,創業公司入局大模型應該找到屬于自己的 " 護城河 ",面對目前的 " 百模大戰 " 現狀,何曉冬認為,對于市場而言,有壓力和競争是好事,将有效促進行業發展。