今天小編分享的科學經驗:商湯日日新大模型90天大更新!CEO現場整活,主打突破想象力,歡迎閱讀。
商湯 " 日日新 "AI 大模型,如其名,真的做到了日日新。
這不,從發布到現在,時隔僅僅 3 個月,商湯便正式宣布:
商湯日日新(SenseNova)大模型體系全面更新。
那麼這個更新版本又有哪些優化?
話不多說,直接上結果。
例如基于日日新的千億參數語言大模型商量 2.0(SenseChat),在三個全球權威測評基準中的表現,均超越了 ChatGPT:
△各大語言模型在 MMLU、AGIEval、C-Eval 三個評測基準中得分情況
除此之外,基于日日新的其它各大 AIGC 平台,這次也一口氣也都來了個大更新:
秒畫 3.0(SenseMirage):參數量提升至 70 億量級,實現專業攝影級圖片細節刻畫。
如影 2.0(SenseAvatar):語音和口型流暢度提升 30% 以上,實現 4K 高清視頻效果。
瓊宇 2.0(SenseSpace):空間重建效率提升 20%,渲染性能提升 50%。
格物 2.0(SenseThings):渲染精度大幅提升,對物品紋理及材質的還原達到毫米級精細度。
在現場,商湯 CEO 徐立也拿着秒畫 3.0 搞起了花活:
人沒去 CVPR 2023 現場領獎(商湯斬獲今年最佳論文),那就直接讓秒畫來生成。
不會彈吉他、不會畫畫,沒關系,繼續生成:
咱就是說,城會玩兒了。
那麼全新更新的日日新,更多產品的具體表現如何?我們繼續往下看。
不只是超越了 ChatGPT 這麼簡單讓老子和孔子對話
整體來看,商量的模型基礎能力在 2.0 版本有了大幅的提高,這點我們從上文提到的性能超越 ChatGPT 便可有直觀感受。
在模型的體系方面,商湯除了推出商量 2.0(SenseChat XL)之外,還推出了一個商量 S 版(SenseChat S),也就是小模型版本。
徐立便在現場展示了用這兩個模型展示了一波 " 孔子對話老子 " 的情景:
在語言方面,它新增了一些地區語言,例如阿拉伯語和粵語等;以及支持簡體中文、繁體中文、英語等多種語言互動。
同樣是這場 " 孔子對話老子 ",粵語版本是這樣的:
同時,商量 2.0 還突破了大語言模型輸入長度的限制。
例如給它一個指令:将超長的英文文本總結為中文概要,商量 2.0 便可立即執行這樣復雜的任務。
不僅如此,用戶還可以基于此進一步進行多輪對話:
最後,商量 2.0 還發布了一個 " 外挂 " ——知識庫挂載:
無需訓練模型,就可以快速融合知識生成;搭配企業知識庫可以快速解決相關領網域問題。
生成攝影級影像,提示詞可以自動補充了
在文生圖方面,商湯的秒畫更新到了 3.0 版本,從功能更新的内容上來看,主打的就是一個 " 突破想象力 "。
例如在輕量級方面,現在每個人都能通過拖拽的動作,在 10 分鍾内微調模型,并且定制化個人專屬的生成 AI。
我們在上面提到的徐立 " 搞花活 " 便是個很好的例子。
在" 智能化 "方面,根據提示詞(prompt)來生成 AI 繪畫作品不會再變得很繁瑣,因為現在就連提示詞都可以自動補充了。
以往我們想讓 AI 生成一條龍,可能就會輸入 " 中國龍 "、" 藍色擺件 "、" 珠寶風格 ",但往往由于提示詞過于簡單,并不能達到特别精細的效果。
而現在,同樣是只輸入這三個短語,秒畫 3.0 會自動對提示詞做補充,然後生成更為驚豔的作品:
再來感受一下提示詞 " 陽光下的塑料袋 ",在被自動擴充後的效果:
最後在效果方面,秒畫 3.0 現在生成的影像,無論是成片水準還是細節與元素,都能夠達到影視級的效果。
除了單打獨鬥的能力之外,當商量 2.0 和秒畫 3.0 結合之後的多模态大模型,也衍生出了一種新玩法——熱點事件理解。
在對話過程中 " 喂 " 它一張圖片或視頻,便可以看圖說話,更加深入且精準的描述素材中的内容。
延參法師也 " 來現場 " 了
數字人方面的如影 2.0也是本次商湯產品大更新的重點。
這不,在現場商湯便展示了延參法師等知名人物的數字人效果,無論是聲音(口音)亦或是神情,真的可以說是栩栩如生。
還有包括主持人張泉靈、經濟學家任澤平、上交大教授季衛東等等,堪稱上演了一出 " 百變大咖秀 "。
在語言方面,如影 2.0 打造的數字人在英語、日語、西班牙、阿拉伯語等多語種的精準度提升 30% 以上,而且口型和語音匹配得更加自然。
在生成效果方面,如影 2.0 支持實現影級 4K 高清視頻的輸出,可以讓成片更加精良。
如影的更新也同樣帶來了一種新玩法——
現在,用戶可以通過輸入提示詞自動生成與描述匹配的專屬數字人形象了!
而且還是可以實現數字人歌唱功能的那種。
這便極大地降低了虛拟網紅、數字人短片等内容生成的門檻。
無論 1 萬平米還是 1 毫米都能 hold 住的 3D 重建
最後在 3D 重建、數字孿生領網域,商湯同樣帶來了大更新——瓊宇 2.0和格物 2.0。
先來看下這樣一個恢弘的場景:
如果不說這是瓊宇 2.0 3D 重建的結果,或許很多小夥伴都會以為是航拍的視頻了。
據了解,瓊宇 2.0 目前已經實現了厘米級三維重建精度,室外每 1 萬平米精度達 5 厘米,室内每 1000 平米精度達 1 厘米。
同時,重建效率提升 20%,渲染性能提升 50%,100 平方公裡場景的建圖時間僅需 38 小時即可完成(1200 TFLOPS/ 秒算力支持)。
除了這種宏觀場景的 3D 重建之外,在微觀層面上的 3D 重建能力,随着格物迭代到 2.0 版本也有了大幅提升——
對物品紋理及材質的還原達到毫米級精細度,能夠帶來更清晰、更真實的產品細節體驗。
更重要的是,格物 2.0 還突破了高反光和鏡面物體采集這種老大難的問題,是無需貼紙或标籤,即可精确還原商品的外觀和特征的那種。
不難看出,日日新大模型在步入 2.0 時代之後,各項 AIGC 平台的能力都有了顯著的提升。
那麼接下來的一個問題便是:
如何在 3 個月内做到的大更新?
早在三個月前,商湯站在 AGC 新時代下,圍繞數據、算法和算力三要素給出了一個新公式:
計算量(GPU 數量 x 運行時間 x 并行效率 )= 模型參數量 x 處理數據量。
我們先來看下等式右邊的兩個因素:
模型參數量要足夠多,才能實現 AI 智慧的湧現,而這也帶來了對算力的劇增,需要更高的并行效率,才能有效支持大參數模型訓練。
數據方面,高質量自然語言數據逐漸稀缺,而視覺數據相較自然語言在數量、質量、容納信息等方面有多種優勢,能夠使得 AI 更好地理解世界。
二者的深度結合,便有了等式左邊的計算量;而之于這兩者,商湯有自己的一套 " 打法 " ——
大模型 + 大裝置。
首先便是大模型方面,日日新雖然是商湯于數月前發布,但它并非是這一波 AIGC 熱潮中一蹴而就的產物。
因為早于 5 年前,商湯便已經着手于此,而且在 2019 年便使用上千張 GPU 進行單任務訓練,推出了 10 億參數規模的視覺模型,算法效果達到了當時業界最佳。
在後來的 2021 年至 2022 年期間,商湯還訓練并開源了 30 億參數的多模态大模型" 書生 "。
因此,商湯能夠迅速推出千億參數大模型并實現版本迭代,可以視為是長期以來各種 " 小作業 " 的匯總而成的 " 大作業 "。
其次是在大裝置方面,也就是商湯在大算力中的 " 打法 ",它與自身大模型的發展也有異曲同工之妙——同樣也是早有布局。
在 2022 年 1 月,商湯交付使用了首付高達 56 億元的人工智能計算中心(AIDC),而且是 " 出道 " 即成為亞洲最大的 AI 超算中心之一。
一年前它的算力就已經高達了 3740 Petaflops,可以輕松應對萬億參數的大模型;而時隔僅 1 年,這個數值便翻了一小番,達到了 5000 Petaflops。
這又是什麼概念呢?
舉個例子,在如此大裝置的加持之下,它可以以最大 4000 卡規模集群進行單任務訓練,并可做到七天以上不間斷的穩定訓練。
……
總而言之,有大數據、有大算力、有大模型,所以商湯能讓日日新在 3 個月内完成版本迭代也就不難理解了。
但有一說一,這還是" 商湯速度 "的一隅而已。
大模型的落地也在提速
" 商湯速度 " 的另一面,正是體現在了落地應用上。
如果你認為日日新的全面更新只是一個 " 提出 " 和 " 宣布 " 的動作,那就大錯特錯了,因為它已經是 " 上崗 " 了的那種。
例如結合商量 2.0 和秒畫 3.0 的能力,商湯在移動端給客戶帶來了多種互動方面的 " 解法 "。
針對信息獲取的問答互動、生活場景的知識互動、語言和影像生成的内容互動等等,正因為商湯的大模型擁有輕量化版本,所以可以輕松在移動端上部署。
再如瓊宇 2.0 為濟南馬山鎮區網域開發、合肥中國視界園區、上海瑞金醫院等真實線下場景,打造了相對應的數字孿生,使得運營效率得到了大幅提升。
商湯還通過大模型能力為電網巡檢帶來長尾故障識别、復雜缺陷判斷等智能解決方案。
而且商湯產品的更新,并非是單打獨鬥的那種,而是強強聯手出奇迹。
例如我們剛才提到的 " 熱點事件理解 " 便是其中之一,除此之外,商湯在智能汽車領網域的絕影,更是融合了多個 " 看家本領 "。
例如多模态大模型(多模态感知)、語言大模型(車艙大腦)、知識融合(專屬記憶模塊)和 AIGC 大模型(定制數字人)等等。
也正如徐立在現場所述:
大模型的突破掀起了人工智能的新一輪技術革命,随之而來的是產業需求呈現爆炸式增長,全新的應用場景和應用模式正迅速湧現。
商湯希望通過‘大模型 + 大裝置’持續推動 AI 基礎設施能力的躍進提升,不僅打造通用能力更加強大的基礎模型,也進一步高效融合不同垂直領網域的專業知識,構建更懂行業、更具專長的專業大模型,從根本上降低大模型的下遊應用成本和門檻,讓大模型的產業價值在千行百業中綻放。
總而言之,現在的大模型之戰,不僅是拼技術迭代的速度,更是拼應用和落地的速度。
— 完 —
點這裡關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>