商湯日日新大模型90天大更新！CEO現場整活，主打突破想象力

今天小編分享的科學經驗：商湯日日新大模型90天大更新！CEO現場整活，主打突破想象力，歡迎閱讀。

商湯 " 日日新 "AI 大模型，如其名，真的做到了日日新。

這不，從發布到現在，時隔僅僅 3 個月，商湯便正式宣布：

商湯日日新（SenseNova）大模型體系全面更新。

那麼這個更新版本又有哪些優化？

話不多說，直接上結果。

例如基于日日新的千億參數語言大模型商量 2.0（SenseChat），在三個全球權威測評基準中的表現，均超越了 ChatGPT：

△各大語言模型在 MMLU、AGIEval、C-Eval 三個評測基準中得分情況

除此之外，基于日日新的其它各大 AIGC 平台，這次也一口氣也都來了個大更新：

秒畫 3.0（SenseMirage）：參數量提升至 70 億量級，實現專業攝影級圖片細節刻畫。

如影 2.0（SenseAvatar）：語音和口型流暢度提升 30% 以上，實現 4K 高清視頻效果。

瓊宇 2.0（SenseSpace）：空間重建效率提升 20%，渲染性能提升 50%。

格物 2.0（SenseThings）：渲染精度大幅提升，對物品紋理及材質的還原達到毫米級精細度。

在現場，商湯 CEO 徐立也拿着秒畫 3.0 搞起了花活：

人沒去 CVPR 2023 現場領獎（商湯斬獲今年最佳論文），那就直接讓秒畫來生成。

不會彈吉他、不會畫畫，沒關系，繼續生成：

咱就是說，城會玩兒了。

那麼全新更新的日日新，更多產品的具體表現如何？我們繼續往下看。

不只是超越了 ChatGPT 這麼簡單讓老子和孔子對話

整體來看，商量的模型基礎能力在 2.0 版本有了大幅的提高，這點我們從上文提到的性能超越 ChatGPT 便可有直觀感受。

在模型的體系方面，商湯除了推出商量 2.0（SenseChat XL）之外，還推出了一個商量 S 版（SenseChat S），也就是小模型版本。

徐立便在現場展示了用這兩個模型展示了一波 " 孔子對話老子 " 的情景：

在語言方面，它新增了一些地區語言，例如阿拉伯語和粵語等；以及支持簡體中文、繁體中文、英語等多種語言互動。

同樣是這場 " 孔子對話老子 "，粵語版本是這樣的：

同時，商量 2.0 還突破了大語言模型輸入長度的限制。

例如給它一個指令：将超長的英文文本總結為中文概要，商量 2.0 便可立即執行這樣復雜的任務。

不僅如此，用戶還可以基于此進一步進行多輪對話：

最後，商量 2.0 還發布了一個 " 外挂 " ——知識庫挂載：

無需訓練模型，就可以快速融合知識生成；搭配企業知識庫可以快速解決相關領網域問題。

生成攝影級影像，提示詞可以自動補充了

在文生圖方面，商湯的秒畫更新到了 3.0 版本，從功能更新的内容上來看，主打的就是一個 " 突破想象力 "。

例如在輕量級方面，現在每個人都能通過拖拽的動作，在 10 分鍾内微調模型，并且定制化個人專屬的生成 AI。

我們在上面提到的徐立 " 搞花活 " 便是個很好的例子。

在" 智能化 "方面，根據提示詞（prompt）來生成 AI 繪畫作品不會再變得很繁瑣，因為現在就連提示詞都可以自動補充了。

以往我們想讓 AI 生成一條龍，可能就會輸入 " 中國龍 "、" 藍色擺件 "、" 珠寶風格 "，但往往由于提示詞過于簡單，并不能達到特别精細的效果。

而現在，同樣是只輸入這三個短語，秒畫 3.0 會自動對提示詞做補充，然後生成更為驚豔的作品：

再來感受一下提示詞 " 陽光下的塑料袋 "，在被自動擴充後的效果：

最後在效果方面，秒畫 3.0 現在生成的影像，無論是成片水準還是細節與元素，都能夠達到影視級的效果。

除了單打獨鬥的能力之外，當商量 2.0 和秒畫 3.0 結合之後的多模态大模型，也衍生出了一種新玩法——熱點事件理解。

在對話過程中 " 喂 " 它一張圖片或視頻，便可以看圖說話，更加深入且精準的描述素材中的内容。

延參法師也 " 來現場 " 了

數字人方面的如影 2.0也是本次商湯產品大更新的重點。

這不，在現場商湯便展示了延參法師等知名人物的數字人效果，無論是聲音（口音）亦或是神情，真的可以說是栩栩如生。

還有包括主持人張泉靈、經濟學家任澤平、上交大教授季衛東等等，堪稱上演了一出 " 百變大咖秀 "。

在語言方面，如影 2.0 打造的數字人在英語、日語、西班牙、阿拉伯語等多語種的精準度提升 30% 以上，而且口型和語音匹配得更加自然。

在生成效果方面，如影 2.0 支持實現影級 4K 高清視頻的輸出，可以讓成片更加精良。

如影的更新也同樣帶來了一種新玩法——

現在，用戶可以通過輸入提示詞自動生成與描述匹配的專屬數字人形象了！

而且還是可以實現數字人歌唱功能的那種。

這便極大地降低了虛拟網紅、數字人短片等内容生成的門檻。

無論 1 萬平米還是 1 毫米都能 hold 住的 3D 重建

最後在 3D 重建、數字孿生領網域，商湯同樣帶來了大更新——瓊宇 2.0和格物 2.0。

先來看下這樣一個恢弘的場景：

如果不說這是瓊宇 2.0 3D 重建的結果，或許很多小夥伴都會以為是航拍的視頻了。

據了解，瓊宇 2.0 目前已經實現了厘米級三維重建精度，室外每 1 萬平米精度達 5 厘米，室内每 1000 平米精度達 1 厘米。

同時，重建效率提升 20%，渲染性能提升 50%，100 平方公裡場景的建圖時間僅需 38 小時即可完成（1200 TFLOPS/ 秒算力支持）。

除了這種宏觀場景的 3D 重建之外，在微觀層面上的 3D 重建能力，随着格物迭代到 2.0 版本也有了大幅提升——

對物品紋理及材質的還原達到毫米級精細度，能夠帶來更清晰、更真實的產品細節體驗。

更重要的是，格物 2.0 還突破了高反光和鏡面物體采集這種老大難的問題，是無需貼紙或标籤，即可精确還原商品的外觀和特征的那種。

不難看出，日日新大模型在步入 2.0 時代之後，各項 AIGC 平台的能力都有了顯著的提升。

那麼接下來的一個問題便是：

如何在 3 個月内做到的大更新？

早在三個月前，商湯站在 AGC 新時代下，圍繞數據、算法和算力三要素給出了一個新公式：

計算量（GPU 數量 x 運行時間 x 并行效率）= 模型參數量 x 處理數據量。

我們先來看下等式右邊的兩個因素：

模型參數量要足夠多，才能實現 AI 智慧的湧現，而這也帶來了對算力的劇增，需要更高的并行效率，才能有效支持大參數模型訓練。

數據方面，高質量自然語言數據逐漸稀缺，而視覺數據相較自然語言在數量、質量、容納信息等方面有多種優勢，能夠使得 AI 更好地理解世界。

二者的深度結合，便有了等式左邊的計算量；而之于這兩者，商湯有自己的一套 " 打法 " ——

大模型 + 大裝置。

首先便是大模型方面，日日新雖然是商湯于數月前發布，但它并非是這一波 AIGC 熱潮中一蹴而就的產物。

因為早于 5 年前，商湯便已經着手于此，而且在 2019 年便使用上千張 GPU 進行單任務訓練，推出了 10 億參數規模的視覺模型，算法效果達到了當時業界最佳。

在後來的 2021 年至 2022 年期間，商湯還訓練并開源了 30 億參數的多模态大模型" 書生 "。

因此，商湯能夠迅速推出千億參數大模型并實現版本迭代，可以視為是長期以來各種 " 小作業 " 的匯總而成的 " 大作業 "。

其次是在大裝置方面，也就是商湯在大算力中的 " 打法 "，它與自身大模型的發展也有異曲同工之妙——同樣也是早有布局。

在 2022 年 1 月，商湯交付使用了首付高達 56 億元的人工智能計算中心（AIDC），而且是 " 出道 " 即成為亞洲最大的 AI 超算中心之一。

一年前它的算力就已經高達了 3740 Petaflops，可以輕松應對萬億參數的大模型；而時隔僅 1 年，這個數值便翻了一小番，達到了 5000 Petaflops。

這又是什麼概念呢？

舉個例子，在如此大裝置的加持之下，它可以以最大 4000 卡規模集群進行單任務訓練，并可做到七天以上不間斷的穩定訓練。

……

總而言之，有大數據、有大算力、有大模型，所以商湯能讓日日新在 3 個月内完成版本迭代也就不難理解了。

但有一說一，這還是" 商湯速度 "的一隅而已。

大模型的落地也在提速

" 商湯速度 " 的另一面，正是體現在了落地應用上。

如果你認為日日新的全面更新只是一個 " 提出 " 和 " 宣布 " 的動作，那就大錯特錯了，因為它已經是 " 上崗 " 了的那種。

例如結合商量 2.0 和秒畫 3.0 的能力，商湯在移動端給客戶帶來了多種互動方面的 " 解法 "。

針對信息獲取的問答互動、生活場景的知識互動、語言和影像生成的内容互動等等，正因為商湯的大模型擁有輕量化版本，所以可以輕松在移動端上部署。

再如瓊宇 2.0 為濟南馬山鎮區網域開發、合肥中國視界園區、上海瑞金醫院等真實線下場景，打造了相對應的數字孿生，使得運營效率得到了大幅提升。

商湯還通過大模型能力為電網巡檢帶來長尾故障識别、復雜缺陷判斷等智能解決方案。

而且商湯產品的更新，并非是單打獨鬥的那種，而是強強聯手出奇迹。

例如我們剛才提到的 " 熱點事件理解 " 便是其中之一，除此之外，商湯在智能汽車領網域的絕影，更是融合了多個 " 看家本領 "。

例如多模态大模型（多模态感知）、語言大模型（車艙大腦）、知識融合（專屬記憶模塊）和 AIGC 大模型（定制數字人）等等。

也正如徐立在現場所述：

大模型的突破掀起了人工智能的新一輪技術革命，随之而來的是產業需求呈現爆炸式增長，全新的應用場景和應用模式正迅速湧現。

商湯希望通過‘大模型 + 大裝置’持續推動 AI 基礎設施能力的躍進提升，不僅打造通用能力更加強大的基礎模型，也進一步高效融合不同垂直領網域的專業知識，構建更懂行業、更具專長的專業大模型，從根本上降低大模型的下遊應用成本和門檻，讓大模型的產業價值在千行百業中綻放。

總而言之，現在的大模型之戰，不僅是拼技術迭代的速度，更是拼應用和落地的速度。

— 完 —

點這裡關注我，記得标星哦～

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~