今天小編分享的科學經驗:瀾舟堅持四兩撥千斤:ToB場景落地,10B參數大模型足矣,歡迎閱讀。
專注、極致、口碑、快、成本。
這是瀾舟科技創始人兼 CEO 周明給出的 "大模型落地九字法則",是他在雷軍互聯網 " 七字訣 " 的基礎上,加上了 " 成本 " 一詞而來。
他将 2024 年稱為大模型落地元年,但同時堅定地表示,這并不意味着遍地是黃金。
而大模型的具體落地姿态,周明用自己帶領的大模型創業團隊瀾舟科技身先士卒地做了個表率——利用瀾舟 " 一橫 N 縱 " 體系,以孟子大模型為基礎,面向場景,發布產品。
簡單來說,就是抓技術和應用的雙輪驅動,在積極研究和掌握前沿技術的同時,致力于确保這些技術的有效應用。
3 月 18 日的瀾舟大模型技術和產品發布會現場,瀾舟科技還與零一萬物進行了戰略合作籤約。
現場,創新工場董事長、零一萬物 CEO 李開復分享,目前世界上最好的大模型智能已經達到人類平均智力水平的 3 倍,也就是說,100 道題普通人只能答對 33 道,而最好的 AI 大模型可以答對 99 道以上。
他展望了 AI 2.0 時代未來的四大趨勢:
最革命性的 AI 2.0 應用應該是 AI-First / AI-Native:最終脫穎而出的應用,屬于那些敢于全力投入新技術的先驅者。大語言模型的引入為 AI-First 應用帶來了巨大的推動力。
大模型始于文本,未來将拓展至 " 全模态 ":跨模态生成技術是實現認知和決策智能的轉捩點。現實世界的信息是文本、音頻、視覺、傳感器以及人類各種觸覺的綜合體系,要更為精準地模拟現實世界,就需要将各種模态能力打通,例如文本 - 影像、文本 - 視頻等跨模态甚至全模态的綜合能力。
AI 2.0 将超越對話,從聊天工具到智能生產力工具:用戶體驗以及未來互動界面和商業模式都會發生大的變革。
AI 2.0 将走向實體,大幅提振社會生產力:具身智能可以讓機器人制造機器人,進一步實現 AI 2.0+ 生產線智能規劃。
專注研發 10B-100B 參數大模型
瀾舟科技成立于 2021 年 6 月,是國内最早一批下場,進行大模型創業的團隊。
去年 3 月,瀾舟發布了孟子 GPT V1(MChat);今年 1 月,孟子大模型 GPT V2(含孟子大模型 - 标準、孟子大模型 - 輕量、孟子大模型 - 金融、孟子大模型 - 編碼)對公眾開放。
近期,瀾舟團隊完成了Mengzi3-13B的大模型訓練。
多說一句,孟子大模型訓練背後有個大功臣,即總規模 3T tokens 的 Mengzi-3 數據集,包含了網頁、代碼、書籍、論文等高質量數據來源。
據介紹,本月底(3 月 30 日),Mengzi3-13B 的模型将在 GitHub、HuggingFace、魔搭和始智 AI 社區開源。
為什麼開源的孟子大模型,是 13B 版本的?周明正面回答了這個問題。
首先,瀾舟明确以服務 ToB 場景為主,ToC 為輔。
實踐發現,ToB 場景使用頻率最高的大模型參數量多為 7B、13B、40B、100B,整體集中在 10B-100B 之間。
其次,在這個區間範圍内,從 ROI 角度來講,既滿足場景需求,又最具性價比。
所以很長一段時間内,瀾舟的目标都是做好 10B-100B 參數規模範圍内的行業大模型。這就不能理解為什麼開源版本選擇 13B。
周明解釋道,他自己本身其實也是 Scaling law 的信仰者,但創業不同于科研。
" 第一,這個大小的大模型已經可以解決 80% 的問題;第二,對團隊來說也比較穩定,不會因為不斷擴大的模型規模競賽而感到焦躁不安。" 周明補充說,這樣冷靜的思考,可以保證良好的成本控制,避免無謂的 GPU 算力、數據、人力投入競賽。
" 一橫 N 縱 " 體系
發布會上,瀾舟公布了自己的一橫 N 縱體系。
" 一橫 " 是模型層,是孟子大模型技術基礎上研發的各個模型;
"N 縱 " 則是基于孟子大模型的面向 ToB 應用最重要的技術和產品。
據了解,瀾舟目前重點投入到了金融行業,輔助編程等領網域,旨在通過更加全面、專業、優質的領網域數據,打造更加貼近行業場景的垂直大模型。
以孟子 GPT 通用大模型的 " 一橫 " 為基礎,瀾舟科技合夥人、首席產品官李京梅,介紹了瀾舟的應用能力型產品,包括:
AI 文檔理解:涵蓋專業的 PDF 文檔解析能力和信息抽取能力,為 RAG 方案中的文檔理解提供了更優的基礎能力;
AI 文檔問答:根據企業需要,提供私有化企業智能知識庫構建的解決方案能力;
AI 文檔輔助寫作:支持用戶上傳多個文檔作為參考資料,支持自定義多級題目和寫作提綱,由大模型賦能自動化按要求生成完整的文章初稿;
機器翻譯平台:專注以中文為中心的世界主要語種之間互譯和 20 幾個領網域的專業翻譯;
瀾舟智會:專注會議内容的智能分析和問答的產品, 是基于大模型打造的大模型原生的智能會議助手;
瀾舟 AI 搜索:大語言模型時代的搜索引擎。
過去一年,大模型領網域日新月異。
OpenAI 在幹什麼我們就去幹什麼,短期可以,長期不可取,一定要有自己的創新思路。
如何揚長避短,走出自己的獨特的創新之路,周明表達了自己的看法。
最關鍵的第一步,就是企業要有明确定位。瀾舟科技的定位就和國内其它大模型創業公司有明顯差異。
他舉例,瀾舟的定位就是作 " 大模型技術 + 企業場景應用 " 的綜合公司," 我們希望能做到站在技術角度最懂應用,站在應用角度最懂技術,同時又希望把技術和應用形成一種生态連接在一起,讓兩邊可以快速迭代。"
同時,依然需要聚焦和抓緊落地——通過落地,創造價值,拉動創新。
而且需要注意,創新和落地是相輔相成的。
不要一味的創新或者一味的落地,要把這兩者聯系在一起,讓它快速的迭代。
最後周明還語重心長地提醒:
今年是大模型落地元年,就遍地是黃金是嗎?不是的,我可以負責任地說,很多地方我們都沒有開拓出來。
比如大模型如何解決落地的最後一公裡?大模型的商業模式是什麼?如何加強交付能力?如何提高產品的商業化?
大模型落地的一切,其實才剛剛開始。
— 聯系作者 —
>