今天小編分享的互聯網經驗:王小川發布搜索增強的Baichuan2接口產品,稱 AI 大模型不再是工具而是“新物種”,歡迎閱讀。
百川智能創始人、CEO 王小川
随着新一輪 AI 大模型浪潮席卷一年多之後,王小川團隊加速推進大模型成果,以完成百川智能的生态布局。
钛媒體 App 獲悉,12 月 19 日下午,王小川創立的 AI 大模型公司百川智能,在北京發布基于搜索增強的 Baichuan2-Turbo 系列 API(應用程式編程接口),包含 Baichuan2-Turbo-192K 及 Baichuan2-Turbo 產品,即日起產品可開放使用,從而逐步構建百川智能完整的大模型技術棧。
百川智能創始人、CEO 王小川表示,大模型 + 搜索構成了完整的技術棧。搜索增強是大模型發展的必由之路,解決了搜索 + 長視窗結合產生的技術挑戰。他指出,将動态知識引入模型中,在垂直領網域,尤其是領網域知識不易公開獲取的場景,模型本身的領網域知識嚴重不足,而借助搜索增強,則可以實現大模型和領網域知識、全網知識的全新鏈接。利用大模型 + 搜索增強方案可解決 99% 企業知識庫的定制化需求。
王小川對钛媒體 App 表示,現在的 AI 大模型不是在創造工具,而是創造更像人一樣的 " 新物種 "。
" 在互聯網時代,火車、計算機、電腦、AI 更多是工具,都要求精确的方式進行互動,提高人類效率。但今天,其實我們造的是‘新物種’,‘造’的是一種人類夥伴,它就不需要像工具一樣那麼精确。所以在 AI 大模型時代下,我們對它的定義和思考方法是有别于此前的想法。" 王小川表示。
據悉,百川智能創立于 2023 年 4 月 10 日,由搜狗公司創始人、前 CEO 王小川創立,旨在打造中國版的 OpenAI,構建中國最好的大模型底座,幫助大眾輕松、普惠地獲取世界知識和專業服務,并在醫療、互聯網等領網域應用落地。其核心團隊由搜狗、谷歌、騰訊、百度、華為、微軟、字節等科技公司的 AI 頂尖人才組成。
目前,百川智能的團隊規模已經超過 200 人,其中研發人員占比超 80%。
過去的 253 天裡,百川智能平均每四個星期發布一款大模型,已經接連發布 Baichuan-7B/13B、Baichuan2-7B/13B 四款開源可免費商用大模型,以及 530 億參數的 Baichuan-53B、Baichuan2-53B、Baichuan2-192K 三款閉源大模型。其中,Baichuan-7B/13B 兩款開源大模型在多個權威評測榜單均名列前茅,累計下載量超過 600 萬次,在寫作、文本創作等領網域能力已達到行業較好水平。
融資方面,截至目前,百川智能已公布首輪和 A1 輪戰略融資,累計融資額已超過 3.5 億美元(約合 25 億元人民币),投資方包括阿裡、騰訊、小米、深創投、基石資本等機構。百川智能贊未透露當前具體估值,僅表示融資後公司跻身于科技獨角獸行列。根據一般定義,獨角獸估值超過 10 億美元(約合 72.66 億元)。
8 月 31 日,百川智能率先通過國家《生成式人工智能服務管理暫行辦法》備案,是首批八家公司中唯一一家今年成立的大模型初創公司,并于 9 月 25 日開放 Baichuan2-53B API 接口,正式進軍 To B 企業端領網域,開啟商業化進程。
12 月 4 日晚間,鴻博股份披露一則合同公告,百川智能最近與英博數科籤署了《雲服務協定》,在協定期限内英博數科向百川提供高性能計算或 GPU 算力技術等服務。協定涉及交易總金額預計 13.82 億元。
此次,百川智能主要圍繞 " 大模型 + 搜索增強 " 方案公布 Baichuan2-Turbo 系列 API 技術細節。
百川智能稱,Baichuan2-Turbo 系列 API 在支持 192K 超長上下文視窗的基礎上,還增加了搜索增強知識庫的能力。即日起,API 用戶可上傳文本資料來創建自身專屬知識庫,從而根據自身業務需求打造更完整、高效的智能解決方案。
百川智能表示,其自研的向量模型使用了超過 1.5T token 的高質量中文數據進行預訓練,并在通用 RAG(檢索增強生成)的技術基礎上增加大模型自省技術,以解決 " 幻覺 " 加重的現象。而且,百川智能通過長視窗 + 搜索增強的方式,在 192K(19.2 萬)長上下文視窗的基礎上,将大模型能夠獲取的原本文本規模提升了兩個數量級,達到 5000 萬 tokens,通過搜索增強等技術放置在長視窗模型中有效節省了推理費用和時間成本,并且稀疏檢索 + 向量檢索的方式可以實現 95% 的回答精度,高于單純的向量檢索 80% 的回答精度。
百川智能強調,搜索增強技術是大模型落地應用的關鍵,能夠有效解決幻覺、時效性差、專業領網域知識不足等阻礙大模型應用的核心問題。這種技術不僅有效提升了模型性能,并且使大模型能 " 外挂硬碟 ",實現互聯網實時信息 + 企業完整知識庫的 " 全知 ",而且還能讓大模型精準理解用戶意圖,在互聯網和專業 / 企業知識庫海量的文檔中找到與用戶意圖最相關的知識,然後将足夠多的知識加載到上下文視窗,借助長視窗模型對搜索結果做進一步的總結和提煉,更充分地發揮上下文視窗能力,幫助模型生成最優結果,從而實現各技術模塊之間的聯動,形成一個閉環的強大能力網絡。
據钛媒體 App 了解,目前,基于百川通用大模型的搜索增強服務價格為 0.03 元 / 次(接口自動判斷調用搜索增強服務的次數);而基于知識庫 API 接口,費用包括模型調用 Embeddings 和檔案數據存儲兩部分,收費價格分别為 0.0005 元 / 千 tokens,以及每天每 GB(千兆字節)内存 1.5 元。
王小川 12 月 18 日公開演講中表示,上個時代的重要工具突破是 " 搜索引擎 ",其作為人類文明的 " 載體 ",成為信息時代的中心應用。而今天,ChatGPT 等 AI 大模型所代表的是信息本身的收集和整理,并且在信息之上能產生知識。因此,基于基礎大模型,未來大模型将分為三種發展模式:生產力提升、智能助理和開放世界,從而重塑現有行業以及創造全新價值。
" 今年下半年之後(至今),我們看到的不再是一股腦地追最新的技術,而是大模型與現有搜索產品的結合,這種結合能夠顯著減少幻覺問題和時效性問題,從而實現更有潛力的一個應用。" 王小川表示。
百川智能表示,目前,多個行業的頭部企業已與百川智能達成合作,在深度融合百川智能的長上下文視窗和搜索增強知識庫的能力基礎上,對自身業務進行了智能化更新。
談及更大參數模型是否開源,王小川對钛媒體 App 等表示," 從開源角度看,7B(70 億)、13B(130 億)這種參數模型比較合适的,未來可能會考慮把更大模型打開(開源),但在目前情況下,百川希望讓‘這些企業最輕巧的能用(性能)最低 GPU 就能跑起來’。如果遇到復雜問題的時候,要麼是自研,要麼就交給百川來進行。"
王小川指出," 中國(大模型)現在總體抽成三個階段,第一階段是恐慌期,OpenAI 有了之後看中國公司還不行,數據飛輪美國先跑起來,是不是那個 AI 要來了,大家有這個探讨;第二階段我做百川,大家開始火熱地關注這件事;第三階段,大模型學術進展是很快的,每天會有新的進展出來,技術人員每天都要跟進最新東西,不斷迭代、不斷改進,行業發展速度其實超出外界看法,目前需要快速迭代技術。"
王小川最近表示,百川智能在進行超級應用的探索。他期望在未來兩年内,百川智能能證明大模型能夠在健康、娛樂和創造上成為超級應用,帶給人們像互聯網時代那樣的巨大幫助和希望。五年後,人們可能會有新的互動方式,比如擁有機器人、戴着 VR 眼鏡以及每個人都有數字分身等。
" 五年的時間太長,能夠想到兩年的畫面,我就很滿足了。" 王小川表示。
王小川曾對外透露,預計明年一季度前後推出百川智能的 " 超級應用 "。但钛媒體 App 問及目前 " 超級應用 " 進展情況和發布時間等問題,王小川未予回應。
" 我覺得今天能做體量比較大的模型,還能做超級應用,這種公司最多 5 家。" 王小川對钛媒體 App 等表示," 今年是中國 AI 大模型發展的元年,明年國内各家公司都會有相應的成績出來。而今天,大家需要把精力放在模型本身,應用還處于初期狀态,明年會差不多。"
(本文首發钛媒體 App,作者|林志佳)