今天小編分享的互聯網經驗:模型推理成本下降最高99%!百川智能發布一站式大模型商業化解決方案,歡迎閲讀。
百川智能創始人、CEO 王小川
10 月 31 日消息,钛媒體 App 獲悉,王小川創立的通用 AI 公司百川智能今天發布包括 Baichuan4-Turbo、Baichuan4-Air 兩款模型在内的一站式大模型商業化解決方案,即 1+3 產品矩陣(全鏈路優質通用訓練數據,Baichuan4-Turbo、Baichuan4-Air 兩款模型和全鏈路領網域增強工具鏈)。
百川智能表示,相比 Baichuan4,Baichuan4 Turbo 模型效果提升 50%,推理成本下降 85%,首 Token 速度提升 51%,Token 流速度提升 73%;Baichuan4 Air 是首創 PRI(金字塔、殘差、區間)、MoE(混合專家)架構模型,效果持平下推理成本下降 99%,首 Token 速度提升 77%,Token 流速度提升 93%。同時,企業可以将兩款模型進行調優和增強,百川智能 1+3 產品矩陣将模型多場景可用率提升到 96%。
百川智能創立于 2023 年 4 月 10 日,由搜狗公司創始人、前 CEO 王小川創立,旨在打造中國版的 OpenAI,構建中國最好的大模型底座,幫助大眾輕松、普惠地獲取世界知識和專業服務,并在醫療與行業領網域應用落地。
公司成立以來,百川智能以月度為部門相繼推出 14 款大模型,包括 Baichuan-7B/13B、Baichuan2-7B/13B、Baichuan3 系列、Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2-Turbo、Baichuan-NPC 等,涵蓋開源、閉源、學術科研、國產算力等多個維度。
當前,百川智能業務方向主要是 " 超級智能 + 超級應用 " 雙輪驅動,發力領網域(AI 顧問)和醫療大模型(AI 醫生)。
模型領網域,今年 5 月,百川智能發布多模态能力的 Baichuan 4 模型,通用能力提升超過 10%,數學和代碼能力分别提升 14% 和 9%,基準評測中,模型能力位列國内第一。同時,百川已經推出首款 AI 助手 " 百小應 ",不僅支持多步搜索、智能定向搜索等能力,而且希望讓 AI 從工具變為夥伴,逐步具備完整能力。
醫療領網域,今年 7 月,百川智能首次對外展示 To B 端 AI 健康顧問,基于自研的通用醫療增強大模型產品。
融資方面,截至目前,百川智能已公布以 200 億估值開啓 B 輪融資,公開融資總額已超過 50 億元人民币,投資方包括阿裏、騰訊、小米、深創投、基石資本等機構,已跻身于大模型獨角獸行列。
具體到此次產品上,由于 Baichuan4-Turbo、Baichuan4-Air 均為百川智能自研,所以這些優質通用訓練數據與兩者的數據分布高度一致,結合超參動态搜索和自适應配比等算法,與企業私有數據混合微調,顯著提升了兩個模型多場景下的可用率,在金融、教育、醫療等場景下的專業細分任務平均可用率高達 96%,位居行業首位。
Baichuan4-Turbo 的文本生成、知識問答、多語言處理等核心能力相比 Baichuan 4 均有顯著提升,只需 2 卡 4090 的算力即可完成部署,在 GPT-4o 同檔位效果的模型中部署成本最低,非常适合企業探索復雜場景。
Baichuan4-Air 百川智能的首個 MoE 模型,首創了 PRI 架構,即 Pyramid(金字塔架構)、Residual(殘差結構)、Interval(區間結構),與标準的 MoE 架構相比保持了 MLP(多層感知機)和 Attention(注意力機制)的内部結構不變,在相同訓練數據下,Baichuan4-Air 不僅時效率更高,性能也大幅領先于 GPT4-style、Mixtral-style 結構的 MoE 模型,更适用于已經驗證過的較大規模流量的場景,其效果與 Baichuan 4 基本持平,但推理成本行業最低,僅為 Baichuan 4 的 1%,百萬 Token 只需 0.98 元。
硬體層面,百川智能通過大量适配工作解決了不同硬體的适配問題,目前能夠高效适配英偉達 4090/A/H 系列、華為昇騰、寒武紀、高通、MTK、天數(智芯)等企業的多種主流 AI 芯片。
商業化層面,目前百川智能已經服務了數千家客户,包括北電數智、完美世界遊戲、愛奇藝、360 集團、生學教育、愛學堂等,并且與信雅達、用友、軟通動力、新致軟體、達觀數據、華勝天成等多家行業生态夥伴,以及華為、中科曙光等硬體廠商,中國移動、中國電信、中國聯通等運營商達成合作,構建百川大模型生态。
百川智能強調,全新的一站式解決方案,能夠幫助企業以最低成本實現效果最佳的私有化部署,并支持企業将專有數據與百川智能自用的全鏈路優質訓練數據混合,實現行業更高的多場景可用率。
(本文首發于钛媒體 App,作者|林志佳,編輯|胡潤峰)