今天小編分享的科學經驗:百度5款大模型上新,更小更便宜!還可1分鍾零代碼打造Agent應用,歡迎閲讀。
零代碼 1 分鍾,構建一個 Agent 應用。
做一個 " 英語作文批改小幫手 " 應用,只需在 AppBuilder 中輸入應用名稱或者希望開發的功能,平台就能自動生成應用。
再通過簡單的調整角色指令、添加所需工作組件,即可生成應用。
發布後馬上可使用,從創建到分發,全程只需 3 步。
這就是新更新後的大模型應用開發神器百度千帆 AppBuilder。
它開放了 55 個工具組件,包括大模型組件、AI 組件、搜索組件、第三個 API 工具等。
能讓企業或個人零門檻開發各種場景下的 Agent 應用。
同時,百度大模型也上新了,一共 5 個,主打輕量化、性價比、實際場景:
ERNIE Speed
ERNIE Lite
ERNIE Tiny
ERNIE Character
ERNIE Functions
到了應用落地元年,大模型玩家出手不再是純比拼參數了。經濟實用成為了行業開卷的新方向,不僅模型規模變小,價格也降低了。
比如百度智能雲透露,ERNIE Lite 作為 ERNIE Turbo 的更新,輸入從原本的 0.008 元 / 千 token 降到了 0.003 元 / 千 token。
為什麼要這麼做?從百度的最新動作看起。
先來看百度智能雲最新發布的 5 款模型。
ERINE Speed号稱要做最适合微調的基座模型。
它上下文最高支持 128K,更便宜,速度更快,微調後可達到比肩通用大模型的效果。
ERINE Lite版本更小一些,它對标此前的 Turbo 版本,size 差不多,但是效果上明顯提升。
在兼顧輕量和效果的同時,實現了53%的成本降低。
ERINE Tiny是三款中參數量最小的,強調極致低成本、低延遲、高并發,适用于檢索推薦、端側推理等場景。
另外面向垂直場景,百度智能雲針對當下市場的需求,推出了 ERNIE Character 和 ERNIE Functions。
它們可以面向角色扮演類應用場景(遊戲 NPC、客服對話等)和工具調用場景(對話中使用外部工具、調用業務函數等)。
據介紹,這兩款模型已分别與智能硬體廠商、旅遊出行 APP 合作。
為什麼要持續加強底層模型能力?
關鍵原因之一是為了不斷降低開發門檻。
發布模型同時,千帆 AppBuilder 也同步更新。
它的底層由大模型組件、AI 能力組件等構成,基礎組件與高級組件共同支撐 Agent,一方面可以通過工作流編排實現更為復雜的業務邏輯,另一方面 Agent 也具備強大的自主任務規劃能力,能夠理解用户意圖自動規劃執行路徑,實現多工具的自動編排和執行。
可以提供零代碼、代碼編寫兩種開發模式。
如開頭提到的 1 分鍾打造 Agent 應用,就是實際例子。
開發完成後,AppBuilder 支持将應用一鍵分發到微信客服、微信公眾号、Web 端 /H5 及百度靈境矩陣等主流渠道。
值得一提的是,本次發布的基礎組件中還包括百度智能雲全新推出的向量數據庫 VDB 1.0。
據了解,百度智能雲已服務 8 萬企業用户,累計幫助用户精調 1.3 萬個大模型,幫助用户開發出 16 萬個大模型應用,自 2023 年 12 月以來百度智能雲千帆大模型平台 API 日調用量環比增長 97%。
百度副總裁謝廣軍表示,用户數量的快速增長,得益于模型效果不斷變強和很多應用場景已經有了标杆效益。
2024 年 AI 原生應用會加速落地,這個時候行業會遇到模型性能、效果以及成本多方面的挑戰。業界已經逐漸形成一個共識:
模型不見得參數規模越大越好。
因此輕量化模型逐漸成為一種趨勢。
與此同時,随着大模型應用深入,企業需求也會從直接調用基座模型逐步轉向基于自己的數據微調模型。
謝廣軍認為,未來精調模型的需求增長會比較大,精調後仍然需要做推理,推理的需求同樣也會有很大漲幅。