今天小編分享的科學經驗:Agent:OpenAI的下一步,亞馬遜雲科技站在第5層,歡迎閲讀。
大模型下半場拉開序幕。
Agent成為最受重視的方向。
OpenAI 創始成員Andrej Karpathy就在黑客馬拉松演講中表示,相比大模型訓練,OpenAI 内部目前更關注 Agent 領網域。
每當有新的 Agent 論文出來的時候,團隊都會很興奮并且認真地讨論。
你們(開發者們)都正站在 Agent 開發的最前沿,這個領網域 OpenAI 也沒什麼積累。
什麼是 Agent?
在大模型語境下,可以理解成能自主理解、規劃、執行復雜任務的系統。
以 AutoGPT 和 BabyAGI 為代表的技術演示型項目,今年 4 月短暫的火了一陣,但離真正應用到業務中還有一段距離。
現在,Agent 第二輪爆發正在醖釀中,标志就是新一輪應用與場景結合更緊密了。
不出意外,先行動起來的又是編程開發行業。
最近的熱門開源項目Sweep,直接與 GitHub 的 Issue 和 Pull Request 場景整合,自動 " 清掃 "bug 報告和功能請求,直接完成對應代碼。
創業公司中,也有 OpenAI 支持的Cursor代碼編輯器,把生成代碼抬到了一句話生成整個項目框架的高度。
接下來,Agent 也将成為新的起點,成為各行各業構建新一代 AI 應用必不可少的組成部分。
對此,初創公司 Seednapse AI 創始人提出構建 AI 應用的五層基石理論,受到業界關注。
Models,也就是我們熟悉的調用大模型 API。
Prompt Templates,在提示詞中引入變量以适應用户輸入的提示模版。
Chains,對模型的鏈式調用,以上一個輸出為下一個輸入的一部分。
Agent,能自主執行鏈式調用,以及訪問外部工具。
Multi-Agent,多個 Agent 共享一部分記憶,自主分工相互協作。
創業先鋒之外,連 AI 基礎設施的巨頭也已經開始在 Agent 上發力。
比如亞馬遜雲科技紐約峰會上宣布的Amazon Bedrock Agents新功能,便是這種趨勢最有代表性的體現。
Amazon Bedrock Agents 在全托管基礎模型服務的基礎上,又把開發、部署和管理多個 Agent 的能力打包集成在一起。
如果按照前面的五層基石理論,這類服務相當于直接從第五層開始,大大降低開發門檻。
正如亞馬遜雲科技在發布會上所形容:
只用幾次點擊,搞定能執行任務的生成式 AI 應用。
可以預見的是,降低了門檻的 Agent 應用也将在各行各業全面爆發。
Agent,AI 應用新時代的起點
怎樣才算一個 Agent 應用?OpenAI 華人科學家翁麗蓮給出直觀的 " 配方 ":
Agent = 大模型 + 記憶 + 主動規劃 + 工具使用
以亞馬遜雲科技平台為例,開發 Agent 應用首先要根據具體任務場景給 Agent 選擇合适的基礎模型。
Amazon Bedrock 上除了自家的 Amazon Titan 大模型,還集結了擅長安全可控的 Anthropic、擅長檢索匯總信息的 Cohere、以及專攻文生圖的 stability.ai 等各家模型。
選好後,把要執行的任務指令直接用文字描述出來,讓 Agent 明白要扮演的角色和要完成的目标。
指令可以是包括一系列 " 問題 - 思考步驟 - 行動步驟 - 示例 " 的結構化提示詞,在 ReAct(協同推理和行動)技術支持下,基礎模型可以通過推理和決策找出相應的解決方案。
接下來的重頭戲便是 Add Action Group(添加動作組)。
Agent 要完成的具體任務,以及能使用的工具如企業系統 API、Lambda 函數等都是在這裏設定。
官方演示中是一個保險索賠管理場景,Agent 通過提取未結索賠的列表、确定每個索賠的未完成文書工作并向保單持有人發送提醒來管理保險索賠。
所有動作組設定好後,創建 Agent 和部署都是幾次點擊就能完成。
部署完成後,在測試中就可以看到 Agent 理解用户請求、将任務分解為多個步驟(收集未結保險索賠、查找索賠 ID、發送提醒)并執行相應的操作。
Amazon Bedrock 通過向導式互動界面,減少了配置基礎模型所需的編碼工作量。
動作組提供調用 API 實現特定功能,以及使用自己的數據構建差異化應用程式,又讓基礎模型能夠完成更復雜的實際業務任務。
在整個流程中,還可以配合亞馬遜雲科技平台上的各種安全服務。比如使用 PrivateLin 建立基礎模型和本地網絡之間的私有連接,所有流量都不會暴露給互聯網。
又通過提供完全托管的服務,讓開發者不需要管理底層系統就能發揮基礎模型的能力。
最終縮短從基礎模型到實際應用的周期,加速基礎模型為業務創造的價值。
加速大模型應用,還應關注什麼
有了 Amazon Bedrock 的 Agent 能力,我們得以快速将大模型投入實際業務,為企業實現降本增效或創新。
但要真正利用生成式 AI 的全部價值、發揮全部潛力,并與其他競争對手拉開潛力,私有數據才是其中根本。
換言之,大模型應用落地的關鍵,是企業自己寶貴的行業數據。
如何集成這些豐富的資源到我們的 Agent 之中,保證我們的大模型應用在執行任務時能夠高效訪問到正确的信息——是當下每一個企業都要面對的問題。
當然,這一切都必須以保證隐私為前提。
除了私有數據的集成和調用,在大模型應用落地的路上,最為底層的支撐,算力,也始終是一個百説不厭的話題。
眾所周知,當下的顯卡資源異常稀缺,且價格不菲。
譬如有調查就發現,像英偉達的 H100,今年 4 月中旬在海外電商平台就已炒到超 4 萬美元,甚至标價 6.5 萬美元的也不算罕見。
無論是購買還是租用,這都成了全球各企業在探索生成式 AI 應用上的一大筆支出。
如何讓這一筆花銷更為經濟實惠?這也是每個企業的思慮所在。
值得關注的是,以馬遜雲科技為代表的領先供應商,正在針對生成式 AI 落地過程中的這些挑戰和痛點提供系統性的解決方案,對上述問題一一破解。
針對個性化數據問題,亞馬遜雲科技宣布為三款數據服務提供向量引擎,用來助力生成式 AI 應用與業務整合。
我們知道,在生成式 AI 爆發之後,向量數據庫也實在火爆不已。因為相比傳統的關系數據庫,它能給予與模型上下文更相關的響應(如下圖所示)。
亞馬遜雲科技這一最新服務,就是将我們的私有數據存儲到具有向量引擎的數據庫中,在進行生成式 AI 應用時,通過簡單的 API 調用就能方便地查詢企業内部的數據。
而根據當前數據存儲位置、對數據庫技術的熟悉程度、向量維度的擴展、Embeddings 的數量和性能需求等不同需求,亞馬遜雲科技提供了 3 個選項來滿足:
-Amazon Aurora PostgreSQL 兼容版關系型數據庫,支持 pgvector 開源向量相似性搜索插件;
- 分布式搜索和分析服務 Amazon OpenSearch,帶有 k-NN(k 最近鄰)插件和适用于 Amazon OpenSearch Serverless 的向量引擎;
- 兼容 PostgreSQL 的 Amazon RDS(Amazon Relational Database Service)關系型數據庫,支持 pgvector 插件。
當然,最值得説道的是這次最新推出的Amazon OpenSearch Serverless服務,它最大的優點就是讓企業只關心向量數據的存儲和檢索,而不用背上任何底層運維的負擔。
解決完數據集成問題,在底層支撐上,亞馬遜雲科技這次也直接推出H100 支持的全新 Amazon EC2 P5 實例,這一曾經對于大多數企業都相當難得的算力資源,現在也變得 " 唾手可得 " 了。
據了解,該實例包含 8 個英偉達 H100 Tensor Core GPU,640GB 高帶寬 GPU 内存,同時提供第三代 AMD EPYC 處理器、2TB 系統内存和 30TB 本地 NVMe 存儲,以及 3200Gbps 的聚合網絡帶寬和 GPUDirect RDMA 支持,可實現更低延遲和高效的橫向擴展性能。
相比上一代基于 GPU 的實例,Amazon EC2 P5 可以讓訓練時間最多可縮短 6 倍(從幾天縮短到幾小時),降低高達 40% 的訓練成本。
再加上亞馬遜雲科技之前基于自研芯片發布的 Amazon EC2 Inf2 和 Amazon EC2 Trn1n 等性能也表現不錯的實例,我們在算力需求這一問題上,可以説是有了非常多的按需選擇空間。
除了以上這些基礎支持,各種開箱即用的 AI 服務也不 " 缺席 ":
如針對開發環節的 AI 編程助手 Amazon CodeWhisperer,現在它與 Amazon Glue 實現集成,将 AI 代碼生成的場景又擴展到一個新人群:數據工程師,只需自然語言(比如 " 利用 json 檔案中的内容創建一個 Spark DataFrame"),這些開發人員即可搞定各種任務;
再如針對商業智能(BI)的 Amazon QuickSight,也能夠讓業務分析師們使用自然語言執行日常任務,在幾秒鍾内創建各種數據可視化圖表;
還有 Amazon HealthScribe,可以用于醫療行業生成臨床文檔,節省醫生時間。
這些工具都是主打讓企業專注于核心業務,提高生產效率。
最後,簡單總結,我們能夠發現:
從今年 4 月起,亞馬遜雲科技就結合自身定位并基于真實用户需求出發,正式宣布進軍生成式 AI 市場,為一切想要利用生成式 AI 技術加速或創新業務的企業提供服務。
在短短的 4 個月期間,亞馬遜雲科技已推出了各類底座資源,從基礎模型到算力支撐,從私人數據存儲到高效開發工具,應用盡有。
而這次在紐約峰會釋出的最新動向,則是繼續加碼生成式 AI 應用開發所需的一切。
從 Amazon EC2 P5 實例代表的算力層、到 Amazon OpenSearch Serverless 向量引擎、Amazon Bedrock Agents 代表的工具層、再到 Amazon QuickSight 等代表的應用層,一項端到端的解決方案已然形成。
在這之中,亞馬遜雲科技不斷降低生成式 AI 的門檻,無論是初創企業還是傳統行業,無論是處于生成式 AI 進程的哪一層,都能在這裏找到合适的工具,無需耗費太多精力在底層邏輯之上,便可快速投入實際業務。
如亞馬遜雲科技數據庫、數據分析和機器學習全球副總裁 Swami Sivasubramanian 所説:
我相信生成式 AI 将改變每一個應用程式、行業和企業。
在各行各業都全力奔赴的這場全新技術變革之下,亞馬遜雲科技的這一系列服務,無疑為普通玩家赢得了寶貴的時間和機會。
我們可以期待:越來越多的生成式 AI 應用将被開發出來,生成式 AI 的創造力也得以滲透到各個領網域,去改變、去颠覆每一個行業。
>