今天小編分享的互聯網經驗:大模型新貴還是繞不過雲計算大佬,歡迎閲讀。
"AI or die"
至少有那麼一小段時間,雲計算行業真的開始擔心亞馬遜雲科技會落後。
彼時微軟押中 OpenAI,風光一時無兩,激動人心的故事背後是一場豪賭,就連比爾 · 蓋茨也曾警告薩提亞 · 納德拉不要投資 OpenAI,随後 ChatGPT 的現象級熱度讓一切質疑消弭于無形,OpenAI GPT 和微軟 Azure 的組合似乎穩赢。
圖片來源:unsplash
在 " 名不見經傳 " 的 OpenAI 爆火之前,谷歌一直是人工智能領網域技術的标杆,OpenAI 也是站在谷歌的肩膀上才有所成就,比如 Transformer 架構最早由谷歌推出,湧現現象由谷歌研究員發現。如果 AI 是雲服務未來最大的變量,那麼谷歌雲一定是最有力的競争者,位次還要在微軟 Azure 之前。
不得不向微軟 Azure 和谷歌雲脱帽致敬,他們加速了人工智能改變一切的節奏,也讓雲服務的焦點轉向 AI。這是一場 "AI or die" 的競賽,雲巨頭不僅要具備 AI 能力,還要比直接競争對手有更突出的差異化優勢。
當外界普遍為亞馬遜雲科技擔心時,Adam Selipsky 顯然不這麼想,亞馬遜雲科技遍布全球的龐大基礎設施和繁榮的合作夥伴生态,是其長久以來的領先壁壘,外界都在期待亞馬遜雲科技的新底牌。
那些認為微軟 Azure 和谷歌雲能夠憑借大模型超過亞馬遜雲科技,或者説縮小與其差距的觀點,也同時抱有另一種期待,即一旦亞馬遜雲科技将 AI 納入其提供給客户的強大服務生态系統,亞馬遜雲科技失去的任何陣地都會很快被彌補回來。
這就是 2023 年 4 月 Amazon Bedrock 誕生時的背景。相比于微軟和谷歌主推的 OpenAI 和 Google PaLM,亞馬遜雲科技采取了不同的策略。
起初 Amazon Bedrock 主打多模型接入,亞馬遜雲科技的基礎模型 ( Amazon Titan ) ,和各種第三方模型(如 AI21 Labs、Anthropic、Stability AI 等),都可以通過 API 的方式接入。同時發布的還有代碼生成器以及用于訓練和推理的雲上算力。
此後 Amazon Bedrock 不斷更新,增加全新基礎模型、基礎模型供應商以及 Agents 功能,提供微調、知識庫、代理、模型評估等各種豐富的功能,同時還能與亞馬遜雲科技其他工作負載無縫集成。
圖片來源:pixabay
總結來説就是三大方面,簡化選擇:多樣化業界基礎模型選擇; 簡化定制:提供持續預訓練,fine-tuning, RAG 等方式;簡化集成:Agent on Amazon Bedrock。
最新一次的重磅更新,亞馬遜雲科技數據和人工智能副總裁 Swami Sivasubramanian 形容其為 "Significant new capabilities make it easier to use Amazon Bedrock to build and scale generative AI applications – and achieve impressive results"。
重大更新、更易使用、效果顯著,成為 Amazon Bedrock 本次更新的關鍵詞。
大模型向下看,仍舊是雲平台
Amazon Bedrock 對外發布已有一年,過去一年,大模型依然在不斷迭代,甚至迭代得有些過于快速,以至于企業客户不知道把應用做到什麼程度,Amazon Bedrock 給出的答案是,雲廠商不只負責大模型,而是對最終的業務效果負責。
Swami Sivasubramanian 表示,Amazon Bedrock 聚焦于客户所需的關鍵領網域,以适當的成本和速度構建可投入生產的企業級生成式 AI 應用程式。
當所有人都在關注大模型的時候,更應該關注支撐大模型所必需的雲服務,通過一系列的更新,Amazon Bedrock 打造了一個端到端的、對客户業務效果負責的平台,也讓業内再次把目光聚焦到亞馬遜雲科技。
首先,新增了 Llama 3 的 Llama 3 8B 和 Llama 3 70B 版本模型,目前最強的開源模型正式 GA。Llama 3 8B 擅長文本摘要、分類、情感分析和翻譯,适合有限資源和邊緣設備場景。Llama 3 70B 在内容創建、對話式人工智能、語言理解、研發、企業、準确摘要、細致分類 / 情感分析、語言建模、對話系統、代碼生成和指令跟蹤方面表現出色。
同時 Amazon Bedrock 還預告了 Amazon Titan Text Embeddings V2,Embeddings V2 提供 256、512 和 1024 向量空間尺寸,優先考慮降低成本,同時保留 RAG 用例 97% 的準确性,性能優于其他領先模型。
以及即将支持 Cohere 的 Command R 和 Command R+ 企業 FM。Command R+ 是 Cohere 最強大的模型,針對長上下文任務進行了優化,而 Command R 則針對大規模生產工作負載進行了優化。
值得關注的是,Amazon Bedrock 的模型評估工具全面可用,能夠根據特定應用場景的指标(如相關性、風格和品牌聲音)對模型進行評估,為客户評估、比較和選擇适合其應用程式的最佳模型,将評估模型的時間從幾個星期縮短到幾個小時,評估後還會提供評估報告,為更多模型使用者提供參考。
钛媒體 App 觀察到,現階段客户并不希望被一個模型綁定,基礎模型在進化,應用場景也在調試,客户希望更多選擇、更低成本、更易調試不同的模型,來測試自己的業務效果,模型評估工具就很有必要且應景。
另外還有非常實用的 Amazon Titan 影像生成器現已全面推出,客户可以利用自然語言實現低成本、大量高效地生成影像,并且每張影像都包含不可見水印,有助于降低知識產權風險。
其次,如何讓企業更安全地定制模型,并将其集成到特定業務用例,Amazon Bedrock 實現了自定義模型導入,客户現在可以導入和訪問流行的開放模型架構(包括 Flan-T5、Llama 和 Mistral)構建自定義模型,作為 Amazon Bedrock 中完全托管的應用程式編程接口(API)。
如此,客户可以采用在 Amazon SageMaker 或其他工具上定制的模型,并将其輕松添加到 Amazon Bedrock,并且經過自動驗證後無縫訪問其自定義模型,就像 Amazon Bedrock 提供的模型一樣,效果和體驗拉滿,這也完全體現了 Amazon Bedrock 的開放性。
最後是安全,Amazon Bedrock 的 Guardrails 現已全面上市,可幫助客户防止有害内容并管理應用程式内的敏感信息。客户能夠定義内容策略、設定應用程式行為邊界并實施針對潛在風險的保護措施。 據了解,與 Amazon Bedrock 上 FM 本身提供的保護相比,它可以幫助客户阻止多達 85% 的有害内容。
GenAI,延續亞馬遜雲科技的第一性原理
不得不説,輪到行業繼續向亞馬遜雲科技脱帽致敬了,老大哥依舊是老大哥。
Amazon Bedrock 僅用一年時間就扭轉了風向,行業依然關注大模型本身的技術進步,但更關注大模型能不能為我所用,這涉及到龐大的基礎設施、工程能力、生态系統等。
亞馬遜雲科技沒有選擇只做大模型,而是以另一種方式,也是他們所擅長的方式,将人工智能融入到原有的生态系統中,數以萬計的客户正在使用 Amazon Bedrock 來構建和擴展大模型應用程式。
亞馬遜雲科技就此構建了完備的生成式 AI 全棧布局,企業構建生成式 AI 應用的三層架構,包括:用于基礎模型訓練和推理的基礎設施、使用基礎模型進行構建的工具、利用基礎模型構建的開箱即用的應用程式。
在底層算力層,一方面,亞馬遜雲科技繼續提供來自英偉達的計算實例,包括最新的 NVIDIA Grace Blackwell GPU 的 Amazon EC2 實例等;另一方面是亞馬遜雲科技自研芯片,包括推理芯片 Inferentia 和 Trainium 系列。
中間層是 Amazon Bedrock 以及各種附加功能。上層是包括 Amazon Q 在内的應用程式,Amazon Q 可以連接到企業自己的數據、信息和系統,可以根據客户的業務定制 Amazon Q,企業中的營銷人員、項目經理以及銷售代表等,都可以利用 Q 進行定制對話、解決問題、生成内容、采取行動等等,據悉,亞馬遜雲科技即将帶來進一步的更新。
如果説大模型改變了雲計算行業的遊戲規則,那麼如今行業人士會發現,亞馬遜雲科技制定的遊戲規則,在更廣泛的層面還在發揮着作用。
OpenAI GPT 和 Google PaLM 足夠引人注目,但同時也為微軟 Azure 和谷歌雲制造了新的競争問題,市面上還有很多模型公司,Amazon Bedrock 為這些模型公司建立了一個相同的起點,客户得以同等體驗不同的模型。
在钛媒體 App 看來,亞馬遜雲科技不論是做雲還是做生成式 AI,其基本理念和邏輯如出一轍,所以亞馬遜雲科技不必搖擺去思考到底怎麼做、做什麼,而是直接按照第一性原理,做出最适合亞馬遜雲科技的 Amazon Bedrock。
早年 Andy Jassy 做雲計算的理念是—— " 将 IT 基礎設施細分到最小單元,讓程式員可以最大自由來選擇與組合 ",亞馬遜雲科技的确是這麼做的,到了大模型依然如此。
翻閲 Swami Sivasubramanian 在 Amazon Bedrock 剛發布時的觀點," 我們生活在一個機器學習非常激動人心的時代。我可能每年都這麼説,但是今年它甚至更特别,因為這些大型語言模型和基礎模型确實可以支持如此多的用例,在這些用例中,人們不必組建單獨的團隊來構建特定于任務的模型。機器學習模型開發的速度将真正提高。"
" 但在未來幾年裏,除非我們讓這些模型對每個人都更容易使用,否則你不會達到你想要的最終狀态。這就是我們在 SageMaker 早期的機器學習中所做的,這也是我們在 Bedrock 及其所有應用程式中需要做的。" 他説。
人工智能是比 IT 更復雜的技術堆棧,亞馬遜雲科技依舊兑現了此前的承諾,讓企業内的任何開發人員都能夠自由構建生成式 AI 應用,而無需關注復雜的機器學習或底層基礎設施,也讓人工智能成為到達雲計算應許之地的關鍵一躍。
(本文首發于钛媒體 App,作者 | 張帥,編輯 | 劉湘明)