今天小編分享的科技經驗:Claude 3 暴打 GPT4 時,亞馬遜雲科技露出了「神秘微笑」,歡迎閱讀。
在 OpenAI 正在熱火朝天地跟 Musk「扯皮」,Gemini 因為在影像中加入過量「多元化」導致政治過于正确而深陷泥潭之時,Anthropic 帶着 Claude 3 模型家族仿佛橫空出世般,殺了個措手不及。
這次「新王登基」究竟籌劃了多久?Anthropic 是 Amodei 兄妹在 2021 年創建的獨角獸公司——一家崇尚安全和以人類為中心價值觀的 AI 公司(這在價值觀方面與 OpenAI 有着不一樣的願景),核心創始團隊均來自 OpenAI 并參與了 GPT-3 產品的早期開發。
Anthropic 創立之初就在亞馬遜雲科技上訓練了他們的第一個基礎模型,然後 Claude 2.1 迭代到 Claude 3, 就只用了短短 4 個月,Claude 3 發布後第一時間,Sonnet 模型就在 Amazon Bedrock 上支持使用,僅僅 9 天後的今天 Haiku 也在 Bedrock 上線。而時至發稿谷歌雲上 Claude 3 仍然是 preview 和 coming soon 狀态,而谷歌雲的 Vertex AI 的產品欄仍然把前排位置都給了 Gemini。
去年亞馬遜雲科技的 re:Invent 上,當時大家就很莫名其妙的發現,亞馬遜雲科技 CEO Adam Selipsky 采訪了一位名不見經傳的創業者 Anthropic 聯合創始人 Dario Amodei,而以往這個位置是要留給可口可樂、納斯達克、高盛這種大客戶的。也沒有太多媒體關注到當時戰略合作的具體内容:Anthropic 把大部分軟體遷移到亞馬遜雲科技的數據中心,亞馬遜雲科技為 Anthropic 提供從定制化的 GPU 算力到存儲、數據分析等多方位支持,而且亞馬遜雲科技的客戶将獲得 Anthropic 模型的優先使用權。而且這個戰略合作的「定制化程度」莫名其妙的高:1、大模型全托管服務 Amazon Bedrock 為 Claude 提供定制化服務;2、為 Claude 優化亞馬遜雲科技自研芯片——不斷優化訓練芯片 Trainium 和推理芯片 Inferentia。顯然,當時我們都沒注意到,Dario 的措辭異常的霸道:「這是一場『力争上遊』的競賽(a race to the top ) 。」
是一盤投資大棋?
其實,在 re: Invent 之前 2 個月,也就是去年 9 月,亞馬遜才宣布對 Anthropic 投資 40 億美金,是 Google 對 Anthropic 投資的 2 倍。業内對這次投資的評價是:顯示了「金主爸爸」對 Anthropic 的強大信心,也說明了亞馬遜在「生成式 AI」領網域的破釜沉舟和孤注一擲。真的是這樣嗎?雖然 Anthropic 這 40 億美金的投資非常炸裂,但你打開亞馬遜雲科技的網頁一看 Amazon Bedrock 上還有另外 17 個高性能基礎模型!這 17 個模型來自于 6 家公司:AI21 Labs、Cohere、Meta、Mistral AI、Stability AI,而第六家雖然是亞馬遜自己,但 Titan 似乎反而在刻意讓位。
AI21Labs – 2 個模型,Jurassic-2 Ultra、Mid,這是個針對多語種的大語言模型,包括葡萄牙語、意大利語和荷蘭語。
Cohere – 4 個模型,是針對檢索和匯總信息的大語言模型,主要是用于提取摘要、文案聚類或分類任務。
Meta – 2 個開源模型,亞馬遜雲科技是首個集成 Facebook 的 Llama 2 的雲廠商 , 這是個開源模型,目前中國區可用,好處就是客戶可通過 Amazon SageMaker 對 Llama 2 進行微調。
Stability AI – 2 個模型,主要是針對影像生成功能。
Mistral AI – 2 個高性能模型,這是一家法國的 AI 公司,大模型的基本場景均可覆蓋。
另外,還有 Amazon 自研的 5 個模型。
Amazon Bedrock 的吸引力,除了大模型多,還在于,它能評估和比較具體應用場景的最佳模型;用專屬數據庫來訓練最适合自己的大模型,比如組織内各種縮寫、各種名詞、各種流程,訓練之後讓它具有專屬于自己的「默契」;開源的大模型,都還可以自己再次調優;Agents for Amazon Bedrock,還能在确保數據安全和隐私保護的情況下執行業務指令,Guardrail 能對最終的生成式 AI 應用提供專屬的保護措施。
于是 Amazon Bedrock 的「工程化的能力」,讓它在圈内被打上了「好用」的标籤。
但是,問題來了:
1、亞馬遜雲科技為什麼要上這麼多種模型?根據亞馬遜雲科技自己的官方說法,已經從全球 100 多個客戶使用生成式 AI 的真實場景中發現:沒有某個基礎模型可以統治一切,甚至一個使用場景需要調用多個模型,而且要綜合考慮價格。在亞馬遜雲科技看來,問題就從「選哪個模型更好」已經變成了「如何輕松訪問」,所謂「輕松訪問」,是指低多次嘗試和切換模型的成本。有企業開發者說:「現在大模型的數量太多,來回切換和嘗試不同的大模型一點也不智能,Amazon Bedrock 就一個「call」,想調那個調那個。而且什麼任務都調用龐大的大模型,成本高,也承受不起。」
2、模型多,可以。但亞馬遜雲科技為什麼不主推自己的模型?
有一條時間線很能說明問題,Bedrock 發布的時間是 2023 年 4 月,像 Meta(23 年 7 月上線)、Cohere(23 年 7 月上線)、Mistral AI(24 年 2 月底上線)這些「明星」AI 公司的大模型都是在 Bedrock 發布之後才陸續登陸這個平台。也就是說,亞馬遜雲科技從一開始就賭定了「淘金熱裡賣鏟子」這一賽道。
或許,除了永遠沉迷于客戶需求(亞馬遜稱之為「Customer Obsession」),更重要的原因就是:雲計算平台,原本就應該是個「集市」,Market Place,而一個公共的基礎設施重要的是能夠為優質的入住玩家提供更好的服務——雲計算是工程化的「商場」服務——這才是本質。
投資生成式 AI
只是買買買嗎?
看到擁有強大功能的 Amazon Bedrock 和 17 個領先的基礎模型,你以為布局生成式 AI 只是在市場上買買買嗎?不!你想買空市場所有存貨,人家還不見得想讓你投呢,為什麼?因為你的基本盤「技術底座」不行。生成式 AI 是非常燒錢的行業,成本主要包括算力、算法和數據三個方面。當我們把更多的目光投向算法的時候,總是容易偏頗的忽略算力。這是亞馬遜雲科技 最具有競争力的部分。
引用 VentureBeat 的報道:「亞馬遜雲科技正在生成式 AI 領網域進行全棧式布局,包括雲基礎設施、基礎模型和面向用戶的應用。」
亞馬遜雲科技在生成式 AI 的「全棧式」布局:最底層是訓練和推理的基礎設施層,各類超級芯片(自研 +NVIDIA ) 為基礎模型訓練和推理提供超級算力;中間層是以 Amazon Bedrock 為主的模型全托管服務;上層是生成式 AI 應用層,包括生成式 AI 助手 -Amazon Q 和 AI 編程助手 Amazon CodeWhisperer。
這樣看來,亞馬遜雲科技正在憑借着極其穩固的基本盤,與像 Anthropic 一樣的大模型「先鋒」,在玩一場雞生蛋、蛋生雞的遊戲——或許這就是貝索斯的飛輪效應:貨多了 - 場活了 - 人多了 - 場大了 - 貨便宜了 - 人更多了 - 場更大了……
看懂了亞馬遜雲科技在生成式 AI 這場浪潮裡的獨特占位,我就一直試圖找到亞馬遜雲科技挑選大模型的标準:既然選了很多,又沒有都選,那标準是什麼?有一個詞反復的跳出來,吸引了我的注意力「Constitutional AI」,它的直譯是「憲法 AI」。官方給出的解讀是:亞馬遜雲科技強調幫助企業建立公正、可解釋、穩健、透明、可治理、确保隐私與安全的「負責任的 AI」。在字裡行間的反復暗示中,我發現這個詞的正确解讀,不應該是它是什麼?而是它不是什麼——它不是 General AI。或者說,它不是一個比照人、超越人、無所不能的人造上帝。具體來說,确保用戶用自定義模型将數據保留在客戶自己的企業内網,任何數據都不會用于訓練底層模型。這會不會是亞馬遜雲科技挑選大模型的标準?我并沒有得到亞馬遜雲科技的官方回應。
結尾
在大家都在卷自建大模型的時候,亞馬遜雲科技更傾向于為大模型提供「淘金的鏟子」——作為雲計算的開創者、迄今為止雲計算領網域的老大,亞馬遜雲科技在生成式 AI 時代的戰略占位、對「雲是公共服務」這一本質的認知邏輯,值得我們今天中國雲計算廠商思考。沒錯,公共服務是規模效益,公共服務是穩定第一,公共服務是成本降低、價格下降,但這只是結果,前提是絕對優秀、值得信賴的工程化能力。
其實,本質上,亞馬遜雲科技是在憑借平台優勢的一己之力,卷更多的大模型。它不是不卷而是卷更多
那麼就還有最後一個「看似顯而易見,但深究卻不得其所」的問題:為什麼雲廠商都在卷大模型?是怕生成式 AI 另辟賽道搶了雲計算的風頭嗎?顯而易見,是因為業内人士會認為這是個偽命題,大模型根本無法離開算力。
那雲計算廠商,究竟在卷什麼?
2022 年,亞馬遜雲科技的 re: Invent 上的一個概念或許給出了回答「Data Gravity」,它的基本理念是指:數據在哪裡,資源就在哪裡,趨勢就在哪裡。數據就像具有引力一樣,吸引着一個又一個的技術潮流奔向它,比如 2021 年的 Data Lake。這句話放在今天的生成式 AI 同樣成立。
過去經常提到「數據驅動型」(Data-driven),數據驅動型企業、數據驅動型決策、數據驅動型應用、數據驅動型硬體設計……我們過去更多的關注到了「數據」倆字,或許更重要的是「驅動」,數據如何「驅動」?就是今天強大的 AI。說到底,雲廠商從誕生的那一天起,就已經清楚的知道數據、AI、雲缺一不可。草蛇灰線伏延千裡,今天的生成式 AI 其實一直在那裡,這盤大棋一直在下。我們看的是熱點,他們早就看到了自己宿命的未來。
參考資料:
https://www.amazonaws.cn/en/newsroom/2023/global-1130-bedrock/?searchQuery=bedrock&tag=search&targetPage=MARKETING_OTHERhttps://mp.weixin.qq.com/s/C7EEI73oK24rnt2-lk0eKAhttps://mp.weixin.qq.com/s/To9muQObT_LF7vTjq2rACw https://venturebeat.com/ai/amazon-adds-gpt-4-beating-claude-3-to-bedrock/
* 頭圖來源:亞馬遜雲科技