今天小編分享的科技經驗:OpenAI最強“企業版”炸場,B端大模型市場會“赢家通吃”嗎?,歡迎閱讀。
速度翻倍、安全加密、調用 GPT-4 無上限,今天凌晨,OpenAI 官宣的企業專用版 ChatGPT 堪稱 " 最強 ChatGPT 版本 "!
同普通版 ChatGPT 相比,企業版性能更加強大,包括:提供無限制的 GPT-4 訪問,速度提升 2 倍,支持無限制高級數據分析,支持可用于 4 倍輸入和檔案的 32k Tokens 上下文視窗,提供可共享的聊天模板和免費的 API 接口、保證企業的數據隐私和安全等。
除了目前适合大型企業的版本之外,OpenAI 還将很快推出适用于各類小型團隊的自助式 ChatGPT Business 產品,服務于所有規模和類型的組織。也就是說,從今天開始,OpenAI 已然吹響了向 B 端市場全面進攻的号角。
自然,這就帶來了一個問題:面向企業的 B 端 AI 大模型市場,會 " 赢家通吃 " 嗎?
最近,美國光速創投 ( Lightspeed Venture Partners ) 合夥人 Guru Chahal 深度分析了這一問題。
作者認為,B 端最有可能的路徑,是企業在探索階段使用大型模型,随着在實際使用中對大模型理解的加深,逐漸轉向生產階段使用更小型、專業化(調整 + 精煉)的模型。
Chahal 還提到了企業在選擇模型時需要考慮的因素,以及 AI 基礎設施的發展機遇,包括評估框架、模型運行與維護、增強系統、運維工具、數據利用等各個方面。
文章幹貨很足,相信對想了解 B 端 AI 市場、AI 基礎設施、未來機遇等方面的朋友一定大有裨益。
以下為全文内容,大家 enjoy~ ✌️
目錄:
● 大模型生态系統分類
● 将用例與模型匹配
● 未來機遇在何方
在過去的十數年裡,作為 Lightspeed 團隊一員,我親歷了人工智能和機器學習領網域的驚人創新,這主要歸功于我們與卓越創業者的深度合作。
現在,我們與他們的公司、所構建的平台,以及服務的客戶進一步合作交流,以便更系統地了解企業如何思考生成式 AI。
具體來說,我們深入探究了大模型生态系統,嘗試探讨諸如 " 性能最強大模型是否會赢家通吃?"、" 企業在使用時是否會一味依賴 OpenAI 的 API,還是選擇更加多樣化的實際用例?" 這一類問題。
這些問題的答案,将決定該未來大模型生态系統的增長方向,以及算力、人才和資金的流向。
大模型生态系統分類
根據我們的研究,我們認為,人工智能領網域正在經歷一次 " 寒武紀式 " 的模型大爆發。未來,開發者和企業将根據實際需求選擇最适合的模型,盡管在探索階段的使用的可能更加集中。
B 端最有可能的路徑,是企業在探索階段使用大型模型,随着在實際使用中對大模型理解的加深,逐漸轉向生產階段使用更小型、專業化(調整 + 精煉)的模型。
下圖展示了我們對基礎模型生态系統演化的看法。
我們認為,人工智能模型領網域可以分為三個主要、但又有些交叉的類别:
類别 1:巨腦模型
這些是最優秀的模型,也是模型領網域的先驅。它們產生了令人驚嘆的演示效果,深深吸引了我們的注意。當開發者試圖探索人工智能對其應用的潛力極限時,這些模型往往是默認的起點。
這些模型的訓練成本高,維護和擴展復雜。但同一個模型可以應對法學院入學考試(LSAT)、醫學院入學考試(MCAT),撰寫高中論文,并像聊天機器人朋友一樣與你互動。目前,開發者正在這些模型上進行實驗,并評估在企業應用中的人工智能使用情況。
需要注意的是,這些模型的使用成本高,推理延遲較大,并且在明确定義的受限用例中可能過于復雜。
同時,這些模型是通用模型,可能在專業任務上不夠準确(例如,參見康奈爾大學等的綜合研究)。
而且,它們也是黑匣子,可能給企業帶來隐私和安全挑戰,企業正在探索如何在不洩露數據的情況下利用這些模型。
OpenAI、Anthropic、Cohere 都屬于這一類别。
類别 2:挑戰者模型
這些模型同樣具有高能力,僅次于領先模型。Llama 2 和 Falcon 是這一類别中的佼佼者。它們通常與類别 1 模型中的 "N-1" 或 "N-2" 模型一樣優秀。
據某些基準測試,Llama 2 甚至與 GPT-3.5-turbo 相媲美。通過在企業數據上進行調整,這些模型在特定任務上的能力可與類别 1 中模型相當。
其中許多模型是開源的(或非常接近)。一旦發布,它們往往會被開源社區迅速改進和優化。
類别 3:長尾模型
這些是 " 專家 " 模型。它們專為特定目标構建,例如對檔案進行分類、識别影像或視頻中的特定屬性、識别商業數據中的模式等。這些模型靈活,訓練和使用成本低,可以在數據中心或邊緣上運行。
僅需浏覽 Hugging Face,即可窺見這一生态系統的廣度之大,未來還會因為它為各種用例提供服務而不斷擴大!
将用例與模型匹配
盡管尚處于早期階段,但我們已經看到一些領先的開發團隊和企業開始以這種精細的方式思考這個生态系統。他們渴望将用例與最适合的模型匹配,甚至可能在更復雜的用例中使用多個模型。
在選擇使用哪個 / 哪些模型方面,通常會考慮以下因素:
a. 數據隐私和合規要求,這會影響模型是在企業基礎架構中運行,還是數據可以發送到外部托管的推理終端。
b. 能否對模型進行微調對這個用例是否至關重要或者強烈希望進行微調。
c. 期望的推理 " 性能 " 水平(延遲、準确性、成本等)。
實際清單通常比上述内容更長,反映了開發者希望利用人工智能解決的各種多樣用例。
機遇在哪裡
這一新興生态系統產生了幾個重要影響:
① 評估框架:企業将需要工具和專業知識,來評估哪個模型适合哪個用例。
開發者需要決定如何最好地評估特定模型是否适合 " 所需工作 "。評估需要考慮多個因素,不僅包括模型性能,還包括成本、可以行使的控制水平等。
② 運行和維護模型:預計将出現用于幫助企業訓練、微調和運行模型的平台,特别是第三類長尾模型。
這些平台過去通常被稱為 ML Ops 平台,我們預計這個定義将擴展到包括生成式人工智能。Databricks、Weights and Biases、Tecton 等平台正在迅速朝這個方向發展。
③ 增強系統:模型,特别是托管的 LLM(檢索增強模型),需要通過增強生成提供卓越的結果。
這涉及做出次級決策,包括:
o 數據和元數據攝取:如何連接結構化和非結構化的企業數據源,然後攝取數據以及關于訪問策略等方面的元數據。
o 生成和存儲嵌入:選擇用于為數據生成嵌入的模型。然後,如何存儲這些嵌入:根據所需性能、規模和功能選擇哪個向量數據庫?
在這裡,存在機會來構建面向企業的 RAG(檢索增強生成)平台,以簡化選擇和組合這些平台所帶來的復雜性:
① 運維工具:企業 IT 部門需要為工程團隊建立監管措施,管理成本等。
與今天為軟體開發所做的所有工作一樣,他們需要擴展這些任務,以包括人工智能的使用。IT 感興趣的領網域包括:
o 可觀測性:模型在生產環境中的表現如何?它們的性能是否随時間改善 / 惡化?是否存在可能影響未來應用程式版本中模型選擇的使用模式?
o 安全性:如何确保 AI 本地應用程式的安全性。這些應用程式是否容易受到新的攻擊方式的攻擊,需要新的平台?
o 合規性:我們預計 AI 本地應用程式和 LLM 的使用将需要符合相關主管機構已開始制定的框架。這是除了隐私、安全、消費者保護、公平性等現有合規性制度之外的。企業将需要平台來幫助他們保持合規性、進行審計、生成合規性證明等相關任務。
② 數據:預計将迅速采用幫助企業了解其數據資產以及如何通過使用新型人工智能模型從這些資產中提取最大價值的平台。
正如地球上最大的軟體公司之一曾對我們說的那樣," 我們的數據是我們的壕溝,我們的核心 IP,我們的競争優勢。"
通過利用人工智能将這些數據貨币化,以一種在不削弱防御能力的情況下推動 " 差異化 " 的方式,将是關鍵。Snorkel 等平台在其中發揮着關鍵作用。
我們認為,現在正是構建人工智能基礎設施平台的絕佳時機。
盡管人工智能的應用将繼續改變整個行業,但要想使每個企業都能采用這一強大技術,就需要支持基礎設施、中間件、安全性、可觀測性和操作平台。
本文來源:硬 AI