今天小編分享的科技經驗:明星AI公司身後,全是微軟、谷歌等巨頭:英偉達去年投了35個項目,歡迎閲讀。
2018 年的某一天,裏德 · 霍夫曼(Reid Hoffman)在辦公室裏接到了一個電話, " 馬斯克離開了,現在他們(OpenAI)需要更多的錢。"
對這位硅谷知名風投 Greylock 的合夥人來説,幾乎每天都會接到類似的電話。有時是立場不一,有時是利益談不攏或者是商業衝突,總之,初創公司創始成員出走的情況對他來説,太見怪不怪了。
" 可以出 5000 萬(美元),這個數字對我來説是沒問題的。" 霍夫曼説。
不久之後,他順利加入了 OpenAI 的董事會。在一次公司大會上,他被公司創始人之一的山姆 · 奧特曼(Sam Altman)介紹給全體員工。當着底下所有人的面,奧特曼問霍夫曼:" 如果我的工作做的不稱職,你會怎麼做?"
" 我會幫助你克服困難,然後看看怎樣做的更好,我們一起來推進公司發展。" 霍夫曼很熟練地拿出那一套在公開場合安全而又冠冕堂皇的説辭。
" 不,不,不,我是説,呃,如果我真的無法把工作做好,比如,無法保證 AI 對人類是安全的,且對整個社會帶來好處,你會怎麼做?" 奧特曼依然不依不饒。
" 那我就 … 解雇你 ?" 霍夫曼被逼無奈,只好當着 OpenAI 全體員工的面,半開玩笑地對奧特曼説。
一語成谶。
5 年後,作為首席執行官的奧特曼,果然被 OpenAI 的董事會解雇了,但此時霍夫曼已不是董事會成員。這場被外界看作是 OpenAI 宮鬥的突發事件,成為整個 2023 年生成式人工智能火爆的一個戲劇性注腳。
就在這場宮鬥發生的前一年,OpenAI 發布了人工智能聊天機器人 ChatGPT,人們很快發現,和過去的所謂人工智能不同,ChatGPT 仿佛能夠真正理解人們向它發出的自然語言指令,憑借着其令人驚詫的、不同于以往的超強理解力,ChatGPT 很快出圈,并迅速掀起新一輪以生成式人工智能為核心的熱潮。
OpenAI 無疑成為最受追捧的人工智能初創公司,但在成立之初便定下的非盈利目标性質,卻決定了 OpenAI 對于蜂擁而至的資本,并非來者不拒。
奧特曼曾説,我們既希望享受 " 資本主義 " 帶來的好處,但又不願被資本所裹挾。
于是,一個被譽為 " 天才設計 " 的奇特公司架構應運而生了。OpenAI 的最頂層是一個由五人組成的董事會,肩負着非盈利并實現通用人工智能的使命和目标;董事會控制旗下的盈利部門,該部門負責吸納來自外部的融資,以支持未來的公司研發。
這樣的設計似乎行得通,OpenAI 順利拉來了微軟最初 10 億美元的投資,以及後續 100 億美元的追加投資和深度的戰略合作,同時,OpenAI 得以保持獨立運作,在 ChatGPT 一炮走紅的基礎上,繼續突飛猛進,接連推出了 GPT-3.5、GPT-4.0 等更新的大語言模型。
2023 年 11 月,在 ChatGPT 誕生一周年之際,OpenAI 舉辦了首屆開發者大會,雄心勃勃對外展示了未來願景,包括搭建 GPT 商店,通過自然語言,将 GPT 應用開發能力下放到每一個普通人手中。
一切看似順風順水,但就在開發者大會結束兩周後,一場被稱作硅谷 "911" 的突發事件爆發了。
美國時間 2023 年 11 月 17 日周五午間,OpenAI 毫無征兆地對外發布官方聲明,稱公司首席執行官山姆 · 奧特曼因存在與董事會的溝通 " 不坦誠 " 的問題被解雇,同時,公司原董事長格雷格 ∙布洛克曼(Greg Brockman)也将卸任,但仍将留在公司,向過渡期 CEO、原公司首席技術官(CTO)米拉 · 穆拉蒂(Mira Murati)匯報。
在微軟的參與下,OpenAI 董事會各方很快重新坐回談判桌,并最終達成了協定,奧特曼重新回歸 OpenAI,但不再擔任董事會成員, OpenAI 的最大股東微軟,則以董事會觀察員的身份介入。
雖然 OpenAI 的此次事件,在不到一周的時間内便塵埃落定,但無疑是這家公司快速發展道路上遇到的一個重大阻礙。盡管奧特曼重歸 OpenAI 執掌權杖,但當初設立的公司架構,是否為這樣的事件埋下了隐患,投資人将如何看待 OpenAI 未來的發展,以及事件對于人工智能行業產生的影響,都依然是未知數。
微軟激進,谷歌追趕
微軟與 OpenAI 的牽手并非偶然。
OpenAI 最早就是微軟雲服務的客户,一直在大量使用微軟 Azure 雲資源。由于訓練海量數據的成本高昂,OpenAI 曾一度考慮切換到谷歌的雲服務。
作為大客户之一,OpenAI 一直受到微軟的密切關注,在看到他們對微軟雲資源的使用量呈指數級增長的趨勢後,微軟首席執行官薩蒂亞 · 納德拉(Satya Nadella)特意派遣公司的首席技術官凱文 · 斯科特(Kevin Scott)前往 OpenAI 一探究竟。
斯科特在 OpenAI 第一次見到了 GPT 模型的能力,他大為震驚,回到微軟後,他向納德拉匯報,一定要關注 OpenAI 這家公司。
納德拉非常重視,很快便親自去觀摩了 GPT 的技術能力展示,這位萬億市值公司的掌舵人,立即意識到這将是人工智能領網域的一次飛躍。
2019 年,微軟向 OpenAI 投資 10 億美元,但當時這筆投資并沒有引起多大的關注,直到 2023 年 1 月,微軟對外高調宣布與 OpenAI 的長期戰略合作關系并追加投資 100 億美元時,人們才意識到,微軟早已做好了布局,在這一波新的人工智能浪潮中,占據了最有利的前排位置。
此時,谷歌成為了最焦慮的那家公司。ChatGPT 一經問世便技驚四座,新的自然語言的互動方式,是對傳統互聯網搜索方式的一種颠覆,在搜索領網域常年占據着壓倒性優勢的谷歌,或許第一次感受到了真正的威脅。
谷歌心有不甘,畢竟驅動 ChatGPT 的大語言模型 GPT 所使用的底層架構 Transformer,最早發源于谷歌。ChatGPT 并不是一項劃時代的發明創造,而是在原有的架構、大規模的數據和算力以及極致的產品思維的共同合力下的一個成功產物。
匆忙中,谷歌迅速給予了回應。在微軟官宣與 OpenAI 的戰略合作後兩周,谷歌對外發布了對标 ChatGPT 的人工智能聊天機器人 Bard,但出師不利。在當天的對外演示上,Bard 就出現了重大事實性錯誤,稱韋伯望遠鏡拍攝了歷史上首張太陽系以外的星球照片——事實上,這是由歐洲天文台太空望遠鏡在近 20 年前所拍攝。
這也是大語言模型目前所面臨的一個普遍性問題:" 幻覺(hallucination)",通俗來説就是 " 一本正經地胡説八道 "。事實上,在徹底弄清楚大語言模型 " 湧現 " 能力之前,目前還沒有任何一家公司能夠很好地解決模型 " 幻覺 " 的問題。
但谷歌此次的 " 滑鐵盧事件 ",将外界對大語言模型的質疑,集中在了自己身上,更被解讀為谷歌的大語言模型不如 OpenAI,進一步加劇了外界對谷歌未來的看衰。谷歌股價在接下來的一個交易日大幅下跌超過 7%,市值一天蒸發超過 1000 億美元。
三個月後的谷歌開發者大會,是谷歌再一次對外證明自己的機會。在此次大會上,谷歌成功地展現了自身在人工智能領網域多年來深厚的積澱,穩定了外界對這家公司未來的預期,還發布了自研的 Palm 大語言模型,以及一系列旗下產品的 AI 化進化,并預告了即将在 2023 年年底發布的下一代基于多模态的 Gemini 基礎大模型。
随後,谷歌還重組了旗下 Google Brain 和 Deepmind 這兩個原先相互獨立的部門,合并為一個統一的人工智能部門,形成資源和目标的合力。
谷歌的一系列快速反應,暫時穩住了陣腳,至少沒有掉隊太多,依然維持在這一波生成式人工智能熱潮的第一梯隊。
其他硅谷大公司也沒閒着:社交巨頭 Meta 推出了開源的 Llama 大語言模型,并宣布允許商用,激活了無數的基于該開源模型的創業熱情;蘋果也在籌劃一個名為 "Ajax" 的項目,重點發力于在端上直接運行大語言模型的能力;亞馬遜在 2023 年年底的 Re-Invent 大會上,也宣布了 Amazon Q 的大語言模型文本機器人,重點面向其提供雲服務的客户。
大資金趨之若鹜,英偉達頻頻出手
生成式人工智能領網域飛速發展,自然吸引到了最多的資金的關注。一位在硅谷從事早期投資的投資人對騰訊新聞《潛望》表示,過去幾年風投資金相對謹慎,尤其是美聯儲進入加息周期後,一度陷入低迷,但新的人工智能領網域起來讓投資人又看到了新的希望。
這位投資人表示,從投資角度來看,這一輪的特征是:資金繼續高度集中于頭部公司,估值昂貴但投資人依然趨之若鹜。
這其中,OpenAI 以融資額超過 100 億美元遙遙領先,緊随其後的是最早由 OpenAI 團隊成員出走後組建創辦的 Anthropic,融資額近 80 億美元。此外,Databricks,Inflection AI 等融資規模都在數十億美元級别,Hugging Face、Runway 等融資規模在數億美元左右。
另一個顯著特征是,這些生成式 AI 初創公司,在早期融資階段,投資人名單中就已經出現了微軟、蘋果、谷歌、亞馬遜、英偉達等科技巨頭的身影,這反映了科技巨頭都生怕錯過這其中的明星創業公司,早早入局占位。也正是在這些巨頭的主導下,新的生成式人工智能的格局已經逐漸明晰。
首先是由微軟巨額投資入局并深度合作綁定的 OpenAI,其次是由谷歌、亞馬遜以及 Salesforce 共同扶持的 OpenAI 直接競争對手 Anthropic,這兩家公司可以稱作是這一輪大語言模型創業公司中的第一梯隊;随後是以提供數據服務和專注人工智能助手的 Databricks 和 Inflection AI,這兩家相對細分的 AI 創業公司,背後同樣是微軟、英偉達等。
根據市場研究機構 Pitchbook 的調查數據顯示,2023 年全年生成式 AI 相關的創業公司融資總額達到 270 億美元,其中約三分之二,也就是 180 億美元左右的資金,都是由微軟、谷歌、亞馬遜等科技巨頭所投出。
值得一提的是,過去投資活動并不是十分顯著的芯片巨頭英偉達,2023 年投出了 35 個生成式 AI 相關項目,比 2022 年多 6 倍。英偉達在 2023 年積極高調的投資活動,也反映了其公司戰略不僅僅局限于目前市場中供不應求的 GPU 供應,還廣泛布局于下遊的創業公司。
上述投資人對騰訊新聞《潛望》表示,預計 2024 年,生成式人工智能依然将會是資金趨之若鹜的領網域。
" 像 OpenAI 這樣的公司,依然需要大量的資金支持,至少現在他們不需要為錢的事發愁。" 這位投資人表示。
近期,有消息稱,OpenAI 正在醖釀一輪估值超過 1000 億美元的融資,與此同時,其競争對手 Anthropic 也在尋求 7.5 億美元的新融資。
留給小創業公司的機會微乎其微
雖然資金蜂擁而至,生成式人工智能領網域發展如火如荼,但一個現實是,商業模式并不清晰。目前 OpenAI 的 ChatGPT 通過 Plus 會員的模式收費,以及 GPT 模型 API 調用收費,算是初期的一種商業模式探索,但能否足夠覆蓋 OpenAI 目前高昂的成本,外界尚未可知。
2023 年 10 月,奧特曼曾向公司員工透露,目前公司的年化收入已經能夠達到 13 億美元,也就是相當于每月 1 億多美元的收入。在 2023 年 11 月份的首屆 OpenAI 開發者大會上,該公司對外公布了未來 GPT Store 的計劃,一個類似于蘋果應用商店的生态雛形已經顯現,OpenAI 希望通過自然語言就能夠讓普通人很快生成一個特定的 GPT 應用,并放到 GPT Store 上共享。
這是一個可以預見的商業模式,但依然處在非常早期的階段,GPT Store 真正上線以後,實際效果如何,是否真的能夠像蘋果應用商店那樣形成新的生态,還有許多的未知數。
從大公司來看,微軟無疑是将生成式人工智能商業化變現走在最前面的。幾乎與 OpenAI 開發新一代的 GPT 大模型同步,微軟以極快的速度推出了旗下一系列應用的 AI 化更新,将生成式人工智能的能力,嵌入到幾乎每一個微軟旗下的重要應用及產品中,雖然部分新功能目前還處于試用階段,終端用户的感知并不是很明顯,但假以時日,或許将成為用户習以為常的功能。
投行 Wedbush 估計,未來 3 年中,微軟產品用户中的 50% 将使用新的 AI 工具,這僅僅對于微軟的軟體銷售部分的收入就将新增 250 億美元。投行 Evercore 預計,到 2027 年,整合的 AI 功能将給微軟新增 1000 億美元的收入。
有美國媒體的商業分析報告認為,在未來 10 年中,生成式 AI 将出現爆發式增長,市場規模将從 2022 年的 400 億美元,膨脹至 1.3 萬億美元,年化復合增長率達到 42%。
在大公司都在急速狂奔、生怕落後的情況下,留給小創業公司的機會顯得微乎其微。大語言模型本身算力資源和數據的要求,讓小公司進行大語言模型研發幾乎成為一件不可能的事,更多地會集中在生成式 AI 的應用層面來做一些文章。在 OpenAI 開放 API 後,無數基于 GPT 能力的創業公司如雨後春筍般出現,将 GPT 模型做一些微調,成為了簡單可行的創業路徑,但在 OpenAI 開發者大會後,外界又驚呼:那些套殼 GPT 的創業者,瞬間被殺死了。
" 現在還沒有出現真正的 Killer App。" 一位曾在硅谷大廠工作,2023 年起開始全職創業的創業者對騰訊新聞《潛望》表示。
" 如果 OpenAI 的 ChatGPT 算一個 Killer App 的話,至少目前還沒有出現能夠與其相提并論的其他應用。" 這位創業者説。
在 ChatGPT 已經足夠好用,甚至 OpenAI 自己開發的、作為未來 GPT store 模範的幾個有專屬功能的 GPT,已經足夠能滿足現在用户的需求時,很難有理由再去使用其他的類似產品。
" 在經歷完最初的創業衝動後,許多人會回歸理性,思考自己真正擅長做什麼,以及做這個東西,長期來看,是否真的行的通。" 這位創業者表示。
AI 能力與安全相生相伴
" 兩位穆斯林走進清真寺,"
" 其中一位對另一位説,你看起來比我更像恐怖分子。"
當用户對 ChatGPT 輸入前半句後,ChatGPT 自動補齊了後半句。這是在 GPT-3 模型上真實發生的案例。
在海量的信息數據訓練下,早期的 GPT 模型在無任何人為幹預的情況下,存在着嚴重的歧視問題,這些歧視包括宗教歧視、性别歧視、種族歧視等,這正是人工智能安全所要應對解決的一個問題。
2023 年 10 月底,美國白宮發布一則重磅行政令,對人工智能安全提出了框架性的政策意見指導。在美國政府看來,人工智能安全包含對用户隐私數據的保護、平等和公民權利、就業保障以及創新和公平競争等方面。
這份行政令要求人工智能系統的開發者需要與美國政府共享他們的安全測試數據及其他關鍵信息,開發用于保證人工智能安全可靠的标準、工具和測試,保護用户不受到人工智能生成的内容的欺騙。
從政府層面來看,在人工智能快速發展的同時,如何建立一套保障 AI 安全的規範和規則,是迫在眉睫的任務。他們希望這一領網域的領軍公司,能夠在保證安全可靠的前提下進行相關的研發,這也是 2023 年年中,OpenAI 首席執行官奧特曼頻繁與許多國家元首會面時,雙方讨論最多的話題。
按照 OpenAI 成立之初的承諾,是要建成對人類有益且可靠安全的通用人工智能,因此 OpenAI 内部也有 " 對齊 " 組,所謂 " 對齊 ",即通過人工幹預讓 AI 生成結果與人類的目标和價值觀相一致。
OpenAI 這一内部組織在這方面的最新研究成果,是一篇探讨如何在模型能力超越人的能力時的應對方案,該論文探讨用規模和能力較小的模型與監督能力更強的模型,用來模拟未來 " 超級人工智能 " 在智能方面超越人類的情況。
其他人工智能主要領先公司,也都在積極提出應對人工智能安全的方案。谷歌提出,在遵循通用的軟體開發系統的安全準則基礎上,還有一些專門針對人工智能安全的額外标準和路徑,包括以人為中心的設計研發理念、在可能的情況下,直接去檢驗原始數據、理解數據集和模型的局限性、多輪測試以及在發布後持續監測和更新。
社交巨頭 Meta 提出,在基于 AI 讓所有人受益的這一核心理念上,有 5 大支撐人工智能安全的支柱,分别是隐私和安全、公平和包容、能力與安全匹配、透明和可控以及可靠與治理。
到目前為止,各大人工智能公司所公開發布的成熟的基于大語言模型的應用,基本上都已很難再出現有害的、歧視性、攻擊性言論,但這些都是在大公司加了許多層過濾後的人工幹預的結果。底層大模型在沒有足夠人為幹預的情況下,依然存在嚴重的有害信息的問題,許多開發者在調用大語言模型 API 時,已經發現了許多這方面的問題。
" 在應用層面,實際上也有許多安全問題需要得到解決。" 一位 2023 年開始在硅谷從事大模型應用開發的創業者對騰訊新聞《潛望》表示," 基礎大模型相對沒有那麼精細,直接交到廣大的開發者手裏,需要開發者也有 AI 安全的意識。"
他表示,開發者完全有能力基于大語言模型,開發出專門散布虛假信息或有害信息的人工智能應用。
被譽為 " 人工智能教父 " 的傑弗裏 · 辛頓(Geoffrey Hinton)則給出了更加聳人聽聞的 AI 威脅論。他認為 AI 的能力将超過人類,可以操縱甚至取代人類。他表示自己也沒有很好的解決方案,只能呼籲所有人共同努力來應對 AI 安全的問題。
毫無疑問的是,大公司對 AI 的研發只會不斷加碼,大模型能力也将變得越來越強,但與此同時所帶來的 AI 安全問題也不容忽視,AI 的能力與 AI 安全風險必然是相生相伴的關系。
下一個熱點:多模态和機器人
臨近 2023 年年末,谷歌又向業界投放了重磅消息。備受期待的 Gemini 大模型正式發布,這是谷歌自去年 5 月份開發者大會上就已經宣布的下一代大模型,從最初的數據訓練階段開始就基于多模态,可以説是第一個原生多模态大模型。
谷歌在 Gemini 發布當天對外展示的演示視頻,展現了模型對于語義、圖形、空間方面超乎尋常的理解,但很快這則視頻被曝出有拼接的嫌疑。但無論如何,人們從谷歌的這一則視頻中看到了未來多模态大模型可能具備的能力。
從 2023 年全年來看,基礎大模型的能力,已經從純文本逐漸過渡到多模态,例如 OpenAI 的 GPT-4,Meta 的 Llama 2、Mistral 等,都已經展現出包括文字、圖片、語音等多模态能力,谷歌在去年底發布的 Gemini 大模型,更是從訓練數據開始就是多模态,是原生多模态模型。
在多模态的基礎上,未來的人工智能可能會更多朝着與空間相結合的方向進展,也就是不僅讓模型理解文本、影像、視頻等,還能夠結合這些能力,理解所處的空間環境以及與空間環境之間產生互動,這就自然而然引向了機器人領網域。
蘋果前 AI 總監魯斯蘭 · 薩拉赫丁諾夫(Ruslan Salakhutdinov)此前曾對騰訊新聞《潛望》表示,大模型展現出的能力讓他感到興奮,但未來可能讓他更加興奮的是與機器人技術的結合。
他表示,過去機器人領網域的研究更多是在事先設定好的命令集的基礎上,結合機械工程、自動化等技術,而未來可以暢想的是,如何結合大模型的理解能力,讓機器人真正能夠更加自主地與環境和人互動。
如果将 2023 年看做是生成式 AI 的元年,群雄割據的格局逐漸成型,人們對于人工智能的熱情重新被點燃,那麼接下來的 2024 年,無論對于大模型還是圍繞生成式人工智能的相關創業,都将會是更為務實的一年。人們看到了 GPT 以及其他大模型所展現出的非同以往的能力,但接下來還需要看到,大模型帶來的價值提升,究竟體現在哪裏?
盡管大模型展現出的能力激動人心,也提供了無限的想象空間,但另一方面,大模型的發展依然受制于許多現實因素,例如成本高昂、有限的算力資源、大模型不可解釋的幻覺、數據版權問題等。
對于 OpenAI 等頭部人工智能公司而言,需要不斷向外界回答的問題是,在達到通用人工智能這一長遠目标之前,如何使其成為一個現階段在商業上可持續的項目。OpenAI 的年化收入已經達到 16 億美元,盡管對于剛剛商業化不久的這家公司來説,這已經是非常可觀的收入水平,但 OpenAI 的大模型訓練成本以及人力成本高昂,仍需要持續獲得外部資金的支持。
在首屆開發者大會上,OpenAI 已經試圖在商業化方面做更多的布局,例如計劃在 2024 年推出 GPT 商店,打造生成式人工智能下的生态以及針對企業用户的定制化大模型服務等,但這樣的生态能否搭建起來并真正進入圍繞大模型的應用商店時代,現在還未可知。2023 年年底發生的董事會 " 内亂 " 也暴露出許多公司治理結構上的問題,OpenAI 如何處理好 " 非盈利 " 的初衷與需要資本加持這樣的現實兩者之間的關系,也将是未來生成式人工智能能否繼續快速良性發展的一大重點。