今天小編分享的科技經驗:開源大模型LLaMA 2會扮演類似Android的角色麼?,歡迎閲讀。
圖片來源 @視覺中國
文 | 李智勇
在AI 大模型沒有商業模式?等文章中,我多次表達過這樣一個觀點:不要把大模型的未來應用方式比喻成公有雲,大模型最終會是雲端作業系統的核心(新通用計算平台),而它的落地形式會很像過去的沃森,以系統型超級應用的形态落地。假如真的這樣,那無疑的就需要一個開源的、便宜的 " 安卓 " 來真正啓動這種落地。沒想到的是這還沒過去一個月,LLaMA 2 出現了,并且表現優異。那 LLaMA 2 會在 AI 行業裏扮演移動互聯網中安卓的角色麼?
安卓與歷史性時刻
整個移動互聯網有兩個至關重要的歷史性時刻:一個是 iPhone 的發布,這伴随着喬布斯而載入史冊;一個則是同年 Android 的發布,相比之下這個則有點默默無聞。但實際上對于移動互聯網而言,後者的實際影響大于前者。每年全球手機銷量裏面 15% 左右為蘋果手機,其它基本是安卓手機。
換句話説,沒有安卓就沒有移動互聯網。
那安卓這類作業系統到底是什麼?為什麼這麼關鍵?我們來簡單科普下作業系統的概念。
( 作業系統最簡示意圖 )
這個圖不十分精确,Kernel(内核)那個位置通常還有非常復雜的各種模塊,但好在它能清楚説明作業系統是什麼。安卓就處于中間的 Kernel 那個位置,對上面的各種應用比如微信、抖音來講,他們其實根本接觸不到麥克風、攝像頭、内存、網絡等,所有對具體物理設備的使用都要通過安卓這樣的系統。
這樣的分工好處是什麼呢?
降低開發和應用成本。在 IT 行業的早期沒有上面的分工,通常都是一個公司(比如 IBM)把所有事都幹了。這就導致對人員要求非常高。純粹從技術復雜度角度看開發一般終端應用的難度如果是 1,那很多作業系統裏模塊的開發難度估計是 10,并且兩者的難度不在一個維度上。同時作業系統只有 1 個,但應用會有無數個(安卓 -- 應用商店)。所以就需要一種更為高效的分工方式,于是行業再分工,作業系統出現了。
高效的分工體系才能導致整個生态的大發展,對于移動互聯網安卓就是生态大發展的最關鍵支點。如果微信團隊需要自己做安卓,那很可能我們就看不見微信了。
如果説技術意義上的作業系統是上面那張簡圖,那商業意義上的作業系統則是一個引擎,為所有應用提供動力,縮減它們的開發成本、縮短周期。
大模型扮演的就是這個角色,但如果它只有一個(chatGPT),并且只是 OpenAI 自己用,那就像只有 iOS 一樣,根本就造不出來五花八門的手機,也就不會有移動互聯網的真正啓動。
過去基于 chatGPT 根本沒法打造沃森這樣的系統,各種數據風險的考量根本不是一個技術進步就能對衝掉的,誰願意把數據都上傳到 OpenAI 呢,誰願意依賴一個完全不知道的黑盒呢!
但在過去别的大模型又太差了,LLaMA 2 在改變這種局面,從評測看它基本趕上 GPT3.5,, 也就是説在創造價值的維度它變的能用了,在落地的維度又因為開源而能對衝風險上的顧慮。再發展下去就真的會變成一個新智能生态的引擎,類似安卓的角色。
在前面系列文章裏面也曾經多次提到我們普遍的看待大模型的方式是有問題的。如果就看到技術和能力,而看不到它的落地需要一套復雜系統做支撐,那就搞不清它的真正價值創造方式,就會争論是屁胡還是什麼,但其實并不對。
人工智能應用會大爆發麼?
如果評測結果無誤,那現在就需要開始在不同的領網域打造一個個類似沃森的系統。否則可能就晚了。
大模型很關鍵,提供了打造智能型應用的機會,但就像移動互聯網上真正有價值的是微信而不是一個裸的安卓一樣,大模型也需要在它上面長出自己的應用。用系統的思維模式很容易看到這類系統型超級應用的關鍵點。我們換一張圖來對此進行説明。
( Alexa 基礎架構,本質和安卓一樣)
上圖是亞馬遜 Alexa 的基礎架構圖,為什麼用它呢,因為 Alexa 是現在為止最像雲端作業系統的一個產品。
實際上 OpenAI 的插件骨子裏也是這模式。可以這麼講從大模型的角度看 OpenAI 的遠勝,這種智能的進步大幅縮減應用(上圖中的 Alexa Skills Kit)的開發成本,但從系統完備性的角度看 OpenAI 還有很長一段路要走,比如對大規模設備的介入和管控等。
基于這種架構圖很容易看出基于大模型的超級應用的關鍵點:
大模型:會處于中間的部分,負責提供通用智能的能力。也要與其它各類算法相配合,比如感知類算法、推薦類算法等。上圖中針對互動做了一點分解,抽成:語音識别(ASR)和自然語言理解,後者會完全被大模型取代,但不會改變架構。
AIoT 基礎設施:為了支撐大模型跑好并且和另外幾部分連接起來,AIoT 用的東西一個也缺不了,包括大規模設備管理通訊等。這些部分加起來才是過去系統的 Kernel,也就是安卓所扮演的角色(上圖中間的部分)。
用户側(上圖右側):要提供充分感知,這種感知要有時間維度和空間維度,要有現場和歷史數據。我們和智能音箱進行互動的時候,先要喊一嗓子,比如小愛同學等,它要聽不到不管後面大模型多厲害也是不行。然後互動的時候肯定需要這個人的建模數據(歷史)以及位置等,然後才能做好内容輸出。不同場景下這部分會有比較大差别,比如沃森的場景可能就需要個人的 24 小時心電圖、病史以及基因數據。這些部分非常關鍵,需要綜合應用 IoT 和各種算法才能達成目标。大模型在這個環節扮演的角色沒那麼關鍵。
應用側(上圖左側):智能音箱的場景就需要對接各種數據源(chatGPT 的插件就幹這事的),總不能天氣也靠大模型來生成吧。對于沃森類系統這裏就需要行業數據和法規等。
相比于過去應用側在變薄,但問題是三個部分整個加一起才是智能雲系統下的應用,非要類比的話這種新應用的創建有點像需要打造一個個屬于特殊領網域的手機。
有無數個領網域需要這種系統型超級應用,醫療、教育、税務、企業、零售、軍事、家居等,很久以前 DeepMind 甚至還嘗試過給 Google 數據中心做個這樣的應用來管空調。
人工智能應用确實會大爆發,在過去大模型是起點和障礙,而不是應用本身。LLaMA 2 提供了跨越低成本跨越這種障礙的可能性。
普遍盈利(break-even)會來麼?
在此前的系列文章中我多次總結:從商業角度看,人工智能過去 10 年的創業其實集體性失敗了,因為沒跑通任何一個像樣的商業模式。而真自己做大模型的企業短期虧損會加劇,因為投入增加并且經常會被歸零,而議價權并不會增加。
那現在看這會有什麼變化麼?
有點變化,但不是對做大模型的公司,而是對應用大模型的公司。
可以更低成本創造一種效力巨大的系統型超級應用,甚至可以簡單用等于多少人來衡量其效果和商業價值。如果 LLaMA 2 繼續再進展下去,那相當于這個超級應用總是可以用便宜卻更強勁的引擎。
這時候整體成本可控了,周邊的部分也需要投入,但不會像大模型研發那樣導致投入產出高度失衡。
這時候效果明顯了,過去的 AI 算法其實解決了一些不痛不癢的問題,不創造商業上的核心價值,做閘機和智能音箱能創造什麼核心價值?但現在不一樣,大模型在技術上的進展保證了,在用和不用上會導致大刀對坦克的差異。比如對企業而言誰能想象電腦、互聯網全部都不用的企業?
更關鍵在于數據飛輪的 Key 看着是在做出系統型超級應用的企業手裏,這導致上限會比較高。
在琢磨事上馬斯克首先是個商人,從 xAI 發布説起裏我畫了一張這樣的圖:
( 數據飛輪的三個階段 )
每一個大模型每個領網域中最終追求的一定是把這個數據飛輪跑起來,但很遺憾的是到目前為止好像除了 AlphaGo 别的就沒跑起來過。
可這不意味着未來也這樣,誰在未來能把它先跑起來,誰就是那個領網域的冠軍,也就赢了。
現在產業鏈條上誰最可能把這個飛輪跑起來?
顯然是成功落地系統型超級應用的人,他們才是擁有場景和用户的人。
若幹年後,回看我們可能會認為 LLaMA 2 是一個類似 2007 年安卓發布的時刻。
小結
我個人前十年主要做系統,中間做了陣戰略投資,後十年主要就做人工智能的產研,可能是這種背景的原因導致我越看大模型商業化的路徑越覺得是系統型超級應用。希望對此感興趣的同學和我聯系,共同探讨如何在新技術要素下确立新的商業模式。确實,像 DeepMind 那哥們説的:不要扯圖靈測試了,現在核心是看看能不能終結人工智能行業的十年虧損,這更關鍵些!
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App