今天小編分享的科技經驗:下一個蘋果還是蘋果,歡迎閲讀。
蘋果冷靜地觀察了生成式 AI 亢奮的一年,一直在為自己的生态基礎添磚加瓦,還在一步一個腳印地邁向明年發布 AiPhone。
十月份,蘋果機器學習研究團隊曾推出一個 " 雪貂 " 模型(Ferret),這個多模态大模型比 GPT-4v 對空間的理解更準确。最近這個模型開源了。簡單地説,在一幅圖中的任何地方,你指出任何一個物體,哪怕它再微小," 雪貂 " 都能解釋清楚。
這種對空間的敏感,對于蘋果即将發布的 Vision Pro 具有重要作用,它讓自然 / 虛拟的視覺感知與語言大模型結合。這篇不張揚的論文作者全部是華人,最近越來越引起業内的重視,它在空間計算上達到了 SOTA 水平。
" 雪貂 " 模型架構 (來源:FERRET: REFER AND GROUND ANYTHING ANYWHERE AT ANY GRANULARITY )
蘋果最近推出了能在其 M3 芯片上訓練部署大模型的開源框架 MLX。這意味着 Mac 筆記型電腦的開發者,可以開發出大模型支持的應用。
蘋果還推出了 " 閃電大模型 " (LLM in a Flash),用閃存解決了手機上部署大模型内存(DRAM)不足的問題。
這是個人很喜歡的一篇論文。是的,偷偷幹活的蘋果,也開始默默地發論文了。
這篇論文談的是一個小而關鍵的問題,如何在手機這樣一個内存非常有限的空間裏,部署一個大模型,而且推理的速度要快,還不費電池。
它的最大優點,不是就算法談算法,而是從對硬體的深刻理解,結合算法提出了自己的方法。它的出發點完全是消費者思維,大模型在遙遠的雲端,大得吓人,貴得驚人,只有揣在用户的口袋裏,才能讓消費者對生成式 AI 產生感覺。
DRAM 太小,放不下一個幾十億級的模型。盡管可以放到閃存裏,但閃存的帶寬不夠。為了最小化從閃存到 DRAM 帶寬的負載,蘋果創新了兩個技術,視窗化 (windowing)和行列捆綁 (row-column bundling)(詳見論文)。
在 OPT 6.7B 和 FALCON 7B 兩個模型上測試,結果相當 " 炸裂 ",能夠運行的模型尺寸達到可用 DRAM 能容納的兩倍,與 CPU 和 GPU 中的簡單加載方法相比,推理速度分别提高了 4~5 倍和 20~25 倍。
對齊芯片、作業系統和系統設計,找到方法建立起一個推理成本模型,這事只有蘋果做得出來。
最近一系列的幾十億參數級小模型表現當驚世界,如 Mistral, Phi-2 能挑戰百億參數級大模型;谷歌推出了 18 億參數的 Nano 級 Gemini 模型,直接裝到 Pixel 手機上。高通的骁龍芯片能跑得動百億參數級的模型。三星可能将于 2024 年初推出生成式 AI 遊戲功能的 Galaxy S24 手機。
還有上海交大團隊推出的推理引擎 PowerInfer,都為大模型在設備終端,尤其是手機和筆記型電腦的部署,掃清一個又一個障礙,也預示着 2024 年,消費類電子產品,将會迎來一波大模型加載的高潮。
這些 " 小 " 模型的推出,有一個共同的特征,就是采用了高質量的數據," 教科書級 " 的數據。無疑,主流新聞媒體的檔案,所能提供的是好的語言訓練材料。
蘋果正在與美國各大媒體機構談判,約以 5000 萬美元的價格,獲得這些媒體的檔案語料庫,用來訓練自己的大模型,可能會用 Siri 的對話服務。
想想這些用來訓練語料的品質吧,康迪納斯特的 Vogue、New Yorker、NBC News,以及 IAC 的 People、The Daily Beast、Better Homes、 Gardens 等。它包括大量的以時尚與生活方式為内容的精美文字和圖片。也包括部分新聞文章、圖片和視頻。
但是其他的主流媒體對此沒有表示出多少興趣。以往紙媒與社交媒體的合作,并沒有給他們帶來多少利益。另外,媒體将其檔案中的新聞交給蘋果去訓練大模型,在使用的過程中,可能產生的法律糾紛,也引起這些媒體的擔憂。
蘋果的做法,被認為更加地道。其他的 AI 公司或者科技巨頭,是先用了人家的語料,被揪住了再去談授權,已經引發了一些官司。
蘋果出于對隐私的強調,它不願意直接從網絡上扒數據。蘋果也不允許收集其客户的數據。
那麼,2024 年蘋果會做什麼?
大家首先想到的是,它會在明年推出生成式 AI 加持的語言助理 Siri。它将是 2024 年秋季 iPhone16 和 iOS18 的最大亮點。有些果粉開玩笑説會推出 SiriGPT。但這些都只是冰山一角。
巨頭的做法,通常是尋找新的技術加強其固有的核心能力,在原有的產品上產生差異化。是從表面上看,吃老本的蘋果,在生成式 AI 上行動遲緩,采取了保守的跟随戰略?還是蘋果能真正利用其在芯片、作業系統、大模型方面一體化整合的能力和產品設計能力,做出最好的 AI 產品體驗?答案可能是後者。
蘋果在過去的幾年,已經收購了幾十家 AI 初創企業,用于其產品、服務及生态中。只是這裏面沒有那些明星級的初創公司。
蘋果只做不説,早有分析人士注意到,蘋果在 AI 上的投資,一點都不比微軟少:已經花了上百億美元,建造生成式 AI 應用開發的基礎設施。稍早人們傳聞蘋果在内部偷訓自己的大模型 Ajax,或者叫 Apple GPT,據説當時能趕上 GPT-3.5。
但最近蘋果在機器學習方面一系列的研究成果表明,蘋果在走自己的路。微軟、谷歌、亞馬遜、英偉達,以及 OpenAI 為代表的閉源大模型公司,圍繞模型、雲和算力去收割了第一茬。
而蘋果看重的是其 20 億設備及其用户所形成的巨大的生态。生成式 AI 所帶來的 iPhone 的新的體驗,以及用大模型去加持所有的應用,這些給蘋果帶來的消費市場機會,是其他巨頭難以奪走的。蘋果以隐私保護的名義,控制了第三方應用之間互相竄訪,這也讓蘋果商店成為自己未來 AI 應用的金礦。
蘋果動作慢了嗎?生成式 AI 的幻覺問題,還有監管、隐私保護、版權糾紛等,這些問題都會令蘋果想得更深一些,考慮得更周全一些。蘋果有這樣的底氣,因為它在芯片、作業系統、應用、產品、制造等各個層面一體化的設計,最終所帶來的產品體驗創新性的深度,仍将可能是其競争對手難以比拟的。
OpenAI 引發的 "iPhone 時刻 ",已經尖叫好幾回了,但下一個蘋果,還是蘋果。