今天小編分享的科技經驗:走下雲端的大模型,能否再造一個萬億「英偉達」?,歡迎閲讀。
2016 年 9 月 13 日,一身黑色皮衣的英偉達 CEO 黃仁勳第一次将 GTC(GPU 技術大會)帶來了中國,同時也展示了 GPU 計算不再局限于遊戲,還應用在 AI(人工智能)、科學研究、自動駕駛以及 VR 等熱門領網域。
但最重要的還是 AI,黃仁勳在演講中提醒所有人,「我們不再是一個半導體公司,而是一個 AI Computing Company(AI 計算公司)。」
同一年,谷歌在 I/O 大會上提出「AI 為先」的戰略,往後每年都要一遍又一遍地強調,并将 AI 越來越多地融入自家的產品之中。微軟也第一次宣布攜手 OpenAI「履行普及且全民化人工智能的使命」,那篇新聞稿在開頭就寫道:「我們正處于技術發展歷程中的關鍵時刻。」
圖 / 微軟官網
這是一個時代的序幕。
七年後,生成式 AI 帶來新一輪的革命,ChatGPT 在全球範圍颠覆了大眾的認知。而伴随着 AI 熱潮的持續爆發,英偉達的股價從去年 10 月的 112.27 美元漲超 400 美元,成為了有史以來第一家萬億美元市值的芯片公司,在全球僅次于蘋果、微軟、Alphabet(谷歌)和亞馬遜這四家公司。
今日之成功非今日之功。今天 AI 領網域最重要的 4 家公司,在 2016 年共同邁出了走向 AI 未來的關鍵一步,也堅定了「AI 改變世界」的決心。那一年發生了什麼,大部分人都知道—— DeepMind(谷歌旗下)推出的 AlphaGo 與人類棋手李世石的世紀對決吸引了全球的目光。
AlphaGo 将 AI 重新拉回到人們的視野之中,卻沒有在實驗室之外真正改變人們的生活。即便是 2018 年發布的 Transformer(也就是 GPT 中的「T」)深度學習模型,也要等到 ChatGPT 的橫空出世。
而現如今,無數人都可以斷言 AI 開始真正地改變世界:
- 研究人員利用 AI 技術快速篩選出了能殺死超級細菌的新型抗生素,上海市科委也説要圍繞 AI 藥物設計進行布局;
- 生物公司在像英偉達 CEO 黃仁勳所説的「借助 AI,學會理解蛋白質」,晶圓代工廠也在利用 AI 提高生產效率;
- ChatGPT 之外,搜索、Office 文檔、筆記、社交媒體……更多的公司和開發者正在将 AI 應用于各種生活和工作場景之中。
留給 AI 的挑戰當然還有很多,生成内容的歸屬、惡意濫用(比如詐騙)以及一本正經胡説八道的「幻覺」等等。但在所有挑戰中,最關鍵的可能還是如何讓生成式 AI 更安全的同時,擴大使用場景,降低普通用户的使用門檻,使得更多的人可以利用 AI 得到更高的生產效率,享受更好的生活。
AI 技術的擴散,或許就是下一個七年甚至幾十年的最大機會。
半個多世紀前的 1946 年,世界上第一台電子計算機 ENIAC 誕生了,從此人類一只腳邁入了計算機時代。
但直到 PC(個人電腦)在 1982 年真正推向市場之前,普通人其實觸碰不到計算機給生活帶來的變革,而 PC 作為第一代個人計算平台在誕生之後的幾十年,徹底改變了所有人的生活,也衍生出了一系列今天至關重要的產業,包括但不限于互聯網、芯片以及智能手機。
IBM 5150,圖 / Wikimedia Commons
人類的技術史不斷在證明一件事——技術創新很偉大,但技術擴散同樣偉大。印刷術的出現對于整個人類文明的重要性不言而喻,但印刷術在北宋以降的擴散,以及文藝復興時期在西方世界的擴散,一樣無比關鍵。
然而當下幾乎所有生成式 AI 應用都跑在昂貴的數據中心,比如最熱門的 ChatGPT 就跑在微軟 Azure 的全球數據中心裏。與此同時,數據中心也限制了生成式 AI 在更大範圍内的落地。
貴是一方面,就連當下最炙手可熱的 OpenAI CEO Sam Altman 也説,OpenAI 目前的首要任務是降本增效,更何況是從去年就開始喊的一眾互聯網公司,普遍都面臨成本的壓力。
Sam Altman,圖 / Steve Jennings
而且随着更多用户更頻繁的使用,AI 的運營成本還會水漲船高,關鍵是對大部分互聯網的商業模式來説,企業其實很難向用户直接收取高昂的費用。另一方面,生成式 AI 的應用并未成熟,大部分用户也不太可能接受高昂的收費模式。
除此之外,隐私安全的重要性現如今越來越受到重視,很多人不再願意把自己的照片、視頻上傳到網絡,反而傾向于存儲在本地,比如蘋果為代表,更多的企業都在面向用户強調產品的隐私安全。而企業本身對數據安全的重視更是如此。
之前三星半導體部門的員工在使用 ChatGPT 的時候,就把一些數據上傳到雲端,導致商業機密泄露,不僅是三星在内部重新實施了 ChatGPT 禁令,也引起了不少公司對 ChatGPT 的警惕。
同時 AI 作為一種基礎設施,未來應該被所有人使用,使用場景也将極其廣泛,包括輕負載和重負載場景,也包括對延時比較敏感的場景。而從數據傳輸到雲端處理,再回傳結果,其中必然會有網絡延時的影響,一些 AI 任務可能不需要過高的加速性能,反而要求更低的延時。
一言以蔽之,來自雲端的算力無法覆蓋更多的 AI 使用場景,也滿足不了更多人的 AI 使用需求,AI 不應該只「活」在雲端。
微軟數據中心(2010 年),圖 / Robert Scoble
在 ChatGPT 之後,很多人就提出了一個構想——每個人都可以擁有專屬的 AI 助手以及背後的語言模型。印象研究院院長常誠之前接受雷科技采訪時就説到,印象 AI 未來一個可能的發展方向就是結合印象筆記作為知識管理產品的定位,讓每一個用户可以選擇用私人語料訓練和部署自己的專有語言模型。
但從成本、隐私和延時等不同角度來看,一個雲端的 AI 并不合适。而在更廣泛的 PC,以及幾乎人手一台的智能手機上,我們還有大量的晶體管和算力,足以接下來的算力變革中創造一個更多元、更龐大的 AI 生态。
5 月底,英偉達公布了最新一季财報,在遊戲和專業可視化收入繼續大跌的背景下,數據中心收入達到創紀錄的 42.8 億美元。電話會議上,黃仁勳解釋説:
計算機行業正在同時經歷兩種轉變——加速計算和生成式 AI。随着各個公司競相為生成式 AI 部署加速計算,價值 1 萬億美元的全球數據中心基礎設施将從通用計算轉向加速計算。
事實上,這種轉變不僅發生在數據中心,還發生在全世界的 PC 和智能手機上。早前的一場媒體會上,英特爾就在一台輕薄筆記本上展示了通過本地運行 Stable Diffusion 生成圖片的過程。
英特爾的演示,圖 / 英特爾
英特爾客户端計算事業部終端生态合作亞洲區總監高源透露,新一代 Meteor Lake 處理器将會集成 CPU、GPU 以及專門面向 AI 加速的獨立計算單元 VPU。不僅如此,CPU、GPU 以及 VPU 将共同參與 AI 加速計算的過程,使得在輕薄型 PC 成為可能。
與此同時,微軟和谷歌——兩家走在時代潮頭的作業系統廠商也在系統層面引入生成式 AI。微軟先前宣布将在 Windows 11 上率先推出 Windows Copilot,成為第一個加入生成式 AI 助手的 PC 作業系統,本月就會推出預覽版。
谷歌還要更進一步,計劃在手機上率先内置 AI 語言模型。為此谷歌通過大模型「降參數」得到小模型,實現了更低的算力要求和功耗,在上月的 I/O 大會上就推出了四個版本的 PaLM 2,其中 PaLM 2「壁虎」作為羽量級版本可以直接在 Pixel 手機上離線使用,每秒處理 20 個 token。
PaLM 2 Gecko(壁虎),圖 / 谷歌
無獨有偶,榮耀 90 系列發布的會後采訪環節上,榮耀總裁趙明也表示,相比雲端的大模型,手機端 AI 更為強調個性化和安全,榮耀将在端側 AI 上進行發展,「未來端側 AI 與大模型會有某種程度的結合。」
説到底,終端 AI 也不是要代替雲端 AI,更多是為了覆蓋所有人的所有使用場景和需求,大模型運行在手機和 PC 本地,比起雲端延遲更低,離線運行也可以更好地保護用户隐私。
在前不久結束的 Computex 上,高通資深副總裁暨運算及遊戲部門總經理 Kedar Kondap 説,考慮到延時、效率和實用性等問題,部分計算于手機、平板或電腦中、部分則在雲端運行,「未來的 AI 計算是混合的。」
從芯片到終端廠商都意識到了,終端算力正在從通用計算加速轉向 AI 加速計算,不僅是 NPU(神經網絡處理器)變得越來越重要,CPU 和 GPU 也可能将更多的通用算力轉向加速計算。過去更多用在影像處理上的加速處理能力,未來将覆蓋生成式 AI 的方方面面。而全球每年賣出的數十億台手機和 PC,也會把 AI 加速計算的能力源源不斷地帶給每一個人。
換言之,不管是英特爾演示用的輕薄本 PC,還是谷歌不久後的新 Pixel 手機,都只是一個開始。我們不難想象未來在手機和 PC 上可能都會預裝一個「小模型」,用户可以随時随地安全且高效地使用專屬的 AI 助手。
圖 / PxHere
而終端和雲端,大模型和小模型的協同也會進一步推動 AI 的快速進化。大模型向搭載在設備端的小模型輸出能力,小模型則在大模型的基礎上負責感知、推理和執行,再将執行的結果反饋給大模型,讓大模型的知識與能力持續進化,形成一套有機循環的系統。就像阿裏達摩院説的:
參與者越多,模型進化的速度也越快。
在科幻小説《造神年代》裏有一段描述:面對全世界股市發生的混亂,男主在網吧通過萬國寶(小説中阿裏開發的翻譯 AI)向一位蘇格蘭友人大吼「活下去!奇點就要到了!」緊接着作者寫到:「就在剛才,時代已經變了。他們還不知道。」
因為就此,強人工智能萬國寶獲得了新生,有了根指令和初始本能,接下來将以全球為戰場,在與谷歌(小説中另一個強人工智能巨獸)和人類的三方戰争中努力「活下去」。
但在現實世界中,即便是公認最領先的 GPT-4 距離強人工智能(或稱通用人工智能)也還有很遠。而且技術總是充滿了兩面性,AI 或許擁有威脅人類未來的可能,也有幫助人類打造更美好世界的可能。
網景浏覽器和傳奇創投公司 a16z 創始人馬克 · 安德裏森(Marc Andreessen)過去多次寫過預言式的雄文,包括《軟體吞噬世界》《是時候開始建造了》,不久前他又寫了一篇《為什麼 AI 将拯救世界》,其中一個核心的觀點是:AI 通過增強人類智能,幫助人類像過去幾千年一樣創造更美好的世界。
或許安德裏森的觀點過于宏大和抽象,但當我們聚焦在 ChatGPT 上就會發現,生成式 AI 技術最具革命性的部分在于自然語言輸入。
「計算機可以像人類一樣説話嗎?」圖 / YouTube@TED
過去人類只能通過命令行與計算機進行互動,輸入指令來獲得結果,後來圖形用户界面的出現,與計算機的互動變得更加直觀,手機觸屏則在滑鼠和鍵盤的基礎上,進一步降低了用户的使用門檻。ChatGPT 告訴我們,人可以通過自然語言——平常和同事、親人説話的方式,與計算機進行溝通,并且計算機有能力同樣以自然語言的方式告訴我們(結果)。
另一方面,沒有人可以窮盡所有的知識,哪怕掌握再多的生產力工具和技巧,構建再多的「第二大腦」。但理論上計算機可以輸入人類有史以來保存的所有知識,ChatGPT 就幾乎「遍覽」了互聯網上所有公開知識,并且跨越社會語言文化,用最底層的邏輯關聯所有知識。
結果就是 ChatGPT 雖然還有很多「幻覺」,卻是無可争議的博學,同時還一舉超越 NLP(自然語言處理)技術,不同語言之間的翻譯效果也甚于過往,以至于粵港澳大灣區數字經濟研究院 - 認知計算與自然語言研究中心負責人張家興博士在 ChatGPT 出現後感嘆:「(傳統的)NLP 技術不存在了。」
于人類而言,ChatGPT 最直接的意義就是提供了一位學貫中西的數字助理,幫助我們越過無數的(語言、文化、技術)障礙,直接了解散落在互聯網的各種信息和知識,也可以與之進行情感上的交流。但就如前文提到的,出于隐私的顧慮和使用的體驗等各種因素,如果我們想要更進一步,讓 AI 更了解每個人之後進行個性化的微調,同時管理更多私人的任務和内容,就不可能完全依賴于雲端的算力和模型。
所幸過去幾十年,高性能個人計算終端—— PC 和手機飛入尋常百姓家,算力和功耗的挑戰當然還在,但事情已然邁出了關鍵一步。