今天小編分享的科技經驗:百度為什麼要幫别人造AI應用?,歡迎閲讀。
李彥宏對于百度的定位,在大模型時代有一個很大的變化。
11 月 12 日,在百度世界 2024 大會上,百度創始人李彥宏以《應用來了》做主題演講,他表示," 百度不是要推出一個‘超級應用’,而是要不斷地幫助更多人、更多企業打造出數百萬‘超級有用’的應用。"
上一個時代的中國互聯網,普遍被認為是互聯網應用公司,譬如百度的搜索、阿裏的電商、騰訊的遊戲等,互聯網巨頭們的招牌都是應用,中國成為互聯網應用最發達的地區之一。
大模型時代,這些企業也被視為是殺手級 AI 應用的候選人,可能沒有人比他們更清楚需求在哪、應用如何打造,以及具備充足的人才和資本,而李彥宏卻説要幫其他人和企業造數百萬應用。
這透露出李彥宏對于大模型的認知和态度。大模型帶來了技術範式轉換,百度已經不再是上一個時代只需考慮應用層的互聯網公司,若要成就于大模型時代,百度自己得先入局做硬體、生态以及基礎設施,某種程度上這才是當下大模型企業最應該關心的事。
這并不代表百度不做應用了,李彥宏也表示," 我們(百度)做的應用,同時做十款應用或者最多一百款應用,外界可能有一萬個創業公司在試各種各樣不同的賽道。"
只是在當下的時間節點,百度需要扮演一個垂直整合的角色。OpenAI 和微軟聯手,AWS 投資眾多大模型創業企業,Meta 做開源生态,谷歌将自家大模型與雲做垂直整合,終極目的都是讓更多 AI 應用根植于自己的平台和生态上,百度也不例外。
AI 應用,走到哪了?
" 我們正處在 AI 的 iPhone 時刻!" 去年,英偉達 CEO 黃仁勳做出這一著名預判。對于英偉達來説可能的确如此,英偉達面向的是芯片客户,ChatGPT 現象級熱度之後,AI 芯片行業迎來了大爆發。
對于 C 端消費者應用和 B 端企業應用客户而言,還未達到同樣的階段。作為對比,2010 年是移動互聯網的 "iPhone 時刻 ",當時 iPhone4 正式推出,雖然黑莓手機在美國還占據 43% 的市場,iPhone 只超過 10%,但是 AppStore 的應用數量達到了 13 萬,并且在未來幾年走出了一條陡峭的曲線,移動互聯網應用極大繁榮,如今我們使用的微信、頭條、快手等,都誕生于這條曲線。
有意思的是,李彥宏在會上也給出了一條陡峭的曲線——文心大模型的日均調用量變化曲線圖。
李彥宏表示,到今天這個數字已經超過了 15 億次,代表着過去兩年中國大模型應用爆發。6 個月之前,當文心大模型日均調用量達到兩億的時候,他還在思考,如果日均調用量一年之内漲 10 倍,也就是從 2 億漲到 20 億,我認為就成了,就説明大家是真需要大模型。
為何大家願意用大模型了?一言以蔽之,支撐大模型應用發生的前提條件越來越成熟。據 Gartner 預測,到 2027 年,企業使用的 AI 模型中将有一半以上具有特定行業或業務功能,而在 2023 年這一比例僅為不到 1%。
大語言模型的能力已經基本滿足應用場景的需求,同時精調和推理等成本在急速下降,加之眾多企業分工構成的大模型生态也正在快速演進,加速了大模型不同層級的創新和融合,大模型應用生态朝着健康的方向發展。
李彥宏就提到,過去 24 個月,行業最大的變化是大模型基本消除了幻覺,它回答問題的準确性大幅提升,這讓 AI 從 " 一本正經的胡説八道 ",變得可用、可被信賴,采用 RAG 技術後,大模型會利用檢索到的信息來指導文本或答案的生成,從而極大地提高了内容的質量和準确性。
針對大模型落地成本高的問題,百度智能雲今年将文心主力大模型 ERNIE Speed、ERNIE Lite 全面免費開放,對文心旗艦大模型 ERNIE 4.0、ERNIE 3.5 進行了大幅降價,大幅降低大模型使用門檻和試錯成本。
造大模型應用,難在何處?
盡管大模型應用的基礎設施和生态演進加速,但大模型畢竟是一次革命級的更新,我們還處在應用繁榮的早期階段,不少企業還沒有适應新的大模型應用開發模式。
李彥宏認為,開發者可能已經逐步适應了怎麼在大語言模型上開發應用,突然搞出來一個新的方向(比如 o1),又得适應一遍。百度也很希望大家趕緊适應這種新的思維邏輯,怎樣慢思考,調用工具,大家有學習和适應的過程。
" 今天雖然我們發了多智能體協作這些東西,但讓一個開發者開發一個多智能體協作的應用,其實難度還是很高的,成本很高,反應速度很慢,各種各樣的能力怎麼調用,有一個接受的過程。我們得逐步逐步得讓大家學習這種新的能力,接受然後再把它利用好。" 他説。
過去,傳統應用開發流程復雜,需要先進行高層設計,再分解為子模塊開發,最後集成到一起,這一過程耗時不少且風險高。在大模型時代,AI 原生應用在產品形态上顯著變化,依托大語言模型的理解、生成、邏輯、記憶四大核心能力,應用互動從傳統的表單和按鈕,轉變為自然語言對話。
目前,通過工具進行大模型應用開發主要有三大類:
第一類是原來有一套 APP 或者一套應用系統,能夠将大模型作為 Copilot 優化互動體驗。這是最常見的形式;
第二類是原來的業務流程還在,能夠用大模型降低成本提升效率、節省時間;
第三類是能夠做到原來做不到的事情,比方説用大模型去生成一個 CAD 的圖紙,產生更大的創新生產力。
同時,各行各業的企業在應用大模型落地過程中,在準确可靠性、與内部系統關聯性、安全性、使用門檻上仍有許多問題。
具體來看,百度智能雲總結了大模型應用落地的問題,第一,用户怎麼選模型;第二,如何優化模型在應用場景的效果;第三,基于大模型怎麼低成本做應用開發。
結合實際情況看,企業意識到不是尺寸越大、越先進、參數量越大,模型就适合自己的需求,既要有效果,也要成本低,才能夠規模落地。同時,在很多應用場景當中,企業不止一個大語言模型,需要多個大小模型協同,另外,僅有大模型本身無法構建應用,企業還需要一些周邊的人工智能能力與大模型匹配。
百度集團執行副總裁、百度智能雲事業群總裁沈抖表示,AI 應用正率先在 B 端爆發。由企業級大模型工程平台、異構算力平台組成的新型 AI 基礎設施,将替代傳統雲計算,為大模型應用在企業生產力場景中的規模落地提供關鍵支撐。
大模型時代的 " 應用工程化 "
如果説文心大模型的目标是追求大模型的技術革新,百度智能雲就要做大模型的應用工程化,李彥宏的原話是 " 百度智能雲是我們構建智能產業生态的主要依托 "。
沈抖表示,過去一年餘,企業大模型應用已經深入到 " 研產供銷服 " 的各個環節,傳統的雲計算已經無法支撐大模型應用的快速發展,百度智能雲在做的,就是打造一套全新的基礎設施,圍繞大模型及其應用,幫助企業加速實現智能化更新。
據介紹,百度智能雲目前擁有中國最大的大模型產業落地規模。超過六成的央企和大量的民營企業,正在聯合百度智能雲進行 AI 創新。百度智能雲千帆大模型平台已經幫助客户精調了 3.3 萬個模型、開發了 77 萬個企業應用。
千帆和百舸即是百度智能雲提供的工程化平台,千帆平台幫客户做大模型和應用的開發和服務;百舸平台為客户提供大模型相關的算力服務。
首先看千帆,可以從三個方面優化大模型應用效果,一是直接調用模型,也就是模型推理;第二種是模型應用效果優化,包含了提示詞優化、模型精調以及模型能力增強;第三種則是大模型應用開發。
千帆大模型平台提供了大量模型服務,包括 ERNIE 4.0、ERNIE Speed、ERINIE Lite 等主力模型,适用于不同垂直場景定制訓練、構建行業模型、垂直場景調用。
提示詞優化方面,千帆大模型平台還優化了 Prompt,并預置了近 300 個行業場景的 prompt 模版;模型精調方面,千帆提供了數據洞察、清洗和回流能力,獨家的高質通用語料數據以及量化壓縮工具鏈,内置了最佳實踐精調模範間;模型能力增強方面,千帆提供了 RAG 以及各類工具的使用結合能力。
在本次大會上,千帆還發布 " 工作流 Agent" 功能,可幫助企業快速開發出面向復雜對話場景的 AI 應用,快速擁有專業水平的 " 數字員工 "。
再看百舸,百度表示,目前百舸已具備了成熟的 10 萬卡集群部署和管理能力,客户包括中國石化、中海石油、長安汽車、上海交通大學、地平線等,主要解決從集群創建、開發實驗,到模型訓練、模型推理的全程算力需求。
百舸平台可兼容昆侖芯、昇騰、海光 DCU、英偉達、英特爾等國内外主流 AI 芯片,支持同一智算集群中混合使用同一廠商不同代際芯片、不同廠商芯片,屏蔽硬體差異,幫助中國企業擺脱單一芯片帶來的高溢價和供應鏈風險。
據了解,在萬卡規模集群上,百舸能夠将兩種芯片混合訓練大模型的效率折損控制在 5% 以内,另外,通過設計高效的網絡拓撲結構,結合模型切分優化和跨地網域無擁塞高性能網絡方案,百舸能夠在橫跨幾十公裏的多機房組成的萬卡規模的集群上,将單一模型訓練任務的性能折損控制在 4% 以内,達到業界最領先水平。
大模型的科學創新固然重要,但要規模應用于現實場景,做好大模型應用工程是必經之路,在基礎設施和產業生态相互促進的過程中,企業可以選擇做 "2011 年的微信 ",也可以選擇做 "2016 年的抖音 "。
" 很多美國同行,他們做法是當做一個 Science(科學),我有一個終極目标,就想盡各種辦法解決它,這個問題可能用工程的方法也可能用其他的方法、用數據驅動,最後解決下來。現在諾貝爾獎都授給公司 CEO 了,很多非常有意義的,即使是從 science 的角度很有意義的事,最後是靠工程的方法解決出來。所以做工程不丢人,做工程很有可能是比科學更早發現機會、發現規律的。" 李彥宏在對談中表示。(本文首發于钛媒體 APP,作者 | 張帥,編輯 | 蓋虹達)