今天小編分享的互聯網經驗:百度電話會:文心大模型日調用量已超5000萬次,歡迎閲讀。
2 月 28 日港股盤後美股盤前,百度公布 2023 年第四季度及全年财報,當季除愛奇藝外的百度核心收入為 274.9 億元,超出市場預期的 273.1 億元,同比增長 7%。集團全年營收達 1345.98 億元,較上年增長 9%;歸屬百度的淨利潤(non-GAAP)287 億元,同比增速達 39%。
在随後進行的電話會上,百度創始人、董事長兼首席執行官李彥宏透露,百度智能雲四季度總營收 84 億元,其中大模型為雲業務帶來約 6.6 億元增量收入。文心大模型的日調用量已超過 5000 萬次,季度環比增長 190%;12 月,約有 2.6 萬家企業調用文心大模型,季度環比增長 150%。目前,三星、榮耀、汽車之家等知名企業均與百度達成合作。
并且,近期上線的千帆 AppBuilder 和千帆 ModelBuilder 兩款 MaaS 產品都已取得亮眼的成績,截至目前,千帆 ModelBuilder 累計精調了 10000 個模型。
以下為電話會分析師 Q&A 環節紀要:
Q1: 展望未來,管理層如何看待 2024 年中國的宏觀經濟形勢?對于整個百度 2024 年的增長前景,管理層有什麼看法?在 2024 年,百度總收入中 AI 相關收入的比例是多少?
去年我們的宏觀經濟環境非常具有挑戰性,但我們的業務表現非常穩健。我們非常積極地投資生成式 AI,但我們的非美國 GAAP 營業利潤率同比增長,收入經驗和資金增長。更重要的是,我們開始從 AI 和基礎模型中產生增量收入。
今年,我們注意到中央和地方政府都在努力發展經濟,農歷新年假期我們看到了消費增長,特别是在旅遊領網域,但我們仍然在一個充滿不确定性的宏觀環境中運營。
我們的核心業務保持穩健,生成式 AI 和基礎模型的增量收入将在 2024 年增加到數十億,為我們總收入的增長做出貢獻。我認為百度能夠維持長期增長,速度将比中國的 GDP 增長更快。
Q2: 還有多少降本增效的空間?如何看待與 AI 相關的投資?
百度将繼續專注于我們的核心業務,大幅減少對非戰略業務的資源分配。此外,我們通過層級扁平化,優化了企業組織架構,不斷提高我們的整體組織效率。今年我們會持續優化運營效率,确保每個人都更有生產力。
雖然 AI 領網域的投資有所增加,但這些投資預計不會對利潤率產生重大影響,我們的長期 GAAP 營業利潤率仍然比去年同期增長了兩個百分點。
Q3: AI 相關的收入貢獻有沒有侵蝕搜索業務的份額?
我們是中國最大的搜索引擎。我們擁有近 7 億月活躍用户,并在中國互聯網和移動用户中建立了非常強大的品牌形象。他們依賴我們提供全面可靠的信息,因此我們擁有強大而穩定的收入和利潤。
但我們也對宏觀非常敏感,因為我們的廣告業務覆蓋了不同的垂直領網域。而且,我之前提到宏觀經濟仍然存在不确定性,但生成式 AI 和 LLM 正在貨币化和用户參與方面釋放新的機會。
得益于文心一言,我們如今能夠提高定位能力。生成和呈現更具相關性的廣告。第四季度由此攬下數億美元的收入,今年的增量收入将增長到數十億美元。
生成式 AI 是改善用户體驗的東西。我們将繼續推出新功能,激發 AI 業務更大的潛力,所以我認為 AI 是純粹的增量收入。
Q4:AI 與雲的產品組合是什麼?如何預期今年 AI 業務的整體增長?
第四季度 AI 大模型為雲業務帶來的增量收入已經達到 6.56 億人民币,2024 全年應該增長至數十億元人民币。我們已經看到企業越來越有興趣使用 GenAI 和大語言模型開發新的應用程式和功能,因此我們正在積極構建模型,為他們的產品和解決方案賦能。
同時,我們看到來自外部客户的模型推理相關收入顯著增加,雖然目前模型推理這部分收入仍然較小,但我們相信長期下來,這将成為收入增長的重要推動力。我們認為内部客户產生的收入也非常重要,因為這種收入的很大一部分是來自于模型推理。
百度在中國擁有最強大的模型訓練和推理 AI 基礎設施。因此,這種基礎設施可以幫助我們的客户經濟高效地構建和運行模型。我們還開發了自己的人工智能原生解決方案,例如 GenAI。因此,這些應用程式正在幫助企業提高生產力和效率,除了與 AI 相關的增量機會,GenAI 和基礎模型也為我們的傳統雲業務帶來了新的機遇。因此,我們正繼續赢得 CPU 端的雲客户和項目。
總體而言,我們會看到雲業務收入在 2024 年比去年加速增長,我們對保持雲業務的盈利能力非常有信心,企業雲業務的毛利率也能夠不斷提高。而對于 GenAI 和 LLM 業務,市場發展仍處于非常早期的階段。因此我們應該采取非常動态的定價策略,以快速教育市場并擴大客户滲透。我們相信,從長期來看,新業務應該比傳統雲業務有更高的利潤率。
Q5: AI 產品開發計劃是怎樣的?新的生成式搜索的利潤增長關鍵指标如何?
我們正在重建包括生成式 AI 的所有產品,我認為 GenAI 和基礎模型正在使我們的所有產品更加強大,過去幾個月裏這方面取得重大進展,初期客户對搜索的反饋不錯。GenAI 能讓百度回答更廣泛的問題,包括更復雜的、開放的和比較性的問題。只有這樣,我們才能以更互動的方式提供直接和清晰的答案。
在過去的幾個月裏,百度搜索結果的生成不再僅僅是簡單地混合一些内容和提供一些鏈接,越來越多的搜索結果是由文心生成的。因此,用户更頻繁地與我的產品互動,并提出新問題。例如,在春節假期期間,越來越多的用户來到百度進行内容創作,無論是文本還是圖片,百度幫助用户創建新年祝福信息并為他們的親人生成個性化電子賀卡。這不是搜索引擎的典型用例,但我們看到大量用户依賴百度來完成這類任務。
未來,我們将越來越多地使用文心平台來為搜索查詢生成答案。然後,我們使用多輪對話來搞清用户意圖,以便通過自然語言解決復雜的用户問題。這一舉措已經讓搜索體驗提升。
我們仍處于使用文心重構百度搜索的早期階段。我們将繼續測試并加速變革,會根據用户反饋啓用功能,尋找新體驗,直到準備好推出下次大規模更新。總的來説,我們相信通用智能将補充傳統搜索,最終增加用户留存、參與度和在平台上的時間。
除了搜索引擎外,文心還充當了 Copilot,它已經從一個幫助用户查找專利和文檔的應用轉變為一個一站式平台,讓用户能夠以多種格式創建内容。迄今為止,我認為一些新的付費用户是被這些真正的新功能所吸引。我想強調的是,我們處于使用文心重構我們的應用并構建新體驗的早期階段。同時,我們也在吸引和幫助企業建設。我們相信文心的成功依賴于廣泛和積極的應用,無論是對内部開發還是對第三方廣告。
Q6: 可否談一下有關多模态功能、Sora、開設 AI 商店或啓動 AI 代理的話題?這些發展是否有關鍵指标?AI 的運行成本如何?如何進行優化提高效能?
我們手頭有的芯片應該能夠幫助我們将文心 4.0 提升到更高一個水平。我們将采取應用驅動的方式自我加強,讓我們的用户和客户告訴我們在哪裏應該進行改進和調整。對于我們的模型來説,可能是構建多模态代理,提高可靠性等。
價格是一個非常重要的問題。制作高性能的基礎模型,經濟實惠對大規模運營至關重要。我們一直在持續減少模型推理成本。現在文心 3.5 的推理成本大約是 2020 年 3 月版本的 1%。通過這樣做,越來越多的企業願意測試、開發和迭代他們的應用程式。我們理解對許多客户來説,他們傾向于平衡效率、成本和速度,因此我們還提供了較小的語言模型,并幫助我們的客户利用 Moe(專家混合模型)來獲得最佳性能。通過我們端到端的方法,我們相信還有充足的空間來降低我們最強大模型的成本,并使我們的客户越來越可負擔。
我們正在密切監控由文心平台上開發的應用程式數量,目前文心大模型日調用量超過 5000 萬次。目前,來自内部應用程式的學習 API 成本仍然高于外部廣告成本。因為來自外部應用程式的學習,不同大小的應用程式需求正在迅速增加。現在只是個開始,随着越來越多的終端用户使用它,文心将變得更加強大、更智能、更有用。
無論是通過我們自己的應用程式還是通過第三方,這将使我們能夠培養一個以我們為中心的生态系統。當這些應用程式和模型被終端用户積極使用時,它們還将為我們帶來可觀的大模型推理收入。
Q7: 文心的企業采用率和其他產品相比如何?目前有多少企業正在使用文心構建模型和應用程式?上個季度相比增長情況如何?增長推動力有哪些?是否能夠假設使用文心 API 集成的企業不太可能轉向其他大語言模型?
不同規模與不同行業的企業在 12 月通過我們的雲服務調用文心 API 的次數,環比增長了 150%。文心 API 的成本已經超過了每天 1500 萬美元,我們相信在中國沒有其他公司能夠吸引這麼多客户,并接收到這麼高數量的 API 調用請求。
企業選擇我們主要是出于以下幾個原因。首先,我們在建模和推理方面擁有中國最具成本效益的 AI 基礎設施,這主要因為我們具有強大的端到端優化能力,包括 GenAI 和大語言模型,重塑中國公共雲入口的競争格局并增強我們的競争優勢。因此,我們在管理以 GPU 為中心的雲方面具有強大的能力,幫助企業在雲端構建和運行他們的模型。
其次,文心系列模型已經在過去幾個月裏吸引了許多客户,我們一直在提升文心的性能,收到了客户的正面反饋。我們還提供不同大小的文心模型,以更好地滿足客户關于成本結構的需求。當然,我們是中國第一家推出模型即服務(MaaS)的公司,這是一個一站式的大型語言模型(LLM)和 AI 應用開發平台,使企業易于使用。我們還提供了工具包,幫助企業輕松訓練或微調他們的模型,在我們的雲端開發應用程式。
有了這兩大原因,客户可以通過整合他們自己的專有數據,有目的地進行訓練,從而降低成本,也可以直接使用文心 API 來支持他們自己的應用程式。因此,企業可以專注于識别用户,這些舉措幫助讓 GenAI 和 LLM 上取得了先發優勢。
随着越來越多的客户使用我們的 MaaS 平台來開發旨在吸引用户的 AI 原生應用,将在我們這裏生成并積累大量的用户和客户想法,這些想法也将允許我們進一步完善工具包。随着我們的工具變得越來越對客户友好,并幫助企業輕松地應用模型和自由開發應用程式,他們将更傾向于繼續使用我們的服務。
此外,值得注意的是,在當前使用大型語言模型的階段,對客户來説,為他們選擇的模型創建合适的平台是至關重要的。因此,由于他們需要投入相當的努力來構建和積累使用大型語言模型的最佳提示(prompts),如果要切換到另一個模型,他們将不得不重新建立他們的提示庫,這對他們來説是一個挑戰。因此,随着我們平台的不斷采用和活躍使用,客户滿意度和切換成本将幫助我們提高客户留存率。
Q8: 美國的 AI 芯片制裁對百度的 AI 發展有何影響?是否有替代產品的最新消息?百度開發 AI 產品的方式與海外同行有何不同?可能出現哪些成就和挑戰?未來幾年如何才能跟上海外同行的發展腳步?
短期内,美國制裁對我們的模型開發或產品重塑、變現的影響微乎其微。正如上個季度提到的,我們已經擁有中國最強大的基礎模型,我們的 AI 芯片儲備使我們能夠在接下來的幾年裏繼續增強文心一言的性能。對于模型推理,它需要的芯片不那麼強大,我們的儲備以及市場上可用的芯片足以支持我們為終端用户開發許多 AI 原生應用。
從長遠來看,我們可能無法獲得最尖端的 GPU,但是有了最高效的原創軟體棧,用户體驗将不會受到影響。在應用層、模型層和框架層都有大量的優化空間。我們的端到端早期 AI 架構,加上我們強大的研發團隊,将允許我們使用較不先進的芯片進行高效的模型訓練和基礎設施建設。這為百度提供了與國内同行相比的獨特競争優勢,對于企業和開發者來説,構建文心應用将是采用 AI 的最佳和最高效的方式。
Q9:近來文本生成視頻的 AI 技術發展迅速,如何看待這項技術對中國 AI 產業發展以及對文心的影響?可否詳細説明文心未來的戰略路線圖?目前文心在文本生成、文本轉圖片以及轉視頻方面表現如何?還需要哪些改進?
這是一個寬泛的話題,首先,多模态或者説文本、音頻和視頻等多模态的整合是未來基礎模型發展的一個重要方向。這對于通用人工智能(AGI)來説是必不可少的,而百度已經在這一領網域進行了投資,并将在未來繼續這樣做。
其次,如果我們觀察基礎模型的發展,特别是大型語言模型的市場,會發現這個市場巨大且仍處于非常早期的階段。即使是世界上最強大的語言模型對于許多應用來説仍然不夠好。對于創新的需求很大,小型模型、專家混合模型(MoE)和代理都在非常快速地演進。我們努力使這一產品更加易于所有類型的企業接入,并解決各種領網域的問題。
第三,在視覺基礎模型領網域,值得注意的是一個具有巨大市場潛力的重要應用是自動駕駛。在這一領網域,百度是先驅者和全球業務領導者。我們一直在使用擴散和變換器來訓練我們的視頻生成模型,以服務于自動駕駛的目的。我們還在對象分類、檢測和分割方面不斷取得進展,從而更好地理解物理世界和物理世界的規則。這使我們能夠将道路上捕獲的影像和視頻轉換為特定的标籤,從而使自動駕駛技術更加智能、适應性強和安全。總的來説,我們的策略是開發最強大的基礎模型來解決現實世界的問題,我們将繼續在這一領網域投資,以确保我們的領導地位。