今天小編分享的科技經驗:百度李彥宏:如果沒有應用,DeepSeek等 AI 模型和芯片都沒有價值,歡迎閲讀。
百度創始人、CEO 李彥宏
4 月 25 日消息,钛媒體 AGI 獲悉,今天上午武漢舉行的百度 Create 開發者大會上,百度創始人、董事長兼 CEO 李彥宏正式發布文心大模型 4.5 Turbo 和文心大模型 X1 Turbo。
李彥宏認為,當下以 DeepSeek 為代表的部分模型仍然存在模态單一、幻覺高、速度慢和價格貴等問題,而百度發布這兩款新模型,正是為了解決這些問題。
李彥宏在演講中表示,DeepSeek 橫空出世,MCP(模型上下文協定)逐漸被接受為行業标準,代碼智能體和通用智能體等多智能體協作產品被廣泛關注,越來越多的人加入到開發者的隊伍。過去一年,開源中國社區增加了 150 萬個開發者,但同時,不少開發者充滿了焦慮,模型迭代這麼快,模型能力也越來越強,那麼開發者基于大模型開發出來的應用,會不會很快就過時,就沒有價值了——這種擔心不無道理。
" 大模型的世界風雲變幻,幾乎每周都有發布,天天有更新。去年第四季度有 49 個大模型更新發布,今年一季度就有 55 個,最多的時候一周發 8 個模型。一邊,大模型的廠商卷生卷死,另外一邊對于開發者來説又無所适從,不敢放心大膽的做應用,為什麼?因為擔心自己做的應用被模型迭代給快速覆蓋掉,這樣就相當于是白費了功夫。" 李彥宏稱。
李彥宏認為,當前對于開發者來説是一把雙刃劍。一方面,開發者确實需要理解技術發展的趨勢,避開大模型自身發展的延長線;另一方面,日益強大的模型能力其實給開發者帶來了更多選擇,需要找對場景、選對基礎模型。
李彥宏強調,AI 應用才是真正創造價值的。沒有 AI 應用,什麼模型、什麼芯片其實都沒有價值。
這是李彥宏對于 AI 技術行業的最新言論。
早前,李彥宏曾表示,中國的大模型太多。國内有 200 多個大模型其實都沒有什麼使用量。他還曾指出,百模大戰是對社會資源的極大浪費,更多資源應該放在超級應用。同時,包括百度在内的大公司内部反應太慢、生產力落後。
2024 年 7 月,李彥宏直言開源模型就是 " 智商税 "。" 當你理性地去想,大模型能夠帶來什麼價值,以什麼樣的成本帶來價值的時候,就會發現,你永遠應該選擇閉源模型。今天無論是 ChatGPT、還是文心一言等閉源模型,一定比開源模型更強大,推理成本更低。"
2024 年 4 月百度 Create 大會上,李彥宏再度表示,同等效果下,成本明顯更低,所以開源 AI 模型會越來越落後。随着今年中國開源 AI 大模型 DeepSeek-V3/R1 風靡全球之後,李彥宏的這句話再被熱議。
李彥宏曾強調,大模型的算力推理其實很貴。所以説開源大模型的價值在教學科研這些領網域,要想搞清楚大模型的工作原理是什麼,如果不知道源代碼什麼的肯定是有劣勢的,但是真正在商業領網域,當你追求的是效率、效果,追求的是最低的成本時,開源模型是沒有優勢的。
李彥宏表示,DeepSeek 不是萬能的,比如它只能處理文本,還不能夠理解聲音、圖片、視頻等多模态内容,而百度智能雲的很多客户都需要這種多模理解和生成的能力;同時再比如,它的幻覺率比較高,在很多場合你不能夠放心使用,如果在電商直播當中幻覺出 " 買一送一 " 的優惠,那麼商家就要賠慘了;此外,中國市場上絕大多數大模型 API 的調用的價格都比 DeepSeek 滿級版要低,而且反應速度也更快。
如今,李彥宏發布全新文心大模型 4.5 Turbo 和文心大模型 X1 Turbo。對比文心 4.5,Turbo 版速度更快、價格下降 80%,每百萬 tokens 的輸入價格僅為 0.8 元,輸出價格 3.2 元,僅為 DeepSeek-V3 的 40%;而文心大模型 X1 Turbo 價格,僅為 DeepSeek R1 調用價格的 25%,輸入價格 1 元 / 百萬 tokens,輸出價格 4 元 / 百萬 tokens。
此外,百度還公布基于昆侖芯三代 P800 的中國首個點亮的全自研的 3 萬卡集群,李彥宏稱其同時承載多個滿血版 DeepSeek 這樣千億參數大模型進行全量訓練,也可以支持 1000 個客户做百億參數大模型精調。
" 現在可以説,在中國開發應用,我們有底氣。" 李彥宏在演講結尾表示,堅信應用創造未來,開發者創造未來。
(本文首發于钛媒體 App,作者|林志佳)