大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科技

百度「文心一言」首秀,大模型内測開啟

2023-05-12 简体 HK SG TW

今天小編分享的科技經驗:百度「文心一言」首秀,大模型内測開啟,歡迎閱讀。

3 月 16 日,百度文心一言如約而至。在 ChatGPT 發布三個月後,國内終于有了第一款可以對标的產品。

文心一言是基于文心大模型推出的生成式對話產品。從今年 2 月消息外洩開始,這個項目就備受外界矚目。在百度集團内部也上升為過去兩個月裡優先級最高的項目,并由 CTO 王海峰博士親自挂帥。

李彥宏在現場展示了文心一言在文學創作、商業文案創作、數理邏輯推算、中文語境下典故理解、多模态信息生成等不同場景下的案例。

而對于目前文心一言的性能,李彥宏也坦言這類語言大模型的門檻非常高,現在的表現不算完美,會持續訓練提升。「一旦有了真實的人類反饋,文心一言的進步速度會非常快,我們都希望它快點成長,早日為用戶和客戶創造價值。」

或許正是出于這樣的考慮,百度這次在宣傳上十分低調,避開了「發布」、「推出」這樣的字眼,将此次活動命名為文心一言的「邀請測試會」。極客公園獲得内測碼後,測試了一下古文理解能力,并與 ChatGPT 做了同題對比。在古文理解上,似乎它更擅長一些。

生成式 AI 的浪潮才剛剛開始,大模型不會是最後的王炸,而是這場遊戲的牌桌。百度選擇在這個時間點發布,或許正是認為相比一個完美的產品,先有一個牌桌讓中國的玩家們參與遊戲,才是今天最重要的事情。

01 寫詩,做視頻,算雞兔同籠

會上,李彥宏表示「文心一言」對标的是 ChatGPT(亦即 GPT-3.5),甚至最新發布的 GPT-4。這意味着,文心一言需要在開放網域多輪對話的場景下,具有内容創作、知識問答、數學計算、寫作代碼等不同能力。對标 GPT-4 則又增加了處理圖片、文字等不同維度信息的能力。

李彥宏演示了文學創作、商業文案創作、數理邏輯推算、中文語境下典故理解、多模态信息生成等不同場景下的實例。

在文學創作場景中,文心一言根據對話問題将知名科幻小說《三體》的核心内容進行了總結,并提出了五個續寫《三體》的建議角度。

在商業文案創作場景中,在「建立一個大模型為中小企業數字化更新的科技服務公司」設定下,文心一言完成了給公司起名、寫 Slogan、寫新聞稿的創作任務。

在數學計算上,文心一言解答了經典的「雞兔同籠」問題。

此外,為了展示文心一言對中文語言的更強理解能力,李彥宏根據「洛陽紙貴」這一典故進行連續追問:洛陽紙貴是什麼意思?當時洛陽紙多貴;在經濟學原理中;對應的理論是什麼;寫一首藏頭詩。

在多模态的能力上,李彥宏請文心一言創作「世界智能交通大會」的海報,并讓模型用四川方言回答「智能交通最适合哪個城市發展」,并将以上内容再轉化為視頻。

信息的多模态轉換并非百度的新技術,此前在百家号中,根據文章生成短視頻即來源于此。李彥宏表示,「生成視頻因為成本比較高,還沒有對所有用戶開放,未來我們會逐步接入。」

李彥宏表示,文心一言針對中文理解,表現出更優秀的能力。不過相對于英文、代碼場景的訓練還是不夠好,接下來會繼續完善相關能力。

極客公園拿到内測碼,和 ChatGPT(GPT3.5 版本)對比了一下古文理解能力。文心一言回答對了《項脊軒志》最後一句話的含義、出處、及作者。而 ChatGPT 只回答對了句意。

總體而言,今天的發布會更像宣布了一個時間點,作為中國市場類 ChatGPT 產品空白的填充。而接下來,基于真實用戶的數據反饋,模型将持續進行迭代。

02 大模型時代,AI 技術棧變化

在上一輪深度學習熱潮中,百度開始了對 AI 的技術投入,至今已經 12 年。近十年,百度累計投入超過 1000 億元的研發開支,核心研發投入占核心收入比例連續 8 個季度超過 20%。在全棧能力積累至今,是百度能夠在短短幾個月的時間内集中突破瓶頸,将文心一言完善到可以邀請外界測試的基礎。

7 年前,當 Alpha Go 戰勝李世石,產業内外共同意識到了深度神經網絡展示其強大威力。如今,發布于 2017 年的 Transformer 被認為是比卷積神經網絡更有延展性的架構。

基于此架構,AI 從原來的識别模式發展到生成模式。形象而言,如果大模型是房屋,那麼 Transformer 便是搭建房屋的「磚頭」。

然而,訓練作為系統工程的大模型,遠遠比「搭建房屋」要復雜得多,不少有過訓練模型經驗的從業者,更喜歡用「造火箭」來形容。因此,真正要實現模型的訓練、數據閉環、持續迭代,需要全面技術能力和基礎設施支持。

在 ChatGPT 出現後,随着微軟、谷歌進入視野,首先人們意識到牌桌上巨頭的身影,以搜索業務起家的百度,也順理成章成為視野内可見的第三位巨頭玩家。

不過,可能很少有人知道,2012 年百度就曾和微軟、谷歌坐在同一張拍賣桌上。那時候,圖靈獎得主、深度學習三巨頭之一的 Geoffrey Hinton 和 Open AI 總裁 Brockman 拍賣共同創立的技術公司,當初四家競标企業之中的唯一中國身影,便是百度(另外三家分别是谷歌、微軟與 DeepMind)。

2013 年,百度建立了深度研究院(IDL),随之在 AI 領網域,開始了從芯片、框架、模型算法、到應用全面能力的布局。

在算力上,百度 2012 年即投建了陽泉計算中心。2022 年,正式更新為「智算中心」。此次,陽泉智算中心也專門搭建了一個機房支持「文心一言」訓練。該中心最高支持每秒 400 億億次浮點運算。當模型投入使用之後,這裡将與江蘇鹽城等地的其他幾座智算中心一起支持大模型的運算。

文心一言的模型演進始于 2019 年的 ERNIE 1.0,此後,百度不斷發布新模型。2021 年,發布了百億參數中英雙語的對話大模型 PLATO-X,以及知識增強大模型 ERNIE 3.0。

CTO 王海峰表示,文心一言是在 ERNIE 及 PLATO 系列模型的基礎上研發的。「文心」系列模型是百度持續研發的一系列模型,而「文心一言」則是最新研發,基于對話場景下的通用模型。

CTO 王海峰介紹「文心一言」相關技術|來源:百度

文心模型也一直在服務百度的產品。在模型的能力的加持下,百度搜索的問題分類準确率提升 4.5%,新聞去重召回率提升 8%,視頻推薦召回率提升 10%,小度的意圖理解準确率提升了 3.1%。

王海峰介紹,在文心一言的研發過程中,深度學習框架所提供的支持也頗為關鍵。「飛槳有效支撐了大模型的靈活開發、高效訓練和推理部署。」飛槳平台,也是百度 AI 技術成果的重要部分。目前,飛槳是除了國際兩大主流框架 TensorFlow 和 PyTorch 之外,國内影響最大的深度學習框架,平台上開發者數量已經達到 535 萬,創建 AI 模型超過 67 萬個。

生成式 AI 讓市場的需求爆發式增長,意味着除了底層模型的開發人員之外,需要更多開發者加入,進行不同環節、不同層面的開發工作。這也意味着基于大模型,會形成新的技術棧。

提到基于模型開發 AI 應用,李彥宏表示「文心一言讓每一家公司離客戶更近,利用新的能力,做出更好的客戶體驗」。服務客戶,首先需要服務開發者。當學習框架與底層模型的訓練适配,無疑能為更多開發者基于通用模型繼續開發應用,提供更友好的環境。

03 李彥宏:大模型帶來三大產業機會,「模型即服務」是未來的雲

演講中李彥宏坦言,目前文心一言的效果尚不完美。王海峰也表示,在對大模型的最終訓練環節中,在人類反饋的強化學習(RLHF)上做的還不夠充分。

但大模型的市場需求日益增長,國内大模型的空白急需填補,這是百度選擇在今天發布的原因之一。邀請測試會的最後一個環節,百度正式宣布了向 C 端和 B 端開放測試。首批用戶采用邀請制,可以通過邀請碼在「文心一言」官網進行產品體驗 ;面對企業用戶,百度智能雲開放 API 接口調用。

李彥宏還透露,近期,百度智能雲将召開發布會。屆時,将圍繞文心一言的雲服務和應用產品做介紹。接入了大模型的智能,既能夠提供公有雲服務,也可以做私有化部署。

而在上個月的 Q4 财報電話會上,他便強調了大模型對于雲服務的加持。「之前選擇雲廠商更多看算力、存儲等基礎雲服務。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應用之間的協同。這會根本性地改變雲計算市場的遊戲規則。」

李彥宏介紹「文心一言」|來源:百度

這也是百度智能雲的新機會。在文心一言發布會上,李彥宏提出,大模型将會帶來新型的雲計算。主流商業模式從将從 IaaS 變為 MaaS。所謂 Maas,是「模型即服務」。依托雲設施,模型将其推理能力快速接入軟體公司,後者能夠做出更新的產品體驗。

傳聞中投資 OpenAI 百億美金的微軟,也在做相同的布局。目前,GPT-4 的模型能力也已經集成在微軟 Azure 中,并通過雲服務的方式向外提供服務,即為 Azure OpenAI 產品。微軟還表示,為了能夠支持大模型的持續更新,針對大語言模型培訓,專門優化了 Azure 的基礎設施。

李彥宏認為,大模型将為 AI 產業帶來三大機會,雲服務是其中之一,另外兩個分别是「行業模型精調」、「基于大模型底座進行應用開發」。

前者服務的是企業客戶,應用行業 Knowhow,提供垂直領網域解決方案;後者直接面向普通用戶開發產品,在文本生成、影像生成、音頻生成、視頻生成、數字人、3D 等場景,今天已經湧現出很多創業明星公司,他們可能就是未來的新巨頭。

值得注意的是,要實現模型能力的大規模發放,還需要解決部署端的快速調用問題。目前出現「智能湧現」的大模型,參數達到了一定量級之後,在多種任務的能力上,都具備了小模型所不具備的能力水平。并且這種表現是「突然出現」的。這使得在模型的綜合表現令人驚喜,也成為 ChatGPT 已經具備了產品屬性的原因。

當人們使用模型回答問題、整合信息,或者創作能力生成文本草稿時,便是在調用模型的實時計算推理能力。這與訓練模型所需求的數據訓練、參數調優等能力相比,需要的是基礎設施支持上的軟硬體協同效率、服務穩定性的能力。

如何實現靈活地調用模型能力,也将是構建商業模式的關鍵。這裡面可能涉及到很多具體挑戰,比如對于數據隐私要求極高的醫療、金融等行業,不适合将數據直接接入大模型。而領網域的專業性要求,又需要基于通用能力,基于專業數據進行精調。

大模型的訓練成本極高。将大模型微調後,服務于相關企業,如何既保留大模型的能力,又節約算力成本,并實現本地化部署、迭代,将是未來服務行業需要解決的問題。

目前,百度積累了芯片、框架、模型、應用的四層技術架構。李彥宏表示,「在全球範圍内,在四層架構的每一層都有領先產品的公司幾乎沒有,百度的優勢非常獨特,相信大家會在後續文心的迭代速度上有明顯感受。」

文心一言的測試開始,也意味着數據飛輪即将啟動。随着真實用戶反饋的建立,在 AI 上積累了十多年,百度的機會剛剛開始。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們