今天小編分享的科學經驗:百度AI,和“吳文俊獎”同行的十二年、千丈山、萬裏路,歡迎閲讀。
今天,AI 正作為一個科技發展周期的軸心,成為萬眾矚目的焦點。與歷史上數次技術革命和 AI 浪潮所不同的是,這次 AI 的全球領先陣營裏,有了中國的身影。
從一個學術靈感,到一項全球領先的專利技術,從一篇頂會論文到一個宏大的 AI 產業布局,中國 AI 的量變和質變,凝結了無數人扎根在泥土中一步一個腳印的寸進。
5 月 6 日,第十二屆吳文俊人工智能科學技術獎頒獎典禮正式舉辦。其中,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰帶領團隊完成的 " 知識與深度學習融合的通用對話技術及應用 " 成果,榮獲 "2022 年度吳文俊人工智能科技進步獎特等獎 ",這也是 " 吳文俊獎 " 首次評出特等獎。
這一個特殊的時刻,承載了一個 " 中國人工智能最高獎 "、一個中國 AI 科學家、一個中國 AI 科技企業的十二年光陰。
如果大家對中國 AI 如何一步步前行而感到好奇,那麼這個獎項正好是機會,可以看到一個人和一家企業,究竟是如何征服山嶺的。
敢登千丈山
和 " 吳文俊獎 " 同行的百度攀山路
這兩天,大家一定看到了很多 " 吳文俊獎 " 的消息。
将時間退回到 2011 年,中國人工智能學會剛剛發起 " 吳文俊人工智能科學技術獎 " 的那一天,絕大多數人都無法想象,中國 AI 能有這樣的盛況。
十二年,對于 " 吳文俊獎 ",以及百度和王海峰,都是一條值得感慨的時間旅程。
十二年前,剛剛發起的 " 吳文俊獎 " 規模尚小,第一屆只頒出了五個獎項,獲獎者大多來自北京郵電大學、中科院自動化所等高校院所。十二年來,該獎先後授予了兩百多個部門和行業機構,以及七百多位專家學者,見證了中國 AI 學術力量和產業力量的崛起。
這個中國 AI 醖釀量變的過程,百度的身影一直都在。
早在 2010 年,大部分人對 AI 的想象,還跟科幻電影一樣,覺得非常遙遠、看不懂的時候,百度已經開始積累 AI 技術。2010 年,王海峰加入百度,推動 NLP、知識圖譜、深度學習等 AI 技術進入新的應用空間。
百度技術進入了新的階段,一系列 AI 布局接連啓動。比如 2010 年成立的百度自然語言處理部(NLP),是百度歷史最悠久的基礎技術部門之一;2013 年,百度深度學習研究院(IDL)成立,是中國產業界最早觸摸深度學習技術的機構之一。随後百度又相繼打造了大數據實驗室 BDL、硅谷人工智能實驗室 SVAIL、百度研究院等研究機構。
正是與 AI 的結緣夠早、夠深,百度才能在人工智能領網域達成全面領先,第一個看到未知的遠處風景。
王海峰,作為推動 AI 產學研融合的一面旗幟,是 " 吳文俊獎 " 十二年歷史中,首個 " 吳文俊人工智能傑出貢獻獎 " 的得主。
王海峰團隊的 " 知識與深度學習融合的通用對話技術及應用 ",則拿下了吳文俊人工智能科技進步獎首個特等獎。
從中,我們也可以看到," 吳文俊獎 " 究竟在嘉獎什麼。
能夠讓代表中國人工智能領網域最高榮譽的 " 吳文俊獎 ",打破常規,因為百度 AI 不斷深入技術無人區,主動探索那些未被發覺的地帶。
以此次獲 " 特等獎 " 的 " 知識與深度學習融合的通用對話技術及應用 " 為例,這一研究項目解決了該領網域的四方面技術難題:
提出了基于知識統一表示的通用對話管理技術,解決了對話不連貫的難題;提出了融合知識的流式對話語音識别技術,解決了對話聽不清的難題;提出了知識增強的通用對話理解技術,解決了理解不準确的難題;提出了基于隐變量與知識的對話生成技術,解決了回復有錯誤的難題。
王海峰在發表獲獎感言時提到:" 通用對話技術是人工智能領網域最具挑戰性的方向之一,也被認為是通用人工智能的必備能力。團隊多年來持續在技術上探索和創新,突破了知識與深度學習融合的通用對話技術,目前已廣泛應用于各行各業和人們生產生活中。"
敢登千尺山的百度,最終和 " 吳文俊獎 " 一起,見證中國 AI 一路走來,和世界頂峰相見。
深耕 AI 路
夯實底層技術,長出文心一言
對于首個吳文俊人工智能科技進步獎特等獎,院士專家給出了這樣的評語," 整體技術指标與應用效果達到國際領先水平,極大地提升了我國在這一領網域的科技競争力和產業影響力 "。
不難看到,學術高度與產業廣度,是百度獲獎研究項目的兩大特點。
據了解,百度的通用對話技術已經獲授權發明專利 82 項,發表高水平論文 36 篇,在國際權威評測中獲得了 11 項世界冠軍。同時,其也實現了大規模的產業應用,基于小度等業務,支持了 5 億智能設備的對話能力提升,服務了超過 10 億用户,其應用領網域覆蓋通信、金融、汽車、能源等 20 多個行業。
如今,百度在通用對話技術上的積累和突破,也經由技術藍圖,流向了全新的領網域。比如讓全球矚目的 AI 新貴:大語言模型。
很多人都認為,文心一言是全球第一個由科技大廠自研的大語言模型。它的出現讓中國快速跻身全球 LLM 的第一梯隊,為中國 AI 争取到了更大的戰略空間,而文心一言的背後,就有成熟的通用對話技術作為支撐。
對話增強是文心一言的核心技術特征之一,讓文心一言具備更強的上下文理解、多輪對話能力,強化文心一言對話的完成度、連貫性、合理性,而對話增強,就是百度基于通用對話技術優勢的再創新。百度提出了全球首個基于隐空間的生成式開放網域對話大模型文心 PLATO,不斷提高模型的内容豐富性和連貫性。文心 PLATO 是百度研發的具有大規模參數的中英文對話預訓練生成模型,經歷多次更新,現已更新到百億參數的文心 PLATO 版本。正是長期積累下來的通用對話技術,讓文心一言具備了對話增強這個關鍵優勢。
除了對話增強之外,文心一言還具備知識增強、檢索增強等技術特點。
在知識增強方面,得益于百度構建的 5500 億事實的知識圖譜,以及早在 2019 年 3 月就提出了知識增強的語義理解框架 ERNIE,百度不斷強化語義理解技術能力。
文心一言基于龐大的知識圖譜來做知識增強,從海量數據和大規模知識中融合學習,還可以直接調用知識圖譜做知識推理,自動構建提示,高效滿足用户需求。
而檢索增強也是基于百度已有的語義理解技術優勢的創新。百度擁有世界上最大的中文搜索引擎,百度搜索已經發展到基于語義理解和匹配的新一代搜索架構,深入理解用户需求和網頁内容,進行語義匹配,得到更精準的搜索結果,進而為大模型提供準确率高、時效性強的參考信息,更好地滿足用户需求。
更值得一提的是,文心一言還在飛速成長中。
王海峰在一次采訪中透露,在内測時,有員工疑惑,文心一言怎麼寫不好藏頭詩,而當時文心一言還處于學習階段,王海峰很有信心,説 " 差不多明後天就能學會了 ",果然第二天文心一言就能寫藏頭詩了。王海峰説:" 信心就是因為我們對系統的能力有比較準确的把握。"
最近,飛槳又專門針對文心一言做了專項優化,一個月内迭代了 4 次,推理性能提升 10 倍,其中業内首創的支持動态插入的分布式推理引擎,推理性能提升了 123%。
可以説,文心一言的各個方面,都展現出了百度夯實底層技術,系統化積累技術優勢的技術戰略。顯然,王海峰的技術視野與技術關懷,在其中扮演了關鍵角色。
技術攀登是一個非常漫長的過程,如果沒有對于技術動能的持續補充,可能因為 " 體力不支 ",而無法堅持到登頂的那一天。基于文心大模型 ERNIE 及對話大模型 PLATO 的文心一言,能走的更遠、更快,靠的正是百度 AI 技術的持久續航。
青山遮不住
百度 AI,向產業衝鋒
從 " 訓大模型 " 到 " 用大模型 ",已經成為中國產學政各界這一波大語言模型浪潮的深層期待。
如何穿越 AI 與產業之間的無人區,走向千行百業,與社會更具深度地融合,是今天擺在科技企業面前的新挑戰。
文心一言的技術核心,來自百度積累了十餘年的四層架構:芯片、框架、模型、應用,這一整套技術體系,共同支撐文心一言向產業衝鋒。
芯片層,百度有自研的量產 AI 芯片昆侖。同時,百度還跟硬體行業上下遊建立了緊密的合作,與主流國内外芯片廠商進行了非常好的适配,所以任何一家有合适的 AI 算力,文心一言都能用得起來,這就保障了後續 AI 業務發展所需要的算力資源。
框架層,百度自主研發的中國首個開源開放的產業級深度學習平台飛槳,支撐了大模型的靈活開發、高效訓練和推理部署。
模型層,文心大模型 ERNIE 及對話大模型 PLATO 等自研模型已經證明了,文心一言的核心技術都是掌握在中國企業手裏。
應用層,百度已經打造并開放了 200 多項 AI 能力和應用,并在飛槳平台提供大量應用模型、開發者工具,以及定制化服務,幫助各行業更簡單地将 AI 用起來。
這四層架構,合在一起,展現出百度 AI 布局的全面與長遠,也成為文心一言持續向上攀爬的保障。
用王海峰的話説,有了百度獨特的技術和積累,能給普通用户帶來不一樣的感受:一是效果更好,文心一言能記住上下文,給出更新的信息、更準确的知識;二是效率更高,模型推理效率提高,用户等待的時間更短了。
從中,我們能看到,百度 AI 在產業中鮮明的差異化特征:
1. 向上,保持核心技術突破,勇于探索技術無人區,主動承擔了全球範圍内底層技術的突破任務,保持着中國 AI 與世界最前沿的并列或領先。
2. 向下,做實 AI 基礎設施,确保產業自主可控。大模型訓練推理,需要芯片、框架、開發工具等一系列軟硬體,核心基礎設施不能掌握在自己手裏,產業使用時就會有顧慮。百度在 AI 領網域四層架構實現了全面的核心技術自研,解除 AI 產業化和產業 AI 化的後顧之憂。
3. 向前,帶頭構建產業生态,打通大模型到產業的關隘。通過開源開放的飛槳生态,以及飛槳產業賦能中心,把 AI 技術沉澱下去、開放出去、讓各行業都用起來,幫助更多人爬上 AI 這座高峰,看見路前方的風景。
此時再回眺百度 AI,會發現領先不是一個結果,而是由一個個技術腳印所串聯起來的過程。這些過往凝結在一起,才有了我們熟悉的百度 AI,與新生的文心一言。
獲得 " 吳文俊獎 ",頂峰之上的百度,正在攀登更高的山。大模型所開啓的 AI 與產業融合之路,有如一片未知的土地,藴藏着極大價值可能性,但也充滿了變數,需要勇敢者先抵達彼端,一探究竟。
十二年彈指一瞬,走在科技前沿的百度,已踏上天地重開一境寬的新旅途。青山萬丈,遮不斷赤子的眼眸;雀喧鸠聚,擋不住行者的腳步。
>