今天小編分享的科技經驗:AI大模型“國家隊”定了,歡迎閲讀。
全文共計 4673 字,預計閲讀時間 8 分鍾
編輯 | 蒲蒲
我國大模型 " 國家隊 " 已完成首次 " 選拔組隊 "。
百度、華為、阿裏等入局
近日,在 2023 世界人工智能大會(WAIC2023)上,國家标準委指導的國家人工智能标準化總體組宣布,我國首個大模型标準化專題組組長,由上海人工智能實驗室與百度、360、華為、阿裏等企業聯合擔任,現場進行了證書頒發并正式啓動大模型測試國家标準制訂。
這意味着百度、華為、阿裏等入局了 " 大模型國家隊 "。
公開資料顯示,今年 5 月,國家啓動大模型标準化工作,人工智能标準化總體組設立大模型專題組,啓動大模型專題組組長、副組長申報和大模型标準化研究選題建議工作。大模型專題組将承擔大模型标準化制訂工作,目的是推動大模型技術和标準化的實踐結合,促進人工智能產業健康發展。
大模型專題組組長要求在大模型理論研究和產業應用等方面具有較高專業水平,熟悉大模型領網域國際前沿科技發展态勢、法規制度與标準規範等。聯合組長部門需要發揮在大模型領網域的理論和實踐經驗,圍繞大模型軟硬體底座、關鍵技術、產業應用等重點領網域的突出問題提供标準化研究選題建議。
大模型内卷,百 "模" 大戰開啓
當前,中國大模型呈現蓬勃發展态勢。近年來,中國大模型技術沿各技術路線迅速發展,在自然語言處理、機器視覺和多模态等領網域湧現出多個具有行業影響力的預訓練大模型。
科技部新一代人工智能發展研究中心發布的《中國人工智能大模型地圖研究報告》顯示,從全球已經發布的大模型分布來看,中美兩國數量合計占全球總數的超 80%,美國在大模型數量方面居全球之首,中國目前則已進入大模型快速發展期,與美國保持同步增長态勢。
據不完全統計,截止今年 5 月,中國 10 億參數規模以上的大模型已發布 79 個。毫不誇張地説," 百模大戰 " 已開啓。IDC 預測,2026 年中國人工智能軟體及應用市場規模将達到 211 億美元,人工智能将進入大規模落地應用關鍵期。科技企業們感覺到了 " 一日千裏 "" 時不我待 "。
《報告》分析發現,中國自 2020 年進入大模型加速發展期,目前與美國保持同步增長态勢。在自然語言處理、機器視覺和多模态等各技術分支上均在同步跟進、快速發展,湧現出盤古、悟道、文心一言、通義千問、星火認知等一批具有行業影響力的預訓練大模型,形成了緊跟世界前沿的大模型技術群。
《報告》顯示,目前中國在 14 個省市 / 地區均有團隊在開展大模型研發,北京、廣東兩地最多,地網域集中度相對較高。從領網域分布來看,自然語言處理仍是目前大模型研發最為活躍的重點領網域,其次是多模态領網域,在計算機視覺和智能語音等領網域的大模型還較少。國内大學、科研機構、企業等不同創新主體都在積極參與大模型研發,學術界與產業界之間的聯合開發還不充分。
《報告》通過調研全國範圍内的算力基礎設施分布情況發現,北京、廣東、浙江、上海等地的大模型數量最多,同時這 4 個地方也是近 3 年人工智能伺服器采購數量最多的地區,表現出非常明顯的強相關性,為大模型研發應用提供了重要支撐。同時,各地也在通過提供公共智能算力方式補充快速增長的人工智能算力需求,為大模型研發提供更多算力支撐。
《報告》分析發現,目前中國大模型產業化應用大致出現兩種并行的發展路徑,文心一言、通義千問、紫東太初等中國一批通用化大模型正在快速發展,打造跨行業通用化人工智能能力平台,其應用行業正在從辦公、生活、娛樂向醫療、工業、教育等加速滲透。
與此同時,一批針對生物制藥、遙感、氣象等垂直領網域的專業類大模型,正在發揮其領網域縱深優勢不斷深化落地,提供針對特定業務場景的高質量專業化解決方案。
根據騰訊研究院、同濟大學、騰訊雲、騰訊新聞共同發布的《人機共生——大模型時代的 AI 十大趨勢觀察》報告," 大模型 " 已可以在多個領網域催生出全新的商業價值,第一批跨功能的應用程式已在眼前:金融、零售、政府、制造、物流、地產、教育等多個行業,以及财務、HR、客服等應用場景," 大模型 " 展現了出色能力。報告預測,各行業都将迅速整合大模型的能力。與其他颠覆型技術一樣,這種變革一開始會緩慢發展,然後迅速加速。
國内大模型列表如下
AI 大模型實力哪家強?
為了更好地評估和比較這些模型在中文領網域的表現,已經有針對中文的通用大模型的測評基準。
中文通用大模型基準(SuperCLUE)就是其中的一個測評基準,嘗試對主流的 AI 通用模型進行一個可量化的對比評分。它主要回答的問題是:在當前通用大模型大力發展的情況下,中文大模型的效果情況。包括但不限于:這些模型不同任務的效果情況、相較于國際上的代表性模型做到了什麼程度、 這些模型與人類的效果對比。SuperCLUE 從三個不同的維度評價模型的能力:基礎能力、專業能力和中文特性能力。其中專業能力包括中學、大學與專業考試,涵蓋了從數學、物理、地理到社會科學等 50 多項能力。
近日,SuperCLUE 發布了大模型 6 月榜單。6 月榜單由 4 部分組成:總排行榜、基礎能力榜單、中文特性榜單、70 億參數量級榜單。
2023 年 6 月 SuperCLUE 中文大模型總排行榜
2023 年 6 月 SuperCLUE 基礎能力榜單
2023 年 6 月 SuperCLUE 中文特性榜單
2023 年 6 月 SuperCLUE-70 億參數量級榜單
從榜單上的測評結果來看,GPT-4 的綜合能力和單項能力都表現非常出色,各榜單中 GPT-4 都是獨占鳌頭,比第二名 GPT-3.5-turbo 要強不少;其次是 GPT-3.5-turbo、Claude,二者評分旗鼓相當。
國内的幾個大模型的表現只能説是有待加強,與 GPT4 的差距還是相當明顯的,在 AI 大模型的競賽中,國内模型的追趕步伐還得再快些,按 360 集團創始人周鴻祎話説,目前中國 AI 模型與 GPT-4 之間的差距在 2 到 3 年左右。
大模型時代的 AI 十大趨勢
針對大模型 AI 技術發展,騰訊研究院、同濟大學、騰訊雲、騰訊新聞基于產學研等多方在 AI 領網域的研究,共同發布了《人機共生——大模型時代的 AI 十大趨勢觀察》報告,從技術、應用、社會等角度,提出大模型時代的關鍵性趨勢觀察。
十大趨勢分别為:LLM 推動人工智能快速進化到 AGI 階段,多模态助力大模型解決復雜問題,生成式 AI 帶來更貼近人的互動方式,模型即服務(MaaS)生态呼之欲出,垂直領網域應用是大模型的主戰場,Plugin 工具讓大模型迎來 App Store 時刻,大模型為數字人 " 注入靈魂 ",AI 大模型将幫助個體成為超級生產者,版權 " 思想表達二分法 " 基石正在動搖,倫理和安全建設塑造負責任的 AI 生态。
技術趨勢
大語言模型和多模态技術将助力人工智能向 AGI 發展
AGI(通用人工智能)是一種具有所有人類智能能力的機器,它可以理解、學習、适應和實現任何知識工作。報告顯示,自 2010 年代初深度學習問世以來,人工智能進入到第三次高潮,而 2017 年出現的 Transformer 算法,又将深度學習推向了大模型時代。以 ChatGPT 為代表的大語言模型,展現出來的推理、思維鏈等能力,讓人類感到驚訝,尤其是 GPT4 在多種能力測試中達到人類頂級水平,更是讓人類看到了 AGI 的曙光。
未來真正的 AGI 可以自然地處理多種類型信息,它需要具有高效的多模态信息處理機制。報告認為,多模态 AI 不僅能夠處理單一數據類型的任務,而且可以在不同數據類型間建立聯系和融合,為解決復雜問題提供支持,因此多模态 AI 也将助力人工智能向 AGI 發展。
報告還強調,多模态 AI 也将帶來創新應用的藍海,例如多模态 AI 可以擴展在社交媒體中的實時語音、文字、影像和視頻的處理能力,為傳統遊戲和增強現實 / 虛拟現實(AR / VR)應用帶來更為豐富和沉浸式體驗。
應用趨勢
AI 将給產品互動、企業生态、商業模式等多個領網域帶來變革
在應用層面,報告重點提到了 AI 對產品互動、企業生态、商業模式、個人創作能力等方面的變革。
在產品互動方面,過去人類用鍵盤滑鼠與電腦互動,用手指觸屏與手機互動,用喚醒詞與智能音箱互動,但生成式 AI 讓人類可以用自然語言的方式跟機器對話,機器也可以通過大模型擁有理解人類語言的能力。報告顯示,過去的數次人機互動變革,都帶來了從終端到連接,到各類應用的颠覆式變革,生成式 AI 也必将帶來產業鏈、價值鏈和生态的重塑。
在商業模式方面,大模型促進了 AI 的工業化,并且正在重構現有的商業模式,未來将形成模型即服務的 MaaS 生态。報告顯示,未來的數字化商業将分為大模型基礎設施型企業、垂直行業領網域的小模型應用企業,以及更加貼合個人用户的模型應用和服務。這一生态的建立和發展,将更廣泛地賦能各行業應用,加快社會各領網域數字化轉型、智能化發展,帶來全社會的生產效率提升。
此外,垂直領網域應用将是大模型的主戰場。随着生成式人工智能技術的飛速發展,它已經在多個領網域展現出全新的商業價值。在中國,諸多行業企業也已經看到生成式 AI、大模型可能為企業帶來競争優勢。金融行業、文化娛樂行業等頭部機構預計會在一年内,在相對成熟的場景中嘗試引入大模型以及生成式 AI 能力。
與此同時,MaaS 服務正助力加速行業大模型落地。騰訊雲從產業客户需求場景出發,基于大模型高性能計算集群和大模型能力,依托騰訊雲 TI 平台打造模型精選商店,為客户提供 MaaS 一站式服務和行業大模型解決方案,全面降低落地門檻,助力客户構建專屬大模型及智能應用。截至目前,騰訊雲已聯合行業頭部企業,為 10 大行業輸出了超過 50 個解決方案,提供一整套模型服務工具鏈,幫助企業高效宰、高品質、低成本創建和部署 AI 應用。
對于個人來講,AI 大模型将助力個體成為超級生產者。報告指出,基于生成式 AI 的新應用快速進化,湧現出許多新型面向個體的生產力應用。在創意制作、文本生成、影像和視頻工具、學習工具、閲讀工具、市場分析、編程等各個領網域快速融入工作流,從信息處理、個性化學習、輔助創作、智能優化等方面協助人類創作,賦能個體成為超級生產者。在大模型的加持下,人工智能正在從 " 工具 " 變成 " 夥伴 ",人機關系将進入到下一階段。
社會趨勢
重點審視版權歸屬難題和倫理挑戰
在社會觀察層面,報告重點關注當下受到 AI 衝擊最為明顯的兩個領網域:版權與治理。
傳統的版權制度立足于 " 思想表達二分法 " 這一基本原則,即 " 只保護自然人思想的表達,而不保護自然人的思想本身 "。報告指出,在人工智能時代,版權制度如果無法對 " 人的創造性思想 " 和 "AI 模型的獨創性表達 " 加以有效回應,那麼其适用價值将會受到極大影響。
同時,生成式 AI 也帶來了更加復雜難控的風險,包括對人類未來生存的潛在風險。報告指出,AI 時代需要成為一個負責任創新的時代,人們需要建立合理審慎的 AI 倫理和治理框架,塑造負責任的 AI 生态,打造人機和諧共生的未來。
其中,生成式 AI 領網域的創新主體需要積極探索技術上和管理上的安全保障措施,為生成式 AI 的健康發展和安全可控應用構築起防護欄。
▐ 風口洞察
▐ 行業報告
▐ 國際要聞
▐ 政策新規
▐ 數據觀出品
>