今天小編分享的科技經驗:中國AI產業地圖:誰是“大模型之都”,歡迎閲讀。
經濟觀察報記者 任曉寧 實習記者 陶思羽 譚玉清
一場關于大模型的地網域競速已經開始。
" 現在已有 80 餘個大模型公開發布,其中北京約占一半 ",北京市經濟和信息化局黨組書記、局長姜廣智最近在接受媒體采訪時説。
經濟觀察報記者不完全統計發現,在新一輪生成式 AI 熱潮中,全國已經出現了 106 個大模型,其中北京的大模型公司數量和研發數量均占據 "C 位 ",多達 54 個;上海在 AI 算力方面積累了優勢;深圳、廣州、杭州、成都等城市也都有多個大模型公司。
今年 4 月 28 日,中共中央政治局會議提出,要重視通用人工智能發展,營造創新生态,重視防範風險。5 月 5 日召開的二十屆中央财經委員會第一次會議指出,要把握人工智能等新科技革命浪潮。之後,全國各地相繼推出大模型扶持政策。搶占新一輪 AI 高地,各大城市正在行動中。
目前,各地大模型均還在内測中,未開放給公眾。大模型發展仍處于混沌初開時刻,最終誰能勝出,成為真正的 " 大模型之都 ",還需繼續觀察。
北京:54 個
姜廣智的話并不誇張,據經濟觀察報不完全統計,截至 7 月 13 日,北京已有 54 個大模型公司。
中關村是北京大模型公司的核心聚集地。經濟觀察報記者在五道口走訪時,方圓 3 公裏内,就坐落着近 10 個大模型創業公司,它們也都是中國大模型公司中的佼佼者。
五道口清華大學南門外,搜狐網絡大廈 3 層,是王慧文創辦的光年之外。這家公司成立剛 4 個月,以 20.65 億元的價格被美團收購。搜狐大廈對面是智源大廈,北京智源人工智能研究院坐落其中,院長是北京大學計算機科學技術系主任黃鐵軍,這是學院派的中堅力量之一,早在 2021 年,智源就推出了中國首個超大規模預訓練模型 " 悟道 2.0",參數量達到 1.75 萬億。
智源大廈往南 800 米,是王小川創辦的百川智能,7 月 11 日,百川智能發布參數量 130 億的通用大語言模型 "Baichuan-13B-Base"。
距離智源大廈 3 公裏外的丹棱街上,MiniMax 北京團隊在這裏辦公,這是當前國内估值最高的大模型創業公司,6 月最新一輪融資後,估值 12 億美元。丹棱街 1 公裏之外,是銜遠科技的辦公室,這家公司由京東前 AI 掌門人周伯文創辦。
坐落在中關村附近的,還有李開復的大模型新公司 " 零一萬物 ",這家公司 7 月 3 日剛成立,目前團隊已經有數十名核心成員。
出門問問創始人李志飛的公司也在海澱,他們推出了大模型產品 " 序列猴子 "。這附近也有互聯網大廠推出的大模型產品,比如位于知春路的字節跳動,在 6 月 28 日發布了大模型服務平台 " 火山方舟 "。
如果把中關村的範圍擴大到方圓 10 公裏,大模型公司更多。中關村向北 10 公裏,是互聯網大廠的聚集地後廠村。今年 3 月,百度在百度科技園裏發布了文心大模型,是國内第一個互聯網大廠發布的大模型。
同在北京發布大模型的大廠,還有位于望京的 360,今年發布了 " 智腦大模型 "。位于亦莊的京東,發布了 " 言犀大模型 "。
北京還有一批中等規模公司也發布了大模型,比如昆侖萬維的 " 天工 "、知乎的 " 知海圖 "、網易有道的 " 子曰 "、第四範式的 " 式説 " ……
根據 IDC《2022-2023 中國人工智能計算力發展評估報告》,北京位居 2022 年中國人工智能城市排行榜首位。獵聘研究院發布的《AIGC 就業趨勢大數據報告 2023》顯示,在近一年 AIGC 新發職位城市分布 TOP10 中,北京職位最多,占比為 22.21%。
AI 政策扶持方面,北京市正在發力。5 月份,北京市政府 12 天内連發 3 個 AI 相關檔案。5 月 19 日,發布《北京市通用人工智能產業創新夥伴計劃》;5 月 30 日,印發《北京市促進通用人工智能創新發展的若幹措施》;5 月 30 日,印發《北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023-2025 年)》。
姜廣智也提到,北京市經信局将按季度迭代推出大模型應用成果,形成一批人工智能與經濟社會發展深度融合的典型案例,并正在籌劃通過算力券等形式支持模型夥伴和模型觀察員,首期預計支持不低于 4000 萬元算力券,補貼到模型夥伴企業。
上海:12 個
今年 7 月 8 日,在 2023 世界人工智能大會閉幕式上,《上海市推動人工智能大模型創新發展的若幹措施》公布,并發布了 " 模 " 都倡議,成立上海人工智能開源生态產業集群,打造 AI" 模都 "。
圍繞創新能力、創新要素、創新應用、創新環境四大方向,上海将重點打造三項計劃以及五大平台。三項計劃分别為:大模型創新扶持計劃、智能算力加速計劃、示範應用推進計劃。
不過,與北京的大模型企業數量相比,上海稍微遜色了一籌。據經濟觀察報不完全統計,截至 7 月 13 日,上海共有 12 個大模型,分别是:總部位于上海的 MiniMax、復旦大學的 MOSS、商湯科技的日日新、達觀數據的曹植、微盟的 WAI、星環科技的無涯和求索、樂言科技的樂言、醫療算網的 Uni-talk、上海 AI 實驗室的書生通用大模型體系、虎博科技的 TigerBot、智臻智能的小 i、蜜度的蜜度文修。
上海大模型的帶頭人,是商湯及復旦大學。今年 7 月,商湯日日新大模型更新到了 2.0 版本,還在大模型基礎上推出了小模型。復旦大學的 MOSS 于今年 2 月推出,MOSS 系統負責人邱錫鵬説,MOSS 在中文能力上已超 ChatGPT。
雖然大模型數量沒有北京多,不過,在每家大模型公司都離不開的算力、芯片方面,上海處于遙遙領先的位置。
今年上半年,英偉達股價暴漲,原因是他們的 GPU 可以為大模型提供算力,由于 GPU 出貨量有限,市場供不應求。在上海,也分布着一眾國產 GPU 公司。
闵行區和上海自由貿易試驗區是上海芯片公司重鎮。陳行公路上,坐落着壁仞科技、天數智芯等為大模型計算提供通用 GPU 芯片的國產龍頭芯片公司。上海自由貿易試驗區,林立着芯璐科技、日觀芯設、世瞳微電子等從芯片設計到生成的不同節點、不同研發類型的半導體公司。
張江也是上海芯片公司聚集地。今年世界人工智能大會上,張江的芯片公司們集中發布了芯片新品,包括沐曦集成的 " 曦思 N100 人工智能推理 GPU"、瀚博半導體的 " 瀚博第二代全功能 GPU 芯片 "、燧原科技的 " 人工智能雲端訓練芯片邃思 2.0" 等。
同時,上海外資芯片公司較多,闵行區紫竹科學園區,有着半導體芯片巨頭英特爾的中國區公司,定義了 GPU 的英偉達,其中國區公司也在上海。
除了大模型之外,上海也是上一波深耕計算機視覺的 "AI 四小龍 " 商湯科技、依圖科技的發源地。2019 年,上海浦東新區成為全國第一個人工智能先導區。現在,上海交大、復旦、同濟、上大等 13 所高校和 5 個科研院所都設立了人工智能相關學科點。
AI 扶持政策上,上海在全國範圍内都跑得很快。去年 9 月,上海出台了全國首部 AI 省級法規《上海市促進人工智能產業發展條例》,提到上海市推動算法模型交易流通,上海市經濟信息化部門會同相關部門指導行業組織制定人工智能算法模型推薦目錄,降低算法模型交易風險,提高算法模型交易效率。《條例》指出,上海市支持相關主體開展基于先進架構的高效能智能芯片設計創新,研制雲端芯片和雲端智能伺服器,布局類腦芯片,強化軟硬體協同适配,支持聯合建設研發測試和應用平台,加強技術協同和芯片架構互聯互通,提升智能芯片產品和技術競争力,培育智能芯片應用生态體系。
深圳:11 個
在深圳龍崗政數局的行政服務大廳,大模型已應用于政務咨詢服務系統,背後提供支撐的就是雲天勵飛技術股份有限公司名為 " 天書 " 的大模型。這家 AI 公司今年 4 月 4 日登陸科創板,是 " 深圳人工智能第一股 ",目前市值 229 億元。
深圳另一家做自然語言處理技術的追一科技,今年也發布了其自主研發的大模型 " 博文 Bowen",落地于金融、政務等垂直場景。
此外,深圳也有大模型科研力量。在深圳福田,前微軟全球執行副總裁、AI 及技術研發體系負責人沈向洋挂帥的 IDEA 研究院,推出了開源通用大模型 " 姜子牙 " 系列并開源封神榜第 99 個通用大模型 " 姜子牙通用大模型 v1"。姜子牙大模型擁有 130 億參數,可進行千億 token 量級預訓練。同時,香港中文大學(深圳)和深圳市大數據研究院訓練并開源了一個醫療大模型—— HuatuoGPT(華佗 GPT),以使語言模型具備像醫生一樣的診斷能力和提供有用信息的能力。
" 北京做的是 0 到 1 的事情,上海做的是從 1 到 10 的事情,深圳則是做從 10 到 100 的事情。" 一位專注深圳人工智能企業的研究人士這樣形容深圳在 AI 領網域與北京、上海的不同。在他看來,深圳的 AI 公司擅長的是最上層 AI 應用,可能還要等半年到 1 年時間,才是深圳公司大顯身手的時刻。
前不久,上述人士對當地大模型公司做了摸底工作,最新數據是,深圳有 11 家做大模型的公司和機構,其中既有通用大模型,也有行業大模型。
當然,深圳 AI 毫無疑問的龍頭公司還是華為。7 月 7 日下午,華為發布盤古大模型 3.0,并且華為也提供算力,7 月 6 日,華為旗下算力解決方案昇騰 AI 集群全面更新,集群規模從最初的 4000 卡集群擴展至 16000 卡,為業界首個萬卡 AI 集群。
5 月 31 日,深圳市印發《深圳市加快推動人工智能高質量發展高水平應用行動方案(2023-2024 年)》,同步發布首批 " 城市 +AI" 應用場景清單,統籌設立規模 1000 億元的人工智能基金群,以最充足的算力、最大的政策支持、最優的產業生态、最好的人才環境、最豐富的場景應用,打造國家新一代人工智能創新發展試驗區和國家人工智能創新應用先導區。
上述研究人士告訴經濟觀察報,由于大模型創業門檻比較高,需要頂尖人才,偏基礎研究,在大模型發展早期,北京這樣高校多的城市有優勢。深圳制造業發達,将來會強在應用端和產業化。
7 月 4 日,深圳市人工智能產業協會研究團隊發布的《深圳市人工智能產業發展白皮書(2023 年度)》顯示,2022 年,深圳市人工智能產業規模達 2488 億元。
其中,深圳市人工智能核心產業規模達 308 億元,同比增長 52.48%;企業數量方面,2022 年,深圳市人工智能企業數量達 1920 家;產業鏈分布方面,2022 年,深圳市人工智能基礎層僅占企業總數量的 8.13%,技術層占企業總數量的 17.29%,應用層占企業總數量的 74.58%;區網域分布方面,2022 年,深圳市人工智能企業主要集中在南山、寶安兩區,合計占比高達 58.1%。其中,南山區數量占 36.8%,寶安區占 21.3%。
杭州:8 個
據經濟觀察報不完全統計,杭州的大模型有 8 個,最大的是阿裏雲的通義大模型家族,此外還有西湖心辰的西湖、宇視科技的梧桐、恒生電子的 Light-GPT、螞蟻集團的貞儀、新華三 H3C 的百業靈犀、實在智能的塔斯、網易伏羲的玉言。
杭州 AI 龍頭是阿裏巴巴,目前,阿裏雲通義大模型家族已經有 3 款大模型,包括通義千問、通義聽悟和通義萬相。阿裏巴巴旗下的螞蟻集團也發布了貞儀大模型。
杭州另一股 AI 力量來自網易。在 2023 世界人工智能大會上,網易伏羲多款 AI 大模型產品首次亮相,包括 " 玉言 "、" 丹青 " 等。
浙江西湖邊上,還坐落着一家大模型創業公司西湖心辰,這家公司與西湖大學等科研機構合作,融合了學院派的力量,發布了西湖大模型。今年以來,西湖心辰獲得了百度、湯姆貓的投資,其最新一輪融資發生在 7 月,完成超億元戰略融資。
據 IDC 與浪潮信息聯合發布的系列《中國人工智能計算力發展評估報告》,近五年,杭州穩居十大算力城市的前三席,與北京、深圳角逐,顯示出強大的競争力。
在算力載體方面,杭州擁有阿裏雲城市大腦、海康威視視頻感知國家新一代人工智能開放創新平台,以及腦與腦機融合前沿科學中心、人工智能協同創新中心、國家數據智能技術創新中心國家級創新平台。
同時,杭州的科技公司還找到了一個現成的試驗場:電商產業。作為電子商務之都,頻繁更新的内容生產需要催生了電商對于 AIGC 的市場需求,這成為當前 AIGC 在杭州市場化落地的支柱項目。目前杭州科技企業的 AIGC 服務已經能實現電商場景的快速搭建,除了營銷文字外,商家所需要的產品介紹,圖片素材都可以通過 AIGC 自動生成。去年流行一時的 AI 繪畫,部分新媒體已經在使用的 AI 内容生成等,杭州企業的相關產品也已推出。
政策方面,去年底杭州發布《2022 年杭州市第三批重點建設的人工智能應用場景清單》,涉及智慧城市、智慧制造、智慧醫療、智慧交通、智慧金融等多個領網域,共 46 個重點建設人工智能應用場景入選。今年 6 月,杭州市經信局起草了《關于加快推進人工智能產業創新發展的實施意見(征求意見稿)》,現向社會公開征求意見。
目前之江實驗室、阿裏達摩院、浙江大學等科研院校都在加大對 AIGC 領網域的研究。
廣州:4 個
據經濟觀察報不完全統計,廣州有 4 個大模型,分别是雲從科技的從容、華南理工大學未來技術學院的扁鵲和靈心、數説故事的 SocialGPT、賽靈力科技的達爾文。
2021 年 7 月,廣州市科學技術局就發布了《廣州市人工智能產業鏈高質量發展三年行動計劃(2021-2023 年)(征求意見稿)》,提出廣州将重點打造 1 項具有國際影響力的人工智能創新大賽、建設 10 個人工智能產業園,打造 100 個人工智能典型應用場景,培育超 1000 家人工智能企業。
去年 9 月,廣州市發布了《廣州市促進創新鏈產業鏈融合發展行動計劃(2022 — 2025 年)》點出六大重點行動。
成都:3 個
據不完全統計,成都已發布的大模型有 3 個:曉多科技與國家超算成都中心聯合發布的曉模型 XPT、醫聯科技發布的 medGPT、明途科技的 workChat 數字人。
今年 5 月,曉模型(XPT)發布,這是基于大語言模型技術開發的面向電商行業的垂類大模型。5 月 25 日,醫聯發布了國内首款醫療大語言模型—— MedGPT,致力于在真實醫療場景中發揮實際診療價值,實現從疾病預防、診斷、治療、康復的全流程智能化診療能力。5 月 31 日,明途科技正式發布明途 workChat 數字人,功能包含知識問答、AI 寫作、知識采集、輔助工具等。
今年 5 月,《2023 年成都市大數據與人工智能(含車載智能控制系統)產業建圈強鏈工作要點》印發,17 條細化舉措,給予成都大數據與人工智能(含車載智能控制系統)產業鏈發展 " 路線圖 "。
成都市的目标是,今年力争培育國家級人工智能專精特新 " 小巨人 " 企業 5 家、上市企業 1 家、上規企業 10 家,人工智能產業規模突破 700 億元。
成都市提出,鼓勵高校、科研機構、龍頭企業聯合算力中心聚焦重點產業領網域孵化原創 AI 大模型,并給予建設方每年最高 500 萬元的算力成本補貼,降低企業創新成本。每年發放總額不超過 1000 萬元的算力券,用于支持算力中介服務機構、科技型中小微企業和創客、科研機構、高校等使用國家超算成都中心、成都智算中心算力資源。
南京:3 個
身處長三角地區的南京,近年來也在着力發展 AI 產業。據不完全統計,南京已有 3 個大模型公司,分别是孩子王公司的 KidsGPT、智子引擎的元乘象和硅基智能的炎帝。
孩子王公司的 KidsGPT 在六一童玩節期間推出,專攻母嬰童垂直領網域。炎帝大模型是一個多模态的行業模型,企業可以用來做短視頻生成、直播生成、電影 / 電視劇生成、甚至數字永生等方面的工作。智子引擎是一家多模态大模型初創企業,已經完成千萬元天使輪融資。該公司背後的核心團隊便是中國人民大學高瓴人工智能學院教授盧志武帶領的課題組,其大模型產品元乘象 ChatImg 參數約 150 億。
2022 年 12 月,南京市印發《南京國家人工智能創新應用先導區建設實施方案》,提出到 2025 年,南京将高标準打造 5 個人工智能產業園區,争創 1 — 2 個省級以上人工智能產業集群,培育 100 家人工智能重點企業,省級以上專精特新小巨人企業和單項冠軍企業達到 30 家,全市人工智能核心產業收入超過 500 億元。
未來,南京人工智能計算中心将繼續在算力支持之外,為企業客户提供易用的服務及產品,着眼數據、算力、算法等人工智能產業發展核心能力,賦能企業,推動人工智能產業上下遊企業在南京聚集。中心計劃于近期完成核心夥伴的模型适配驗證,将為本地企業孵化行業大語言模型提供強有力的基礎模型支撐,在江蘇打造行業大模型轉商落地标杆示範。
其他:11 個
其他發布大模型的城市還有天津、合肥、哈爾濱、沈陽、西安、長沙、綿陽、廈門。
天津已有 2 個大模型公司:國家超級計算天津中心發布的天河天元模型、慧言科技和天津大學聯合發布的海河 · 谛聽模型。
在世界人工智能大會期間,國家超算天津中心發布了天河百億級智能計算開放創新平台和國產中文大模型——天河天元。國家超算天津中心搜集整理了網頁數據、各種開源訓練數據、中文小説數據、古文數據、百科數據、新聞數據,以及專業領網域的中醫、醫藥、問診、法律等多種數據集,訓練數據集總 token 數達到 350B。
安徽合肥的 AI 公司代表是科大訊飛。今年 5 月,科大訊飛發布了星火認知大模型。科大訊飛董事長劉慶峰稱,當前訊飛星火認知大模型在文本生成、知識問答、數學能力三大能力上已超 ChatGPT。
在合肥高新區,一個圍繞智能語音和人工智能領網域的產業園區也蓬勃發展起來,被稱為 " 中國聲谷 "。這裏已有 1000 多家企業入駐,從業人員超過 5 萬人,形成了千億級的產業集群。