今天小编分享的科技经验:中国AI产业地图:谁是“大模型之都”,欢迎阅读。
经济观察报记者 任晓宁 实习记者 陶思羽 谭玉清
一场关于大模型的地網域竞速已经开始。
" 现在已有 80 余个大模型公开发布,其中北京约占一半 ",北京市经济和信息化局党组书记、局长姜广智最近在接受媒体采访时说。
经济观察报记者不完全统计发现,在新一轮生成式 AI 热潮中,全国已经出现了 106 个大模型,其中北京的大模型公司数量和研发数量均占据 "C 位 ",多达 54 个;上海在 AI 算力方面积累了优势;深圳、广州、杭州、成都等城市也都有多个大模型公司。
今年 4 月 28 日,中共中央政治局会议提出,要重视通用人工智能发展,营造创新生态,重视防范风险。5 月 5 日召开的二十届中央财经委员会第一次会议指出,要把握人工智能等新科技革命浪潮。之后,全国各地相继推出大模型扶持政策。抢占新一轮 AI 高地,各大城市正在行动中。
目前,各地大模型均还在内测中,未开放给公众。大模型发展仍处于混沌初开时刻,最终谁能胜出,成为真正的 " 大模型之都 ",还需继续观察。
北京:54 个
姜广智的话并不夸张,据经济观察报不完全统计,截至 7 月 13 日,北京已有 54 个大模型公司。
中关村是北京大模型公司的核心聚集地。经济观察报记者在五道口走访时,方圆 3 公里内,就坐落着近 10 个大模型创业公司,它们也都是中国大模型公司中的佼佼者。
五道口清华大学南门外,搜狐网络大厦 3 层,是王慧文创办的光年之外。这家公司成立刚 4 个月,以 20.65 亿元的价格被美团收购。搜狐大厦对面是智源大厦,北京智源人工智能研究院坐落其中,院长是北京大学计算机科学技术系主任黄铁军,这是学院派的中坚力量之一,早在 2021 年,智源就推出了中国首个超大规模预训练模型 " 悟道 2.0",参数量达到 1.75 万亿。
智源大厦往南 800 米,是王小川创办的百川智能,7 月 11 日,百川智能发布参数量 130 亿的通用大语言模型 "Baichuan-13B-Base"。
距离智源大厦 3 公里外的丹棱街上,MiniMax 北京团队在这里办公,这是当前国内估值最高的大模型创业公司,6 月最新一轮融资后,估值 12 亿美元。丹棱街 1 公里之外,是衔远科技的办公室,这家公司由京东前 AI 掌门人周伯文创办。
坐落在中关村附近的,还有李开复的大模型新公司 " 零一万物 ",这家公司 7 月 3 日刚成立,目前团队已经有数十名核心成员。
出门问问创始人李志飞的公司也在海淀,他们推出了大模型产品 " 序列猴子 "。这附近也有互联网大厂推出的大模型产品,比如位于知春路的字节跳动,在 6 月 28 日发布了大模型服务平台 " 火山方舟 "。
如果把中关村的范围扩大到方圆 10 公里,大模型公司更多。中关村向北 10 公里,是互联网大厂的聚集地后厂村。今年 3 月,百度在百度科技园里发布了文心大模型,是国内第一个互联网大厂发布的大模型。
同在北京发布大模型的大厂,还有位于望京的 360,今年发布了 " 智腦大模型 "。位于亦庄的京东,发布了 " 言犀大模型 "。
北京还有一批中等规模公司也发布了大模型,比如昆仑万维的 " 天工 "、知乎的 " 知海图 "、网易有道的 " 子曰 "、第四范式的 " 式说 " ……
根据 IDC《2022-2023 中国人工智能计算力发展评估报告》,北京位居 2022 年中国人工智能城市排行榜首位。猎聘研究院发布的《AIGC 就业趋势大数据报告 2023》显示,在近一年 AIGC 新发职位城市分布 TOP10 中,北京职位最多,占比为 22.21%。
AI 政策扶持方面,北京市正在发力。5 月份,北京市政府 12 天内连发 3 个 AI 相关檔案。5 月 19 日,发布《北京市通用人工智能产业创新伙伴计划》;5 月 30 日,印发《北京市促进通用人工智能创新发展的若干措施》;5 月 30 日,印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025 年)》。
姜广智也提到,北京市经信局将按季度迭代推出大模型应用成果,形成一批人工智能与经济社会发展深度融合的典型案例,并正在筹划通过算力券等形式支持模型伙伴和模型观察员,首期预计支持不低于 4000 万元算力券,补贴到模型伙伴企业。
上海:12 个
今年 7 月 8 日,在 2023 世界人工智能大会闭幕式上,《上海市推动人工智能大模型创新发展的若干措施》公布,并发布了 " 模 " 都倡议,成立上海人工智能开源生态产业集群,打造 AI" 模都 "。
围绕创新能力、创新要素、创新应用、创新环境四大方向,上海将重点打造三项计划以及五大平台。三项计划分别为:大模型创新扶持计划、智能算力加速计划、示范应用推进计划。
不过,与北京的大模型企业数量相比,上海稍微逊色了一筹。据经济观察报不完全统计,截至 7 月 13 日,上海共有 12 个大模型,分别是:总部位于上海的 MiniMax、复旦大学的 MOSS、商汤科技的日日新、达观数据的曹植、微盟的 WAI、星环科技的无涯和求索、乐言科技的乐言、医疗算网的 Uni-talk、上海 AI 实验室的书生通用大模型体系、虎博科技的 TigerBot、智臻智能的小 i、蜜度的蜜度文修。
上海大模型的带头人,是商汤及复旦大学。今年 7 月,商汤日日新大模型更新到了 2.0 版本,还在大模型基础上推出了小模型。复旦大学的 MOSS 于今年 2 月推出,MOSS 系统负责人邱锡鹏说,MOSS 在中文能力上已超 ChatGPT。
虽然大模型数量没有北京多,不过,在每家大模型公司都离不开的算力、芯片方面,上海处于遥遥领先的位置。
今年上半年,英伟达股价暴涨,原因是他们的 GPU 可以为大模型提供算力,由于 GPU 出货量有限,市场供不应求。在上海,也分布着一众国产 GPU 公司。
闵行区和上海自由贸易试验区是上海芯片公司重镇。陈行公路上,坐落着壁仞科技、天数智芯等为大模型计算提供通用 GPU 芯片的国产龙头芯片公司。上海自由贸易试验区,林立着芯璐科技、日观芯设、世瞳微电子等从芯片设计到生成的不同节点、不同研发类型的半导体公司。
张江也是上海芯片公司聚集地。今年世界人工智能大会上,张江的芯片公司们集中发布了芯片新品,包括沐曦集成的 " 曦思 N100 人工智能推理 GPU"、瀚博半导体的 " 瀚博第二代全功能 GPU 芯片 "、燧原科技的 " 人工智能云端训练芯片邃思 2.0" 等。
同时,上海外资芯片公司较多,闵行区紫竹科学园区,有着半导体芯片巨头英特尔的中国区公司,定义了 GPU 的英伟达,其中国区公司也在上海。
除了大模型之外,上海也是上一波深耕计算机视觉的 "AI 四小龙 " 商汤科技、依图科技的发源地。2019 年,上海浦东新区成为全国第一个人工智能先导区。现在,上海交大、复旦、同济、上大等 13 所高校和 5 个科研院所都设立了人工智能相关学科点。
AI 扶持政策上,上海在全国范围内都跑得很快。去年 9 月,上海出台了全国首部 AI 省级法规《上海市促进人工智能产业发展条例》,提到上海市推动算法模型交易流通,上海市经济信息化部门会同相关部门指导行业组织制定人工智能算法模型推荐目录,降低算法模型交易风险,提高算法模型交易效率。《条例》指出,上海市支持相关主体开展基于先进架构的高效能智能芯片设计创新,研制云端芯片和云端智能伺服器,布局类腦芯片,强化软硬體协同适配,支持联合建设研发测试和应用平台,加强技术协同和芯片架构互联互通,提升智能芯片产品和技术竞争力,培育智能芯片应用生态体系。
深圳:11 个
在深圳龙岗政数局的行政服务大厅,大模型已应用于政务咨询服务系统,背后提供支撑的就是云天励飞技术股份有限公司名为 " 天书 " 的大模型。这家 AI 公司今年 4 月 4 日登陆科创板,是 " 深圳人工智能第一股 ",目前市值 229 亿元。
深圳另一家做自然语言处理技术的追一科技,今年也发布了其自主研发的大模型 " 博文 Bowen",落地于金融、政务等垂直场景。
此外,深圳也有大模型科研力量。在深圳福田,前微软全球执行副总裁、AI 及技术研发体系负责人沈向洋挂帅的 IDEA 研究院,推出了开源通用大模型 " 姜子牙 " 系列并开源封神榜第 99 个通用大模型 " 姜子牙通用大模型 v1"。姜子牙大模型拥有 130 亿参数,可进行千亿 token 量级预训练。同时,香港中文大学(深圳)和深圳市大数据研究院训练并开源了一个医疗大模型—— HuatuoGPT(华佗 GPT),以使语言模型具备像医生一样的诊断能力和提供有用信息的能力。
" 北京做的是 0 到 1 的事情,上海做的是从 1 到 10 的事情,深圳则是做从 10 到 100 的事情。" 一位专注深圳人工智能企业的研究人士这样形容深圳在 AI 领網域与北京、上海的不同。在他看来,深圳的 AI 公司擅长的是最上层 AI 应用,可能还要等半年到 1 年时间,才是深圳公司大显身手的时刻。
前不久,上述人士对当地大模型公司做了摸底工作,最新数据是,深圳有 11 家做大模型的公司和机构,其中既有通用大模型,也有行业大模型。
当然,深圳 AI 毫无疑问的龙头公司还是华为。7 月 7 日下午,华为发布盘古大模型 3.0,并且华为也提供算力,7 月 6 日,华为旗下算力解决方案昇腾 AI 集群全面更新,集群规模从最初的 4000 卡集群扩展至 16000 卡,为业界首个万卡 AI 集群。
5 月 31 日,深圳市印发《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024 年)》,同步发布首批 " 城市 +AI" 应用场景清单,统筹设立规模 1000 亿元的人工智能基金群,以最充足的算力、最大的政策支持、最优的产业生态、最好的人才环境、最丰富的场景应用,打造国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区。
上述研究人士告诉经济观察报,由于大模型创业门槛比较高,需要顶尖人才,偏基础研究,在大模型发展早期,北京这样高校多的城市有优势。深圳制造业发达,将来会强在应用端和产业化。
7 月 4 日,深圳市人工智能产业协会研究团队发布的《深圳市人工智能产业发展白皮书(2023 年度)》显示,2022 年,深圳市人工智能产业规模达 2488 亿元。
其中,深圳市人工智能核心产业规模达 308 亿元,同比增长 52.48%;企业数量方面,2022 年,深圳市人工智能企业数量达 1920 家;产业链分布方面,2022 年,深圳市人工智能基础层仅占企业总数量的 8.13%,技术层占企业总数量的 17.29%,应用层占企业总数量的 74.58%;区網域分布方面,2022 年,深圳市人工智能企业主要集中在南山、宝安两区,合计占比高达 58.1%。其中,南山区数量占 36.8%,宝安区占 21.3%。
杭州:8 个
据经济观察报不完全统计,杭州的大模型有 8 个,最大的是阿里云的通义大模型家族,此外还有西湖心辰的西湖、宇视科技的梧桐、恒生电子的 Light-GPT、蚂蚁集团的贞仪、新华三 H3C 的百业灵犀、实在智能的塔斯、网易伏羲的玉言。
杭州 AI 龙头是阿里巴巴,目前,阿里云通义大模型家族已经有 3 款大模型,包括通义千问、通义听悟和通义万相。阿里巴巴旗下的蚂蚁集团也发布了贞仪大模型。
杭州另一股 AI 力量来自网易。在 2023 世界人工智能大会上,网易伏羲多款 AI 大模型产品首次亮相,包括 " 玉言 "、" 丹青 " 等。
浙江西湖边上,还坐落着一家大模型创业公司西湖心辰,这家公司与西湖大学等科研机构合作,融合了学院派的力量,发布了西湖大模型。今年以来,西湖心辰获得了百度、汤姆猫的投资,其最新一轮融资发生在 7 月,完成超亿元战略融资。
据 IDC 与浪潮信息联合发布的系列《中国人工智能计算力发展评估报告》,近五年,杭州稳居十大算力城市的前三席,与北京、深圳角逐,显示出强大的竞争力。
在算力载体方面,杭州拥有阿里云城市大腦、海康威视视频感知国家新一代人工智能开放创新平台,以及腦与腦机融合前沿科学中心、人工智能协同创新中心、国家数据智能技术创新中心国家级创新平台。
同时,杭州的科技公司还找到了一个现成的试验场:电商产业。作为电子商务之都,频繁更新的内容生产需要催生了电商对于 AIGC 的市场需求,这成为当前 AIGC 在杭州市场化落地的支柱项目。目前杭州科技企业的 AIGC 服务已经能实现电商场景的快速搭建,除了营销文字外,商家所需要的产品介绍,图片素材都可以通过 AIGC 自动生成。去年流行一时的 AI 绘画,部分新媒体已经在使用的 AI 内容生成等,杭州企业的相关产品也已推出。
政策方面,去年底杭州发布《2022 年杭州市第三批重点建设的人工智能应用场景清单》,涉及智慧城市、智慧制造、智慧医疗、智慧交通、智慧金融等多个领網域,共 46 个重点建设人工智能应用场景入选。今年 6 月,杭州市经信局起草了《关于加快推进人工智能产业创新发展的实施意见(征求意见稿)》,现向社会公开征求意见。
目前之江实验室、阿里达摩院、浙江大学等科研院校都在加大对 AIGC 领網域的研究。
广州:4 个
据经济观察报不完全统计,广州有 4 个大模型,分别是云从科技的从容、华南理工大学未来技术学院的扁鹊和灵心、数说故事的 SocialGPT、赛灵力科技的达尔文。
2021 年 7 月,广州市科学技术局就发布了《广州市人工智能产业链高质量发展三年行动计划(2021-2023 年)(征求意见稿)》,提出广州将重点打造 1 项具有国际影响力的人工智能创新大赛、建设 10 个人工智能产业园,打造 100 个人工智能典型应用场景,培育超 1000 家人工智能企业。
去年 9 月,广州市发布了《广州市促进创新链产业链融合发展行动计划(2022 — 2025 年)》点出六大重点行动。
成都:3 个
据不完全统计,成都已发布的大模型有 3 个:晓多科技与国家超算成都中心联合发布的晓模型 XPT、医联科技发布的 medGPT、明途科技的 workChat 数字人。
今年 5 月,晓模型(XPT)发布,这是基于大语言模型技术开发的面向电商行业的垂类大模型。5 月 25 日,医联发布了国内首款医疗大语言模型—— MedGPT,致力于在真实医疗场景中发挥实际诊疗价值,实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。5 月 31 日,明途科技正式发布明途 workChat 数字人,功能包含知识问答、AI 写作、知识采集、辅助工具等。
今年 5 月,《2023 年成都市大数据与人工智能(含车载智能控制系统)产业建圈强链工作要点》印发,17 条细化举措,给予成都大数据与人工智能(含车载智能控制系统)产业链发展 " 路线图 "。
成都市的目标是,今年力争培育国家级人工智能专精特新 " 小巨人 " 企业 5 家、上市企业 1 家、上规企业 10 家,人工智能产业规模突破 700 亿元。
成都市提出,鼓励高校、科研机构、龙头企业联合算力中心聚焦重点产业领網域孵化原创 AI 大模型,并给予建设方每年最高 500 万元的算力成本补贴,降低企业创新成本。每年发放总额不超过 1000 万元的算力券,用于支持算力中介服务机构、科技型中小微企业和创客、科研机构、高校等使用国家超算成都中心、成都智算中心算力资源。
南京:3 个
身处长三角地区的南京,近年来也在着力发展 AI 产业。据不完全统计,南京已有 3 个大模型公司,分别是孩子王公司的 KidsGPT、智子引擎的元乘象和硅基智能的炎帝。
孩子王公司的 KidsGPT 在六一童玩节期间推出,专攻母婴童垂直领網域。炎帝大模型是一个多模态的行业模型,企业可以用来做短视频生成、直播生成、电影 / 电视剧生成、甚至数字永生等方面的工作。智子引擎是一家多模态大模型初创企业,已经完成千万元天使轮融资。该公司背后的核心团队便是中国人民大学高瓴人工智能学院教授卢志武带领的课题组,其大模型产品元乘象 ChatImg 参数约 150 亿。
2022 年 12 月,南京市印发《南京国家人工智能创新应用先导区建设实施方案》,提出到 2025 年,南京将高标准打造 5 个人工智能产业园区,争创 1 — 2 个省级以上人工智能产业集群,培育 100 家人工智能重点企业,省级以上专精特新小巨人企业和单项冠军企业达到 30 家,全市人工智能核心产业收入超过 500 亿元。
未来,南京人工智能计算中心将继续在算力支持之外,为企业客户提供易用的服务及产品,着眼数据、算力、算法等人工智能产业发展核心能力,赋能企业,推动人工智能产业上下游企业在南京聚集。中心计划于近期完成核心伙伴的模型适配验证,将为本地企业孵化行业大语言模型提供强有力的基础模型支撑,在江苏打造行业大模型转商落地标杆示范。
其他:11 个
其他发布大模型的城市还有天津、合肥、哈尔滨、沈阳、西安、长沙、绵阳、厦门。
天津已有 2 个大模型公司:国家超级计算天津中心发布的天河天元模型、慧言科技和天津大学联合发布的海河 · 谛听模型。
在世界人工智能大会期间,国家超算天津中心发布了天河百亿级智能计算开放创新平台和国产中文大模型——天河天元。国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以及专业领網域的中医、医药、问诊、法律等多种数据集,训练数据集总 token 数达到 350B。
安徽合肥的 AI 公司代表是科大讯飞。今年 5 月,科大讯飞发布了星火认知大模型。科大讯飞董事长刘庆峰称,当前讯飞星火认知大模型在文本生成、知识问答、数学能力三大能力上已超 ChatGPT。
在合肥高新区,一个围绕智能语音和人工智能领網域的产业园区也蓬勃发展起来,被称为 " 中国声谷 "。这里已有 1000 多家企业入驻,从业人员超过 5 万人,形成了千亿级的产业集群。