今天小编分享的科学经验:OpenAI刺破了中国AI的幻想,欢迎阅读。
OpenAI 在 6 月 25 日凌晨宣布,将从 7 月 9 日起,将阻止来自不支持其服务的国家和地区的 API 流量,而中国也在禁用名单之列。
消息一出,国产大模型们应声而动,立刻推出了相应的 " 搬家 " 或 " 迁移 " 方案。有的还提出了与 OpenAl 使用规模对等的 Token 赠送计划(不设上限),坊间戏称," 这下中国做 AI 的可以实现 token 自由了 "。
我们知道,海外对于中国 AI 的限制一直存在。但此前针对 AI 的禁令,主要是限制英伟达和 AMD 的高性能 AI 算力卡,而 OpenAI 此次强势禁用,则让 AI 軟體算法层面的 " 另一只靴子落地 "。
从硬體到軟體,越来越扩大的禁用范围,以及越来越严格的限制,无时无刻不在提醒着我们,在 AI 这一关键科技领網域,全方位阻隔中国的进步,已经是一张明牌了。
面对这个不可逆的 AI 封锁大趋势,中国企业受的影响到底有多大?AI 全面国产化,中国做好准备了吗?
放弃幻想
OpenAI 禁用到底影响了谁?
自 ChatGPT 发布以来,OpenAI 的 API 已向近 190 个国家和地区开放,其中并不包括中国。不过,一直以来,一些国内企业和用户,可以通过技术手段来继续使用 OpenAI 的服务。
对于这些来自中国的流量,OpenAI 并非检测不出,只是以前可能 " 枪口抬高了一寸 "。
而就在 6 月 22 日,美国财政部发布了一份规则草案,进一步限制美国个人和企业投资中国的半导体、量子计算和人工智能业务。新规则草案推出,面对越来越明确的 AI 封锁态势,OpenAI 也主动明哲保身,选择了加强区網域限制,采取额外措施阻止来自不受支持地区的 API 流量。
到底是什么人和公司 " 明知不可为而为之 ",在使用 OpenAI 的 API 呢?主要有三类:
一是部分自研模厂。一部分模厂会在研发阶段,调用 OpenAI 的 API,使用其 GPT 产品进行模型训练、数据对比迭代等。实际上,谷歌 Gemini-Pro 大模型的训练也曾用到了百度文心生成的数据。此前就有国内某互联网公司,被爆出经常达到 OpenAI API 的最大访问上限,不过对方也表示,仅在年初的初期探索阶段使用了 OpenAI 的 API,而在今年 4 月已经停止了这种做法。
二是套壳 AI 公司。一些初创公司为了快速推出 AI 产品或服务,可以通过技术手段,对 OpenAI 的 API 进行封装," 改头换面 " 作为自己的产品推向市场。实际上用户的每次互動,都会通过 API 调用 OpenAI 的模型来完成。
三是面向海外市场的应用开发者。在 OpenAI 所支持的国家和地区,为了跟海外开发者 " 站在同一起跑线 ",而选择 OpenAI API。
目前来看,上述群体受 OpenAI 禁令的影响程度都不高。
随着国内模厂的模型基本完善,不用再通过调用 API 的方式收集数据。海外应用的开发,应用往往需要对本地市场的深入了解,因此国内开发者数量规模也较小。相比之下," 套壳 API" 的初创公司可能受到的打击是最大的,不过通过 " 搬家 " 切换到国产大模型,快速找到能力接近的替代方案,也能一定程度上规避风险。
所以总体来说,OpenAI 更严格的 API 限制,并不会给中国 AI 带来很大的动荡。
但这并不意味着,中国 AI 可以高枕无忧了。从 " 英伟达禁令 " 到 "OpenAI 禁令 ",发出了一个鲜明的信号:" 潘多拉魔盒 " 一旦开启,就不会关上,针对中国 AI 的封锁,也不可能在短时间内被撤回。
是时候摒弃 " 枪口抬高一寸 " 的侥幸心理和幻想了,事实证明,枪口随时可以朝下扣动扳机。
认清现实:不可逆的 AI 封锁
还有哪些牌可出?
在封锁烈度上,美国官方和 AI 企业的行动在不断加强;在封锁广度上,从高性能 AI 芯片的底层算力,到大模型的底层算法," 釜底抽薪式 " 的封锁正逐渐延伸到 AI 基础设施的各个关键部分。
那么,在算力禁运、算法禁用之后,海外想要阻隔中国 AI 的发展,还有哪些牌可以打?梳理一下 AI 軟體基础设施:
1. 框架。深度学习框架,是支持 AI 算法模型开发和部署的軟體平台,对 AI 应用的开发效率和性能有重要影响。目前国内深度学习框架市场主要由飞桨(由百度开发)、TensorFlow(由 Google 开发)、PyTorch(由 Meta 开发)三家主导,共同占据了超过 80% 的市场份额。这三家均为开源框架,允许开发者自由地查看、修改和使用其源代码,不过 TensorFlow、PyTorch 作为开源平台也需要遵守所在国法律法规,并可以通过开源许可证等方式,限制开发者的访问。
2. 算子库。包含各种数学和逻辑运算函数的库,在深度学习框架中扮演着至关重要的角色,为各种算法提供了基础的计算单元。如果算子库是闭源的,又归属于海外公司,那么可以直接限制使用。开源的算子库也要遵循一定的开源協定,協定中往往会规定代码的使用、修改和分发规则,如果开发者没有获得适当的许可或权限,也无法使用。目前,国内飞桨、昇思等 AI 开发平台都发布了算子库。
3. 数据集。AI 界有句名言 "garbage in,garbage out(垃圾进,垃圾出)",高质量的数据集,对于 AI 算法模型的性能至关重要,在大模型时代也不例外。各个领網域和应用场景都有专有数据集,比如计算机视觉领網域的 MNIST、CIFAR、ImageNet 等。NLP 领網域的 SQuAD、GLUE 等,再比如 AI 蛋白质结构预测任务所需要的数据集,如 CASP、AlphaFold DB、PDB 等,这些数据集为 AI 研究提供了丰富的数据资源,大多由海外研究机构建立。
近年来,中国 AI 领網域的高质量数据集也在快马加鞭地建设,数据治理体系也在不断完善,数据作为核心生产要素的战略地位不断提升。但现阶段,与海外一流水平还有差距。而 AI 算法的特别之处在于,不像传统軟體能一次开发完成,模型需要不断学习、迭代和进化,依赖于持续更新的数据集进行训练。一旦数据集被阻止访问,就如同剥夺了模型成长的土壤,甚至可能变得停滞不前。
此外还有编译器、IDE 等,这些軟體工具可以大大提高开发者的编程效率。如果被禁用,开发者将需要手动完成这些工作,从而导致开发效率降低,团队协作困难,甚至影响项目的进度和质量。
" 英伟达禁令 " 执行以后,一位国內某计算厂商向腦极体表示," 虽然我们还可以用特供版的 AI 芯片,但确实支持不了英伟达最新的平台了 "。
所以说,硬體、軟體基础设施共同构成了 AI 产业的支撑体系。面对阻隔中国 AI 的封锁禁令,一定要有 " 底线思维 ",軟體并不比硬體更安全,开源軟體并不比闭源軟體更安全。
准备应对
中国 AI,必须两条腿走路
提到国产化替代,总有人担忧这是在闭门造车、与世界脱节。AI 作为高度全球化的高新技术产业,这种担忧确实不无道理。
但也必须看到," 没有一次 AI 断链是我们先动的手 "。
实际上,中国 AI 产学界始终保持着开放心态,积极吸收国际先进技术,与世界接轨。斯坦福大学发布的《2024 年人工智能指数报告》显示,自 2011 年以来,GitHub 上的开源人工智能项目,中国参与度不断增长,直到 2019 年在科技领網域遭受不合理打压之后,才开始走低。
无论是芯片禁运,还是 API 禁用,都是海外以 " 国家安全 "" 保证美国 AI 领先地位 " 等理由,发起的单方面阻隔。而在短时间内,这种单方面动手的 "AI 封锁 ",并不会告一段落。
这种情况下,中国 AI 将面临一个重要抉择:是彻底国产化替代,底层软硬體全用自己的?还是继续参与全球 AI 大市场,更多利用国外技术?
小孩子才做选择,成年人全都要。中国 AI,必须学会 " 两条腿走路 "。
第一条腿,是基础软硬體的自主创新,做好全栈 AI 技术国产化的准备。
中国 AI 在底层软硬體的关键 " 卡脖子 " 环节,都积累了不少力量。以軟體为例,百度、华为云等头部大模型厂商,都建立了 "AI 大底座 ",从底层算力(百度昆仑、华为昇腾)、基础模型(文心、盘古)、深度学习框架(飞桨、昇思)、全栈 AI 开发工具平台(千帆平台、昇腾 AI 云服务)等。
这些全栈自研的 AI 软硬體基础设施,可以让中国 AI 做好 " 最坏的准备 ",无惧来自海外的断链风险。
但正如经济学家江小涓所说的,在当今科技全球化、产业全球化的格局下," 会做的全部自己做 " 并不是最优选项。
所以中国 AI 的第二条腿,是保持与全球最新趋势的紧密联系,确保信息通畅、创新同步。
还记得芯片禁运之时,有网友义愤填膺地表示要 " 对等制裁 "" 不用也没有损失 ",但一位资深从业者却说 " 别人小心眼,我们自己不能小心眼 "。美国封闭但我们不能封闭,不能自己把路走窄了。
紧密贴近全球趋势、充分利用全球资源,是中国 AI 保持领先的必要条件。一方面,吸收全球最先进的技术,中国 AI 可以在更高的起点上推动技术自主创新,避免产业链割裂带来方向迷失,错过主流的 AI 发展机会。
另一方面,中国 AI 是科技竞赛中排名全球前列的一个领網域,这种领先优势十分关键,且不容失去,必须与全球创新保持同步,因此要积极拥抱国际市场和科技合作。
随着国产算力的突破," 英伟达禁令 " 不再让 AI 算力束手无策,就在大家觉得中国 AI 稳了的时候,OpenAI 的禁令犹如一道闪电,划破了中国 AI 界对 " 限 AI= 限卡 " 的幻想。
国产算力固然是底气所在,但绝非高枕无忧的保证,来自 OpenAI 的 API 限制说明,海外 AI 軟體也并不完全可靠,同理,开源軟體也并非绝对安全的屏障。
AI 产业链封锁,如同悬在头顶的达摩克利斯之剑。但换个角度看,逐渐加码的禁令,恰恰是之前的措施劳而无功,没能起到彻底阻拦中国 AI 进步的效果,这也间接反映出中国 AI 产业的生存活力,是不会轻易被阻隔在世界之外的。
中国 AI,唯有认清现实,把一张张产业链王牌都握在自己手心里,才能继续留在全球大市场的牌桌上。