今天小编分享的互联网经验:谷歌发布大模型,国内“百模大战”鏖战正酣,欢迎阅读。
图片来源 @视觉中国
文|趣解商业,作者 | 周佟
2022 年底,OpenAI 发布 ChatGPT 掀起了人工智能热浪,时隔一年后,谷歌终于 " 杀回 " 人工智能赛道。
当地时间,12 月 6 日,谷歌正式发布了 Gemini 大模型。谷歌 CEO 桑达尔 · 皮查伊称,Gemini 的发布,是谷歌新时代的开始;但人们最关注的问题还是 Gemini 和 GPT-4 相比水平谁更高。
谷歌公司高管称,三种不同版本的套件中的 Gemini Pro,表现优于 GPT-3.5,但暂未直接回应 Gemini 与 GPT-4 相比表现如何的问题。不过外界有测评认为,它们已经超过了 GPT-4。
图片来源:微博截图
不管是否超过,作为大模型的 " 风向标 ",由一年前推出的 ChatGPT 引发的 " 生成式人工智能 " 革命,仍在不断地改写着每个人的认知。
如今巨头谷歌已 " 上线 ",过去一年,在 ChatGPT 的引领下,国内的大模型企业也从摸索和尝试,逐渐步入深水区。
" 百模大战 ",从震惊到追赶
ChatGPT 的出现并非毫无征兆。
创造它的 OpenAI 早在 2015 年便已成立,并在 2018 年就推出了初代生成式预训练模型 GPT-1,这也是 ChatGPT 最初的原型。
公开资料显示,在 GPT-1 之前,业内的 NLP 模型(Neuro logic level 自然语言处理)主要是基于针对特定任务的大量标注数据进行训练,能力有限。
GPT 是第一个结合 Transformer(多层变换器)结构和自监督预训练目标的模型,在自然语言推理、问答任务和常识推理等方面取得了突破,为此它们也获得了微软 10 亿美元投资。随后,从 GPT-1 到 GPT-2,到 GPT-3,短短 2 年时间里 GPT 的能力不断提高。
图片来源:OpenAI 官网截图
2022 年 11 月 27 日,随着由 GPT-3.5 修改而来的人工智能对话聊天机器人 ChatGPT 的推出,这个一直在小圈子走红的研究成果,才第一次为大众所认识。能聊天、画画、写文案、编代码,强大的功能,使得 ChatGPT 一经发布迅速走红,5 天时间注册用户数超过百万,两个月时间月活突破 1 亿,成为史上增长最快的消费者应用。
消息传至国内,一石激起千层浪。人工智能竟然已经发展到如此地步了?震惊之下,淘宝上售卖 ChatGPT 账号甚至都成了一门生意。与此同时,看到巨大商机的各界大佬们,也纷纷下场,表态要尽快推出自己的大模型。
率先落地的是百度。2023 年 3 月 16 日,国内首个大语言模型 " 文心一言 " 问世,发布会上,百度 CEO 李彦宏直言," 生成式 AI 是任何企业都不应错过的大机会 "。
而百度之所以能够拔得国内大语言模型的 " 头筹 ",源自其过去 10 多年中,在 AI 研发上的坚持投入。按李彦宏的说法,文心大模型的第一个版本早在 2019 年就发布了,此后每年都有更新,文心一言的发布只是百度多年努力的 " 自然延续 "。
紧接着,3 月 29 日,360 集团发布人工智能战略及 360 智腦大模型 1.0 版本,创始人周鸿祎现场演示了大模型在搜索场景的应用。4 月 11 日,阿里巴巴的 " 通义千问 " 大模型在阿里云峰会上揭晓,CEO 张勇宣布未来阿里巴巴所有产品都将接入 " 通义千问 "。5 月 6 日,科大讯飞星火大模型发布,董事长刘庆峰表态要在 10 月 24 日实现中文超过 ChatGPT,英文赶上 ChatGPT。9 月 7 日,腾讯混元大模型上线。
至此,国内传统的三大互联网巨头 "BAT" 全部下场。
此外,华为、京东、字节跳动、商汤科技、昆仑万维等等都陆续推出了大模型产品,甚至连移动、联通、电信三大运营商,长虹等家电生产企业,清华、复旦、中科院等科研院所和高校,都发布了各自的大模型。
5 月底举行的中关村论坛上,有专家披露,中国 10 亿级参数规模以上大模型已发布了 79 个;在 7 月初的 2023 世界人工智能大会中有信息表明,中国已有 130 家研发大模型的公司。此时,ChatGPT 引起的大模型研发热,已经带动国内形成 " 百模大战 " 的格局。
不过相比当初外卖界的 " 百团大战 "," 百模大战 " 对资金的需求更为苛刻。
根据 NVIDIA 官方信息,在训练底层模型阶段,训练一次 1750 亿参数的 GPT-3 需要 34 天、使用 1024 张 A100 GPU 芯片,而为了维持日常推理,OpenAI 至少需要 3.24 万张 A100,以此推算,ChatGPT 仅硬體成本就超过了 8 亿美元。
昆仑万维集团 CEO 方汉更是公开表示," 没有 2000 张 A100 的卡,实验都做不了 "。为此,海天瑞声、因赛集团等 "AI 概念股 " 甚至接连发布定增预案,募集资金用于训练大模型。
此时 ,如何在缩小与 ChatGPT 差距的同时,尽快找到应用落地的方向,实现自我造血,成为了 " 百模大战 " 中,每一位参与者都要面对的问题。
人工智能 + 将所有行业做一遍?
从商业角度分析,大模型带来的机遇,可以概括为成本减少效率提升、原有市场需求再扩大、创造新的市场需求三大类。
在今年 8 月 31 日、11 月 4 日,根据网信办《生成式人工智能服务管理办法(征求意见稿)》的要求,国内先后有两批涉及 26 家公司的 AI 大模型和 151 个深度合成衣务算法通过备案,陆续向全社会开放服务,其中的商业化尝试,也基本是围绕这三类展开的。
图片来源:网信办截图
大模型超强的人机对话、图文及音视频生成能力,不但让其在传统客服场景中获得了广泛应用,对于游戏、影视制作等也产生了深远影响。
阿里、美团的在线智能客服算法,以及中国移动的 " 九天大模型 "、中国电信的 TeleChat 大模型等,都属于此类产品,将应用场景直接锁定在了智能客服、智慧政务等方面。在今年的亚运会上,科大讯飞与中国移动联合推出了基于星火大模型的 5G 新通话,接完电话之后,申请服务,会即刻转成文字、生成纪要、生成待办事项。
游戏、影视制作方面,导演陆川曾在采访时表示," 用 AI 画电影海报,15 秒出来的效果比专业海报公司做一个月的还要好。" 光线传媒、华策影视等率先尝试将大模型应用在影视创作中的公司,股价在年中都收获了一波大涨。
原有市场需求再扩大,则体现在对于传统业务的更新上,这也是大模型应用最广泛的领網域。以传统的搜索引擎为例,接入文心一言后,在百度搜索框里输入问题,给出的可以不再是链接,而是一个更准确的答案。
10 月 17 日,文心一言 4.0 发布,根据李彦宏现场的演示,除了搜索外,百度地图、网盘、文库等十余款应用,都接入文心一言完成了重构。
旗下业务众多的腾讯,对腾讯云、腾讯广告、腾讯游戏、腾讯会议等多个业务和产品,也已完成了接入腾讯混元大模型的测试,并取得了初步效果。
图片来源:腾讯混元官网截图
此外,在传统的教育、医疗、汽车等领網域,大模型也获得了广泛的应用。接入讯飞星火大模型后,科大讯飞的学习机实现了 AI 一对一辅助教学、中英文作文批改、口语陪练等功能;百度推出了产业级的医疗行业大模型 " 灵医 ",有超过 1000 家企业级机构先行体验;华为云盘古大模型的赋能,则让问界新 M7 在智能驾驶领網域 " 遥遥领先 ",两个月大定突破 10 万台。
在创造新的市场需求方面,AI 超级助理、AI 机器人等需求也被不断创造出来。前者,包括文心一言、讯飞星火、360 智腦、通义千问等在内的各家通用大模型都有相应产品提供,它们大都能理解用户的语言语义,并具备影像理解能力,可以通过调用軟體 API,使用各种各样的工具来帮助用户完成任务;而后者,在今年 8 月 16 日举行的 2023 世界机器人大会上,包括优必选、追觅、宇树在内的不少于 10 家机器人企业,展出了相关产品,赛道也正呈现井喷态势。
图片来源:通义官网截图
不过,在一片欣欣向荣背后,也存在隐忧。比照各家大模型的应用不难发现,不管是提高效率还是扩大需求,市场上绝大多数的应用,实现的功能都较为雷同。
以 AI 学习机为例,除了科大讯飞有相关产品外,接入子曰大模型的网易有道、接入 MathGPT 的好未来、接入银河大模型的作业帮,以及接入文心一言的百度、接入 360 智腦的 360,都有类似的产品在售。功能方面,各自宣传的也都大同小异,AI 一对一辅导、全科 AI 作业助手、虚拟人口语教练等,站在消费者的角度,几乎很难体会到其中的差别。
尽管各家都能拿出一堆的排名榜单来论证,自己的大模型得分更高、能力更强,但体现在实际应用中时,那百分之几甚至是千分之几的差别,还是让人不得不产生疑惑:我们真的需要这么多大模型吗?
AI 原生应用至上,亟待 " 安卓 " 出现
对于大模型步入 " 深水区 " 将会遇到的挑战,百度创始人、董事长兼首席执行官李彦宏提出了自己的看法。
近期,在深圳 2023 西丽湖论坛开幕式上,李彦宏就直言,拥抱 AI 时代,是 " 一把手工程 "。因为 CTO、IT 负责人更关注技术本身,认为自己做大模型是交作业,结果不仅资源浪费,而且用不起来,最后一地鸡毛;只有一把手才会真的关注,新技术如何提升自己业务的关键指标,一把手上阵,才能让新技术真正为企业所用。
不断地重复开发基础大模型是对社会资源的极大浪费。在李彦宏看来,国内如今的大模型实在是太多了。根据统计,截止 10 月份,国内已经发布的大模型达到了 238 个,比 5 月科技部统计时的 79 个,翻了三倍,但与此同时,市场上真正的 AI 原生应用却很难找出几个。一把手应该主导做 AI 原生应用,而不是大模型。
"人类进入 AI 时代的标志,不是产生很多的大模型,而是产生很多的 AI 原生应用。" 李彦宏认为,大模型时代其实和 PC 时代、移动互联网时代极为类似。PC 时代,主流的作業系統只有 Windows 一个,移动互联网时代,也基本只有安卓和 iOS 两家,然而围绕着它们,诞生了无数的应用軟體。
大模型本身也属于基础底座,类似作業系統,最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。"AI 原生时代,我们需要 100 万量级的 AI 原生应用,但是不需要 100 个大模型。"
这确实是国内的大模型玩家们不得不面对的难题。尽管市场上大模型产品有几百个,但细究起来都是在各玩各的,360 智腦只为自家搜索赋能,讯飞星火此前主要是为科大讯飞的学习机产品服务。
相比大模型训练的高额花费,如果不能够有效扩大 " 朋友圈 ",让自家的大模型为更多人所用,只是一味投入,显然难以为继。
上半年大涨的 AI 概念股们,下半年几乎集体熄火,与此不无关系。科大讯飞(002230.SZ)10 月 19 日发布的三季报显示,前三季度实现营业收入 126 亿元,同比下滑 0.27%,净利润 9936 万元,同比跌了 76%。根据公告,其利润下滑的主要原因,就是源自对大模型的 " 坚定投入 "。
图片来源:财报截图
三六零(601360.SH)的情况也没有好多少,上半年尽管新兴业务 "360 智腦 " 创造了近 2000 万元营收,但在 9.1 亿元的总收入中,占比不过 2.1%。
在 " 百模大战 " 进入深水区后,如何围绕各自的大模型," 扩大朋友圈 " 创造生态,争取更多的开发者,成了国内通用大模型玩家们不约而同的选择。
在 1024 开发者节上,科大讯飞董事长刘庆峰透露,除了联合相关企业发布了包含金融、汽车、住建、法律等在内的 12 个行业大模型外,在讯飞星火上,已有 1.5 万助手开发者,开发了超过 2.9 万个助手应用。
百度则先后推出了 " 百度智能云千帆大模型平台 "、" 灵境矩阵 ",帮助企业开发自己的专属大模型,目前平台月活企业数已近万家。
阿里巴巴旗下的通义千问,从 18 亿、70 亿、140 亿到 720 亿参数规模,率先成为业界首个 " 全尺寸开源 " 的大模型,以吸引更多合作伙伴加入,共促通义千问生态建设。
去年 11 月,阿里巴巴发布 AI 开源社区 " 魔搭 ",中国 80% 的大模型研发机构把魔搭作为模型开源的首发平台。短短一年时间,魔搭汇聚了 280 万开发者、2300 多个优质模型,模型下载量超过 1 亿。
正如中国科学院院士、中国计算机学会(CCF)开源发展委员会主任王怀民所说,开源是 AI 发展的重要驱动力,AI 开源社区不仅将有力推动 AI 迈向广泛的落地应用,还将助力中国从开源世界的参与者逐步成长为引领者。
大模型行业的未来,如智能手机系统的迭代。曾经,除了苹果的 iOS 外,手机作業系統中还有诺基亚的 Symbian、微软的 Windows Phone、黑莓的 BlackBerry,但是最终它们无一例外都败给了 " 在 2012 年,就拥有 10 万开发者,超过 40 万活跃应用 " 的 Android。
期待国产大模型们,早日跑出本赛道的 "Android"。