今天小编分享的教育经验:独家专访科大讯飞董事长刘庆峰:DeepSeek、“必赢之战”与开源,欢迎阅读。
以下文章来源于中国企业家杂志 ,作者闫俊文
作者 | 闫俊文《中国企业家》记者
来源 | 中国企业家杂志 管理智慧
咨询合作 | 13699120588
文章仅代表作者本人观点
刘庆峰做的是,依靠国产算力做大模型,追求自主可控。
刘庆峰和 DeepSeek 创始人梁文锋两人的目标都是做强 " 中国 AI",但某种程度,走的是不同路径。
就在 DeepSeekV3 以及 R1 模型正式上线的前几个月,刘庆峰已经带着科大讯飞团队把全国产算力平台上的深度推理模型跑通了。2025 年 1 月 15 日,科大讯飞发布国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型——讯飞星火深度推理模型 X1。
" 因为算力受限,既要做算力训练,又要做大模型算法训练,所以 1 月 15 号只推了一个 13b(参数总量,b 代表十亿)的模型,今年 3 月 3 号,我们推出来 70b 的模型。" 今年全国两会期间,全国人大代表、科大讯飞董事长刘庆峰接受《中国企业家》独家专访时说。
虽然戴着脚镣跳舞,但依旧挡不住科大讯飞迅猛发展的脚步。
在 2024 年大模型招投标市场,科大讯飞拿下央国企得標数量和得標金额双第一。在 2024 年,科大讯飞连续 5 次更新讯飞星火的底座能力,持续对标 GPT-4Turbo 和 GPT-4o,还首发星火多语言大模型。
来源:视觉中国
2025 年 1 月 8 日,讯飞医疗在港交所上市。在 1 月 25 日的科大讯飞年会上,刘庆峰喊话,他和公司要在 2025 年打 5 场 " 必赢之战 ":在大模型底座实现全栈自主可控,语音大模型全面引领,OCR 能力领先;教育等公共行业,以及汽车、金融等央国企行业第一;学习、办公领網域软硬一体化行业第一;AIforScience 行业引领;多语言大模型为世界提供第二种选择。
据科大讯飞最近发布的 2024 年第三季度财报,公司营收 55.25 亿元,较上年同期增 15.77%;净利为 5696 万元,较上年同期增长 120.87%,实现了利润当季度转正。截至 3 月 5 日收盘,科大讯飞股价为 51.79 元,较前一日微涨 0.37%,总市值为 1197 亿元。
以下为刘庆峰采访内容实录(有删减):
谈与 DeepSeek 的不同路径
刘庆峰:DeepSeek 有重大的意义,它不光是在人工智能领網域,实际上对全社会对自主创新的信心有很大的提升。它是这两年中国人工智能通用大模型中技术成果的一个典型标志,并不是唯一的。
DeepSeek 在工程上做了非常优秀的成果,而且开源了,但背后是英伟达的超强算力。
而科大讯飞依靠的是 1 万张华为升腾 910B 的国产算力,过程中还要做很多国产算力的适配训练。在这个基础上,1 月 15 号,我们推出星火 X1,我们当时对外就说了,2024 年 10 月,我们就把深度推理模型跑通了,但因为算力受限,要做很多创新,所以 1 月 15 号只推了一个 13b 的模型,等到 3 月 3 号,我们推出来 70b 的模型,已经在数学上全面对标 OpenAIo1 和 DeepSeek-R1,模型小了差不多 10 倍,DeepSeek-R1 满血版是 671b。
星火 X1 的 70b 模型对行业训练是非常方便的。因为像 R1 这样大尺度强化学习出来的模型,它很难对行业做专门训练,但本地部署和做简单的微调是可以的。
在这些领網域中,大家开始各有侧重和发力点,我们希望在全自主可控的大模型上对标,然后形成生态,代表国家做更大的贡献,同时在教育、医疗等垂直赛道上做得更好。DeepSeek 的目标是要在底座模型上不断往前发展,它现在没有精力做行业,也没有精力去做应用落地。
谈开源与闭源
刘庆峰:我们会有一部分开源。我认为将来开源和闭源应该是个组合,开源对整个生态发展和算法的进步是非常有好处的,但是闭源在一些需要安全的领網域,需要高可靠保障的领網域,它有独特的优势。
讯飞星火会参与国产自主可控的开源,DeepSeek 这 5 天公布的算法非常好,但实际上还是对英伟达生态的贡献,那么我们在国产平台上还要做更多的事,我们跟华为、寒武纪做了很多工作,这是对整个国产算力生态的贡献。
但我们自己在一些垂直行业的深度积累,不见得会公开,因为毕竟还有个商业闭环的要求。
闭源和开源历来不是非此即彼,它应该是共同组合发展的,而且应该是企业中有开源的,同时也要有闭源的。
我觉得 DeepSeek 如果要在垂直行业赛道变现,或者在特定领網域要商业变现的时候,可能也不会把所有东西公开,所以这是一个我觉得既推动科技进步、产业繁荣,又要考虑自我造血的整个过程,它并不是非此即彼的事情。
谈底座模型能力与应用
刘庆峰:以大模型为代表的通用人工智能发展呈现两个重要特点。第一,底座大模型的天花板还在持续打开,所以绝不能说现在大模型底座不用做了,就做应用就行了,这是绝对不对的。第二,通用人工智能已经开始可以在很多行业释放红利了,从好看好玩,到真正地解决刚需。
这两块齐头并进,所以对讯飞来说,我们叫 "1+N",1 就是底座,一定要在国产自主可控的平台上对标全球最高的水平,并且要在我们自己关注的核心能力维度上实现超越。
现在大模型涉及的方向非常之多,以前,我们讲 7 个主要维度,文本生成、知识问答、逻辑推理、数学代码、多模态以及语言理解等 7 个维度。在 2023 年,我们推出来(星火大模型)的时候,大概有 481 个细分项,现在已经到 1000 多个细分项了。
在我们最关注的领網域,科大讯飞底座大模型的这些维度方向要做到底。比如,多轮对话指令、语义理解、数学代码这些能力,我们坚定不移要做到全世界第一梯队,要力争做到全球最好。
底座能力要真正应用到具体行业,它还必须要有一整套的工具链,以使它更好地落地,怎么更快地做行业数据的清洗和快速训练,怎么有更好的工具链使得它能够外挂行业知识库,能够解决幻觉问题。
谈科大讯飞 " 必赢之战 "
刘庆峰:在大模型招投标市场,为什么科大讯飞 2024 年央国企市场得標数和得標金额双第一?
因为我们不仅底座大模型的技术已经对标了国际最高水平,而且我们是自主可控的,还有一整套能帮它落地的工具链,我觉得这个非常关键。
比如通用底座的能力 80 分,行业优化以后达到 90 分,针对场景就是到 95 分或者 100 分,解决真正应用了,所以一定要把这个链条走通。
另外,我要把能力开放给广大创业者,让大家可以在这个平台上做创新应用。2024 年,科大讯飞新增了 200 多万实名认证的开发者团队,54% 跟工业有关,所以形成了底座平台加上垂直赛道,再加上开放生态的整个组合。这就是 2025 年科大讯飞的 " 必赢之战 "。
谈讯飞医疗拆分上市
刘庆峰:拆分并不是今天(发生的)。我们在 2016 年酝酿(讯飞医疗)成立的时候就是把它独立了,目的是将来独立上市。
上市,首先可以引入全球化的更多的人才。第二,它在独立的过程中,因为我觉得医疗的空间本身就足够大,GDP 投入甚至比教育还要多。当年我们成立(讯飞医疗)的时候,我们对医疗还没有那么熟悉,我们只有认知智能全国重点实验室的核心技术基础,毕竟期权机制的交易手段相对有限。
在一个全新的需要专业积累的赛道中,应该把空间打开,让更多的专业人才、更多的创业人才能够加入进来,用这种更新的机制去发展,我觉得这是关键。
谈人才观:大平台 + 英雄主义
刘庆峰:所谓大平台,就是数据算力和已有的技术积累,个人英雄主义就是小团队发挥聪明才智,真正的年轻人领衔来做应用。你要没有算力,没有底座模型的核心基础,你是很难有单个小团队能够做出创新性成果的。
你看科大讯飞的讯飞星火 APP,星火底座大模型迭代这么快,其实它的主要负责人是 90 后,是我们自己培养的博士。
DeepSeek 也就 100 多个人,但从 OpenAI、谷歌等等这些公司也都看出来,它有着企业所提供的公共平台,然后有一个小团队,甚至多个小团队在做创新。
激发团队的活力和创造力,然后在平台上能够创造出全新的成果,我觉得大概是这一轮通用大模型发展非常特色的标志。
谈合肥与杭州
刘庆峰:合肥有很大的潜力。
人工智能再往后走,它在计算模式上应该跟量子科技结合,甚至能源的提供上要跟可控核聚变、人造獨生子等结合。如果我们把自主可控的人工智能跟量子计算、核聚变的核能源组合起来,那合肥在全国,甚至在国际上都是独一无二的。
杭州和合肥也在相互学习。大家还是各有侧重,今天这一场创新和伟大的历史进程刚刚开始。
我认为杭州非常棒的是政府的宣传和品牌意识很强,它挑出来了 " 六小龙 "。实际上 " 五小龙 "" 八小龙 " 也都可以,它体现了一个城市不光是推动企业创新发展,而且要形成一种品牌效应。