今天小编分享的互联网经验:科大讯飞刘庆峰:大模型不在一朝一夕,重要的是落地解决刚需和自我造血,欢迎阅读。
科大讯飞董事长刘庆峰
进入 2023 年,由 ChatGPT 带动的 AI 产品成为了科技行业的新热点,国外的谷歌、Meta 相继跟进,国内百度的 " 文心一言 ",阿里的 " 通义千问 ",商汤科技的 " 日日新 " 也先后入局。
5 月 6 日,科大讯飞发布了讯飞星火认知大模型,并于发布会现场演示了产品的七项核心能力,包括语音输入,实时互动、文本生成、语言理解、知识问答、逻辑推理和数学能力,目前星火认知大模型已可应用于教育、办公、汽车、数字员工四个领網域。
在被问到为何产品姗姗来迟的时候,科大讯飞董事长刘庆峰表示,大模型的竞争关键不在于发布日期那一朝一夕,更重要的是,要今早落地转化为产品,解决用户的刚需,实现自我造血。
正视数据算力差距,用国产化降低不确定性
图片来源:视觉中国
目前,以 GPT 为首的大模型产品,主要是通过机器的不断学习去实现人工智能的进化。期间需要原始的数据资料,通过各家的算法,调用 GPU 的算力去执行。
对于国内厂商而言,要打造一款大模型产品,由于 OpenAI 的 GPT 珠玉在前,算法目前来看并不会是瓶颈,而数据和算力会是相对的短板。
数据方面,由于中文互联网起步较晚,且微信、头条、微博、百度各家的数据较为封闭,导致可用于大模型训练的数据量不多。
从数据质量方面,中文互联网也没有优势。科大讯飞副总裁、研究院院长刘聪对钛媒体 App 举了一个例子:" 中文技术论坛经常出现的情况是,一开始都是在讨论学术,到最后就变成了吵架。"
对此,刘聪表示科大讯飞目前正在使用中英文混合的数据库,希望能够将英文有价值的东西转化成中文资料的增量,借此实现对 AI 的提升。此外,科大讯飞在教育等行业已经有了多年的积累,相关数据也能够进一步帮助 AI 进行训练。
算力方面,此次科大讯飞与华为、寒武纪、曙光等公司合作,借此实现国产化,降低不确定性。
但刘庆峰也坦言,虽然目前算力方面不会受到国外的限制,但整体与国外相比,存在至少一代的差距。但算力和数据是中国厂商共同的的短板,而非科大讯飞一家的短板。
快速落地,形成商业模式
全球首款搭载大模型的 AI 学习机:科大讯飞AI 学习机 T20 Pro
刘庆峰表示,未来大模型的关键并不是算力,而是要把教育、办公、汽车、数字员工一类的子模型联动起来,形成 "1+N" 的布局。
其中 "1" 作为大模型的本身,具备自己的商业价值,而 "N" 则是教育、办公、汽车、数字员工一类的子模型,可以让产品更快落地,快速形成商业模式。随后不同的任务、不同的数据再回归到 1,组成一整个循环的过程。
据科大讯飞介绍,目前星火认知大模型的核心团队在 200 人以上,外围团队 2000 人以上,另外还有大量负责数据标注的人员。
根据第三方中文通用大模型基准 SuperCLUE 测试基准的测试显示,目前科大讯飞星火认知大模型仅次于人类、GPT4 和 GPT3.5,在众多大模型中名列第四位,在中国厂商中排名第一。
刘庆峰透露,今年 6 月 9 日星火大模型将突破开放式问答,多轮对话能力和数学能力将再次更新;8 月 15 日,星火认知大模型将突破代码能力,多模态互動再更新;10 月 24 日,星火认知大模型通用模型将直接对标 ChatGPT,其中中文能力超越后者,英文能力与后者相当。
在谈到未来是否可能被美国制裁的话题时,刘庆峰表示已做好相关准备,并积极推进国产化替代,当然前提是把产品做好。(本文首发钛媒体 App,作者 / 吴泓磊,编辑 / 钟毅)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App