今天小编分享的互联网经验:专访思必驰:DFM-2百亿级大模型主攻汽车、物联网等行业,将持续推进IPO,欢迎阅读。
作为一家 16 岁 AI 公司的董事长,思必驰创始人高始兴在今年初第一次使用 ChatGPT 时依旧难掩惊艳," 至少,发言稿可以不用专人写作了。"
然而,伴随惊艳而来的,还有当时外界对几乎所有 AI 公司的质疑。
大模型走红后,不论是计算机视觉、语音识别,亦或基于垂直任务的自然语言理解,都被统称为 " 上一代 AI"。在 36 氪今年的交流中,就有好几家 " 上一代 "AI 公司坦言面对新技术倍感压力。
对比之下,虽然思必驰也属人工智能语音语言公司,高始兴的内心却没有过多波澜," 我们比较早就布局了这一技术。之前十亿级的模型已经用在产品上,只是没有对外强调 "。
据介绍,思必驰十亿级参数量的模型,名为 DFM-1,于 2022 年研发推出,在 ChatGPT 还未火热的 2022 年已进行了小规模产品应用。而在 7 月的发布会上,思必驰又新推出了 DFM-2 大模型,参数量达到百亿级别。
除却已有布局,高始兴对思必驰的信心,还源于大模型的技术路线和场景积累。
对比其他模型,DFM-2 在技术上强调对话互動能力,在场景中强调专业化和行业化。
思必驰联合创始人、首席科学家俞凯专门厘清了几个概念," 通用人工智能,必须要大模型加上语言计算才行,否则只是专用大模型。而在此基础上,通用大模型还分全網域和垂網域。" 而语言计算,恰好是这家对话式人工智能公司的擅长所在。
俞凯解释,大模型概念由来已久,包括 AIphaFold 蛋白质折叠、Stable Diffusion 影像生成大模型到 Whisper 语音大模型等,但都没有引起产业广泛重视。直到对话式语言大模型 ChatGPT 的出现,展现出语言计算与大模型结合所达成的通用人工智能效果。俞凯笃信," 对话式语言计算大模型 ",是认知领網域通用人工智能发展的里程碑。
基于大模型和语言计算技术,思必驰的百亿参数模型选择落地垂直行业,而非全網域。俞凯认为,目前 To C 领網域,生成式 AI 已经跨越生产力门槛,但在 To B 领網域,对大模型的数据和经验的要求都非常高。
思必驰的百亿大模型将主要聚焦汽车、物联网等行业——也就是这家公司早前已深入的领網域。以汽车为例,据介绍,自 2019 年正式进入汽车前装,思必驰的产品目前已 " 上车 "600 多万辆。
" 汽车和物联网领網域是思必驰的主要业务领網域——服务于汽车、家电等智能化,同时,也赋能垂直行业的信息智能化,如金融、政务。" 高始兴表示。
但即便对所选行业已有积累,高始兴依然不否认大模型落地到具体垂直行业场景的困难。在他眼中,现在思必驰的百亿大模型 " 还不错,但依然有提升空间 "。尤其,在汽车和家电等物联网领網域,产品类别非常多,各种复杂场景下各系统的融合,都需要差异化方案——这种情况下要用好大模型,势必是一场长期战。
而在回答大模型是否会促进 IPO 的提问时,高始兴坦言,思必驰会在今年或明年继续启动上市,而大模型是否会对此有促进作用,还是要看产业落地。
" 我们的主战场针对几个重点垂直行业,如车联网、IOT 以及金融政务等。这个方向,思必驰在技术、资源和客户各方面都有积累。" 他总结," 思必驰是一家比较踏实的公司。"
以下是对话部分(经节选):
36 氪 : 思必驰是什么时候开始考虑做大模型的?而且是大模型加上语言计算的概念?
高始兴:语言模型和人机对话,确实是我们首先提出的理念。我们是中国最早做对话式人工智能的公司之一,甚至可以说是首个引入这一理念的公司。
思必驰的联合创始人俞凯曾经参与创办过一家人机对话公司,后来被苹果公司收购,所以我们在人机对话方面的经验非常丰富。而在语言模型方面,我们已经做了三四年了。思必驰实际上很早就发布了十亿级别的模型。
36 氪:这次发布的 DFM-2 百亿模型是什么时候开始做的?现在的进展是?
高始兴:我们的百亿级模型在四月份开始内部测试,现在已经开始与一些客户进行落地应用。
另外,思必驰的模型更加深扎行业。B 端和 G 端与 C 端有很大不同,我个人认为,或许应该由国家来做这些能够覆盖各种生态的大模型,因为这应该是国家的基础设施。对思必驰来说,行业更应该是我们模型所深耕的对象。技术型公司应该深入到行业场景中去做技术创新,做产业应用。所以,我们的百亿模型的定位是具有一定的通用能力,然后深入到行业中,服务于行业的垂網域模型。
36 氪:思必驰怎么看生成式人工智能和大模型?
俞凯:今天我们讲了大模型和通用人工智能。生成式人工智能其实是诸多人工智能中的一类,它可以不是大模型,也可以不是通用的,而且在人工智能领網域早已存在。现在的关键变化是,生成式人工智能在影像、语音和文字生成的多样性和质量上已经到了一个突破性阶段。
从产业上看,现在生成式人工智能在 To C 领網域跨越了门槛。但如果是在 To B 领網域,情况可能会有所不同。C 端和 B 端的需求不一样,在 To B 领網域,判别式人工智能的问题,生成式人工智能同样会面临。判别式人工智能关注正确与否,生成式人工智能更关注好与坏。然而在 To B 领網域,即使是生成式人工智能,正确与否也非常重要。
对于我们来说,巨大的机会在于,生成式人工智能已经过了门槛,它可以作为辅助工具,与现有的商业模式结合来扩大应用。但是,出现一种全新的、纯技术的生成式人工智能被大规模复制的可能性是相当小的。
因此,在我看来,既没有那么乐观,也没有那么悲观。我不认为现在的生成式人工智能能够改变世界,但我相信,它会扩大我们的工具使用范围,并促使我们将人工智能系统更全面地应用到工作中。
36 氪:大模型是否会对 To B 行业过去的部署应用产生影响?
俞凯:会有一部分影响,但我认为影响比较小。这个事情特别容易判断,举个例子:
假设你是一名不了解 To B 业务的媒体工作者,我把你派到一个制造工厂,你能否在一天之内完成那里的工作?如果能,那么这项工作肯定可以被 ChatGPT 或其他通用人工智能复制。如果不能,那么所有的积累都是有价值的。这件事的重点并不在于你生成了一些文案,而是你对整个知识流程的精确理解非常重要。
然而,你要如何获得这种精确的理解呢?要么需要有数据,要么需要有人教你。但如果你没有和厂商合作,没有处在这个垂網域内,怎么可能有这些呢?所以行业的数据和经验是非常重要的。因为它无法代替人的经验和繁琐的 to B 流程,因为在 to B 领網域评价指标是多维且复杂的,这些无法被通用人工智能简单替代。
36 氪:目前思必驰大模型所重点关注的行业是?
高始兴 : 我们主要关注汽车和物联网领網域,这与我们的主要业务——汽车、家电智能化,行业信息智能化息息相关。对于垂直行业,如金融,我们也在做智能外呼等项目,像公安的智能审讯和反诈骗等也有。
我觉得我们目前也承载不了太多行业,而且要把几个垂直行业的赋能做好,也是一件非常了不起的事情。
比如在汽车、物联网领網域,产品类别本身非常多,成千上万。而且,其中有的场景需要本地服务,有的需要云端服务,有的需要本地与云端结合才能做出好的端到端的人机互動体验。
在这之外,还有各种系统融合、声学环境等需要考虑。实际上,我认为如果不深入到行业中,是很难做好的。我们必须理解场景,而这些场景实际上非常复杂。
汽车领網域思必驰从后装到前装,做了八到九年的时间,才做到现在的程度。我们已经做得相当好了,比上一代的语音控制技术已经进步很大,但还有进步的空间,东风大模型将会带来新的体验更新。
36 氪:比如说还存在怎样的进步空间,有具体的例子吗?
高始兴:未来,我觉得汽车一定会有无人驾驶,它(大模型)就是你的驾驶助手、汽车空间的生活娱乐助手。你问它任何问题,除了常见的汽车控制等问题外,其他任何问题都可以回答你,像汽车工程师。车里也是一个生活娱乐空间,车内学习、办公等等都可以实现。
36 氪:比较像现在流行的 " 副驾驶模式 "。
高始兴:对,一定是这样的。我们实现了很多创新发布,如多音区人机对话,我们在这里不仅结合了人机对话技术,还结合了一些声学技术。无论你在车内的主驾驶座位、副驾驶座位还是后排座位,都可以进行人车互動。
有了百亿大模型之后,之前的产品就像大腦更聪明了一样。在车内,现在的人机对话还无法让它成为你车内的说明书。大模型之后,你可以问它关于车的任何问题,无论是维修问题,还是其他的问题,都能回答你。这就是一个例子。更高级的场景,你在车内,它就是你的助理,你可以通过人机对话进行订票、订酒店,一站式的服务。我们期待大模型可以像一个智能助理一样,更好地理解和与人交流。
36 氪 : 现在我们内测的效果怎么样?
高始兴 : 还是很不错的,也还有提升空间。因为这涉及到很多方面,不仅是技术性能的提升,真正的落地还需要结合我们在垂直行业中的经验,结合这些场景进行优化,这不是一朝一夕可以完成的。比如刚才提到的让大模型消化、吸收产品说明书,就需要我们和汽车制造商一起合作。
36 氪:思必驰今年还会启动上市吗?大模型会对这件事产生怎样的影响?
高始兴:我们肯定会启动上市,但不一定在今年,有可能是明年。至于大模型是否有促进作用,我觉得核心还是要把业务做好。大语言模型只是我们一个工具,我们一直在做人机对话语言模型,最终还是要产业落地。
36 氪:作为一家准备 IPO 的公司,财务状况也非常重要,但训练大模型是一件比较贵的事。
高始兴:是的,训练大语言模型是很贵的,但好在我们过去有积累,包括人机对话的语料积累,语言模型技术的积累,以及早期购买的计算资源。
对思必驰来说,首先,这是必须要做的事情。其次,公司能承受。我们已经有了对话语言模型的技术和数据,所以这就是一个投入的问题。我们早期也有了 GPU 算力和超算中心,苏州政府也给了我们很多支持。
36 氪:对于大模型的投入产出比,思必驰有什么预期吗?
高始兴:我觉得效果是陆续显现的,其实并不一定仅从 C 端直接收费。比如,如果我们的 B 端产品更新,用户体验好了,自然 B 端客户就会有源源不断的更新需求。当然我们大模型也有直接的 C 端用户。
整体来说,思必驰的大模型主要服务于 " 沟通万物、打理万事 " 的理念,主战场是针对特定行业,如车联网、IOT 以及金融政务等,构建具有通用能力的行业专业模型。对于这件事,我们在技术、资源和客户各方面都有积累。思必驰还是一家比较踏实的公司。