专访思必驰：DFM-2百亿级大模型主攻汽车、物联网等行业，将持续推进IPO

今天小编分享的互联网经验：专访思必驰：DFM-2百亿级大模型主攻汽车、物联网等行业，将持续推进IPO，欢迎阅读。

作为一家 16 岁 AI 公司的董事长，思必驰创始人高始兴在今年初第一次使用 ChatGPT 时依旧难掩惊艳，" 至少，发言稿可以不用专人写作了。"

然而，伴随惊艳而来的，还有当时外界对几乎所有 AI 公司的质疑。

大模型走红后，不论是计算机视觉、语音识别，亦或基于垂直任务的自然语言理解，都被统称为 " 上一代 AI"。在 36 氪今年的交流中，就有好几家 " 上一代 "AI 公司坦言面对新技术倍感压力。

对比之下，虽然思必驰也属人工智能语音语言公司，高始兴的内心却没有过多波澜，" 我们比较早就布局了这一技术。之前十亿级的模型已经用在产品上，只是没有对外强调 "。

据介绍，思必驰十亿级参数量的模型，名为 DFM-1，于 2022 年研发推出，在 ChatGPT 还未火热的 2022 年已进行了小规模产品应用。而在 7 月的发布会上，思必驰又新推出了 DFM-2 大模型，参数量达到百亿级别。

除却已有布局，高始兴对思必驰的信心，还源于大模型的技术路线和场景积累。

对比其他模型，DFM-2 在技术上强调对话互動能力，在场景中强调专业化和行业化。

思必驰联合创始人、首席科学家俞凯专门厘清了几个概念，" 通用人工智能，必须要大模型加上语言计算才行，否则只是专用大模型。而在此基础上，通用大模型还分全網域和垂網域。" 而语言计算，恰好是这家对话式人工智能公司的擅长所在。

俞凯解释，大模型概念由来已久，包括 AIphaFold 蛋白质折叠、Stable Diffusion 影像生成大模型到 Whisper 语音大模型等，但都没有引起产业广泛重视。直到对话式语言大模型 ChatGPT 的出现，展现出语言计算与大模型结合所达成的通用人工智能效果。俞凯笃信，" 对话式语言计算大模型 "，是认知领網域通用人工智能发展的里程碑。

基于大模型和语言计算技术，思必驰的百亿参数模型选择落地垂直行业，而非全網域。俞凯认为，目前 To C 领網域，生成式 AI 已经跨越生产力门槛，但在 To B 领網域，对大模型的数据和经验的要求都非常高。

思必驰的百亿大模型将主要聚焦汽车、物联网等行业——也就是这家公司早前已深入的领網域。以汽车为例，据介绍，自 2019 年正式进入汽车前装，思必驰的产品目前已 " 上车 "600 多万辆。

" 汽车和物联网领網域是思必驰的主要业务领網域——服务于汽车、家电等智能化，同时，也赋能垂直行业的信息智能化，如金融、政务。" 高始兴表示。

但即便对所选行业已有积累，高始兴依然不否认大模型落地到具体垂直行业场景的困难。在他眼中，现在思必驰的百亿大模型 " 还不错，但依然有提升空间 "。尤其，在汽车和家电等物联网领網域，产品类别非常多，各种复杂场景下各系统的融合，都需要差异化方案——这种情况下要用好大模型，势必是一场长期战。

而在回答大模型是否会促进 IPO 的提问时，高始兴坦言，思必驰会在今年或明年继续启动上市，而大模型是否会对此有促进作用，还是要看产业落地。

" 我们的主战场针对几个重点垂直行业，如车联网、IOT 以及金融政务等。这个方向，思必驰在技术、资源和客户各方面都有积累。" 他总结，" 思必驰是一家比较踏实的公司。"

以下是对话部分（经节选）：

36 氪 : 思必驰是什么时候开始考虑做大模型的？而且是大模型加上语言计算的概念？

高始兴：语言模型和人机对话，确实是我们首先提出的理念。我们是中国最早做对话式人工智能的公司之一，甚至可以说是首个引入这一理念的公司。

思必驰的联合创始人俞凯曾经参与创办过一家人机对话公司，后来被苹果公司收购，所以我们在人机对话方面的经验非常丰富。而在语言模型方面，我们已经做了三四年了。思必驰实际上很早就发布了十亿级别的模型。

36 氪：这次发布的 DFM-2 百亿模型是什么时候开始做的？现在的进展是？

高始兴：我们的百亿级模型在四月份开始内部测试，现在已经开始与一些客户进行落地应用。

另外，思必驰的模型更加深扎行业。B 端和 G 端与 C 端有很大不同，我个人认为，或许应该由国家来做这些能够覆盖各种生态的大模型，因为这应该是国家的基础设施。对思必驰来说，行业更应该是我们模型所深耕的对象。技术型公司应该深入到行业场景中去做技术创新，做产业应用。所以，我们的百亿模型的定位是具有一定的通用能力，然后深入到行业中，服务于行业的垂網域模型。

36 氪：思必驰怎么看生成式人工智能和大模型？

俞凯：今天我们讲了大模型和通用人工智能。生成式人工智能其实是诸多人工智能中的一类，它可以不是大模型，也可以不是通用的，而且在人工智能领網域早已存在。现在的关键变化是，生成式人工智能在影像、语音和文字生成的多样性和质量上已经到了一个突破性阶段。

从产业上看，现在生成式人工智能在 To C 领網域跨越了门槛。但如果是在 To B 领網域，情况可能会有所不同。C 端和 B 端的需求不一样，在 To B 领網域，判别式人工智能的问题，生成式人工智能同样会面临。判别式人工智能关注正确与否，生成式人工智能更关注好与坏。然而在 To B 领網域，即使是生成式人工智能，正确与否也非常重要。

对于我们来说，巨大的机会在于，生成式人工智能已经过了门槛，它可以作为辅助工具，与现有的商业模式结合来扩大应用。但是，出现一种全新的、纯技术的生成式人工智能被大规模复制的可能性是相当小的。

因此，在我看来，既没有那么乐观，也没有那么悲观。我不认为现在的生成式人工智能能够改变世界，但我相信，它会扩大我们的工具使用范围，并促使我们将人工智能系统更全面地应用到工作中。

36 氪：大模型是否会对 To B 行业过去的部署应用产生影响？

俞凯：会有一部分影响，但我认为影响比较小。这个事情特别容易判断，举个例子：

假设你是一名不了解 To B 业务的媒体工作者，我把你派到一个制造工厂，你能否在一天之内完成那里的工作？如果能，那么这项工作肯定可以被 ChatGPT 或其他通用人工智能复制。如果不能，那么所有的积累都是有价值的。这件事的重点并不在于你生成了一些文案，而是你对整个知识流程的精确理解非常重要。

然而，你要如何获得这种精确的理解呢？要么需要有数据，要么需要有人教你。但如果你没有和厂商合作，没有处在这个垂網域内，怎么可能有这些呢？所以行业的数据和经验是非常重要的。因为它无法代替人的经验和繁琐的 to B 流程，因为在 to B 领網域评价指标是多维且复杂的，这些无法被通用人工智能简单替代。

36 氪：目前思必驰大模型所重点关注的行业是？

高始兴 : 我们主要关注汽车和物联网领網域，这与我们的主要业务——汽车、家电智能化，行业信息智能化息息相关。对于垂直行业，如金融，我们也在做智能外呼等项目，像公安的智能审讯和反诈骗等也有。

我觉得我们目前也承载不了太多行业，而且要把几个垂直行业的赋能做好，也是一件非常了不起的事情。

比如在汽车、物联网领網域，产品类别本身非常多，成千上万。而且，其中有的场景需要本地服务，有的需要云端服务，有的需要本地与云端结合才能做出好的端到端的人机互動体验。

在这之外，还有各种系统融合、声学环境等需要考虑。实际上，我认为如果不深入到行业中，是很难做好的。我们必须理解场景，而这些场景实际上非常复杂。

汽车领網域思必驰从后装到前装，做了八到九年的时间，才做到现在的程度。我们已经做得相当好了，比上一代的语音控制技术已经进步很大，但还有进步的空间，东风大模型将会带来新的体验更新。

36 氪：比如说还存在怎样的进步空间，有具体的例子吗？

高始兴：未来，我觉得汽车一定会有无人驾驶，它（大模型）就是你的驾驶助手、汽车空间的生活娱乐助手。你问它任何问题，除了常见的汽车控制等问题外，其他任何问题都可以回答你，像汽车工程师。车里也是一个生活娱乐空间，车内学习、办公等等都可以实现。

36 氪：比较像现在流行的 " 副驾驶模式 "。

高始兴：对，一定是这样的。我们实现了很多创新发布，如多音区人机对话，我们在这里不仅结合了人机对话技术，还结合了一些声学技术。无论你在车内的主驾驶座位、副驾驶座位还是后排座位，都可以进行人车互動。

有了百亿大模型之后，之前的产品就像大腦更聪明了一样。在车内，现在的人机对话还无法让它成为你车内的说明书。大模型之后，你可以问它关于车的任何问题，无论是维修问题，还是其他的问题，都能回答你。这就是一个例子。更高级的场景，你在车内，它就是你的助理，你可以通过人机对话进行订票、订酒店，一站式的服务。我们期待大模型可以像一个智能助理一样，更好地理解和与人交流。

36 氪 : 现在我们内测的效果怎么样？

高始兴 : 还是很不错的，也还有提升空间。因为这涉及到很多方面，不仅是技术性能的提升，真正的落地还需要结合我们在垂直行业中的经验，结合这些场景进行优化，这不是一朝一夕可以完成的。比如刚才提到的让大模型消化、吸收产品说明书，就需要我们和汽车制造商一起合作。

36 氪：思必驰今年还会启动上市吗？大模型会对这件事产生怎样的影响？

高始兴：我们肯定会启动上市，但不一定在今年，有可能是明年。至于大模型是否有促进作用，我觉得核心还是要把业务做好。大语言模型只是我们一个工具，我们一直在做人机对话语言模型，最终还是要产业落地。

36 氪：作为一家准备 IPO 的公司，财务状况也非常重要，但训练大模型是一件比较贵的事。

高始兴：是的，训练大语言模型是很贵的，但好在我们过去有积累，包括人机对话的语料积累，语言模型技术的积累，以及早期购买的计算资源。

对思必驰来说，首先，这是必须要做的事情。其次，公司能承受。我们已经有了对话语言模型的技术和数据，所以这就是一个投入的问题。我们早期也有了 GPU 算力和超算中心，苏州政府也给了我们很多支持。

36 氪：对于大模型的投入产出比，思必驰有什么预期吗？

高始兴：我觉得效果是陆续显现的，其实并不一定仅从 C 端直接收费。比如，如果我们的 B 端产品更新，用户体验好了，自然 B 端客户就会有源源不断的更新需求。当然我们大模型也有直接的 C 端用户。

整体来说，思必驰的大模型主要服务于 " 沟通万物、打理万事 " 的理念，主战场是针对特定行业，如车联网、IOT 以及金融政务等，构建具有通用能力的行业专业模型。对于这件事，我们在技术、资源和客户各方面都有积累。思必驰还是一家比较踏实的公司。