專訪思必馳：DFM-2百億級大模型主攻汽車、物聯網等行業，将持續推進IPO

今天小編分享的互聯網經驗：專訪思必馳：DFM-2百億級大模型主攻汽車、物聯網等行業，将持續推進IPO，歡迎閲讀。

作為一家 16 歲 AI 公司的董事長，思必馳創始人高始興在今年初第一次使用 ChatGPT 時依舊難掩驚豔，" 至少，發言稿可以不用專人寫作了。"

然而，伴随驚豔而來的，還有當時外界對幾乎所有 AI 公司的質疑。

大模型走紅後，不論是計算機視覺、語音識别，亦或基于垂直任務的自然語言理解，都被統稱為 " 上一代 AI"。在 36 氪今年的交流中，就有好幾家 " 上一代 "AI 公司坦言面對新技術倍感壓力。

對比之下，雖然思必馳也屬人工智能語音語言公司，高始興的内心卻沒有過多波瀾，" 我們比較早就布局了這一技術。之前十億級的模型已經用在產品上，只是沒有對外強調 "。

據介紹，思必馳十億級參數量的模型，名為 DFM-1，于 2022 年研發推出，在 ChatGPT 還未火熱的 2022 年已進行了小規模產品應用。而在 7 月的發布會上，思必馳又新推出了 DFM-2 大模型，參數量達到百億級别。

除卻已有布局，高始興對思必馳的信心，還源于大模型的技術路線和場景積累。

對比其他模型，DFM-2 在技術上強調對話互動能力，在場景中強調專業化和行業化。

思必馳聯合創始人、首席科學家俞凱專門厘清了幾個概念，" 通用人工智能，必須要大模型加上語言計算才行，否則只是專用大模型。而在此基礎上，通用大模型還分全網域和垂網域。" 而語言計算，恰好是這家對話式人工智能公司的擅長所在。

俞凱解釋，大模型概念由來已久，包括 AIphaFold 蛋白質折疊、Stable Diffusion 影像生成大模型到 Whisper 語音大模型等，但都沒有引起產業廣泛重視。直到對話式語言大模型 ChatGPT 的出現，展現出語言計算與大模型結合所達成的通用人工智能效果。俞凱笃信，" 對話式語言計算大模型 "，是認知領網域通用人工智能發展的裏程碑。

基于大模型和語言計算技術，思必馳的百億參數模型選擇落地垂直行業，而非全網域。俞凱認為，目前 To C 領網域，生成式 AI 已經跨越生產力門檻，但在 To B 領網域，對大模型的數據和經驗的要求都非常高。

思必馳的百億大模型将主要聚焦汽車、物聯網等行業——也就是這家公司早前已深入的領網域。以汽車為例，據介紹，自 2019 年正式進入汽車前裝，思必馳的產品目前已 " 上車 "600 多萬輛。

" 汽車和物聯網領網域是思必馳的主要業務領網域——服務于汽車、家電等智能化，同時，也賦能垂直行業的信息智能化，如金融、政務。" 高始興表示。

但即便對所選行業已有積累，高始興依然不否認大模型落地到具體垂直行業場景的困難。在他眼中，現在思必馳的百億大模型 " 還不錯，但依然有提升空間 "。尤其，在汽車和家電等物聯網領網域，產品類别非常多，各種復雜場景下各系統的融合，都需要差異化方案——這種情況下要用好大模型，勢必是一場長期戰。

而在回答大模型是否會促進 IPO 的提問時，高始興坦言，思必馳會在今年或明年繼續啓動上市，而大模型是否會對此有促進作用，還是要看產業落地。

" 我們的主戰場針對幾個重點垂直行業，如車聯網、IOT 以及金融政務等。這個方向，思必馳在技術、資源和客户各方面都有積累。" 他總結，" 思必馳是一家比較踏實的公司。"

以下是對話部分（經節選）：

36 氪 : 思必馳是什麼時候開始考慮做大模型的？而且是大模型加上語言計算的概念？

高始興：語言模型和人機對話，确實是我們首先提出的理念。我們是中國最早做對話式人工智能的公司之一，甚至可以説是首個引入這一理念的公司。

思必馳的聯合創始人俞凱曾經參與創辦過一家人機對話公司，後來被蘋果公司收購，所以我們在人機對話方面的經驗非常豐富。而在語言模型方面，我們已經做了三四年了。思必馳實際上很早就發布了十億級别的模型。

36 氪：這次發布的 DFM-2 百億模型是什麼時候開始做的？現在的進展是？

高始興：我們的百億級模型在四月份開始内部測試，現在已經開始與一些客户進行落地應用。

另外，思必馳的模型更加深扎行業。B 端和 G 端與 C 端有很大不同，我個人認為，或許應該由國家來做這些能夠覆蓋各種生态的大模型，因為這應該是國家的基礎設施。對思必馳來説，行業更應該是我們模型所深耕的對象。技術型公司應該深入到行業場景中去做技術創新，做產業應用。所以，我們的百億模型的定位是具有一定的通用能力，然後深入到行業中，服務于行業的垂網域模型。

36 氪：思必馳怎麼看生成式人工智能和大模型？

俞凱：今天我們講了大模型和通用人工智能。生成式人工智能其實是諸多人工智能中的一類，它可以不是大模型，也可以不是通用的，而且在人工智能領網域早已存在。現在的關鍵變化是，生成式人工智能在影像、語音和文字生成的多樣性和質量上已經到了一個突破性階段。

從產業上看，現在生成式人工智能在 To C 領網域跨越了門檻。但如果是在 To B 領網域，情況可能會有所不同。C 端和 B 端的需求不一樣，在 To B 領網域，判别式人工智能的問題，生成式人工智能同樣會面臨。判别式人工智能關注正确與否，生成式人工智能更關注好與壞。然而在 To B 領網域，即使是生成式人工智能，正确與否也非常重要。

對于我們來説，巨大的機會在于，生成式人工智能已經過了門檻，它可以作為輔助工具，與現有的商業模式結合來擴大應用。但是，出現一種全新的、純技術的生成式人工智能被大規模復制的可能性是相當小的。

因此，在我看來，既沒有那麼樂觀，也沒有那麼悲觀。我不認為現在的生成式人工智能能夠改變世界，但我相信，它會擴大我們的工具使用範圍，并促使我們将人工智能系統更全面地應用到工作中。

36 氪：大模型是否會對 To B 行業過去的部署應用產生影響？

俞凱：會有一部分影響，但我認為影響比較小。這個事情特别容易判斷，舉個例子：

假設你是一名不了解 To B 業務的媒體工作者，我把你派到一個制造工廠，你能否在一天之内完成那裏的工作？如果能，那麼這項工作肯定可以被 ChatGPT 或其他通用人工智能復制。如果不能，那麼所有的積累都是有價值的。這件事的重點并不在于你生成了一些文案，而是你對整個知識流程的精确理解非常重要。

然而，你要如何獲得這種精确的理解呢？要麼需要有數據，要麼需要有人教你。但如果你沒有和廠商合作，沒有處在這個垂網域内，怎麼可能有這些呢？所以行業的數據和經驗是非常重要的。因為它無法代替人的經驗和繁瑣的 to B 流程，因為在 to B 領網域評價指标是多維且復雜的，這些無法被通用人工智能簡單替代。

36 氪：目前思必馳大模型所重點關注的行業是？

高始興 : 我們主要關注汽車和物聯網領網域，這與我們的主要業務——汽車、家電智能化，行業信息智能化息息相關。對于垂直行業，如金融，我們也在做智能外呼等項目，像公安的智能審訊和反詐騙等也有。

我覺得我們目前也承載不了太多行業，而且要把幾個垂直行業的賦能做好，也是一件非常了不起的事情。

比如在汽車、物聯網領網域，產品類别本身非常多，成千上萬。而且，其中有的場景需要本地服務，有的需要雲端服務，有的需要本地與雲端結合才能做出好的端到端的人機互動體驗。

在這之外，還有各種系統融合、聲學環境等需要考慮。實際上，我認為如果不深入到行業中，是很難做好的。我們必須理解場景，而這些場景實際上非常復雜。

汽車領網域思必馳從後裝到前裝，做了八到九年的時間，才做到現在的程度。我們已經做得相當好了，比上一代的語音控制技術已經進步很大，但還有進步的空間，東風大模型将會帶來新的體驗更新。

36 氪：比如説還存在怎樣的進步空間，有具體的例子嗎？

高始興：未來，我覺得汽車一定會有無人駕駛，它（大模型）就是你的駕駛助手、汽車空間的生活娛樂助手。你問它任何問題，除了常見的汽車控制等問題外，其他任何問題都可以回答你，像汽車工程師。車裏也是一個生活娛樂空間，車内學習、辦公等等都可以實現。

36 氪：比較像現在流行的 " 副駕駛模式 "。

高始興：對，一定是這樣的。我們實現了很多創新發布，如多音區人機對話，我們在這裏不僅結合了人機對話技術，還結合了一些聲學技術。無論你在車内的主駕駛座位、副駕駛座位還是後排座位，都可以進行人車互動。

有了百億大模型之後，之前的產品就像大腦更聰明了一樣。在車内，現在的人機對話還無法讓它成為你車内的説明書。大模型之後，你可以問它關于車的任何問題，無論是維修問題，還是其他的問題，都能回答你。這就是一個例子。更高級的場景，你在車内，它就是你的助理，你可以通過人機對話進行訂票、訂酒店，一站式的服務。我們期待大模型可以像一個智能助理一樣，更好地理解和與人交流。

36 氪 : 現在我們内測的效果怎麼樣？

高始興 : 還是很不錯的，也還有提升空間。因為這涉及到很多方面，不僅是技術性能的提升，真正的落地還需要結合我們在垂直行業中的經驗，結合這些場景進行優化，這不是一朝一夕可以完成的。比如剛才提到的讓大模型消化、吸收產品説明書，就需要我們和汽車制造商一起合作。

36 氪：思必馳今年還會啓動上市嗎？大模型會對這件事產生怎樣的影響？

高始興：我們肯定會啓動上市，但不一定在今年，有可能是明年。至于大模型是否有促進作用，我覺得核心還是要把業務做好。大語言模型只是我們一個工具，我們一直在做人機對話語言模型，最終還是要產業落地。

36 氪：作為一家準備 IPO 的公司，财務狀況也非常重要，但訓練大模型是一件比較貴的事。

高始興：是的，訓練大語言模型是很貴的，但好在我們過去有積累，包括人機對話的語料積累，語言模型技術的積累，以及早期購買的計算資源。

對思必馳來説，首先，這是必須要做的事情。其次，公司能承受。我們已經有了對話語言模型的技術和數據，所以這就是一個投入的問題。我們早期也有了 GPU 算力和超算中心，蘇州政府也給了我們很多支持。

36 氪：對于大模型的投入產出比，思必馳有什麼預期嗎？

高始興：我覺得效果是陸續顯現的，其實并不一定僅從 C 端直接收費。比如，如果我們的 B 端產品更新，用户體驗好了，自然 B 端客户就會有源源不斷的更新需求。當然我們大模型也有直接的 C 端用户。

整體來説，思必馳的大模型主要服務于 " 溝通萬物、打理萬事 " 的理念，主戰場是針對特定行業，如車聯網、IOT 以及金融政務等，構建具有通用能力的行業專業模型。對于這件事，我們在技術、資源和客户各方面都有積累。思必馳還是一家比較踏實的公司。