蜜度CTO劉益東：AI技術發展的成果要讓普通人都能理解

今天小編分享的互聯網經驗：蜜度CTO劉益東：AI技術發展的成果要讓普通人都能理解，歡迎閱讀。

文 | 周鑫雨

編輯 | 鄧詠儀

在今年的世界人工智能大會（WAIC）逛蜜度的展台，會有一種來到了做 AIGC 應用的 To C 企業的錯覺，與會者可以體驗用 AI 寫詩、作畫，并領取 AI 制作的明信片。

WAIC 蜜度展廳。圖源：蜜度

此次，長年為政企提供語言智能服務的蜜度在 WAIC 上一口氣發布了三個垂直領網域的大語言模型：蜜巢知識問答與内容生成大語言模型、蜜巢智能輿情分析大語言模型、智能校對領網域大語言模型 " 蜜度文修 "。這三款語言大模型主要為新聞出版、媒體采編、政府公文領網域提供智能化的服務。

蜜度 CTO 劉益東告訴 36 氪，以前蜜度參加過不少展會，采取的都是在螢幕上展示產品專業參數的形式。從去年 WAIC 開始，蜜度開始用普通用戶都能理解的形式呈現技術能力，觀眾可以對 AI 技術進行現場體驗。

他打了個比方：" 我們的展台，想讓爺爺奶奶輩也感受到 AI 的智能便利。好比大詩人杜甫常将寫好的詩念給不識字的老婆婆聽，以便通俗易懂。"

7 月 6 日的 WAIC 開幕式上，" 深度學習之父 " 楊立昆重申 "LLM 不會是那條通往人類智能的道路 "。這也讓許多廠商跳脫出 Transformer 的框架，去做創新。

發布自研的行業基座大模型，是今年蜜度的目标。劉益東覺得，自研行業基座大模型是蜜度的方向：" 下一個創造風口的可能就不是 OpenAI，國内廠商要抓住機會。"

以下是劉益東和 36 氪的對話：

先垂直，後通用

36 氪：這次蜜度和友商們同台秀大模型肌肉，為此蜜度做了哪些準備？

劉益東：我覺得這次 WAIC 大家會有一些同行競争的壓力，但更多地是抱着交流學習的态度。雖然很多廠商都推出了大模型，但是聚焦的垂直領網域是有差異的。我覺得作為企業，需要更多地思考我們的優勢在哪裡，以及怎麼為客戶和用戶帶來實用、便捷、高性價比的 AI 服務。

36 氪：那關于這個問題，蜜度的思考結果是怎樣的？

劉益東：在過去的十多年時間裡，蜜度主要服務的是政務、媒體、企事業部門的辦公需求，也積累了一定規模的客戶，所以我們接下來發力的點還是會從這些行業延伸，包括會慢慢地觸及教育行業的 B 端客戶。

我覺得蜜度的優勢首先在數據能力，在 2017、2018 年的時候我們已經把 AI 的一些能力通過產品賦能用戶了，在大量高質量行業數據的基礎上，蜜度能夠更好地實現應用落地。

其次是客戶經驗的積累，我們對客戶需求的認知和理解程度還是很高的，雖說現在方案仍需要精細打磨，但至少現在我們已經有相關的基礎，能在未來給客戶提供 " 開箱即用 " 的成熟方案。

最後是蜜度對科研的投入，2019 年公司成立了專門的科研機構 " 微熱點研究院 "，主要用于與學界科研力量一起追蹤前沿科技。

36 氪：大會上蜜度先發了三個垂直領網域的大模型，而不是一個通用的基座。

劉益東：是的，這次我們發布的幾個模型是針對垂直領網域的。

我們的目标是在今年下半年在已經發布的模型的基礎上，去訓練一個參數規模在千億級的行業基座模型。當然這個基座模型還是會傾向于政務和媒體的場景。

36 氪：先基于開源模型訓練垂直領網域的模型有怎樣的考慮？

劉益東：大模型領網域的發展可以說是日新月異，我們選擇先做垂直領網域的模型主要是考慮了現實應用的需求。因為基座模型的訓練是一個漫長、投入大的過程，同時不是說一次就能得到很好的效果，而是要做很多方向的調整。為了滿足客戶當下的需求，我們考慮先推出垂直領網域的大模型，滿足垂直行業應用的需求。

36 氪：華為也有自己的 " 盤古大模型 "，提出了垂直領網域的模型解決方案，作為華為昇騰的客戶，蜜度與華為會不會也形成競争關系？

劉益東：在我的理解中，華為更多的是做一些底層基礎設施的工作，而我們的定位是偏中上層的應用。整個 AI 生态不是說一個人就能把所有事都幹完，大家各自都在做擅長的事，所以我們一直和華為都有良好的合作。

最難的是工程落地

36 氪：ChatGPT 帶起的 AI 熱潮也已經過去大半年了，您覺得算力、數據等哪些難點得到了一定的解決？哪些還是 " 卡脖子 " 問題？

劉益東：我覺得算力、算法、數據，還有一些工程性的挑戰都是非常關鍵的因素。

先從算力講起。過去半年多的時間裡，各地的算力網絡建設也很快。比如上海的超算中心就在過去半年裡提供給了我們很大的算力支持，其實建設的速度很快，并且它能夠支持國產的異構算力，算力這個難點還是得到一定的解決。

接着是算法。整個大模型開源生态在過去半年裡發展得非常快。最開始開源模型有千億的參數，我們只能用小數據做試驗。後來更多的快速訓練的框架面世，就能幫助我們僅用百卡的級别來訓練一個百億參數級别的模型。所以通過半年的觀察和摸索，下半年我們具備了自主訓練基座大模型的條件。

不過，在數據層面我們仍然面臨一些挑戰。因為中文高質量的數據生态發展才幾個月的時間，當然這段時間内各行各業都在建立高質量的數據訓練集，其中一些是以開放的方式，我覺得這是非常好的趨勢。如果解決了中文訓練數據的問題，至少從大模型的算力、算法和數據三個角度而言，基本上不會有太多問題。

而最大的挑戰來源于工程落地。大模型前期的落地步驟包括用戶應用，成本很高。如何讓大模型在内部落地，并且讓客戶高效利用好，這是蜜度這半年來在思考和在實施的。目前我們已經做到把蜜度的大語言模型部署在消費級的顯卡上，比如說國產的華為昇騰 NPU 卡。

AI 技術發展的成果要讓普通人都能理解

36 氪：蜜度大模型的優勢主要在哪些方面？

劉益東：主要在部署成本上。我們的大模型已經能夠做到用消費級顯卡就能部署，對于企業客戶而言，考慮到安全保障，這個成本是可接受的。

同時用戶要把大模型用好，和單純部署中間有一個 gap，彌合這個 gap 對于我們來說就是要去契合地接入各種業務場景，設計互動友好的產品界面，我們做了很多工程性的工作，把整體的功能用簡單易用的形态交付給客戶。

36 氪：這次展示的 AI 作詩、繪畫等模型功能，看上去都很 toC，蜜度是有做 toC 應用的計劃嗎？

劉益東：以前我們參加過很多展會，更多地是把比較專業的細節在螢幕上展示。但參展者就會覺得很陌生，這其實不利于普通客戶的傳播和理解。所以從去年的 WAIC 開始我們就以普通用戶可以理解的形式把我們的技術能力展現出來。

36 氪：這次大會楊立昆也提到大語言模型不是通往 AGI 的最優解，您對此是怎麼看的？蜜度是否會跳脫出 Transformer 的路徑去做新的嘗試？

劉益東：我們内部一直在啟動一些創新，不管是基于 Transformer 的還是新的技術路徑。那麼我們的創新能不能超越 Transformer？這其實并不是拍拍腦袋就能實現的，而是需要大量的科研投入。

歡迎交流