今天小編分享的互聯網經驗:蜜度CTO劉益東:AI技術發展的成果要讓普通人都能理解,歡迎閲讀。
文 | 周鑫雨
編輯 | 鄧詠儀
在今年的世界人工智能大會(WAIC)逛蜜度的展台,會有一種來到了做 AIGC 應用的 To C 企業的錯覺,與會者可以體驗用 AI 寫詩、作畫,并領取 AI 制作的明信片。
WAIC 蜜度展廳。圖源:蜜度
此次,長年為政企提供語言智能服務的蜜度在 WAIC 上一口氣發布了三個垂直領網域的大語言模型:蜜巢知識問答與内容生成大語言模型、蜜巢智能輿情分析大語言模型、智能校對領網域大語言模型 " 蜜度文修 "。這三款語言大模型主要為新聞出版、媒體采編、政府公文領網域提供智能化的服務。
蜜度 CTO 劉益東告訴 36 氪,以前蜜度參加過不少展會,采取的都是在螢幕上展示產品專業參數的形式。從去年 WAIC 開始,蜜度開始用普通用户都能理解的形式呈現技術能力,觀眾可以對 AI 技術進行現場體驗。
他打了個比方:" 我們的展台,想讓爺爺奶奶輩也感受到 AI 的智能便利。好比大詩人杜甫常将寫好的詩念給不識字的老婆婆聽,以便通俗易懂。"
7 月 6 日的 WAIC 開幕式上," 深度學習之父 " 楊立昆重申 "LLM 不會是那條通往人類智能的道路 "。這也讓許多廠商跳脱出 Transformer 的框架,去做創新。
發布自研的行業基座大模型,是今年蜜度的目标。劉益東覺得,自研行業基座大模型是蜜度的方向:" 下一個創造風口的可能就不是 OpenAI,國内廠商要抓住機會。"
以下是劉益東和 36 氪的對話:
先垂直,後通用
36 氪:這次蜜度和友商們同台秀大模型肌肉,為此蜜度做了哪些準備?
劉益東:我覺得這次 WAIC 大家會有一些同行競争的壓力,但更多地是抱着交流學習的态度。雖然很多廠商都推出了大模型,但是聚焦的垂直領網域是有差異的。我覺得作為企業,需要更多地思考我們的優勢在哪裏,以及怎麼為客户和用户帶來實用、便捷、高性價比的 AI 服務。
36 氪:那關于這個問題,蜜度的思考結果是怎樣的?
劉益東:在過去的十多年時間裏,蜜度主要服務的是政務、媒體、企事業部門的辦公需求,也積累了一定規模的客户,所以我們接下來發力的點還是會從這些行業延伸,包括會慢慢地觸及教育行業的 B 端客户。
我覺得蜜度的優勢首先在數據能力,在 2017、2018 年的時候我們已經把 AI 的一些能力通過產品賦能用户了,在大量高質量行業數據的基礎上,蜜度能夠更好地實現應用落地。
其次是客户經驗的積累,我們對客户需求的認知和理解程度還是很高的,雖説現在方案仍需要精細打磨,但至少現在我們已經有相關的基礎,能在未來給客户提供 " 開箱即用 " 的成熟方案。
最後是蜜度對科研的投入,2019 年公司成立了專門的科研機構 " 微熱點研究院 ",主要用于與學界科研力量一起追蹤前沿科技。
36 氪:大會上蜜度先發了三個垂直領網域的大模型,而不是一個通用的基座。
劉益東:是的,這次我們發布的幾個模型是針對垂直領網域的。
我們的目标是在今年下半年在已經發布的模型的基礎上,去訓練一個參數規模在千億級的行業基座模型。當然這個基座模型還是會傾向于政務和媒體的場景。
36 氪:先基于開源模型訓練垂直領網域的模型有怎樣的考慮?
劉益東:大模型領網域的發展可以説是日新月異,我們選擇先做垂直領網域的模型主要是考慮了現實應用的需求。因為基座模型的訓練是一個漫長、投入大的過程,同時不是説一次就能得到很好的效果,而是要做很多方向的調整。為了滿足客户當下的需求,我們考慮先推出垂直領網域的大模型,滿足垂直行業應用的需求。
36 氪:華為也有自己的 " 盤古大模型 ",提出了垂直領網域的模型解決方案,作為華為昇騰的客户,蜜度與華為會不會也形成競争關系?
劉益東:在我的理解中,華為更多的是做一些底層基礎設施的工作,而我們的定位是偏中上層的應用。整個 AI 生态不是説一個人就能把所有事都幹完,大家各自都在做擅長的事,所以我們一直和華為都有良好的合作。
最難的是工程落地
36 氪:ChatGPT 帶起的 AI 熱潮也已經過去大半年了,您覺得算力、數據等哪些難點得到了一定的解決?哪些還是 " 卡脖子 " 問題?
劉益東:我覺得算力、算法、數據,還有一些工程性的挑戰都是非常關鍵的因素。
先從算力講起。過去半年多的時間裏,各地的算力網絡建設也很快。比如上海的超算中心就在過去半年裏提供給了我們很大的算力支持,其實建設的速度很快,并且它能夠支持國產的異構算力,算力這個難點還是得到一定的解決。
接着是算法。整個大模型開源生态在過去半年裏發展得非常快。最開始開源模型有千億的參數,我們只能用小數據做試驗。後來更多的快速訓練的框架面世,就能幫助我們僅用百卡的級别來訓練一個百億參數級别的模型。所以通過半年的觀察和摸索,下半年我們具備了自主訓練基座大模型的條件。
不過,在數據層面我們仍然面臨一些挑戰。因為中文高質量的數據生态發展才幾個月的時間,當然這段時間内各行各業都在建立高質量的數據訓練集,其中一些是以開放的方式,我覺得這是非常好的趨勢。如果解決了中文訓練數據的問題,至少從大模型的算力、算法和數據三個角度而言,基本上不會有太多問題。
而最大的挑戰來源于工程落地。大模型前期的落地步驟包括用户應用,成本很高。如何讓大模型在内部落地,并且讓客户高效利用好,這是蜜度這半年來在思考和在實施的。目前我們已經做到把蜜度的大語言模型部署在消費級的顯卡上,比如説國產的華為昇騰 NPU 卡。
AI 技術發展的成果要讓普通人都能理解
36 氪:蜜度大模型的優勢主要在哪些方面?
劉益東:主要在部署成本上。我們的大模型已經能夠做到用消費級顯卡就能部署,對于企業客户而言,考慮到安全保障,這個成本是可接受的。
同時用户要把大模型用好,和單純部署中間有一個 gap,彌合這個 gap 對于我們來説就是要去契合地接入各種業務場景,設計互動友好的產品界面,我們做了很多工程性的工作,把整體的功能用簡單易用的形态交付給客户。
36 氪:這次展示的 AI 作詩、繪畫等模型功能,看上去都很 toC,蜜度是有做 toC 應用的計劃嗎?
劉益東:以前我們參加過很多展會,更多地是把比較專業的細節在螢幕上展示。但參展者就會覺得很陌生,這其實不利于普通客户的傳播和理解。所以從去年的 WAIC 開始我們就以普通用户可以理解的形式把我們的技術能力展現出來。
36 氪:這次大會楊立昆也提到大語言模型不是通往 AGI 的最優解,您對此是怎麼看的?蜜度是否會跳脱出 Transformer 的路徑去做新的嘗試?
劉益東:我們内部一直在啓動一些創新,不管是基于 Transformer 的還是新的技術路徑。那麼我們的創新能不能超越 Transformer?這其實并不是拍拍腦袋就能實現的,而是需要大量的科研投入。
歡迎交流