科大訊飛劉慶峰：星火大模型已在三個方面超越ChatGPT - 大酷樂

今天小編分享的教育經驗：科大訊飛劉慶峰：星火大模型已在三個方面超越ChatGPT，歡迎閲讀。

内容來源：本文來自 " 訊飛星火認知大模型 " 成果發布會。

輪值主編 | 智勇責編 | 青羊

第 7412 篇深度好文：2219 字 | 6 分鍾閲讀

AI

筆記君説：

今日科大訊飛召開 " 訊飛星火認知大模型 " 成果發布會。

科大訊飛董事長劉慶峰、科大訊飛研究院院長劉聰，從文本生成、語言理解、知識問答、數學能力、邏輯推理、代碼生成、多模态輸入及生成7 個維度演示了大模型的通用能力，以及認知大模型與訊飛現有產品結合的商業應用成果。

國内認知大模型的最高水平是什麼樣？一起來看看。

一、認知大模型的七個能力維度

自從去年 11 月 OpenAI 推出 ChatGPT 以來，認知大模型技術在全球掀起了人工智能的全新浪潮，認知大模型的出現不亞于 PC 或者互聯網的誕生。

通過統一的大模型學習後，系統具備了像人類一樣觸類旁通的能力，可以在跨領網域形成良好表現，認知大模型已經實實在在開啓了通用人工智能的曙光，星星之火開始出現。

目前，國内通用大模型的水平如何？

我們不得而知，但是訊飛的認知大模型已經具備了 7 大通用能力，在教育、辦公、汽車、數字員工等多個領網域都能落地應用，并且在文本生成、知識問答、數學能力三大能力上已超越 ChatGPT。

1. 長文本生成能力

劉聰現場用星火認知大模型生成了一段歡迎詞，展示了大模型的文本生成能力。

為了測試不同文本類型的生成能力，劉聰還讓星火認知大模型生成了郵件、故事、中英品宣文案等文字内容。

認知大模型，生成了一段孫悟空和奧特曼的故事，還使用語音朗讀了這段現場生成的小故事。

所有内容都是大模型随機生成的，即使是同樣的關鍵詞和描述，每次生成的内容也是不同的。星火認知大模型在中文文本生成方面的能力已經超越了 ChatGPT，英文方面達到了 4.29 分，而 ChatGPT 是 4.48 分。

2. 語言理解能力

科大訊飛通過兩個例子，演示了大模型在語法檢查和語義理解上的成果。

在輸入一段存在單詞拼寫錯誤、單復數錯誤、時态錯誤等問題的英文段落後，星火認知大模型迅速生成了一段糾正所有錯誤的文字。

展示語義理解能力時，劉慶峰以 " 俗話説男子漢大丈夫寧死不屈，但俗話又説男子漢大丈夫能屈能伸 " 為例，測試了大模型是否能準确理解這兩句話背後的含義。

此外，對同一句話在不同語境中的不同理解，大模型也給出了準确的回答。

3. 知識問答

大模型的知識問答能力包括生活常識類、科學知識、工作技巧、醫學知識等。比如，在醫療領網域，大模型将不僅成為醫生的助手，還會成為每個人的健康助手。

後續更多科普知識也會被融入到大模型中。在中國科學院支持下，大模型将持續不斷學習更多科學資料，不斷提升科學問答能力。

4. 邏輯推理

為了測試星火大模型是否真的可以理解人類提問，劉慶峰通過常識理解和故事編輯兩種方式進行了演示。

現場問大模型 " 孔子在 2008 年奧運會上發表了什麼講話？" 大模型基于歷史和常識判斷出孔子不可能出現在奧運會現場。讓大模型以此為主題生成一個故事時，它則從創作維度根據給出的提示編輯生成了一個小故事。

5. 數學能力

數學能力一定意義上代表了認知大模型通用能力的認知水平，星火認知大模型在數學能力方面遙遙領先。

從基礎計算到三角形求度數再到應用題，星火認知大模型都在現場演示中給出了準确答案。

6. 代碼能力

發布會現場星火認知大模型進行了一小段 " 找出 1 到 100 之間的質數并輸出結果 " 代碼生成的演示。

代碼生成能力主要針對工業互聯網和企業内部使用，星火認知大模型仍在不斷訓練中，未來兩到三個月代碼運行能力将有很大提升。

7. 多模态輸入和表達能力

除了前文已經提到過的語音識别和朗讀功能，發布會中還展示了大模型的圖文輸入和理解能力，不僅可以把英文菜單翻譯為中文，還可以對菜單裏的菜名進行解釋，描述菜品的味道。

這一功能不僅可以應用在簡單的圖文翻譯中，也可以成為旅行助手，在提供翻譯功能的同時，介紹不同名勝古迹背後的含義和歷史故事。

更值得一提的是，星火認知大模型還可以根據文字直接生成視頻内容，無論是聲音、虛拟人形象、唇型、手勢還是視頻背景都由大模型實時生成。

後續，星火認知大模型完善的方向如下：進一步提升大模型的開放式問答和多輪對話能力；實現代碼生成能力更新，并将多模态互動能力開放給客户；全面實現通用模型對标 ChatGPT 等。

二、四個領網域，取得落地成果

在教育領網域，一直以來，作文提升都是教學中的一大難點，以批改為例，找出病句、好句、給出評語，一篇文章最少需要老師用 30 分鍾才能完成。

而星火大模型的語言能力和學習機結合，可以對作文快速進行深度理解，自動生成評語和範文。

在辦公領網域，大模型更新產品，幫助智慧辦公邁入了全新階段，可以滿足語音轉寫、會議記錄等多語種翻譯等多種辦公需求，助力職場人提升工作效率。

在汽車領網域和數字人領網域，大模型和產品及業務進行全面結合，比如虛拟人智能互動機現已有 1000 多個虛拟形象資產、300 多個專業聲音、30 多萬用户自定義音庫，可以提供更加自動化、個性化的數字員工服務，實現 24 小時不打烊營業。

三、中外大模型能力差距争議

追趕 OpenAI 首先需要一套科學系統的評測體系。

劉慶峰認為，認知大模型剛剛起步，還在快速成長和迭代過程中。

讓這次智慧湧現的認知智能解決社會剛需，需要一套腳踏實地的科學系統的評測體系。

在認知大模型還在快速迭代中，如果只是找單點例子來證明某個系統的強弱，是沒有意義的。

* 文章為作者獨立觀點，不代表筆記俠立場。

左戰略、右組織，掃碼成為筆記俠的朋友

領取 10 萬字 + 的戰略、組織幹貨合集，迭代你的賺錢思路

分享、點贊、在看，3 連 3 連