今天小編分享的教育經驗:剛剛:訊飛星火交卷,“大模型學習機”有什麼不一樣?,歡迎閲讀。
" 追趕 OpenAI 首先需要一套科學系統的大模型評測體系。"
來源|多知網
作者 |馮玮
圖片來源 | 科大訊飛
剛剛,科大訊飛舉行了星火認知大模型成果發布會。
科大訊飛董事長劉慶峰介紹,訊飛星火認知大模型是科大訊飛自主研發的基于深度學習算法的認知智能大模型,其具備跨領網域多任務上類人的理解和生成能力,可以模拟人類大腦對自然語言的理解和生成過程,實現對語音、影像、文本等多種信息形态的理解和處理。
基于此,此次科大訊飛整理出通用人工智能的七大維度能力:文本生成、邏輯推理、語言理解、數學能力、代碼能力、知識問答、多模态能力。
科大訊飛演示了星火認知大模型的寫發言稿、郵件、營銷方案、英文寫作效果,結果相當出色,可實現語音一句話生成,還能中英文互譯,甚至能用小紅書的文風來寫作。
作為星火落地教育場景的嘗試,科大訊飛推出了首款搭載大模型的 AI 學習機 T20 系列。
01
星火背後的 "7 個維度 "
劉慶峰在發布會上解讀,2022 年年底起認知大模型的技術在全球引起了人工智能全新浪潮——各行各業都在擁抱巨大的變革和巨大的機會,傳統意義上通過重時長、人力的商業模式将被根本性的颠覆。
" 這一次人工智能在歷史上的意義,不亞于 PC 或者互聯網的誕生。"
此次認知大模型主要特點在于:通過多種類型的數據送到一個統一的認知智能的大模型中去學習和訓練,最終可以在通用領網域給大家非常驚喜的能力表現。
各種類型的文本來源也是多樣的,可以是文字、語音、影像或者視頻等多種風格:" 關鍵問題是通過這樣一個統一的單模型學習之後,我們就會發現我們的系統會具備了像人類一樣的觸類旁通,在多領網域的智慧湧現的令人驚喜的表現 ",劉慶峰説道。
據了解,基于 ChatGPT 一開始發布的 48 個任務方向和科大訊飛人工智能開放平台上實名認證開發者團隊對人工智能在未來的各種應用領網域的需求,科大訊飛最終提出當前通用人工智能特别令人關注的 7 個維度。
即:文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力以及多模态能力 7 個方面。
劉慶峰強調," 任意的設備都可以像人一樣能聽會説、能理解會思考,将極大推動萬物互聯、大家公認的 IT 產業發展的第六次浪潮 ";" 同時也會帶來終端數量和產業規模 10 倍以上的提升 " ……
劉慶峰在現場就幾個傳統行業進行了迭代分析,其中:
" 在傳統的手工編程行業,新的技術更新将會大幅提升現在軟體產業的研發和生產效率,也會使得今天只要有創意有想象的每個人都可以在數字經濟時代提出他的設想,不用再會編程,也不用要有資源去組合一個編程的團隊,後台的大模型會直接幫他的程式實現,然後運行,然後進行商業推廣。"
" 像自媒體,今天每個人都會成為作家,每個人都會進行商業模式創新一樣,在未來在信息產業在數字經濟中,人人都可能會創業,它的創意和靈感将會更多地變成產業的福利,我覺得會帶來整個產業生态的重大的變革和重塑 " 劉慶峰説道。
這一次認知大模型本質上是一次對話式的通用智慧的湧現,劉慶峰認為語音和語言的核心能力是一個基礎條件:
" 科大訊飛是中國的國家隊,在 2014 年我們就推出了訊飛超腦計劃,明确提出要讓機器像人一樣具備能理解會思考的能力。在去年的 1 月份,我們的年度大會上就正式宣布了訊飛超腦 2030 計劃,我們就是要讓未來的訊飛超腦 2030 計劃中間懂知識會學習。"
據了解,2022 年 12 月 15 日,科大訊飛正式啓動認知智能大模型的專項突破瓶頸,官方稱其為 "1+N 專項突破瓶頸 "。
1:為通用的認知智能的大模型。
N:是把大模型在各個領網域的落地,包括教育、辦公、汽車、人機互動以及醫療等眾多領網域,也是科大訊飛此次發布通用模型和行業產品的一個非常重要的試點。
随着認知大模型在全球引發的關注和產業浪潮,非常多的科研機構和企業部門都在開始進行認知大模型的研究和產業化的相關工作,有些公司已經推出了階段性的成果。
基于此,劉慶峰坦言:" 如果我們要讓這次智慧湧現的認知智能是真的解決社會剛需,而不是簡單的做一個 PR 去做宣傳的話,我們就要建立一套實實在在的腳踏實地又科學系統的評測體系。"
" 用這一套科學系統的評測體系來告訴我們我們的技術到底到了什麼程度了,下一個發展應該往哪邊走,告訴我們到底我們距離實用是不是已經達标了,還是應該還有哪些工作要去做 " ——劉慶峰強調,無論是對 OpenAI 致敬學習、又或是想快速趕超并超越的時候,首先需要一套科學系統的評測體系。
基于此,科大訊飛對 " 科學系統的評測體系 " 的落地也在 2022 年 12 月 15 日同時啓動。
據了解,科大訊飛此前和中國科技大學共同承建的認知智能的全國重點實驗室,牽頭設計通用人工智能的 7 個重要的方向,和一整套的細化測試方法與基本模塊方向。
同時,科大訊飛與中國科學院人工智能產學研創新聯盟以及長三角人工智能產業鏈聯盟,一個側重在產學研源頭技術,一個側重的產業鏈的應用落地。
02
現場展示:星火交卷
" 現在我們給出了 7 大類,一共 481 個細分的任務類型來來進行我們對整個通用認知智能大模型的評測,今天我們就會圍繞着這 7 個主要方向給大家來展示我們訊飛星火大模型到底已經達到什麼程度,以及它下一步的落地情況。" 劉慶峰解讀并在現場演示了幾個實時對話案例。
多風格多任務的長文本的生產能力,劉慶峰解讀,訊飛星火可以寫發言稿、寫郵件、寫新聞通稿、營銷方案等,擁有各方面的文本生成能力。
用星火給大家寫一個歡迎稿:
用星火給小朋友們講故事,可以由家長随機選幾個詞由星火重新編輯:
讓星火以小紅書的風格寫一篇翻譯機 4.0 新品的品宣文案,強化 " 小姐姐們必備神器 ":
在語言理解能力中,劉慶峰強調星火關注多層次跨語種的語言能力。
其中包含如中英文各個層次每個單詞和語法時态等等的檢查,甚至是能夠到情感分析到後台的深度理解。
" 英文的這樣一個語法句式以及關鍵單詞的糾錯能力,我們已經做在業界最強了,所以它不僅可以賦能,在我們訊飛的學習產品中,我想對每一個現在的商務人士或者工作人員對海外做交流這個功能都是非常有用的。"
星火對英文語法糾錯:
星火對中文模棱兩可的漢語進行理解和解讀,例如:
俗話説,男子漢大丈夫要寧死不屈;但俗話又説男子漢大丈夫要能屈能伸,這兩種意思如何理解?差别在什麼地方?
如果有個小夥子和他女朋友吵架了,他應該是寧死不屈還是能屈能伸?
對 " 一分鍾 " 的理解和使用,也各有不同:
" 因為語言理解是将來我們的認知大模型,就要用各種插件和工具最核心的一項能力。這個能力中根據我們剛才説的測試體系中,481 項測試維度中有 119 項詳細任務跟語言理解有關。根據我們現在測試結果,我也非常自豪的告訴大家,在國内可測的現有系統中我們是明顯遙遙領先的,那麼跟切斷 GDP 相比還有細微的差别,但我們還在持續提升的過程中 ",劉慶峰解讀。
在知識問答部分,劉慶峰表示通常把它定義成叫泛領網域的開放式的知識問答。
菠菜和豆腐能不能一起吃:
家中老人突然暈倒,如何判斷是不是中風:
在這個部分,劉慶峰特别強調,星火只把訊飛醫療專業系統中的一部分通用能力簡單放上來,并沒有專門發布訊飛醫療版的專用的醫療大模型。
" 是因為醫療要更加嚴肅更加謹慎,還有很多醫療的相關的法規。我們會下一步把這些專專業能力從跟醫療機構合作中逐步放到通用的大模型中,希望将來讓每一個老人在居家的過程中,每一個家長每一個年輕的父母親都能夠通過我們的星火模型,能夠成為每個人的健康的顧問,每個人的健康助手不僅要成為醫生的診療助理,還要成為每個人的健康助手。" 劉慶峰解讀。
另據了解,醫療專業模型,大約在今年的 1024 期間正式發出。
回歸到星火模型上,在數學問題中提出,某個公司的股票昨天漲了 10%,今天又跌了 10%,請問到底是漲了還是跌了?
花壇裏面有 3 種花,一共有 88 朵,其中月季花的數量是菊花的 4 倍,牡丹花的數量是菊花的 5 倍少 2 朵。那麼請問花壇裏一共有多少朵牡丹?
" 按照剛才的測試體系來説,大概有 16 個類别的詳細任務,但這 16 個類别的詳細任務中,我們在國内可測到的同類系統中,不僅是領先是遙遙領先,現在已經超過 ChatGPT 了 ",劉慶峰解讀:" 當然我們自己也還在快速更新的過程中,在下一個版本中還會繼續前進,所以我相信在這些領網域中都會成為星火,會源源不斷的給大家帶來驚喜的方面。"
中文方面:
同時還有一些現場問題的征集。
外星人感冒了戴口罩麼?
40 平米的房子裝成 70 平米的可行方案?
跟女朋友吵架了有什麼辦法解決?
發布會現場,劉慶峰同時介紹了純大型技術的待攻克缺陷:
劉慶峰表示,訊飛星火大模型将在:
6 月 9 日前,将開啓實時問答,更新多輪對話能力;
8 月 15 日前,再次提升代碼能力以及多模态互動能力;
10 月 24 日前,星火大模型将對标 ChatGPT,在中文能力上超過 ChatGPT,在英文能力上與 ChatGPT 相當。
發布會現場,劉慶峰介紹由科大訊飛推出的、全球首款搭載大模型的 AI 學習機。
03
星火落地教育:AI 學習機
今年 2 月,多知曾報道稱科大訊飛低調推出 AI 學習機 T20 Pro,官方定價 8999 元,活動價 8799 元——這也是科大訊飛學習機系列中價位最高的一款。
彼時多知觀察發現,最新機型 T20 Pro 較過往產品的核心不同在于:對不同學齡段、不同孩子差異化學習需求進行分層。
但在此次的發布會上,劉慶峰宣布 T20 系列在語數英主學科上進行了大模型應用落地——首批上線了中英文作文類人批改(學習機端)和生成(家長端)、數學個性化精準學類人互動輔學、英語類人口語陪練功能。
即,T20 系列可實現像真人老師一樣的互動式輔學,為 3-18 歲孩子提供真正的智能化、個性化精準學習體驗,進而提升學習效率和學業水平。
具體來看:
搭載認知大模型的科大訊飛 AI 學習機 T20 系列,作文理解和評語生成能力進化式提升,行業内首次實現中英文作文的類人批改。
科大訊飛官方介紹,T20 系列會像真人老師一樣," 以精細化的批改反饋、個性化的點評指導以及人性化的學習體驗幫助孩子提升寫作水平。"
批改作文時,它會像真人老師一樣對文章精細勾畫點評。
進而實現 3 階(基礎批改、高階批改、提升建議)7 級(規範字詞、技法識别、結構分析、内容理解、語言表現、寫作建議、優化參考)的層層批改。
第一個階段:基礎批改主要針對字詞句的錯誤識别和修改。
目前市面上其他學習機大多只做到基礎批改,搭載認知大模型的科大訊飛 AI 學習機 T20 系列可以找出的錯誤類型更全、數量更多,還能自動關聯知識卡片,幫助學生學習和鞏固薄弱知識點。
第二階段:高階批改,根據寫作要求,深度理解文章内容,從布局、審題立意、行文表達等語義角度,對作文結構、内容、語言進行深度批改。
第三階段的提升建議,是科大訊飛 AI 學習機 T20 系列搭載大模型後的專有批改功能。
在這個環節,學習機會以引導式提問、啓發式評語,引導孩子主動思考、找出錯因,訓練寫作思路;同時,通過 AI 技術實時生成優化參考内容和推薦範文,幫學生積累寫作素材,提升寫作技巧。
孩子在學習機端完成作文批改後,家長可在手機端 " 訊飛 AI 學 "APP 上查看完整批改報告,準确掌握孩子寫作學情。
家長還可對學習機上批改的作文一鍵優化,讓孩子通過對比優化前後的作文,提高對寫作要求的理解能力。
在理科知識上,科大訊飛 AI 學習機 T20 系列數學 AI 精準學功能更新,推出了 " 分層知識圖譜 ",分别以夯實基礎、突破進階、拓展拔高為目标。
根據教材知識點和本地化考情大數據,生成基礎、進階、拔高三級難度的知識圖譜。
孩子可以根據 AI 推薦的難度目标學習,也可按照自身的能力階段和所處的學習階段,選擇适合自己的層級進行精準學習,高效提升。
通過認知大模型的能力,每個分層都實現了類人互動輔學,對學生進行深度點撥、引導、解析。
科大訊飛 AI 學習機 T20 系列通過 " 思路點撥 - 解題視頻 - 試題解析 - 舉一反三 - 一題多解 - 大招總結 " 首次一一對應實現了數學知識點學習 " 知識記憶 - 對照應用 - 理解分析 - 變式應用 - 能力拓展 - 素養内化 " 的科學鏈路," 類人老師 " 全鏈路互動式精準輔導,讓孩子逐級進階。
在口語練習部分,搭載星火認知大模型後,科大訊飛 AI 學習機 T20 系列行業首推類人 " 口語陪練 " 功能——官方稱 " 它像是孩子的 24 小時 1 對 1 口語聊天語伴,可以随時随地與孩子免費暢聊練口語。"
據介紹,"AI 語伴 " 采用科大訊飛服務于全國中高考英語聽力、口語考試的同源測評、翻譯技術,孩子直接説中文也能翻譯成英文并讓孩子跟着讀。對話過程中會實時評價發音水平,并給予及時反饋、指導。
2019 年科大訊飛行業首發 " 個性化精準學 " 系統,最核心的功能是知識圖譜找弱項和 " 測 - 學 - 練 " 系統。
相較于市面上同類型產品,目前科大訊飛特有的本地化的考點考頻大數據,同章節的知識圖譜除了課本原有的知識點外,還有本地常考的延展問題,知識點更完整細致。
同時,知識點之間有清晰的邏輯結構,可以溯源并預測知識點掌握情況,科大訊飛的智能推薦算法可推薦最優學習路徑;另外科大訊飛精準學還能滿足小節、單元、備考等全場景精準學習需求。
支持主、客觀全題型的作答和分析,綜合評估知識點掌握程度。
T20 Pro 在内容層面的多個功能,都在凸顯 "AI" 的效用,例如 "AI 同步精準學 "、"AI 考試 "、"AI 錯題本 "、"AI 學習計劃 " 等。
不過劉慶峰也曾強調,在智能教育硬體的發展過程中,科大訊飛會堅持兩個關鍵方向。
第一,技術不能解決所有問題。
" 在用人工智能學習機推動教學的過程中,絕不能認為只是一個技術就能夠解決所有問題。它一定是在教育理念的指引下,跟教研的力量,跟内容資源結合起來,這是一個系統性創新的過程 ",劉慶峰指出。
第二,AI 是幫助老師、學生,而不是替代老師。
" 一定要考慮跟老師之間的協同,人工智能是幫助老師推動教學,而不是代替老師的,因為教學是個長期的問題,而且在這個過程中,跟着教育理念,其實教育的評價方式會改變,一定将來的評價之後的成就導向要多元化,然後教學内容要進行改革,這都是一個系統性工程。" 劉慶峰強調。
劉慶峰所勾勒的是,每個老師都有 AI 教學助手,每個學生都有 AI 學習伴侶:" 我認為将來應該是人手一個,這才是趨勢,它就跟書包一樣,應該是每個孩子都有這樣一個電子書包,然後又能夠護眼,随時随地陪伴。"
如今,科大訊飛 AI 學習機 T20 系列行業首次搭載認知大模型,不僅僅是一次產品創新,更是科大訊飛人工智能技術在教育領網域應用的又一重大突破。
END
本文作者:馮玮
>