今天小編分享的科學經驗:炸裂!訊飛現場大秀強幹擾語音識别,星火4.0霸榜八個榜單,74種語言自由交流,歡迎閲讀。
很炸裂!訊飛星火大秀語音識别能力,現場掌聲雷動——
三個人同時説話,再加上背景音樂,如此強幹擾的場景,大模型卻表示都能聽懂聽清,還瞬間轉化為文字,語音識别的 " 雞尾酒會 " 難題不在話下 ~
好,就只聽到了最後的北京烤鴨,誰懂……
不得不承認,幾個月一度的科大訊飛發布會每次都幹貨滿滿,此次也同樣帶來了驚喜。
訊飛星火 4.0 版本來襲,此次 7 大底座能力提升,八大榜單第一,全面對标 GPT-4 Turbo。
除此之外,訊飛星火 APP/Desk、語音大模型也迎來了一眾更新。
快來看看此次有什麼樣的新發布 ~
訊飛星火 4.0 有多強?八個榜單第一
首先來看看底座大模型訊飛星火 4.0 的全新更新,主要在這幾個方面:
基礎能力上:文本生成、語言理解、知識問答、邏輯推理、數學代碼以及多模态能力都全面更新,并且全面對标 GPT-4 Turbo;
圖文識别能力上也在持續更新之中,尤其像關于版面的復雜理解、融合篇章語義的文字識别、專業領網域的符号識别等方面,在科研、金融、醫療、司法等行業領網域都比 GPT-4o 更強。
復雜指令、復雜邏輯推理、空間推理、數學、基于邏輯關系的多模理解等復雜能力上皆也有所提升。比如,能根據幾張圖來梳理出圖中内容的邏輯關系,這些能力的提升可以加速大模型實際應用的腳步。
在國内外中英文 12 項主流測試集中,星火 V4.0 實現了 8 項第一,包括理解推理、綜合考試、數學等維度的中英文測試。
不過劉慶峰坦言,此次在代碼和多模态能力還有所差距。
值得一提的是,此次星火長文本通用能力也進行了全新更新,并首發了内容溯源功能。
訊飛研究院院長劉聰也進行了現場演示,扔了一本中文版西遊記和英文版哈利波特給它,問:
孫悟空的金箍棒和哈利波特的魔杖有什麼不同?
除了按部就班的回答之外,在回答之中文字上面有小旗幟标識,一點開就會發現來源在哪。
這樣一來,大模型的幻覺能夠極大的降低,相當于星火在回答你的問題時,還告訴你為什麼會這麼回答,是參考了哪一段内容,省去你去全文核對的時間,只需核實它的的溯源即可。
而且注意到,這裏面不局限于中文,英文溯源同樣也能實現。星火大模型并非将英文翻譯成中文,而是直接找對應關系,是真正基于英文自動訓練出來的英文溯源能力。
當然,這個内容來源也不局限于文本,包括像語音、視頻也都不在話下。
好了,底座能力基本已經了解,現在網頁版和 App 端也都已全面更新,這就來淺測一番。
首先來看看前段時間難倒一波大模型的高考數學,訊飛星火 4.0 如何應對,直接拿直接拿高考一卷的前 4 個客觀選擇題試試手:
查看題目,給出這道題的答案。
結果四道題全對,解析也都完全正确,該説不説,是有點東西的啊 ~
再來看看它的多模理解能力,能否從幾個圖中找到對應的邏輯關系。
對于一則漫畫,它也能清晰的判斷出裏面的内容,成功回答了給出的問題:一年後,小孩是否有長高?
此外,強幹擾場景下的語音識别能力也實現了突破,兩個人混疊場景準确率已經到了 91%;三人混疊説話場景也能實現 86% 的語音識别準确率;在 -5dB 的高噪場景,噪音已經比人講話還要高不少的情況下,依然能做到 90% 以上的準确率—— 也就出現了最開始「即使七嘴八舌,也能精準識别」的場景。
語言識别的能力也越來越強,此次更新的星火語音大模型可支持 74 種語言免切換自由對話,包括 37 種語種、37 種方言,不用切換,可以自由交流。
其中,37 個語種識别效果領先 OpenAI whisper-V3,37 個方言識别效果平均提升 30%
也就在前幾天,科大訊飛作為第一完成部門的《多語種智能語音關鍵技術及產業化》項目獲得國家科學技術進步獎一等獎。
這是深度學習引發全球人工智能浪潮以來,過去十年人工智能領網域的首個國家科學技術進步獎一等獎。
在這基礎之上,語音領網域的應用也正在被重構。星火汽車智能座艙全新更新,已經具備了多語種多方言的 " 自由互動 ",還具備多情感多模态的超拟人互動。目前,訊飛語音互動產品國内市占率穩居第一,同時廣泛出口到世界各地。星火大模型為一汽、奇瑞、廣汽、江淮、長城等車企的眾多車型,賦予了高度智能的互動體驗。
主打個性化的 AI 助手
随着底座大模型能力的更新,星火在各行業各場景中的應用體驗也進一步升維。
用科大訊飛自己話説:懂你的 AI 助手。
與此前「通用 AI 助手」定位相比,劉慶峰表示主要實現了三個能力層面的替身。
基于用户畫像的個性化表達;
基于使用歷史的記憶學習;
基于個人資料來進行增強學習;
具體而言,在構建用户個人畫像時,人設風格可以自己選定,也可以根據對話和使用歷史動态完善,進而形成個性化的表達風格;AI 助手再結合個人資料,就可以生成個性化和針對性内容。
而現在每個人都可以通過訊飛星火 APP,或者 Desk 界面,擁有屬于自己的個性化助手。
此次更新了「個人空間」,它能夠對你上傳的各種資料進行收集管理,構建你一個人的專屬知識庫。而大模型也可以基于你的個人資料進行增強學習。
在現場,劉聰就上傳了女兒寫作文,并選取符合女兒 AI 人設标籤後,後續文案生成風格都帶有他女兒人設風格。
在訊飛星火 APP上,還有一個智能體功能,它将各種各樣的 AI 助手集成于此,包括醫療助手、英語聽説助手、數學答題助手、錄音助手、文稿寫作助手、代碼助手等等各種實用功能,你可以随時調用。
目前首批已上線 14 個智能體。
而更聚焦于在具體行業應用中,星火作為「懂你的 AI 助手」正在不斷深入,持續創造價值。
比如醫療。當前訊飛星火醫療大模型也再次更新,醫療核心能力全面超過 GPT-4 Turbo,包括醫學相關的知識問答、復雜的語義理解、專業文書生成、診斷治療以及多輪對話等各項指标。
你可以直接詢問它一些通用問題,比如,要是失眠怎麼辦?痛風患者能喝豆汁兒嗎?
訊飛曉醫 APP 上線了" 個人數字健康空間 ",可以鏈接到你自己以及家人的健康檔案,包括電子病歷、檢查報告、體檢報告等資料。當出現一些小病症的情況,為你剖析原因;用藥時給出藥物禁忌的個性判斷,還可以對比此前報告給出數據變化。
再有就是教育領網域。AI 正在成為老師的教學助理、學生的學習助手。
此次底層星火大模型,在語文數學英語能力以及 OCR 識别能力都有了很大的提升。
在老師端,科大訊飛此次發布星火智能批閲機,他能自動批改,即掃即批,并在現場大秀操作。
批完之後,它還能對整個班級學習情況分析出來,輔助老師給出每個學生學習路徑規劃。
原本 90 分鍾作業批改時間,可以變成 5 分鍾;60 分鍾的學情統計時間編程一分鍾,大大解放了老師的生產力。
而在學生端,由星火大模型搭載的 AI 學習機,基于底層能力提升,進一步實現了超拟人的答疑輔導。
從已有試點數據來看,孩子獨立學習完成率從 67% 到 90%,錯題解決率從以往依靠視頻學習的 72% 到現在達到了 93%。
除此之外,企業應用領網域,還發布了企業智能體平台、以及商機、評标、代碼等企業智能助手的亮相。
與此同時,訊飛星火的開發者生态影響還在不斷擴大——
自今年 1 月 30 日訊飛星火 V3.5 發布以來,短短 5 個月,星火開發者生态加速增長,開發者數從 598 萬增長到 702 萬,新增超 104 萬;海外開發者數超 40 萬;大模型開發者達 57 萬。
讓大模型更好用更實用
整個發布會看下來,科大訊飛釋放出這樣一個發力信号;
讓大模型更好用、更實用。
而要将其進一步具象化,那就是AI 智能助理。
可以是一家老小的健康都被 AI 守護;也可以是每個人孩子一對一個性化教學中培養出主動思考的終身學習能力;還有像深入企業中經營服務場景,每個打工人都可以輕松管理自己的知識庫。
而如果貫穿整個人類文明,每一次進步背後都有一個了不起的助手,每一代助手都有它的使命。
科大訊飛的使命就是解放生產力,釋放生產力。
劉慶峰表示,希望通過我們的能力,成就每一個了不起的企業,幫助每一個人都成為了不起的自己。
而作為 AI 助手的 " 載體 " ——訊飛星火 APP其實正在持續賦能,早已在我們身邊改變着我們的生產生活。
會上劉慶峰提供了這幾組關鍵的數字。
意味着,星火 APP 各類助手,包括寫作、編程、工作、學習、生活、親子、翻譯等助手都在被我們日常使用,部分調用次數甚至達到了幾百萬甚至千萬級别。
不過從整個行業來看,其實這也不是什麼新鮮概念,早在不少科幻電視劇、電影裏面出現,直至現在大模型時代帶來,科幻場面照進現實。
誠如此前爆火的 ChatGPT 男友 DAN、還有帶來全新人機互動熱議的 GPT-4o,更多兼具功能和情感屬性的通用 AI 助手出現,讓人直呼:《Her》真的來了。
但能打造作為 AI 助手,其實并非易事。
相信很多朋友都注意到,GPT Builder 即将在 7 月份終止服務。這個因為「每個人都能創建自己的 GPT」而被寄予厚望,然而現在發布不到半年即将面臨關停。
還記得當時剛出來時,就被不少人诟病,有些定制出來的 GPTs 跟 ChatGPT 本來對話沒有什麼區别,無法解決復雜指令……
當大模型產品直面用户時,人們對它的期望和要求要遠比以往更為嚴苛。當產品現有能力無法滿足用户需求時,很快就會被用户淘汰,被市場淘汰……
只有不斷打磨產品能力、直擊用户痛點,并且始終保持開放的生态,才能在這樣一個浪潮中生生不息。
至少現在來看,目前尚且還留存、持續不斷給用户帶來服務的大模型產品,經歷住了考驗。科大訊飛就是其中一個。
而最近 ChatGPT 的一個決定,再次讓大模型自主可控這個命題變得尤為重要。
OpenAI 的大模型,不會成為中國 AI 應用的基座,自然也更不會成為中國 AI 助手的基座。而像科大訊飛這樣的玩家,從一開始就主打自主可控——
直至現在,訊飛星火 4.0 還是官方認證的唯一全民開放大模型。
什麼概念呢?
就是在全國產算力平台上訓練的大模型,所有算法、每一行碼、每一個數據都是我們自主可控的大模型。
此次訊飛星火大模型的發布,是基于全國首個國產萬卡算力集群 " 飛星一号 "。
劉慶峰表示:大模型底座能力決定發展高度,而中國需要建立自主可控的通用大模型底座。
要科學地認識大模型能力邊界,如今随着大模型能力更新,讓每個人 AI 智能助理成為可能。
星火代表着一種趨勢,也正在引領着這種趨勢的發展。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>