今天小編分享的科學經驗:第一家完成大模型研發和開源的央企為何是Ta?我們和電信AI團隊聊了聊,歡迎閲讀。
前不久,中國電信的星辰語義大模型正式開源,也就此成為第一家完成大模型研發和開源的央企。
星辰語義大模型由中國電信旗下的中電信人工智能科技有限公司(以下簡稱電信 AI)完全自主研發而成,其開源版本在一眾大模型知名榜單上,都取得了良好的成績。
傳統運營商,為何會投入大模型研發?為何選擇開源?
兩種不同領網域的企業氣質,它們的融合碰撞,會造就怎樣的一支團隊?
貼在電信 AI 身上的種種标籤,都讓其在一眾大模型選手中,顯得尤為獨特。
事實上,中國電信入局大模型,可以説是一件水到渠成的事情。
人們常説算力、算法、數據,是大模型研發的三要素。而在這三個方面,中國電信都都具備着優勢:
算力方面,中國電信近十幾年構建了覆蓋全國省份的四級算力體系,可滿足大模型的算力要求;
在算法方面,本質上比拼的是人才資源。電信 AI 團隊規模及 800 人,其中研發人員占比 80%。同時,電信 AI 也匯集了一批行業大牛,比如,AI 領網域知名科學家李學龍已在去年年底全職加盟中國電信,出任集團 CTO 及首席科學家;
而在數據上,電信 20 多年來已積累了大量行業數據,再加上來自包括全國主流網站、百科、書籍、論壇、媒體在内的多個渠道的通用數據,其中文訓練數據超過 25TB,中文總 token 量超 8 萬億。同時,電信 AI 組建了專業标注團隊保障數據質量,為大模型算法訓練打下了堅實基礎。
而憑借着這些優勢,電信 AI 的星辰語義大模型,也在這場卷到極致的競争中,展現出了自己的獨特優勢:
最大可支持 96k 的上下文推理;
中文閲讀理解能力領先于同等參數規模的開源大模型;
模型幻覺問題得到有效緩解;
模型生成的内容更符合主流價值觀;
……
在具體表現上,星辰語義大模型具備常識問答、寫作、邏輯推理、數學、輔助代碼生成等諸多通用能力。
尤其在長文寫作上,星辰語義大模型表現更為突出:根據統計,在電信内部,星辰 AI 大模型在此任務上的有效采納率高達 85.7%。
此外,在多輪理解上,星辰語義大模型也進行了針對性的提升。
無論是百模大戰、千模大戰還是萬模大戰,這一定是一個 " 大浪淘沙 " 的過程,最終存活下來的,可能只有少數的幾家。
而電信 AI 的目标,就是成為其中的 N 分之一。
不過,電信的目标并不止于此。
事實上,在大模型之外,電信在傳統 AI 領網域,如 NLP、計算機視覺、乃至數字人和機器人等領網域,已經進行了多年的投入和布局,也完成了不少交付。
而這些方向的技術積累,最終也将整合到這個更為宏大的目标上來。
至于這個目标是什麼,相信看完視頻,你會得到答案。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>