第一家完成大模型研發和開源的央企為何是Ta？我們和電信AI團隊聊了聊

今天小編分享的科學經驗：第一家完成大模型研發和開源的央企為何是Ta？我們和電信AI團隊聊了聊，歡迎閱讀。

前不久，中國電信的星辰語義大模型正式開源，也就此成為第一家完成大模型研發和開源的央企。

星辰語義大模型由中國電信旗下的中電信人工智能科技有限公司（以下簡稱電信 AI）完全自主研發而成，其開源版本在一眾大模型知名榜單上，都取得了良好的成績。

傳統運營商，為何會投入大模型研發？為何選擇開源？

兩種不同領網域的企業氣質，它們的融合碰撞，會造就怎樣的一支團隊？

貼在電信 AI 身上的種種标籤，都讓其在一眾大模型選手中，顯得尤為獨特。

事實上，中國電信入局大模型，可以說是一件水到渠成的事情。

人們常說算力、算法、數據，是大模型研發的三要素。而在這三個方面，中國電信都都具備着優勢：

算力方面，中國電信近十幾年構建了覆蓋全國省份的四級算力體系，可滿足大模型的算力要求；

在算法方面，本質上比拼的是人才資源。電信 AI 團隊規模及 800 人，其中研發人員占比 80%。同時，電信 AI 也匯集了一批行業大牛，比如，AI 領網域知名科學家李學龍已在去年年底全職加盟中國電信，出任集團 CTO 及首席科學家；

而在數據上，電信 20 多年來已積累了大量行業數據，再加上來自包括全國主流網站、百科、書籍、論壇、媒體在内的多個渠道的通用數據，其中文訓練數據超過 25TB，中文總 token 量超 8 萬億。同時，電信 AI 組建了專業标注團隊保障數據質量，為大模型算法訓練打下了堅實基礎。

而憑借着這些優勢，電信 AI 的星辰語義大模型，也在這場卷到極致的競争中，展現出了自己的獨特優勢：

最大可支持 96k 的上下文推理；

中文閱讀理解能力領先于同等參數規模的開源大模型；

模型幻覺問題得到有效緩解；

模型生成的内容更符合主流價值觀；

……

在具體表現上，星辰語義大模型具備常識問答、寫作、邏輯推理、數學、輔助代碼生成等諸多通用能力。

尤其在長文寫作上，星辰語義大模型表現更為突出：根據統計，在電信内部，星辰 AI 大模型在此任務上的有效采納率高達 85.7%。

此外，在多輪理解上，星辰語義大模型也進行了針對性的提升。

無論是百模大戰、千模大戰還是萬模大戰，這一定是一個 " 大浪淘沙 " 的過程，最終存活下來的，可能只有少數的幾家。

而電信 AI 的目标，就是成為其中的 N 分之一。

不過，電信的目标并不止于此。

事實上，在大模型之外，電信在傳統 AI 領網域，如 NLP、計算機視覺、乃至數字人和機器人等領網域，已經進行了多年的投入和布局，也完成了不少交付。

而這些方向的技術積累，最終也将整合到這個更為宏大的目标上來。

至于這個目标是什麼，相信看完視頻，你會得到答案。

— 完 —

點這裡關注我，記得标星哦～

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~