今天小编分享的科学经验:第一家完成大模型研发和开源的央企为何是Ta?我们和电信AI团队聊了聊,欢迎阅读。
前不久,中国电信的星辰语义大模型正式开源,也就此成为第一家完成大模型研发和开源的央企。
星辰语义大模型由中国电信旗下的中电信人工智能科技有限公司(以下简称电信 AI)完全自主研发而成,其开源版本在一众大模型知名榜单上,都取得了良好的成绩。
传统运营商,为何会投入大模型研发?为何选择开源?
两种不同领網域的企业气质,它们的融合碰撞,会造就怎样的一支团队?
贴在电信 AI 身上的种种标签,都让其在一众大模型选手中,显得尤为独特。
事实上,中国电信入局大模型,可以说是一件水到渠成的事情。
人们常说算力、算法、数据,是大模型研发的三要素。而在这三个方面,中国电信都都具备着优势:
算力方面,中国电信近十几年构建了覆盖全国省份的四级算力体系,可满足大模型的算力要求;
在算法方面,本质上比拼的是人才资源。电信 AI 团队规模及 800 人,其中研发人员占比 80%。同时,电信 AI 也汇集了一批行业大牛,比如,AI 领網域知名科学家李学龙已在去年年底全职加盟中国电信,出任集团 CTO 及首席科学家;
而在数据上,电信 20 多年来已积累了大量行业数据,再加上来自包括全国主流网站、百科、书籍、论坛、媒体在内的多个渠道的通用数据,其中文训练数据超过 25TB,中文总 token 量超 8 万亿。同时,电信 AI 组建了专业标注团队保障数据质量,为大模型算法训练打下了坚实基础。
而凭借着这些优势,电信 AI 的星辰语义大模型,也在这场卷到极致的竞争中,展现出了自己的独特优势:
最大可支持 96k 的上下文推理;
中文阅读理解能力领先于同等参数规模的开源大模型;
模型幻觉问题得到有效缓解;
模型生成的内容更符合主流价值观;
……
在具体表现上,星辰语义大模型具备常识问答、写作、逻辑推理、数学、辅助代码生成等诸多通用能力。
尤其在长文写作上,星辰语义大模型表现更为突出:根据统计,在电信内部,星辰 AI 大模型在此任务上的有效采纳率高达 85.7%。
此外,在多轮理解上,星辰语义大模型也进行了针对性的提升。
无论是百模大战、千模大战还是万模大战,这一定是一个 " 大浪淘沙 " 的过程,最终存活下来的,可能只有少数的几家。
而电信 AI 的目标,就是成为其中的 N 分之一。
不过,电信的目标并不止于此。
事实上,在大模型之外,电信在传统 AI 领網域,如 NLP、计算机视觉、乃至数字人和机器人等领網域,已经进行了多年的投入和布局,也完成了不少交付。
而这些方向的技术积累,最终也将整合到这个更为宏大的目标上来。
至于这个目标是什么,相信看完视频,你会得到答案。
— 完 —
点这里关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>