今天小编分享的互联网经验:对话月之暗面:Kimi智能助手支持200万字无损输入,年内将发布多模态模型,欢迎阅读。
月之暗面北京办公室 (图片来源:钛媒体 App 编辑拍摄)
继 25 亿美元估值炸场之后,杨植麟团队再扔下 " 震撼弹 "。
钛媒体 App 获悉,3 月 18 日上午,国内 AI 创业公司月之暗面(Moonshot AI)宣布在大模型长上下文視窗技术上取得新的突破,Kimi 智能助手已支持 200 万字超长无损上下文,短短五个月内 " 长文本 " 输入量提升 10 倍,并于即日起开启产品 " 内测 "。
18 日上午,月之暗面工程副总裁许欣然对钛媒体 App 等表示,大模型无损上下文长度的数量级提升,也会进一步帮助大家打开对 AI 应用场景的想象力,包括完整代码库的分析理解、自主完成多步骤复杂任务的智能体 Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。
许欣然强调,过去一段时间 Kimi 正不断提升大模型技术能力,尤其是更复杂的模型需求越来越多。而在整个过程当中,Kimi 模型本身跟用户一直存在彼此相互促进增长的状态。
月之暗面创始人杨植麟博士表示,通往通用人工智能(AGI)的话,无损的长上下文将会是一个很关键的基础技术。历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。
月之暗面联合创始人 周昕宇则向钛媒体 App 透露,月之暗面即将在今年内推出自研的多模态大模型。同时,商业化也在快速推进。
当被问及之前为何不做多模态模型时,周昕宇回应称," 如果拿出别人也有的东西,对于世界来说没有什么新价值,大家就不要再陷入‘百模大战’怪圈,我们不做跟随的东西。"
据悉,月之暗面成立于 2023 年 3 月,是国内大模型领網域的关键玩家。其核心团队曾参与到 Google、华为盘古、智源悟道等多个大模型研发中。
月之暗面创始人、CEO 杨植麟本科毕业于清华大学,博士毕业于卡内基梅隆大学计算机专业,曾就职于 Google Brain(谷歌大腦)和美国初创公司 FAIR,师从苹果公司人工智能负责人 Ruslan Salakhutdinov,有多年创业经验,曾与多名图灵奖得主合作发表论文,是盘古、悟道等国内最早大模型的技术贡献者。
同时,杨植麟还是中国 35 岁以下 NLP(自然语言处理)领網域引用最高的研究者,也是 Transformer-XL 和 XLNet 两篇重要论文的第一作者——两篇文章均为大语言模型领網域的核心技术。而另两位联合创始人周昕宇和吴育昕都有超 10000 次 Google Scholar 引用。
人员方面,目前,月之暗面团队人数已超过 80 人。
融资方面,成立不到一年内,月之暗面就已完成两笔融资,总额超过 13 亿美元,投资方包括红杉中国、真格基金、小红书、美团、阿里等。今年 2 月的一笔融资成为国内 AI 大模型公司迄今获得的单轮最大金额融资。
两轮投资后,目前,月之暗面公司估值或达 25 亿美元。
技术产品层面,成立至今,月之暗面已完成从通用大模型到上层应用的布局。
其中,大模型基础层,月之暗面已训练千亿级别的自研通用大模型,并获得了国内大模型备案审批;应用层,2023 年 10 月,月之暗面推出全球首个支持输入 20 万汉字的智能助手产品 Kimi,支持 20 万汉字的长文本输入,主打无损记忆以及 " 长文本(Long Context)",被网友称为 ChatGPT 中文平替,善于读长文、搜网页,可以用于会议纪要、辅助编程、文案写作等场景。
根据 SimilarWeb 显示,春节之后 Kimi 访问量大增。另据公开数据显示,2024 年 1 月,Kimi 智能助手的访问量 142 万,在大模型创业公司的 "AI ChatBots" 产品中排在第一;月环比增长率 94.1%,增长速度也在大模型创业公司排第一位。
许欣然表示,目前 Kimi 平均每个月可能都有 100% 以上的增速。
今天上午会议上,许欣然宣布,即日起,月之暗面旗下的 Kimi Chat、Moonshot 大模型将统一名称,分别更名为 Kimi 智能助手、Kimi 大模型。
" 我们就简化一下,以后统一让大家记住 Kimi。" 许欣然对钛媒体 App 等表示。
具体来说,相比此前 20 万字长度,更长的文本输入首先能带来的变化就是解锁更多超长任务、复杂任务。过去只能整理 50 份简历,现在可以线性增长至 500 份。
月之暗面团队提出 "10 分钟速成定律 ",并指出 Kimi 快速学习一个新领網域的能力,人类要 10000 小时才能成为专家的领網域,AI 只需要 10 分钟,就能接近任何一个新领網域的初级专家水平。
许欣然展示百万字书籍的打印厚度
例如,上传几十万字的德州扑克的教程文档,再提出一个比赛开局,Kimi 就可以分析比赛场上的局面,并提供出牌策略的指导;同时,kimi 还能读懂近百万字中医诊疗手册、《甄嬛传》小说等,它都能一一解答。
此外,除了中英文,Kimi 还能直接阅读代码库檔案,然后用中文写出详细清晰的代码库设计文档,即便是毫无注释的陈年老代码也能快速梳理出结构。
月之暗面方面表示,从很多 Kimi 智能助手用户的反馈来看,20 万字的无损长上下文帮助他们打开了新的 AI 应用世界,带来了更大的价值,但随着他们尝试更复杂的任务、解读更长的文档,依然会遇到对话长度超出限制的情况。这也是大模型产品的无损上下文长度需要继续提升的一个直接原因。此外,Kimi 智能助手的智能搜索,更是离不开大模型的无损长上下文能力。
月之暗面指出,正是因为用户对 Kimi 发出的指令越来越复杂,因此团队也一直致力于提升 Kimi 能遵循的指令的复杂度、信息检索能力。同时由于用户的使用场景从工作逐渐扩展到生活的方方面面,团队在网页端之外补齐了微信小程式、iOS 端以及安卓端等。
许欣然透露,Kimi 充分发挥其作为 " 硅基生命 " 的优势,夜间也没歇着,持续不断地自我进化中。
周昕宇强调,出于用户共创的考虑,Kimi 的定位比起 " 聊天机器人 " 更像一个 " 智能助手 ",因为普通对话对大模型自身迭代的帮助有限。
会后对话交流中,周昕宇表示,对于呼声很高的提示词教程,目前已经在准备当中,预计一个月左右发布;同时,多模态模型也在不断研发,而音频处理能力、海外版同样在需求池内。
许欣然向钛媒体 App 表示,月之暗面的 AI Infra(基础设施)团队也在持续提升能效比,均是采用自研技术。据称比起刚发布时,Kimi 在完全相同的硬體条件下响应速度提升了 3 倍。
目前,Kimi 智能助手仍完全免费。但随着用户群体的扩大和使用量的增长,难免会出现算力不足的情况。许欣然透露,今年上半年预计开启商业化模式。
" 我觉得这个东西都是付费内容。我们思考点不是从性价比来进行(商业化)。而是我们应该要帮助用户解决什么问题。在能解决问题的情况下,我们将商业化不断开放和规划,到时候你(客户)就知道哪个更好了。" 周昕宇表示。
(本文首发钛媒体 App,作者|林志佳)