今天小编分享的互联网经验:蜜度推出自研行业大模型蜜巢系列,预计年底将公布千亿级基座模型,欢迎阅读。
蜜度参展 2023 年世界人工智能大会(来源:钛媒体 App 编辑拍摄)
随着人工智能(AI)大模型热潮以及中国支持 AI 产业发展,国内 AI 企业发现新机遇。
钛媒体 App 获悉,7 月 6 日至 8 日举行的 2023 世界人工智能大会(WAIC)期间,语言智能科技企业上海蜜度信息技术有限公司(MIDU,以下简称 " 蜜度 ")发布自主研发的 3 个行业领網域 AI 大模型,应用于出版、媒体、政务、教育等行业。
具体包括用于辅助写作、新闻稿件辅助生成的蜜巢知识问答与内容生成大语言模型,是首个软硬體一体国产化知识问答与内容生成大语言模型;国内首个智能校对领網域大语言模型 " 蜜度文修 ";蜜巢智能舆情分析大语言模型,以及旗下生成式 AI(AIGC)应用产品 " 蜜小豆 "、" 文稿通 " 等。
蜜度首席技术官(CTO)刘益东对钛媒体 App 表示,此次发布的三款行业垂直领網域大语言模型,参数量在几十亿左右,优势在于语料质量高、公司对数据积累和理解能力较强、有丰富的经验更好落地服务客户等。目前,蜜巢系列行业大模型已逐步尝试部署在政务、媒体等内容生产强需求场景当中。
据悉,蜜度成立于 2009 年,是一家以 AI 技术为核心的语言智能科技企业,专注于多模态多语言智能科技,利用跨模态检索(CMR)、多语言校对(MLC)、计算机视觉(CV)、自然语言处理(NLP)、知识图谱(KG)等技术,为政府和企业各类办公场景提供智能应用軟體产品,以及全方位的智能应用解决方案。
天眼查信息显示,蜜度公司股东中有北京微梦创科创业投资管理公司,持股比例 21.57%。同时,去年 9 月 6 日,蜜度宣布与华为昇腾深度合作,目前蜜度已使用华为云基础设施产品展开业务商业落地。
刘益东于 2009 年参与创办蜜度,现任蜜度 CTO,主要负责公司技术研究与应用工作,推动 AI 技术应用落地。刘益东毕业于哈尔滨工业大学,获计算机专业工学学士学位、軟體工程硕士学位,而且拥有 18 年互联网行业从业经验、10 年大数据研发经验。
刘益东认为,此次蜜度发布大模型产品并不是 " 蹭热点 ",而是有很多行业数据积累形成的技术产品落地。他告诉钛媒体 App,蜜度自 2015 年起专注于语言智能技术方向,在多模态、中文互联网数据积累上有一定优势,尤其是行业数据、客户理解积累上优势明显,有数据内容和生成场景。
具体来说,蜜度自主研发的蜜巢知识问答与内容生成大语言模型,专注于政府与企业内部定制化内容生成的场景,模型能够实时基于用户所输入的文档进行知识增强,并对文档中的相关知识进行定制化的知识问答与内容生成,真正实现 " 千文千面,千人千面 " 式内容生成,打造属于每个人自己的知识问答与内容生成大模型。同时该模型适配华为全栈国产软硬體一体化生态,可在专网环境本地部署使用,提供更加高效、稳定和安全的定制化内容生成衣务。
而蜜度文修是蜜度自研的国内首个专为智能校对领網域打造的垂直大语言模型,以大语言模型(LLM)为技术底座,通过运用高质量数据学习多种特色子任务,大幅度提升中文校对和润色能力的智能化程度。不仅辅助专业用户提高校对质量、提升校对速度、降低差错率,在新闻出版、媒体、政务、央企国企、教育等行业实现快速落地。
值得一提的是,去年 WAIC 大会期间,蜜度就展示了 AI 影像生成、智能文本校对的技术能力,比如智能文本校对语音助手 " 蜜小校 " 等产品。
刘益东直言,过去半年间,团队一直致力于打造优质数据构建、数据训练输出能力,以此形成 ChatGPT、DALL · E 2 这类产品的对话互動、高质量影像生成的优质体验。而与 GPT 不同的是,蜜巢大语言模型更多用于政务、媒体行业等垂直领網域,并非 ChatGPT 这种千亿级通用大模型。
对于企业使用私有云造成大模型难迭代的话题,刘益东向钛媒体 App 透露,相对于阿里、字节等大公司的基座大模型,蜜度更多是把企业自身的公开数据进入蜜巢大模型知识层中,做一些简单的知识问答、命题写作等方案,然后在企业自身环境中去部署蜜巢大语言模型,注入企业自身的知识库 " 内循环 " 更新迭代,而不是做定制化大模型方案。
算力是当前 AI 大模型发展的重要挑战,英伟达显卡成为大模型的 " 入场券 "。刘益东表示,目前蜜度拥有的算力可以支撑十亿级大模型自主训练。而从长期布局,蜜度主要将控制参数规模、控制算力成本,另外扩展云端数据中心这种临时性算力方案,以解决未来更大参数、庞大规模训练等需求响应。据悉,自去年开始,蜜度和华为 AI 算力产品深度合作,而华为的算力也在支持蜜度做国产化大模型,整个产品更自主可控。
刘益东认为,当前 AI 大模型行业应用仍面临三重挑战:一是客户场景能不能支持这种投入产出比;二是大模型在云端的能力能否实现过程的安全可控,让客户放心;三是服务好一个垂直的垂直行业,需要关注不同方面的个性化需求,通用大模型很难全面满足。
刘益东向钛媒体 App 透露,基于当前十亿级参数的垂直领網域大模型基础,以及开源生态发展、大模型基座模型训练、算力能力增长等因素,接下来蜜度团队将全面打造蜜巢行业基座大语言模型,预计 2023 年底前,蜜巢将实现百亿级别参数、千亿级 Token 以及聚焦行业场景的泛化能力。
" 我们还是会聚焦目标市场,以给客户提供优质 AI 产品跟服务为己任,这是我们公司的定位。我们都在探索垂直行业的大模型工作,希望能在现有需求基础上,能迅速把 AI 大模型商业化并形成规模效应。" 刘益东表示,蜜度希望其大模型产品能为中国数字经济做出一定贡献。(本文首发钛媒体 App,作者|林志佳)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App