今天小编分享的科学经验:京东大模型交卷:天生离产业更近一步,欢迎阅读。
做大模型的公司不少,能明确给出产业落地时间线的还是头一次见。
刚刚,在 2023 京东全球科技探索者大会暨京东云峰会上,京东推出了言犀大模型 + 言犀大模型开放计算平台,并展示了零售、健康、物流、营销、金融、客服等多个产业场景的阶段性实践成果。
一开场,就欣赏了一段由大模型驱动的数字人歌舞表演。
电商场景下,支持 AIGC 商品内容生成。
还有 AI 增长营销平台,几句话构建出营销方案、推广网站。
医疗场景下,通过多轮对话即确定用户腰疼的的原因。
除了现场演示之外,三步走的落地路线图也格外引人关注——
今年下半年在京东内部高复杂场景中反复打磨锤炼,并针对重点场景的标杆客户进行对外服务,主要目的是发现那些看起来 " 不起眼 ",但产业应用中又非常关键的问题。
2024 年上半年,就能针对严肃商业场景将大模型能力全面对外开放 。
划重点了,这里的对外开放不只是提供 API,而是连产业应用一起打包,让企业开箱即用的那种。
京东不会把没做好的菜端上餐桌。
而京东之所以有底气制定这样路线,也是颇有不少干货在里面的。
产业伙伴需要什么样的大模型?
通用大模型火过半年之后,整个产业已经把目光聚焦到下个阶段——产业大模型。
随着最早提出产业大模型的京东交出答卷,关于「产业伙伴需要什么样的大模型」的问题也可以得到阶段性解答。
大模型时代到来,C 端应用层出不穷,普通大众有了直观感知,对其所存在的 " 胡说八道 " 等问题,也有了切身体会。
但对于 B 端企业而言,由于身处行业不同以及自身业务考虑,到底「用什么?如何用?」始终没有很好的答案,大多都 " 还是不知道怎么用 "。
当大家谈到产业大模型,第一反应是聚焦某个行业做小模型。
但何晓冬告诉量子位,这可能是一个误解,做产业模型的时候还是需要一个通用網域的数据,通用網域数据对行业应用也非常关键,它提供了背景常识性的知识。否则如果用户突然提出一些跟这个领網域不相关的询问的时候,话题的跳跃性比较大,原来领網域小模型就会很茫然。
所以,企业所需要的产业大模型也必须建立在通用能力基础上。
大模型于企业而言,大都是降本增效之用。比如可以自动化处理数据和任务、分析大量数据给出更精准的决策、扩展到新的业务领網域等等。
而要实现这些用处,大模型就必须满足两个原则:可信、可用。
可信,意味着模型的预测结果是可靠的,可以被企业信任;
可用,则表示模型可以在实际业务中发挥作用,为企业创造价值。
这两点,不仅是企业用什么大模型的选择基准;也是实现大模型产业化的两个基础特性。
首先来看可信。
针对性地解决大模型可信问题,市面上仍未形成完整的解决方案。
过去几个月大模型从亮相到应用以来,始终存在的幻觉问题。而早在 2020 年京东基于 Transformer 做的K-PLUG模型实体属性抽取准确率达到了 95%,已经达到了商用的水平。
这各中原因,在于京东走出了自己一条路——知识注入。
当时放在业内,属于首创。
它大幅改善了此前 AI 生成长文本任务中文本多样性、篇章连贯性,以及在商品卖点文案的生成中尤其需要关注的卖点独特性、属性一致性,给予商品 " 真实的赞美 "。
最终在一系列 NLP 任务中,比如实体属性抽取准确率、生成式多轮对话 ROUGE-L、多轮问答知识检索率,其性能明显优于其他基线模型。
之所以能这么早地发现 " 幻觉 " 问题并解决,这与他们一直以来围绕产业实践有关。
市面上一般生成式语言模型生成的内容正确率是 83%、85% 左右。一般 toC 用户用起来觉得还可以,十个里面错一个,但是商用是不可接受的。
同样的思路,也集成到了可用的实践上。
从提供大模型企业的视角下,这个问题就转变成如何让大模型创造普惠价值。任何一项技术实现普惠,意味着技术门槛和使用成本的尽可能降低。
算法的泛化 + 向量数据库 +SaaS,这是京东给出的一套组合拳。
前两者自不必多说,一方面算法泛化能力,可以让模型处理多种任务,解决行业中复杂长尾场景。
2022 年,针对模型泛化性不足,京东提出百亿级 Vega 模型。并于 2023 年在通用语言理解基础模型方面对织女大模型进行再更新,提出规模更大、性能更强、迁移性更好的 Vega v2 模型。
向量数据库则可以实时更新知识库,补齐大模型的长期记忆,还能降低训练成本,可以说一举多得。
而向量数据库,2019 年京东就在业内率先研发了 Vearch。目前服务超 100 家大中型企业用户。数据显示,将京东的向量数据库用于大模型预训练,相比传统方式,通过优化模型推理效率,推理成本降低 80%。
目前大模型在应用上的主流思路,就是调用 API。何晓冬在接受采访时表示,这对于一些传统行业客户来说,这依旧有一定的技术门槛。
而客户唯一关心的就是服务效率,只要能将产品用起来就行。
于是团队决定直接将技术解耦形成" 言犀 AI 开发计算平台 ",并在内部实践中打磨产品模块。客户甚至不需要掌握深厚的 AI 知识,跳过中间步骤直接引入成熟的大模型能力。
之前需要 10 余人的科学家团队工作,现在只需要 1-2 个算法人员,通过平台即可完成从数据准备、模型训练到模型部署的全流程,训练效率提升 2 倍,推理提效 6.2 倍,成本节约近 90%。
从可信、可用这两个角度来看,京东给出的解决方案,在整个行业中打了个样儿。
从语言大模型走向多模态数字人互動
这种围绕产业实践发现问题、解决问题的方法,不光体现在大语言模型上,也体现在京东产业 AI 发展的各个阶段。
前深度学习时代,还很少有人期望 AI 能像今天一样独立成为一个功能甚至产品,当时的目标主要集中在降本增效、体验优化上。
2012 年京东开始应用智能客服中心,着力于用技术辅助客服提升人效,优化客户体验。回首看来,其中探索的三个具体任务方向:
ASR 语音识别技术、NLP 语义分析技术、数据挖掘技术。
时至今日,这三类技术对大模型的训练影响颇深。
进入深度学习时代,AI 开始能在更综合、复杂的场景下发挥作用。
2015 年,京东智能客服正式应用了深度神经网络技术。2018 年,首度更新无人客服实现人机结合。在同样 " 深度 " 的实践过程中,言犀团队逐渐认识到了这样一个问题:
客服对话属于任务导向性对话,最终是要解决真实场景的问题,与一般闲聊有本质区别。而且不同的场景,用户对于对话的要求也不一样,仅售前和售后就差别很大。
于是,早在 AlphaGo 掀起上一轮人工智能热潮的那段时间,何晓冬就提出" 对话的本质就是推理和决策 ",后来他在各种场合常用 " 围棋也叫手谈 " 来解释这个观点。
在此思想指导下,何晓冬带领团队融合声学、语义、时间等多模态特征,开发出一系列人机互動场景的 " 话语权决策 "(Turn taking)技术路线。
最近谷歌整合旗下谷歌大腦与 DeepMind 团队,提出要用 AlphaGo 技术与 Transformer 结合开发下一代大模型 " 双子星 "Gemini,也标志着这条路线的价值终于被更多人认识到。
再后来就到了现在 Transformer 大模型时代,京东的布局也很早。
京东在 AI 工程化方面,每天服务数亿活跃用户。以智能客服领網域为例,每年产生数百亿的动态互動数据,一是数据规模大,每天提供 1000 万智能客户服务,每月 200 万小时通话语音,今年京东 618 期间累计服务超 7 亿次,在各种高负载考验下,京东沉淀出了最佳实践。
加上京东其他领網域的人机互動,数据量级达到了数百亿。
2022 年,京东以言犀 2.0 ——人工智能应用平台的方式将内部验证过的技术解耦出来,开始对外输出。
如今的言犀 AI 开发计算平台,也是延续着这个思路。
何晓冬介绍,今年起,言犀大模型正在强大工程化能力基础上于京东场景内深度落地,在健康、金融、物流等京东众多优势行业可复制性的场景中率先锤炼能力,打磨出成熟可靠的技术能力。
以健康领網域为例,靠着言犀大模型的多轮互動、工具调用、总结摘要、图文多模态等能力,打造了健康助手及辅助诊疗应用。
目前,健康助手及辅助诊疗已积累超 3 千万高质量临患对话,构建起百万级规模医学知识图谱,涵盖超千种疾病专业性服务,20 种评价标准保障医疗安全。
在物流领網域,在言犀大模型的支撑下,京东物流超腦实现实时互動、根因分析和智能决策,并更新迭代至具备实时自动生成全局最优的供应链解决方案的能力。
在营销领網域,京东科技市场和平台运营团队打造了 AI 增长营销增长平台,运用大模型解决了诸如关键性任务,动态适应性、用户体验等问题,大幅优化了营销运营流程,实现方案生产效率上百倍提高;将过去涉及产品 / 研发 / 算法 / 设计 / 分析师等 5 类以上职能才能完成的流程,压缩至 1 人;同时,一个入口的全新互動模式,让人机互動次数从 2000 次降低至少于 50 次,将操作效率提升了超过 40 倍。
接下来是正在加速到来的通用人工智能时代,何晓冬认为一定是往多模态方向走。
当 AI 的通用能力达到一定程度,就可以不只停留在幕后提供技术支持,而是形成产品直接面对人类用户,甚至像未来智能体一样更深层次与人类互動。
对此,京东云在言犀大模型的基础上整合了多项多模态数字人互動能力,也在数字人客服、直播等场景实践中找到出一些心得。
比如实现了语义驱动的肢体动作编辑,通过与大模型结合让数字人说话时的动作与语义匹配,互動更加自然。
又比如数字人动态局部高清技术,利用了人类视觉感知并不均匀的特点,对脸部特别是眼睛周围格外敏感。通过重点区網域提高分辨率,其他区網域适当降低分辨率,从而降低部署成本。
在 JDD 上他们表示,言犀会进一步降低操作门槛与操作难度,让更多中小商家与个人能够用得起、用得上数字人服务。
……
如此看来,言犀大模型落地路线图中强调要有 " 半年打磨期 " 的原因就呼之欲出了:
不能只提供 API 告诉外界有这么个 AI 能力,最终目标是为合作伙伴提供直接可用、有端到端价值的产品模块。
大模型时代下的京东路线
几个月前,企业们还在纷纷抢发大模型,到世界人工智能大会摇身一变 " 大模型主场 ",各家纷纷给出自己的行业落地解决方案。
虽然看上去琳琅满目,但若进一步了解就会发现,这些方案不可避免存在业务场景趋同、落地进展仍处于起跑阶段等问题。
这与大模型技术产业化难点有关,尤其是最后一公里的问题,往往就是能用与否的边界。这牵涉到整个系统工程难题,并非传统 AI 三要素就可解决。
作为最早提出聚焦产业大模型的京东,早已感知到这种转变,并将其更新为全新 " 三要素 " 内涵:
场景,以往静态的数据无法适应动态的互動,只有活的在行业应用中的场景数据,才得以实现。
产品,单点算法不足以支撑起新的大模型。最终产品形态才具有核心竞争力,并能带动体系算法的创新和突破。
算力,单个 AI 芯片进步的速度慢于大模型算力需求的井喷,算力集群成为更好的解决方案。
至此大模型时代下的京东路线,也就此明晰:
产业原生。源于产业、服务产业。
于是在这场峰会上,京东将自身底层能力解耦,从基础层、模型层、到 MaaS、SaaS 一揽子技术产品和解决方案都给释出亮相给产业伙伴。
甚至于,已经给出了明确的 " 三步走 " 战略:
第一步,基于核心产业数据,内部构建基座大模型;
第二步,在零售、金融、健康、物流等京东内部核心业务应用;
第三步,针对金融、政务、健康等京东網域外重点产业场景全面开放大模型能力,向产业输出可用可控可信可负担的定制化模型。
这样一条落地路径,也是京东再次向业内重申了自己的技术追求:
成本、效率、体验、可信、普惠、突破。
早在 2017 年,京东提出" 技术、技术、技术 "口号,这三个技术代表了三个层次:
第一个层次是服务自己业务的需要;第二层次是服务产业的技术;第三层是探索未来的技术。
这三者两两耦合,形成技术与产业的闭环——基于产业的前沿创新突破,随后在内部打磨沉淀实现 " 可信 ",最终服务产业创造普惠价值。
也正是因为基于产业的思考,自今年 2 月业内首宣产业大模型之后,京东没再透露更多进展,直至现在才首次将自身技术积累首次亮相。
毕竟从现在发展情况来看,大模型落地的难点并不在于技术追赶,而在于产业突破。
— 完 —
点这里关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>