今天小编分享的科技经验:大模型生成的下一个范式:从“能说会道”到贯通行业,欢迎阅读。
智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影
行业需要怎样的大模型能力?
目前,大语言模型的生成、理解能力目前大多以文字为载体,通过此前的文字去预测下一个文字,从而形成完整的文字回答。但当其深入行业,单靠文字这一形式很难解决实际问题。
如用户的体检报告、器材设备的检测数据等,通常并不会直接以文字出现,而这些有价值的数据正在被大模型能力重塑。
今天,第四范式发布的行业大模型平台先知 AIOS 5.0,作为一大载体将这些面向不同场景的行业大模型能力集成了起来。
大语言模型的原理在于Predict the Next "X","X" 这一未知数的指代形式正不断扩展延伸,在 AIOS 5.0 之上,它可以是用户的一份个人体检报告,也可以是水文数据、设备检修数据等多元化形态。
那么,"X" 的这些不同形态数据落地到行业中后表现如何?我们通过深入剖析几大行业大模型的典型案例,找到这些问题的答案。
一、行业大模型承载多元化场景需求
话不多说,先来看看与我们日常生活密切相关的场景。
正如开篇提到的健康领網域,在慢病管理大模型中,当 "X" 化身为用户的个人体检报告,就可以基于过去 5 年的体检报告数据,依次生成未来 3 年的体检报告,并且给出一些可能引发慢性病的核心指标的变化趋势,供医生参考给出相应的健康管理建议。
其次,在一些数据量庞大的工作场景中,由于对数据量的利用率不够,往往需要人工监测、计算,会导致浪费大量的时间精力。当设备检测数据、水文数据变成 "X",AI 的加持就能让这些数据的价值更高效释放出来。
在水电领網域,水电设备大模型可以基于过去 7 天机组子部件的运行状态,生成未来 3 天小时级的定转子部件报告,供运维人员给出维修方案;在水务领網域,水务大模型可以依据历史数据和未来 7 天气象数据, 生成未来 7 天小时级的报告,供水文监测人员识别发生洪水及相关次生灾害险情、采取应急预案。
除此以外,行业大模型还有很多提升用户各项体验的多元化能力,如 AIOS 5.0 平台中的声效大模型,可以基于音乐厅的几何模型和房间数据,帮助专业人员评估音源摆放位置,从而让观众的听觉体验更好。
可以看出,大模型的能力正在从语言等单一形态为中心不断向外扩散,让 "X" 化身不同行业的数据类型,在不同的垂直场景释放出更大的业务价值,真正成为解决场景核心痛点、问题的载体。
二、先知 AIOS 5.0 成 " 最佳练兵场 "
大模型深入行业已经成为产业发展的一大趋势。
从大模型的发展来看,现在已经不仅仅唯参数规模而论。一方面,大模型参数规模继续扩大,并不断激发其更智能化、聪明能力之路上极速狂奔;另一方面,更多参数规模相对较小,更能解决行业痛点问题的模型出现。
这背后的原因在于,基础模型的算力规模非一般公司可以承载,上周,微软工程师 Kyle Corbitt 就在社交平台 X 上爆料,微软已经在悄悄为 OpenAI 开始训练 GPT-6,预计要部署 10 万个 H100 GPU,而一个 H100 售价 2.5 万 ~3 万美元。如此庞大的算力规模,使得企业付出的金钱成本更高。
当前对于行业大模型的普遍认知就是用大语言模型去 fine-tune 行业数据,解决行业特定问题。大语言模型作为语言 " 通才 ",能够学习理解文本知识,但放到垂直场景解决,解决数学题或者是经验题,这些都远远超出了 " 语言 " 的范畴。
在这样的背景下,第四范式打造的先知 AIOS 5.0,就是承载大模型在行业应用的关键底座。让 "X 模态 " 的数据,能像文字一样快速被处理,并解决高价值的问题。
结语:大模型部署落地新周期,深耕多元场景
前沿技术的进步能对人们生活产生价值才是关键,大模型的能力与人们日常生活的结合日渐紧密。但庞大的算力需求等挑战使得基础模型的能力无法真正释放给每一个人,行业大模型的优势显现出来。
第四范式打造的行业大模型平台在让大模型与行业的场景需求结合的更加紧密的同时,进一步降低了业务人员应用大模型的开发门槛,开启了大模型落地部署的产业新周期。