今天小编分享的科技经验:专注金融领網域!百川智能发布全新大模型:用AI改写行业规则,欢迎阅读。
12 月 23 日,百川智能全链路领網域增强大模型 Baichuan4-Finance 正式发布。不同于行业常见的大语言模型,Baichuan4-Finance 主要面向金融领網域,但并未放弃通用能力。
在 FLAME-Cer 评测中,Baichuan4-Finance 整体准确率高达 93.26%,领先 GPT-4o 近 20%,其中银行、保险、基金、证券等多个项目的从业资格认证测试中,Baichuan4-Finance 准确率更是达到了 95% 以上。
(图源:百川智能)
在更偏向一级应用场景的 FLAME - Sce 和国内主流开源金融评测基准 FinanceIQ 两大评测中,Baichuan4-Finance 整体成绩均优于 GPT-4o 和开源金融大模型 XuanYuan3-70B-Chat。
据百川智能介绍,为实现模型在提升专业能力的同时,不损失通用能力,百川智能专门打造了一套全链路领網域增强方案,行业首创领網域自约束训练技术,涵盖高质量数据集构建、模型预训练、微调、强化学习等流程。Baichuan4-Finance 正是该方案的最新成果,其高质量金融数据集全面严谨,包含核心专业金融知识数据及实践应用类数据,为提升金融能力提供良好支撑。
此外,百川智能还在领網域自约束训练中引入高精通用数据混合训练,以确保通用能力能够稳步增长。后训练环节,百川智能通过合成数据、指令数据进行有监督微调,针对金融领網域特定场景进行样本增强,进一步提升了大模型的性能表现。
对于 Baichuan4-Finance,软通动力表示,该大模型的通用能力和专用能力均完美契合他们的需求,部署该大模型后,用户满意度提升了 20%。
在大模型普及度日益提高的今天,如何权衡大模型的专业能力和通用能力已成为令 AI 企业头疼的难题。若使用大量通用数据训练大模型,很可能造成数据污染,降低大模型在专业领網域的准确性,而不使用通用数据训练大模型,则可能导致大模型的通用能力增长停滞乃至下降。
百川智能通过行业首创的自约束训练技术和全链路领網域增强方案,以专业金融知识和实践应用类数据训练大模型,用于提升 Baichuan4-Finance 面对金融领網域专业应用场景时的能力。特选高精通用数据用于混合训练,则能够在避免外部数据污染的同时,提升 AI 大模型的通用能力。
(图源:百川智能)
该方案对于 AI 企业的数据样本筛选、算法、监督和调整能力提出了极高的要求,从多项测试表现来看,Baichuan4-Finance 在金融领網域的能力已跻身第一梯队,远超 GPT-4o 和 XuanYuan3-70B-Chat。
百川智能表示,已与华为、中科曙光、软通动力、达观数据、中国移动 / 电信 / 联通等软硬體公司及运营商达成合作,为爱奇艺、完美世界游戏、360 集团等数千家企业提供了服务。
通用大语言模型竞争烈度较高,且难以实现盈利创收,AI 公司为大模型加入专业能力,面向特定人群是行业趋势。率布局金融领網域的百川智能,或将通过 Baichuan4-Finance 奠定行业地位,与更多企业达成合作,并为个人用户提供更加完善的使用体验。