今天小编分享的互联网经验:招标檔案中的隐藏信息:银行究竟在如何应对大模型浪潮,欢迎阅读。
图片来源 @视觉中国
银行业究竟在如何应对大模型浪潮,招投标市场是一个值得关注的观察切面。
早在去年 5 月,招商局集团电子招投标平台曾发布《招商证券微软大语言模型服务采购项目 - 询价采购公告》,透露出招商证券试图采购微软 Azure-Open AI 大语言模型,并探索在 " 量化投研、精准营销、财富管理、客户服务、智能投顾、人员效能 " 等场景的应用可能性。但在公告的数小时后,该采购项目即宣告终止,终止原因为 " 采购需求变更 "。
下半年,招投标市场出现了数家银行采购大模型相关服务或产品的订单案例。据钛媒体 App 的不完全统计,工行、建行、邮储、中行、招行、中信等数家银行发起招标。
值得注意的是,已完成招投标的项目的候选企业与得標企业均为国内公司,并无微软等外企身影。同时,发起招标的银行大多为国有大行和头部股份行。一位金融云厂商高管表示,目前国内绝大部分银行的大模型探索均是与第三方模型公司合作,从云端调用,按需接入各类大模型 API。只有少数头部银行在探索独立全栈自研大模型或专业大模型基础上进行微调。
招标檔案透露了什么信息
银行大模型相关招标项目,钛媒体 APP 基于公开资料整理
目前而言,银行大模型相关招标项目并不多,且集中于大中银行,采购方向包括了公有云、软硬體等方面。
公有云方向,建行和招行均有所动作。建行的 " 大模型分布式训练集群实验项目公有云服务 " 项目,招行的 "NLP 大模型预训练公有云资源采购 " 项目,分别强调 " 实验项目 " 和 " 预训练 "。可以发现,头部金融机构试图在利用公有云的资源弹性、可扩展性来进行尝试性实验。
大模型相关硬體设备是招标重点。
比如中信银行发布的《大模型平台算力集群建设采购需求调研公告》称,项目内容为拟采购硬體产品。生成式人工智能平台建设一期算力基础设施建设需求:采购该平台支撑模型微调训练 / 推理所需要的算力、存储、网络相关硬體设备。包括大模型 GPU 伺服器、GPU 专用存储伺服器、IB 交换机等。
华夏银行的《大语言模型应用系统项目(智能算力部分)供应商征集公告》称,本项目主要为系统硬體设备采购,需要架构伺服器及 GPU 显卡;北部湾银行的《广西北部湾银行大模型技术基础硬體项目》表示,该行拟采购 GPU 伺服器、AI 伺服器与 GPU(显卡)。
一家国有大行云计算部门的负责人告诉钛媒体 APP,虽然售价已经非常高,大模型应用的前景也并不明朗,但为了紧跟住行业发展,该行正大力投入资源买卡(显卡)、持续建设。
軟體方面同样多家银行投入。
工商银行招标 "NLP 大模型軟體产品一套 ";邮储银行则提到了 " 超大规模预训练模型金融场景应用系统軟體开发 ";华夏银行明确指出来招标 " 大模型应用开发平台(包含自身基础大模型)",要求该平台核心能力包括但不限于数据构建、模型算法、模型训练、模型压缩、模型加速、模型运营、安全可信等,支持从数据采集、选择大模型到微调大模型再到效果评估、部署上线等流程化操作,支持扩展引入第三方基础大模型。
值得注意的是,招商银行的 " 招商银行预训练基础大语言模型 ( 干亿级 ) 采购项目 " 是唯一一个明确提及数据规模的项目,干亿级规模在当前的金融大模型探索中处于优势水平。可以作为参考的是,全球首个金融大模型 Bloom ⁃ bergGPT 为 500 亿参数。
观察参与投标的企业和得標企业也可以一窥行业动态。
在两项关于公有云的招标中,目前国内的主流公有云玩家几乎集体出席——百度、阿里、腾讯、京东、火山引擎(字节)、华为、商汤,以及中国电信、浪潮、软通动力等。最后泰和利通得標建行;火山引擎、阿里云以及商汤三家同时得標招行。
值得注意的是,得標建行的泰和利通(北京泰和利通科技有限公司)成立于 2016 年,注册资本 5000 万元,由曹静 100% 持股,该公司官网的主要信息目前仅更新至 2020 年。虽然该公司颇为年轻和低调,但招投标网站显示,其客户中不乏国家开发银行、中国进出口银行、中国银行、光大银行、中信银行等知名金融机构。
而在招行的 " 基础大语言模型 ( 干亿级 ) 采购项目 " 中,智谱华章、稀宇科技、百度三方投标,最后稀宇科技夺标。公开资料显示,这家位于上海的企业是国内最早入场大模型创业的公司之一,成立于 2021 年。创始人是前商汤科技副总裁、通用智能技术负责人闫俊杰。2023 年,稀宇科技拿到了来自腾讯的 2.5 亿美元投资。
折戟招行的智谱华章,是 AI 大模型市场的另一家明星公司,其成功得標邮储银行项目,战胜了百度和第四范式。去年一年内,智谱华章累计获得超 25 亿人民币融资。
银行需要什么
在招投标公告中,少数银行提到了具体应用场景。
比如,华夏银行明确提到了会议纪要和报告辅助生成:
合规场景功能:大模型应用开发平台需具备合规场景相关功能,一是利用大语言模型实现合规知识智能问答,二是利用大语言模型技术提升行内现有 NLP 自动标注模型准确率,三是使用大语言模型技术提高内外规文档相似度比对准确率。
会议纪要辅助生成、报告辅助生成功能:大模型应用开发平台需具备会议纪要辅助生成功能,根据会议录音和相应模板,实现会议纪要自动生成;同时需具备根据输入素材信息自动汇总辅助生成各类报告的功能。
而上述项目中,实际的应用场景包括催收、合规相关场景、会议纪要和报告辅助生成等。
比如华夏银行发布的《大语言模型应用系统项目(模型平台及应用场景部分)供应商征集公告》显示,项目主要采购大语言模型应用軟體产品,包括大语言模型应用开发平台,以及依托该平台构建的大语言模型合规、会议纪要辅助生成、报告辅助生成等场景应用功能,要求在该行完成本地化部署。
广州银行则聚焦于催收场景,该行的信用卡中心催收大模型智能助手,
上述国有大行云计算部门的负责人表示,该行最新的大模型应用集中在智能客服工单生成,风险经理助理,投研报告摘要生成等。
此外,数据安全性和合规性是另一大重点。部分银行在大模型相关项目招标公告中提到,投标人应保证应用軟體不违规收集、传输和共享客户个人信息和敏感数据,并且明确要求在银行完成本地化部署。(本文首发于钛媒体 APP,作者|蔡鹏程,编辑|刘洋雪)
更多宏观研究干货,请关注钛媒体国际智库公众号: