今天小编分享的互联网经验:对话网商银行:在信贷风控上,大模型能扮演何种角色,欢迎阅读。
大模型如何在金融行业落地应用备受关注。
网商银行近日宣称,已将 AI 大模型的能力应用于产业链金融,并主要在两方面投入:第一,用知识抽取能力构建产业链图谱。大模型通过读取海量的商品信息、企业关系信息之后,形成产业链图谱,让全产业链上下游的小微 " 显形 ";第二,通过信息解析能力,对小微企业的经营情况进行秒级评价。大模型就像 24 小时无休的智能产研专家,读研报、判断产业趋势、解析小微经营数据,评价其信用情况。
具体如何应用,该行行长冯亮介绍了一则案例:
浙江某企业专注于高温尼龙材料的研发和生产。这类新材料研发周期长、资金需求大、客户回款周期长,导致企业周转资金紧张。传统金融机构往往只能将该企业划定为年营业额约 1000 万元的普通小微企业,但对其具体的产品和市场去向了解不足。由于缺乏品牌企业的担保,金融机构难以提供所需的贷款额度。
通过大模型的分析,该行的大雁系统识别出该企业实际上位于汽车产业链中,并拥有 12 项专利,是浙江省认定的高新技术企业。该企业生产的尼龙材料最终被用于比亚迪汽车。此外,该企业位于浙江嘉兴的新兴材料生产基地,具备明显的供应优势。
基于这些深入的产业链分析和企业实力评估,网商银行结合 "AI 产研专家 " 的评分和其他金融风控数据,最终提供了 200 万元的纯信用贷款额度。
网商银行方面表示,已通过大模型搭建了包括汽车、医疗、建筑等在内的 9 条产业方向的产业链图谱,识别超 2100 万产业链上下游的小微企业,小微信用画像效率提升了 10 倍。
不过需要注意的是,网商银行并未将大模型直接应用于授信环节。
网商银行信息科技部副总经理方珂向钛媒体 App 表示,授信是决策系统,需要在各种各样的维度上进行决策,而决策对精准度、风控的要求非常高,大模型的决策能力没那么高,且带来的系统性风险很高。" 现在谈大模型在风控系统中的应用,主要是利用大模型的认知系统能力。换言之,大模型能从较多数据维度中刻画更多认知画像,但在最终决策时,选择画像仍需要一些准入标准和方法。"
钛媒体 App 近日与网商银行信息科技部副总经理方珂、网商银行行业金融一部汽车 & 医疗总经理杨希望展开了一场对谈,以下为对话实录,经钛媒体 APP 编辑:
大模型尚未能直接用于授信系统
问:大雁系统如何利用大模型提高产业链上下游小微企业金融服务覆盖率?
方珂:大模型在风控系统中的角色是决策系统的辅助,而不是直接用于授信。如果把大模型应用于决策系统的话,第一个大模型决策能力没有那么高;第二个带来的系统性风险是很高的。
简言之,大模型通过提升认知画像的维度,帮助决策系统在各种维度上做出更精细的选择。网商银行采用的是大数据风控手段,与传统银行的信审逻辑不同,大数据风控更注重将数据转化为认知特征,以提高决策系统的精细度。大模型的引入强化了这一点,虽然它的决策能力没有达到人工审核的维度,但成本大大降低,减少了大量的人力资源。
以浙江的一家小微企业为例,通过大模型的分析,我们发现它生产的高温尼龙材料是汽车电子元器件的关键材料,并且这些材料最终流向了比亚迪汽车和华为手机。这种细致的分析使我们能够更准确地评估企业的竞争力和市场潜力,从而提供更精准的金融服务。
杨希望:我们对汽车和医疗产业链进行了深入探索,通过引入关键数据,如工商、水电等,来支撑对中小微企业的授信。利用 AI 大模型的能力,我们能够更准确地还原企业的经营状况,包括应收账款、利润和周转次数等。大模型作为信审的一个加持,通过处理大量数据,为信审政策提供输出。
问:关于风控系统,它主要依赖大模型的意图理解能力吗?
方珂 : 风控系统的应用与意图理解关系不大。意图理解主要用于对话领網域,而我们的 AI 应用主要是两种:一是将各种行业数据进行结构化输出,二是将这些数据转化为可计算的语言,进行标准化使用。总之,我们的目标是将专家的理解转化为风控可理解的语言,完成全链路过程,而非简单的意图理解。
问 : 大模型在与决策系统的对接过程中,是否需要在大模型基础上进行 Prompt 的过程?
方珂 : 对于大模型的训练,可以分为增量预训练、微调和 Prompt 三层。Prompt 可以完成很多任务,但是在实际效果并不总是理想,因为通用大模型缺少特定知识,如银行业的知识。因此,我们需要做增量预训练和微调,然后才是 Prompt。这个过程虽然顶层是 Prompt 逻辑,但底层需要大量的数据和知识补充。
通用大模型本地化后,算力成本是原来的 1/10
问:关于 AI 在金融领網域应用,数据支撑非常关键,但金融行业的数据共享存在难度。如何看待数据约束问题,以及未来算力问题将如何解决?
方珂: 这个问题可以从两个方面来看。首先,我们区分通用大模型和行业大模型。通用大模型主要用公开数据训练,解决基础问题,而行业大模型则使用银行内部的私有数据进行训练。可以将通用大模型比喻为 " 大学生毕业 ",到具体公司后需要根据公司的数据和应用方式进行专业训练,而不是简单直接应用。
在算力方面,使用通用大模型时确实面临较大的算力需求,这包括高成本的 GPU 等设备。但当我们在网商银行将通用大模型本地化后进行二次应用,算力需求和成本大约是原来的 1/10,这对银行来说是可接受的。如果我们自己从头开始研究通用大模型,成本会非常高。因此,基于通用大模型再发展行业大模型是一个成本效率更高的策略。
关于数据共享性问题,当前受到《数据安全法》的保护,数据共享必须经过用户授权。网商银行因为长期服务小微企业,积累了大量的用户授权数据。至于更复杂的数据共享问题,可能需要依靠隐私计算等技术,或与其他国家进行合作,以增强大模型训练的效果和合规性。
问: 大模型如何识别数据真实性,避免系统上的造假?
方珂:我们依赖于工商等高可信度的数据源,并通过多维度数据对比来验证数据的真实性。如果数据之间存在逻辑不一致,就不会被采信。我们的风险数据设计过程会考虑数据的真实性和可信度,以及不同可信度数据之间的对比。我们的目标是在有数据的基础上,评估数据的充分性,而不是单纯依赖于用户上传的数据。通过这种方式,我们可以更准确地评估企业的信用状况,从而做出更合理的授信决策。(本文首发于钛媒体 APP,作者|蔡鹏程,编辑|刘洋雪)
更多宏观研究干货,请关注钛媒体国际智库公众号: