今天小編分享的互聯網經驗:對話網商銀行:在信貸風控上,大模型能扮演何種角色,歡迎閲讀。
大模型如何在金融行業落地應用備受關注。
網商銀行近日宣稱,已将 AI 大模型的能力應用于產業鏈金融,并主要在兩方面投入:第一,用知識抽取能力構建產業鏈圖譜。大模型通過讀取海量的商品信息、企業關系信息之後,形成產業鏈圖譜,讓全產業鏈上下遊的小微 " 顯形 ";第二,通過信息解析能力,對小微企業的經營情況進行秒級評價。大模型就像 24 小時無休的智能產研專家,讀研報、判斷產業趨勢、解析小微經營數據,評價其信用情況。
具體如何應用,該行行長馮亮介紹了一則案例:
浙江某企業專注于高温尼龍材料的研發和生產。這類新材料研發周期長、資金需求大、客户回款周期長,導致企業周轉資金緊張。傳統金融機構往往只能将該企業劃定為年營業額約 1000 萬元的普通小微企業,但對其具體的產品和市場去向了解不足。由于缺乏品牌企業的擔保,金融機構難以提供所需的貸款額度。
通過大模型的分析,該行的大雁系統識别出該企業實際上位于汽車產業鏈中,并擁有 12 項專利,是浙江省認定的高新技術企業。該企業生產的尼龍材料最終被用于比亞迪汽車。此外,該企業位于浙江嘉興的新興材料生產基地,具備明顯的供應優勢。
基于這些深入的產業鏈分析和企業實力評估,網商銀行結合 "AI 產研專家 " 的評分和其他金融風控數據,最終提供了 200 萬元的純信用貸款額度。
網商銀行方面表示,已通過大模型搭建了包括汽車、醫療、建築等在内的 9 條產業方向的產業鏈圖譜,識别超 2100 萬產業鏈上下遊的小微企業,小微信用畫像效率提升了 10 倍。
不過需要注意的是,網商銀行并未将大模型直接應用于授信環節。
網商銀行信息科技部副總經理方珂向钛媒體 App 表示,授信是決策系統,需要在各種各樣的維度上進行決策,而決策對精準度、風控的要求非常高,大模型的決策能力沒那麼高,且帶來的系統性風險很高。" 現在談大模型在風控系統中的應用,主要是利用大模型的認知系統能力。換言之,大模型能從較多數據維度中刻畫更多認知畫像,但在最終決策時,選擇畫像仍需要一些準入标準和方法。"
钛媒體 App 近日與網商銀行信息科技部副總經理方珂、網商銀行行業金融一部汽車 & 醫療總經理楊希望展開了一場對談,以下為對話實錄,經钛媒體 APP 編輯:
大模型尚未能直接用于授信系統
問:大雁系統如何利用大模型提高產業鏈上下遊小微企業金融服務覆蓋率?
方珂:大模型在風控系統中的角色是決策系統的輔助,而不是直接用于授信。如果把大模型應用于決策系統的話,第一個大模型決策能力沒有那麼高;第二個帶來的系統性風險是很高的。
簡言之,大模型通過提升認知畫像的維度,幫助決策系統在各種維度上做出更精細的選擇。網商銀行采用的是大數據風控手段,與傳統銀行的信審邏輯不同,大數據風控更注重将數據轉化為認知特征,以提高決策系統的精細度。大模型的引入強化了這一點,雖然它的決策能力沒有達到人工審核的維度,但成本大大降低,減少了大量的人力資源。
以浙江的一家小微企業為例,通過大模型的分析,我們發現它生產的高温尼龍材料是汽車電子元器件的關鍵材料,并且這些材料最終流向了比亞迪汽車和華為手機。這種細致的分析使我們能夠更準确地評估企業的競争力和市場潛力,從而提供更精準的金融服務。
楊希望:我們對汽車和醫療產業鏈進行了深入探索,通過引入關鍵數據,如工商、水電等,來支撐對中小微企業的授信。利用 AI 大模型的能力,我們能夠更準确地還原企業的經營狀況,包括應收賬款、利潤和周轉次數等。大模型作為信審的一個加持,通過處理大量數據,為信審政策提供輸出。
問:關于風控系統,它主要依賴大模型的意圖理解能力嗎?
方珂 : 風控系統的應用與意圖理解關系不大。意圖理解主要用于對話領網域,而我們的 AI 應用主要是兩種:一是将各種行業數據進行結構化輸出,二是将這些數據轉化為可計算的語言,進行标準化使用。總之,我們的目标是将專家的理解轉化為風控可理解的語言,完成全鏈路過程,而非簡單的意圖理解。
問 : 大模型在與決策系統的對接過程中,是否需要在大模型基礎上進行 Prompt 的過程?
方珂 : 對于大模型的訓練,可以分為增量預訓練、微調和 Prompt 三層。Prompt 可以完成很多任務,但是在實際效果并不總是理想,因為通用大模型缺少特定知識,如銀行業的知識。因此,我們需要做增量預訓練和微調,然後才是 Prompt。這個過程雖然頂層是 Prompt 邏輯,但底層需要大量的數據和知識補充。
通用大模型本地化後,算力成本是原來的 1/10
問:關于 AI 在金融領網域應用,數據支撐非常關鍵,但金融行業的數據共享存在難度。如何看待數據約束問題,以及未來算力問題将如何解決?
方珂: 這個問題可以從兩個方面來看。首先,我們區分通用大模型和行業大模型。通用大模型主要用公開數據訓練,解決基礎問題,而行業大模型則使用銀行内部的私有數據進行訓練。可以将通用大模型比喻為 " 大學生畢業 ",到具體公司後需要根據公司的數據和應用方式進行專業訓練,而不是簡單直接應用。
在算力方面,使用通用大模型時确實面臨較大的算力需求,這包括高成本的 GPU 等設備。但當我們在網商銀行将通用大模型本地化後進行二次應用,算力需求和成本大約是原來的 1/10,這對銀行來説是可接受的。如果我們自己從頭開始研究通用大模型,成本會非常高。因此,基于通用大模型再發展行業大模型是一個成本效率更高的策略。
關于數據共享性問題,當前受到《數據安全法》的保護,數據共享必須經過用户授權。網商銀行因為長期服務小微企業,積累了大量的用户授權數據。至于更復雜的數據共享問題,可能需要依靠隐私計算等技術,或與其他國家進行合作,以增強大模型訓練的效果和合規性。
問: 大模型如何識别數據真實性,避免系統上的造假?
方珂:我們依賴于工商等高可信度的數據源,并通過多維度數據對比來驗證數據的真實性。如果數據之間存在邏輯不一致,就不會被采信。我們的風險數據設計過程會考慮數據的真實性和可信度,以及不同可信度數據之間的對比。我們的目标是在有數據的基礎上,評估數據的充分性,而不是單純依賴于用户上傳的數據。通過這種方式,我們可以更準确地評估企業的信用狀況,從而做出更合理的授信決策。(本文首發于钛媒體 APP,作者|蔡鵬程,編輯|劉洋雪)
更多宏觀研究幹貨,請關注钛媒體國際智庫公眾号: