今天小編分享的科學經驗:金融和大模型的“兩層皮”問題,歡迎閲讀。
幾年前,我采訪一位產業專家,他提到了一個高科技到產業落地的主要困惑:兩層皮。
一些特别牛的技術成果在論文上發表了,這是一層皮。企業的技術人員,将這些成果產品化、商品化的時候,可能出于工程化的原因,會做一些簡化,這是另一層皮。
兩層皮之間,是有 gap 的,就像賣家秀和買家秀一樣,并不是融合且一致的。
而往往是那些有技術人才、研發能力、轉化意願的企業,會先碰到 " 兩層皮 " 的問題,產生對技術有效性、ROI 回報率不明确的疑慮。
在衝入大模型熱潮的各路人馬中,金融機構可能是率先遭遇 " 兩層皮 " 挑戰的。
我們知道,金融產業一貫是新技術的早期采用者,在 AI 方面的嘗試很早就開始了,可以説是產業 AI 化的 " 優等生 ",更是有着良好的信息化、數字化基礎。金融機構的前中後台各個場景中,都有被大模型降本增效的空間。因此,金融也被認為是大模型落地的首選場景。
作為大模型落地的先行者,金融領網域如果解決不了 " 兩層皮 " 的問題,意味着大模型在實際應用中還是存在賣家秀和買家秀的差距。
本文希望説清楚,究竟是哪些問題拉開了金融和大模型之間的 gap?
問題一:以誰為主?
既然是做大模型,當然是由 OpenAI/BAT 這樣的科技企業和技術公司為主導了,而這也是金融機構不想看到的事。
有個金融領網域的專家告訴我們,這波大模型的熱度起來之後,金融機構都特别焦慮,有一種 FOMO(Fear of Missing Out 害怕錯過)情緒。
因為上一波技術浪潮,智能手機和移動互聯網崛起,導致傳統銀行、券商的很多業務,被互聯網金融公司分走了。在業内人看來,這種 " 史詩級的悲劇 " 絕不能重演。
在技術焦慮的驅動下,金融機構非常積極想跟上大模型的風口,幾乎不需要科技廠商做太多市場教育,整個行業在接納大模型這件事上表現極其良好。
同時,金融機構也非常重視将金融大模型的 " 核心籌碼 " 牢牢掌握自己手裏,強調 " 以我為主 "。有銀行業人士提出:只有适應銀行的大模型,才是真正可以深度應用到場景裏、業務流程中的大模型。具體怎麼做呢?
一類是硬籌碼。
對金融機構來説,數據安全隐私合規,是沒有妥協的硬指标,有非常嚴格的要求。這也就導致,大模型落地金融更加需要本地化的搭建和私有化部署、運行。
本地部署的要求,對大模型廠商來説有利有弊。有利的地方是,相比其他行業直接調用 API 接口的 MaaS 模式,本地部署的客單價高、利潤大,商業價值更高。不利的地方在于,私有部署需要在雲化方案、數據處理、存儲、模型訓練、提示工程、運維服務等多方面,形成一套完整的解決方案,競争焦點不僅是基座模型本身,這就增加了技術服務商的成本和難度。
另一類是軟籌碼。
金融大模型要表現良好,需要專有數據的精調、領網域知識的引入、基于場景的反饋,而銀行業本身的數字化基礎非常好,數據積累深厚,這便成了掌握在手中的軟籌碼。
摩根斯坦利公司在研發生成式 AI 產品中,就結合超過 10 萬份财務報告、内部資料和金融文獻等,對 OpenAI 的基礎模型進行微調。據透露,我國農業銀行業也沉澱了 2.6TB 的高質量訓練數據,用于大模型的訓練。此外,基礎大模型雖然通識能力很強,但 " 專業課 " 能力不足,缺少金融專業知識,加上金融場景業務復雜,初出茅廬的大模型,要形成高質量的服務能力,成為優秀的 "AI 副駕駛 ",并不容易。
這就要求,大模型廠商和技術公司,改變 " 技術為中心 "" 我是來賦能 / 颠覆你的 " 的慣有思路,增強服務意識,與金融客户合作,以金融客户為主。
大模型落地金融絕不是,也不能是又一次 " 技術颠覆行業 "。無論是通用大模型廠商還是 ISV 服務商集成商,都要在 " 客户為主 " 這條 baseline(基線)上跳舞。
問題二:融合為什麼難?
以金融機構為主,那科技公司豈不是成了 " 大模型施工隊 ",只能收點辛苦費,發揮不了技術創新性了?
大 no 特 no。
一來,金融 AI 不是新事物。
金融機構,并不是大家想的那樣,面對 AI 一竅不通。事實上,在所有行業裏,金融領網域的 " 含 AI 量 " 絕對是排名前列的。幾年前我采訪國内某 985 高校人工智能學院的院長,對方直言,AI 方向的學生畢業後不去 BAT、不去創業公司,去的是招商銀行這類金融機構下面的信息中心 / 技術中心,搞金融的人工智能。
所以,金融 AI 的趨勢其實早在幾年前,就已經大幅開展了,這也是為什麼今年大模型熱度剛起,國內工行、平安、農行、招商銀行、中信銀行等一大波銀行,能很快組建了自己的 GPT 大模型專項研究團隊。銀行能及時行動,靠的就是幾年來投入 AI 的積累。所以,以金融機構為主,也做得好金融大模型。
二來,大模型是個新事物。
大模型究竟比這些 " 傳統 AI" 強在哪裏,能幹什麼?這是一個完全空白的新問題。
理論上講,大模型可以貫穿銀行全產業鏈的各個環節,每條業務線、每個智能都能找到 LLM 的應用場景。但現實中,全環節全面上馬大模型,怎麼跟業務結合都不清楚,意味着會有大量探索是失敗的、浪費的。
要加速探索、減少成本、降低風險就必須金融機構和科技公司一起,讓金融專家、算法科學家、工程師、測試員等坐在一起,一點一點地共同探索,深入洞察場景,對需求 " 去偽存真 "。
有金融機構的負責人直言,今天金融業能夠獲取的智能化應用非常豐富,翻開 AI 企業的金融產品推介手冊,可以看到上百個細分能力,但如何選取最合适的整合到自家機構的業務中,這個過程中會有大量的試錯。
目前來看,業内基本已經達成共識,金融大模型,必須優選場景。有幾個關鍵詞:
1. 高頻次。在一些重點場景、重點應用上,盡快讓大模型可以上崗解決問題,降低應用的門檻。比如智能客服、智能投顧等原本的勞動密集型崗位,可以很快帶來顯著的降本增效成果。
2. 高價值。對于一些有社會價值、商業價值的領網域,率先開始探索。比如普惠金融,就是目前從政府到民間都非常看中的金融服務,需要精準的數據洞察、更低成本、高可及性的服務能力,去綜合降低中小微企業 / 商家的金融成本。其中,大模型的多模态表達能力、強大的理解分析能力都可以發揮很好的作用。
3. 易部署。不少金融從業者,聽到大模型的第一反應是,這事兒小模型能幹嗎?大模型對硬體基礎設施的算力、穩定性等都提出了更高的要求,金融機構又在加速推進國產化硬體,各個業務線都部署大模型,帶來的性能壓力、成本壓力、部署壓力都是非常大的。所以,大模型壓縮優化後或者同樣效果的小模型,可以落地的業務場景,比如大模型生成銀行理财產品推薦建議,大模型作為券商機構的研究助理,對這些已經在應用的傳統 AI,用大模型進行更新,不會增加過高的算力成本和工程量,是更易落地的漸進式場景。
正因為大模型是一層皮,實際應用是另一層皮,兩層皮怎麼融合,在哪些場景優先融合,是一條無人走過的路。金融機構和科技企業,都不能獨行,唯有緊密配合,才能尋找到金融場景與大模型之間的最佳融合之路。
問題三:鐐铐怎麼這麼多?
是不是找到場景,重點攻克,然後規模化復制,金融大模型就能突飛猛進了?
我們説金融機構 " 人多、錢多、技術多 ",只是相對其他行業而言。現實中,金融機構也不可能拿出無限的預算、投入無限的人力、開放無限的場景,供大模型随意大顯身手。而且,金融領網域還存在大量的中小銀行、券商,能負擔的技術創新成本也是有限的。
一位銀行從業者提到 AIGC 就説:競争是加劇的,人員是有限的,人才是缺乏的,費用是緊張的。
可以説,帶着鐐铐跳舞,正是金融和大模型 " 兩層皮 "" 賣家秀和買家秀 " 的關鍵原因。
比如算力的問題。國產化替代進程中,金融大模型要打破訓練昂貴、算力成本高的桎梏,對模型廠商的硬體基礎、自研能力、生态兼容能力、軟體協同優化,提出了綜合的考驗。
目前,頭部雲廠商都下大力氣在自研硬體上,比如百度的昆侖、阿裏的倚天、華為的昇騰,以及配套的軟體、生态,沒有這些很難真正拿下金融大模型。
還有技術本身的限制。坦率來説,大模型技術本身還存在不少問題,尤其是在金融領網域落地,必須解決幻覺問題,胡説八道對嚴謹的金融業務是不可接受的。模型黑箱性會導致 AI 智能決策不可信、不敢信,無法真正用于金融投顧、市場分析決策。
另外,金融機構也會衡量 ROI 投入產出比。但因為金融場景中,已經沉澱了大量的傳統 AI,比如智能客服,大家可能都接過機器人打來的產品推銷電話、賬單催收電話。
所以引入大模型後,究竟能給客户帶來多少收益,回報產出比 ROI 怎麼評估,哪些是大模型帶來的提升,這些目前還沒有一個明确的衡量标準。
無法量化大模型給業務帶來的貢獻,顯然會導致大模型廠商的無序競争,或者比拼客户關系,這也成為金融大模型效果不彰的一個隐憂。
消除產業和大模型之間的 gap,将會是接下來,大模型賽道的标準動作。
這個過程中,最早遇到 " 兩層皮 " 問題的金融大模型,或許會提供大量有益的參考和實踐,而金融機構也會成為更早挖掘到金礦的第一批大模型淘金者。
>