今天小編分享的财經經驗:大模型落地金融業,想象力在哪?,歡迎閱讀。
圖片來源 @視覺中國
文 | 產業家,作者 | 思杭 ,編輯 | 皮爺
" 從經濟角度講,整個金融業的數字化進程并非勻速;從技術角度講,催化劑的出現會加速行業駛向數字化深水區。而大模型正是過去十年最強的‘催化劑’。" 恒生電子首席科學家告訴我們。
大模型正在成為推進金融業數字化的第二波浪潮。
2013 年,互聯網金融騰空出世。此後十年,金融產業共經歷過兩次由 AI 帶來的革命。
第一場革命的主角是辨别式 AI,比如幫助金融機構更好地進行智能分析與決策。在當時,互聯網金融正處于浪潮之巅,金融無紙化、在線化、移動化、遠程化,都促進了金融產業鏈的變革與創新。
在第一波 AI 浪潮中,最為顯著的改變是,以銀行為代表的金融產業經歷了新舊範式的轉變。
然而,這一波金融產業革命進行得并不徹底。雖然 " 金融信任 " 的号角早已吹響,但在金融業,數字化接受程度不高。人工智能的利好,也并未充分得利用在金融業。
這其中,有技術問題,也有合規因素,更有行業壁壘等種種原因,都阻礙着金融產業革命的到來。直到 2023 年,大模型讓局面發生了些許變化。
客觀來看,生成式 AI 的到來,讓行業正在重拾 " 金融信任 "。
大模型在金融業是剛需嗎?
當下,金融機構對數字化的接受程度普遍較低,全面實現數字化的難度也較大。但全流程的數字化,正是金融機構引入大模型的前提。如果仍僅停留在工具層應用,大模型無法更好地賦能產業發展,其颠覆性不大。
恒生電子告訴我們," 如果将金融機構的數字化轉型成熟度分為 0 到 5 級,其中 0 級代表剛起步階段,而 5 級表示完全以數據驅動的商業模式。目前大多數金融機構處于 2 級和 3 級的水平,少量機構已經達到 4 級,甚至有一些局部達到 5 級。"
在所有金融機構中," 數字化轉型表現最優異的是銀行,尤其是頭部銀行,其次是券商。"
之所以銀行的數字化接受程度最高,是因為銀行涉及到很多客戶服務和風險監控的場景。券商則不同,其更多的應用場景在智能決策方面。這兩類不同的場景恰恰是辨别式 AI 與生成式 AI 各自擅長的領網域。
具體來看,辨别式 AI 是直接将輸入映射到輸出上,通過學習輸入數據的特征來預測輸出标籤,而在輸入與輸出之間,并沒有生成式 AI 的增強學習的過程中。因此,辨别式 AI 更多用于分類、回歸等任務,比如影像識别和語音識别。
生成式 AI 則有所不同。其最大的優勢就在于增強學習的過程。生成式 AI 可以從已有數據中學習樣本的統計特征,并在此基礎上生成新的數據。因此,在金融場景下,更适合進行智能決策,通過大模型中輸入的金融知識和新聞等知識,從而給出業務營銷、風險投資等建議。
這意味着,在 AI 大模型的加持下,在金融行業裡會出現一些之前沒有的變化。
正如白碩所言,大模型是多年來對金融業影響最為直觀的 " 催化劑 ",相比于元宇宙、區塊鏈等技術,大模型更能深入到垂直領網域,颠覆產業,帶來實際價值。其中,最為直觀的影響是給原有的崗位帶來全新的工作方式。
" 比如像數據分析師崗位的變化就很突出。在投資研究領網域,數據分析師需要根據财務報表、公開資訊、研報等公開數據進行數據分析形成内容。大模型在這樣的數據處理能力上表現很好,可以替代一部分的崗位工作。" 白碩這樣告訴產業家。
然而,由于大模型在精度、時效性、專業性等方面還有明顯缺陷,當前在金融業還很難實現更深的價值。目前,大模型更多能起到的還是提供一個人機非常友好的互動能力,在金融專業工作中還是需要專業人力完成。
可以說,想象力豐富之餘,就當下而言,大模型對金融行業帶來的更為實際價值,更多體現在一些互動性更強的場景。
已經有銀行開始行動。今年 3 月,工商銀行基于昇騰 AI,發布了首個金融行業通用模型。在發布會上,工行宣布該模型已應用在客戶服務、風險防控、運營管理領網域。比如,工行應用該模型支撐智能客服接聽客戶來電;再比如,利用金融大模型,對工業工程融資項目建設進行進度監測。
或者也可以說,大模型對金融行業的意義,在加速數智化和重拾 " 金融信任 " 之前,更鮮明的變化是長尾場景落地。
金融大模型走到哪了?
半年時間,互聯網大廠已全部入局;銀行、券商等金融機構也紛紛下場。
金融大模型之所以被稱為 " 塔尖技術 ",其難點不僅在于技術和合規,更在于數據和領網域經驗。也就是說,金融大模型的搭建并非可以一蹴而就,而需要具備一定的條件。
以互聯網大廠為例,百度、騰訊、阿裡和 360 憑借其多年對抗黑灰產的經驗和在 AI 領網域的深耕,可以算得上最有條件做金融大模型的佼佼者。
最先有所動作的是度小滿。5 月 26 日,度小滿正式開源中文金融大模型 " 軒轅 "。與文心一言不同的是,軒轅大模型是度小滿在金融領網域長期深耕的結果,并擁有更多高質量的可訓練數據。對金融大模型而言,金融領網域的數據質量直接決定了軒轅大模型的各方面表現。
另外,從參數量來看,據官方介紹,軒轅大模型是在 1760 億參數的 Bloom 大模型基礎上訓練而來,且軒轅還融合了金融名詞理解、金融市場評論、金融數據分析和金融新聞理解等數據。
其次傳出風聲的是螞蟻集團。6 月 21 日有消息稱,螞蟻集團的技術研發團隊正在自研語言和多模态大模型,内部命名為 " 貞儀 "。對此,螞蟻集團的回應是 " 消息屬實 "。
螞蟻集團的底氣一方面來源于支付寶在金融領網域的多年行業經驗;另一方面來源于從 2015 年螞蟻集團在可信 AI 技術研究的投入。2016 年,螞蟻集團全面啟動 AI 智能風控防御戰略,目前已在反欺詐、反洗錢、反盜用、企業聯合風控、數據隐私保護等多場景落地。近兩年,螞蟻集團更是加緊 AI 領網域的布局。
早在 2019 年清華 AI 研究院基礎理論研究中心成立,該中心首席科學家朱軍及其團隊同期發布了第三代人工智能平台 RealAI,并與金融、工業制造等行業應用深度結合。而就在螞蟻集團傳出自研 " 貞儀 " 的前兩日,由朱軍帶領的新團隊完成了近億級天使輪融資,由螞蟻集團領投。
最後,騰訊和 360 也在近日聯合信通院編制國内金融大模型标準。對于騰訊而言,過去 20 多年黑灰產對抗經驗加上上千個真實業務場景,這些都讓騰訊具備了最真實的行業數據。而向來有着 " 安全衛士 " 稱号的 360 也不例外。
除了互聯網廠商,在金融領網域大模型方向布局的還有數據庫廠商,比如星環科技。
對于金融大模型的搭建,數據庫廠商與互聯網廠商走的是兩條完全不同的路線。星環科技的優勢有兩方面。
第一是工藝,即在模型訓練過程中涉及到的數據 " 清洗 " 等加工處理。作為數據庫廠商,星環科技對于數據處理有着一套嚴密的方法論,尤其是針對金融領網域特有的異構數據。
對此,星環科技在自研金融大模型 " 無涯 Infinity" 的同時,還提供了一站式的企業自建大語言模型工具鏈。該工具鏈了包含了與大語言模型應用落地緊密相連的向量數據庫 Hippo,以及一系列針對數據庫底層處理技術。其中,最值得注意的是向量數據庫 Hippo。
在金融領網域,數據時效性是大模型落地挑戰之一。如何将突發事件和金融資訊等實時數據輸入到大模型中,直接關乎着金融大模型能否準确地進行分析決策。而向量數據庫正是解決該問題的關鍵。
星環科技的第二大優勢則是其長期深耕于金融領網域沉澱下來的領網域數據和行業 know-how。
盡管互聯網廠商與數據庫廠商各占據行業經驗和模型工藝的優勢,但最具備搭建金融大模型的應該非垂直類廠商莫屬。因為這類廠商有着較高的訓練模型的數據,比如致力于提供金融數字化解決方案的廠商「恒生電子」。
6 月 28 日,恒生電子對外發布金融行業大模型 LightGPT。據了解,該模型使用了超 4000 億 tokens 的金融領網域數據(包括資訊、公告、研報、結構化數據等)和超過 400 億 tokens 的語種強化數據(包括金融教材、金融百科、政府報告、法規條例等),并支持超過 80+ 金融專屬任務指令微調,從而加強 LightGPT 在專業領網域的理解能力。
白碩表示,對于金融大模型,最為重要的是數據質量,即大模型訓練的數據量大小和數據質量,因為這關系到大模型能夠輸出什麼。在底層技術相差無幾的情況下,數據質量才是關鍵。其次是工程化能力和行業經驗。其中,工程化能力包括對數據的選擇、清洗和改造等工作,比如當大模型表現不盡如人意或出現問題時,廠商知道如何判斷缺哪些數據,需要補充哪些數據,從而提高大模型數據質量。
然而,在金融大模型落地過程中,最不容忽視的挑戰是安全問題,即公有雲與本地部署之間取舍。
在金融領網域,很多數據涉及合規、隐私安全,甚至監管問題,無法公開,因此很難上雲。比如工商銀行、農業銀行、郵儲銀行、中信銀行、興業銀行、江蘇銀行、蘇州銀行等多家銀行和券商都已選擇接入通用大模型,即以本地部署方式構建專屬領網域的大模型。
既選擇了本地部署的方式,就必然會面臨一些難點,如算力挑戰、參數量問題等。選擇本地部署的金融機構是否有足夠的算力是一方面,另一方面是參數量是否夠大,如果參數量不夠,即使輸入高質量數據,大模型也無法 " 湧現 "。
種種原因,讓入局金融大模型的廠商面臨重重阻礙。
向產業縱深處探尋價值
但問題仍然很多,即使在金融業較為發達的海外,大模型的落地仍是一大挑戰。
來源:Atom Capital
從上圖不難看出,創業公司融資金額普遍較小;且除了較為知名的 YC,明星資本不多。
在國内,至少目前來看,精準度、時效性和安全性是金融大模型在落地過程中面臨的三大挑戰。
從精準度來講,大模型在專業領網域,尤其涉及到民生經濟的問題時,還無法給出專家級的答案。白碩向產業家說道," 從技術原理上,我們不認為 AGI 能長出某個領網域的專業能力,專業的事情還需要交給專家。但大模型能提供的是人機對接能力,如果兩者相結合就可以發揮出更大的作用。"
另一大挑戰在時效性上。數據產生的過程本身是流動的,市場上的數據講精準、講質量,也講時效。" 從數據時效性方面來講,大模型的訓練周期本身就決定了不可能具有時效性,所以補充時效性很強的數據則是金融大模型的必備條件。" 現在很多自研金融大模型的廠商都使用了向量數據庫的手段來實現這一難題。
最後,也是當前領網域大模型所面臨的最重要的挑戰,即數據安全問題。由于大模型所收集的數據來源于公開數據,行業大模型需要的是領網域數據,甚至是一些不在公開渠道上的研究報告、論文等專有數據。
對此,部分企業、機構的做法是将數據選擇公開出來,但更多的則是選擇将大模型部署在本地。而這就引出了另一個問題,算力挑戰、參數量問題、工程算法等方面的技術問題能否得到解決。
在白碩的觀察中,一些語言能力的差距,在 2~3 年内可以得到解決,不同大模型能力之間的差距也可以拉齊。剩下的問題則要看大模型能否扎在更深的產業中去提供價值。
從當前金融大模型的應用場景來看,提供的價值更多停留在工具層。具體而言,金融大模型在傳統 AI 模型的基礎上更進一步,利用高質量的知識數據和智能屬性,應用于互動性強的場景。
但從更大的視角來看,随着金融大模型标準的落地,數據合規、隐私安全和訓練工藝等問題一一得到解決,金融大模型會撬動更多的崗位,也會提升人的價值。在精準度、時效性和安全性等挑戰被消除後,金融大模型會與 " 專家 " 一起,解決當下無法解決的問題,帶來更大的產業價值。
金融大模型的難點在于,能否在產業中扎得更深;其颠覆性也更建立在,縱深到產業中去,賦能金融行業的數字化發展。