今天小編分享的理财經驗:挑戰:數據、算力、隐私 “三道坎”,歡迎閲讀。
伴随着金融機構數字化體系的不斷推進,金融業數智建設正從 " 立柱架梁 " 逐步邁進 " 積厚成勢 "。盡管金融行業對大模型的關注和應用日益升温,并且在智能客服、AI 投顧等領網域取得一定的成效和收益,但其在發展過程中仍面臨着數據質量、算力成本、隐私安全這三大挑戰。
數據質量
數據質量問題是金融大模型面臨的首要挑戰。
據了解,金融大模型需要大量的高質量數據來進行訓練和預測,但金融數據的質量常常受到數據源的限制,包括數據的準确性、完整性和時效性等方面。中國信息協會常務理事、國研新經濟研究院創始院長朱克力在接受北京商報記者采訪時表示,在數據準确性方面,由于金融數據的來源復雜,數據準确性可能會受到影響。例如,一些數據可能存在錄入錯誤,或者由于數據源的問題,數據可能本身就不準确。在數據完整性方面,如果數據不完整,那麼模型的預測結果可能就會偏頗。在數據時效性方面,金融市場變化非常快,數據時效性也是一大挑戰,過時的數據可能無法反映市場的真實情況,從而影響模型的預測結果。
針對如何解決金融大模型數據質量的問題,資深人工智能專家郭濤在接受北京商報記者采訪時表示,金融機構和金融科技公司可以加強數據質量管理,包括數據清洗、數據标準化和數據驗證等環節,提高數據的準确性和完整性。同時,可以積極尋找更多的數據源,增加數據的多樣性和覆蓋範圍,提高模型的預測能力。
商湯金融創新部相關負責人亦對北京商報記者表示,金融機構應該基于已經治理好的高質量數據,通過大模型解決專屬領網域的問題,以快速實現大模型的業務價值,同時基于大模型的應用特點進行數據治理。
算力成本
算力是算法和數據的基礎設施,支撐着算法和數據,算力的大小代表着對數據處理能力的強弱。作為大模型的重要底層支撐,算力成本問題也是金融大模型發展過程中不可忽視的一大挑戰。
畢馬威中國銀行與資管行業首席信息官、咨詢服務主管合夥人柳曉光對北京商報記者表示,大模型之所以產業化爆發,在于其湧現能力,即當參數規模到達一定水平後,性能顯著提高,超出随機水平。以大模型的生成能力為主線,随着生成内容的可控性增強,模型架構的不斷更新,對算力與存儲的要求也越來越高。金融大模型需要龐大的計算資源來進行訓練和推理,對于許多金融機構來説,建立和維護這樣的計算基礎設施可能會成本高昂,這對于金融機構和金融科技公司來説是一個巨大的挑戰。
綜合來看,算力成本高昂主要體現在硬體成本、能耗成本、人力成本三個方面,其中硬體成本是構建和維護高性能計算設備所需的硬體設備和設施的成本較高;能耗成本是大規模的金融大模型需要大量的計算資源,這會導致高能耗,進而增加了電力成本;人力成本方面,則是為了保證金融大模型的正常運行,需要專業的技術人員進行維護和管理,這增加了人力成本。
針對算力成本高昂的問題,郭濤表示,金融機構和金融科技公司可以考慮采用雲計算和分布式計算等技術,靈活調配計算資源,降低算力的成本。此外,可以與其他機構進行合作,共享計算資源,提高資源利用效率。
另外,金融大模型需要處理海量數據,因此需要強大的算力資源。特别是随着信創進程的加快,如何更高效地利用算力,也是金融行業應用大模型過程中需要考慮的問題。針對該問題,商湯金融創新部相關負責人表示,金融機構可以考慮基于外部算力和公開數據進行業務場景驗證,這是一個高效的方案。同時,基于外部成熟的算力軟硬體建設方案,将私有化部署的算力效能最大化,随着業務場景拓展進行分布式可擴展的部署,這是目前有效的私有化建設思路。
隐私安全
今年以來,AI 換臉新騙局多發,這也讓 AI 技術安全風險被不斷提及,同樣,金融大模型的隐私安全問題也尤為重要。
眾所周知,金融數據高度敏感,涉及用户的隐私,在使用大模型時,确保數據安全和符合隐私法規是一個要持續關注的問題。一旦數據泄露,不僅可能導致金融風險,還可能面臨法律責任。柳曉光也對北京商報記者表示,金融業對數據使用的合規性、大模型湧現能力的可控性要求非常高,數據質量一定程度上決定了大模型生成信息的價值性、準确性和完整性。但金融行業數據涉及大量用户個人隐私數據、資金交易數據等,數據安全和隐私保護至關重要。因此,金融企業面臨模型質量與數據安全之間的平衡關系的挑戰,如何在安全合規的前提下獲取和處理數據,确保數據合法使用是金融行業面臨的關鍵挑戰。
提及金融大模型的隐私安全問題,郭濤亦對北京商報記者表示,金融 AI 大模型需要大量的數據來進行訓練和優化,而這些數據往往涉及到用户的個人隐私和金融安全。如果數據泄露或被惡意利用,不僅會損害用户的利益,也會對金融機構的聲譽和業務造成嚴重影響。
如何解決這一問題?商湯金融創新部相關負責人表示,一方面是金融機構應确保數據安全,包括數據的存儲和處理。通過私有化的架構部署和專業人才的本地服務,可以保證數據不離開本地環境,同時滿足監管要求。另一方面是大模型本身,選用純自主研發的基座大模型,結合業務場景做針對性調優。确保從基座大模型到業務适配的全過程相關數據都經過嚴密的清洗、審查,才能夠充分保證大模型應用的全鏈自主和深度可控,方可從根本上保障大模型應用的隐私安全。
北京社科院副研究員王鵬亦指出,金融機構需要建立嚴格的數據管理制度,保障用户數據的安全和隐私。同時,可以采取一些技術手段,如數據加密、訪問控制等來防止數據泄露和惡意利用。
北京商報記者 馬換換