今天小編分享的科學經驗:首個開源中文金融大模型來了!解釋授信額度、計算收益率、決策參考樣樣通,來自度小滿,歡迎閲讀。
金融行業正迎來大模型時代。
近日,度小滿正式發布千億級中文對話大模型軒轅,集中文、金融、開源特色于一身。
基于BLOOM-176B研發的軒轅大模型,在金融場景中的任務評測中,效果相較于通用大模型大幅提升,表現出明顯的金融領網域優勢。
在諸如金融名詞理解、金融市場評論、金融數據分析和金融新聞理解等任務的評測中,軒轅超越了其他四種開源大模型,赢得了 150 次回答中 63.33% 的勝率,充分凸顯了其在金融領網域的顯著優勢。
在通用中文領網域,軒轅表現也不亞于 ChatGPT。
根據實驗結果,軒轅有 10.2% 的任務表現超越 ChatGPT,61.22% 的任務表現與之持平。其中涉及數學計算、場景寫作、邏輯推理、文本摘要等 13 個主要維度,驗證了軒轅的通用能力。
此次發布的千億級軒轅模型,将成為國内首個開源的中文金融大模型。
度小滿表示,軒轅大模型将有力地推動大模型在金融行業的應用,為客户提供更準确、全面的金融咨詢與服務。
國内首個開源中文金融大模型
去年 11 月,ChatGPT 滾滾而來,全球互聯網用户為之瘋狂。
其專業、快速、精準、富有情感的内容表達,無不向大家展示 NLP 大模型驚人的自然語言理解與生成能力。
ChatGPT 的的誕生,掀起了新一輪技術革命,自此各類大模型層出不窮。而度小滿也開啓了金融大模型的研發之路。
" 将 ChatGPT 的能力遷移到金融領網域,會產生怎麼樣颠覆性的影響?",為了尋找問題的答案,度小滿将軒轅大模型定位在了三個維度:
中文、金融和開源。
軒轅大模型基于 1760 億的 BLOOM(BigScience Large Open-science Open-access Multilingual Language Model)語言模型訓練而來,使用了 IDRIS 的 Jean Zay 超級計算機(來自法國,目前在最新全球超算 500 強榜單上排名第 135)。
BLOOM 擁有 1.61TB 文本,包含 46 種自然語言和 13 種編程語言。
相比 Meta 發布的 LLaMA(Large Language Model Meta AI)模型,Bloom 參數量更有優勢。
度小滿依托多年行業實踐積累,構建了具有金融垂直領網域特色的、千億 tokens 的中文預訓練數據集。
度小滿數據智能部總經理、技術委員會執行主席楊青表示,經過清洗和标注的高質量數據集,不僅在通用性方面與 ChatGPT 達到持平成為可能,且顯著提升了模型在金融垂直領網域的性能。
值得一提的是,軒轅數據集包含了諸如金融研報、股票、基金、銀行、保險等方向的專業知識。
通過在訓練過程中加入大量金融對話數據并針對金融領網域進行特定的預訓練調優,軒轅在金融垂直領網域的表現得到了顯著提升。
因此,軒轅在金融專有領網域内容理解和生成上展現出卓越的能力。
解釋授信額度、計算收益率、決策參考……樣樣通
作為 AI 新基建,大模型在金融及各個行業有着廣泛的應用場景。
軒轅大模型開源後,将會為金融企業帶來怎麼樣的幫助?如何推動產業發展?
度小滿 CTO 許冬亮認為,生成式大模型在内容生成與創作、信息摘要與總結、知識理解與問答、自然互動與對話等方面具備非常出色的能力,在金融場景中會有廣泛的應用。
在前台,生成式大模型将大幅提升客户經理的專業水平和服務能力,大幅降低客户經理的運營成本,讓每個人都擁有 24 小時在線的專業客户經理成為可能。
出色的内容生成能力也将引發營銷内容生產能力的大幅提升。
在中台,生成式大模型有機會改變企業内知識獲取、内容創作、會議與溝通、代碼開發與測試的方式,進而大幅提升企業内部辦公效率,甚至引發研發測試模式變革,全方位的提升金融企業内部運營效率。
在後台,大模型将成為智能科技底座的标配,大幅降低智能技術應用的門檻,只需少量标注數據甚至無需調整就可以讓智能技術覆蓋廣泛的場景。
智能客服,是 AI 在金融領網域最常見的應用方向之一。
通用語音或文本的互動方式,可以為金融用户提供 24 小時在線咨詢和答疑服務。為了降低人工成本和風險,引入智能客服已成為金融企業的基礎配置。
然而實際上,面對用户多樣化復雜場景的詢問,智能客服常常表現出 " 智障 "。以簡單的名詞解釋為例,可以看到軒轅的表現更為專業。
在回復中,軒轅從個人信用記錄、收入水平、負債情況和擔保能力四個方面進行了全面的解釋,清晰的結構、詳細的計算方法以及實用的建議,真正做到以用户視角詳解專業概念。
此外,軒轅在股息收益率、股東權益計算等方面也有相當不錯的表現。
而這些涉及邏輯推理、數學計算的問題往往是 AI 的弱點。
現有的 AI 金融模型也經常會犯一些愚蠢的錯誤,比如:股息率 = 股息 ÷ 股票價格 = 5 美元 ÷ 100 美元 = 0.5。
軒轅對數據和知識的挖掘與理解,不是簡單的關鍵詞搜索,而是多語義關聯與匹配,更智能地識别出用户的真實意圖,進而給出更符合用户需求的答案。
這一點在" 智能金融顧問 "應用中,尤為明顯。
AI 技術的優勢在于海量信息的搜集、提取和分析能力,這是人類難以企及的。
例如 AI 大模型可以通過分析金融數據、新聞動态、社交評論等每日信息,為投資者提供市場輿情和風險預測等服務。
度小滿認為,軒轅大模型要想無限趨近于人類的思維能力,不能停留在标準答案上,需要能夠處理更具開放性、靈活性的復雜問題。
從下面的示例中,可以看到,軒轅會提醒客户結合資產狀況、收益目标和風險偏好,以及外部的市場動态,來進行投資決策。
軒轅在解釋 " 牛市 " 和 " 熊市 " 含義的同時,還強調了投資者要如何面對兩種市場狀況,以及可采取的策略。
這一點相比其他模型,不僅交流更充分、信息更有價值,而且更顯人性化,更有温度。
軒轅還能針對當下金融時事分析背後的原因,并據此從不同維度對金融市場的未來走勢進行預測,給出總體結果評估,為投資者提供明确的決策參考。
AI 算法沒有護城河,正是開源造就了當下大模型創新的繁榮景象。
歷史也證明了,安卓系統的開源不僅使得技術的發展更加快速,也促進了開發者之間的交流與合作,讓移動應用和服務得以更快地普及到全球各地,并帶來更加多樣化的用户體驗。
得益于開源,讓人人都可參與這個行業,這也使得菜鳥和小眾開發者可以通過參與開源項目提高自己的技能和見識,讓業界更加平等公正。
秉承這一精神,許冬亮表示,軒轅大模型是經度小滿業務場景中積累的金融數據訓練而來的,對金融相關問題的理解比通用大模型更有優勢。
我們把大模型能力開放給金融機構,有利于推動大模型在金融行業的應用,降低大模型的應用門檻,提升金融行業智能化水平。