大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

度小滿軒轅:金融行業的大模型實戰派

2024-03-12 简体 HK SG TW

今天小編分享的科學經驗:度小滿軒轅:金融行業的大模型實戰派,歡迎閲讀。

總體來看,12 款金融大模型包括3 種參數。2023 年 5 月,度小滿開源了國内首個千億級中文金融大模型 "XuanYuan-176B"。2023 年 9 月,"XuanYuan-70B" 大模型在 C-Eval 和 CMMLU 兩大權威榜單上位列所有開源模型榜首。本次度小滿 " 軒轅 " 模型矩陣再次更新,十億-百億-千億參數全覆蓋,實現多場景任務适配。

而從效果上看,度小滿軒轅達成了18 大維度金融實戰能力遙遙領先,多場景 6B 模型與 72B 模型表現相當;通用能力同樣達到開源模型 TOP 水平,看齊 GPT-4,并且采用了獨創的數據處理流水線,生產更豐富、更安全、更符合中文場景的數據。通過首次将人類偏好對齊引入金融垂網域大模型訓練,相關模型實現了安全性顯著提升、有用性突破瓶頸、金融任務表現明顯增強 。

讓我們來走進度小滿軒轅,透視金融領網域的大模型變革。

度小滿「軒轅」大模型

全參數矩陣

(度小滿軒轅大模型發布時間軸)

度小滿軒轅系列已經有 17 款開源大模型,适配廣泛場景任務,滿足不同開發者需要。

(度小滿軒轅大模型矩陣)

模型矩陣的設計考慮了不同的應用場景和性能要求:70B 及以上的模型專門針對需要深度分析、復雜指令執行以及全方位 Agent 調用的場景,而 6B、13B 的模型則更加适用于對響應速度有高要求、面向小規模場景和單任務的應用,它們也同樣能夠處理計算、編程、創作等一系列通用需求。特别地,最小化的 XuanYuan-6B-4-bit 量化 Chat 模型以其低推理部署成本,進一步降低了大模型的應用門檻。

模型效果

18 大維度金融實戰能力遙遙領先

01 金融能力

将軒轅系列大模型在金融自動評測集 FinanceIQ 測試集上進行測試,FinanceIQ 涵蓋了注冊會計師(CPA)、税務師、經濟師、銀行從業資格、基金從業資格、證券從業資格、期貨從業資格、保險從業資格(CICE)、理财規劃師等十大權威金融領網域考試。結果如下表,XuanYuan-70B-V2 在該項評測任務上擁有超過 GPT-4 的水平,在知識層面展示出金融領網域專家的水平。

同時,為了考察軒轅大模型在金融實際任務上的能力,軒轅團隊還特别組織了金融專家為對話大模型進行人工評測。任務的設計均是從金融行業實際應用場景出發,去判斷軒轅是否在各項金融任務上具備 " 實戰能力 "。

(人工金融評測集任務構成)

最終結果顯示,軒轅大模型各個參數上均具有" 以小搏大 " 的實力,達到自己 2 倍甚至 5 倍參數量的模型水平。在各項金融評測任務上,XuanYuan-6B 表現超越市面最新 13B 中文開源模型(左圖),XuanYuan-13B 表現超越市面最新 72B 中文開源模型(中圖),XuanYuan-72B-V2 表現可以媲美 GPT4(右圖),并且在金融法規、金融產品信息等中文場景上超越。

(軒轅擁有遠超同參數水平的金融能力)

02 通用能力

将軒轅大模型在 MMLU、CEVAL、CMMLU、GSM8K、HumanEval 等中外主流評測集上進行評測,觀察大模型在知識、邏輯、代碼等通用能力上的表現。同時加入類似參數矩陣的 LLaMA2 系列進行比較,結果顯示軒轅不同參數大模型在各項榜單成績上均有優異表現,在 CMMLU、C-Eval 等多個中文評測榜單上,更是有超越 GPT-4 的水準。

進一步分析發現,經過專門優化以增強考試能力的 XuanYuan-6B 和 XuanYuan-13B 模型,在 C-Eval 和 CMMLU 這兩個中文考試評測指标上有了顯著提升。然而,需要注意的是," 高分 " 并不意味着 " 高能力 "。評測集成績可通過優化模型考試能力來提升,不直接等同于模型在實際應用中的優勢。因此,盡管小參數模型在某些評測中表現出色,這并不意味着它們的各方面真實能力均超越了同系列大參數模型。

(軒轅大模型在各個評測集上的分數)

「軒轅」技術解析

對齊技術突破能力瓶頸

面向公眾開放自動化訓練框架

度小滿軒轅大模型團隊在過去一年,對大模型訓練的各個環節積累了豐富的經驗。這包括建立了一套完整的數據處理流水線、采用更适配領網域模型的高效訓練方法等,以及本次突破性的利用人類偏好對齊技術,極大地提升了 6B、13B、70B 模型的對話能力,顯著增強了模型的場景适應性。

軒轅系列大模型使用 DeepSpeed 分布式訓練框架,引入動态評估與調整機制以優化訓練過程。在微調階段,軒轅特别的采用了Self-QA 策略來收集指令微調數據。該方法能夠在沒有人工标注的情況下生成大量高質量的問答數據,為模型提供有監督的訓練樣本,有效提升模型的學習效率和質量。

(軒轅大模型 Self-QA 數據構造方法)

針對金融領網域的特定需求,軒轅大模型還開發了一種混合微調訓練框架,旨在通過融合通用與特定領網域數據來增強模型性能及适應性。這種混合微調方法不僅顯著提高了模型在特定任務的表現,也增強了其整體的泛化能力和适應性,為金融領網域任務的性能提升開辟了新途徑。

度小滿創新地在金融領網域大模型中引入了人類偏好對齊技術,開創了領網域内強化對齊訓練的先河。通常,領網域大模型僅在微調階段引入特定領網域數據,但這種方法在實際應用中常常顯示出局限性。金融行業的復雜性要求模型能夠更深入地理解并适應行業特定的需求,而強化對齊訓練有助于突破僅依靠微調所能達到的性能瓶頸。

軒轅團隊精心構建了涵蓋通用性、安全性和金融特性的 Prompt 數據集,并組織了專業的标注團隊對成對的回答進行偏好标注。接下來,團隊通過一系列實踐、分析和改進,成功完成了獎勵模型(Reward Model)和後續的強化(采用近端策略優化算法)訓練。下圖以 XuanYuan-6B 為例展示了模型在通用性和金融能力的綜合評估結果。從圖中可以看出,在兩個領網域,經過人類偏好對齊後,模型的能力都有了極大的提升,證明了強化對齊訓練的有效性。

(RLHF-model vs SFT-model)

(通用能力:RLHF-model vs SFT-model)

(金融能力:RLHF-model vs SFT-model)

度小滿軒轅大模型團隊一向貫徹開源開放的原則。為了讓廣大開發者能夠更容易的上手使用大模型,使用真實數據和真實代碼作為示例,詳細介紹了訓練模型的每個關鍵步驟。現在相關代碼已經上傳開源社區,供廣大用户實操體驗。

金融行業需要怎樣的大模型?

金融領網域對大模型的要求遠超過基本的 " 判斷 " 與 " 生成 " 能力,更加強調在 " 分析 " 與 " 決策 " 過程中的高級能力,這些能力是觸及金融企業核心利益的關鍵。大模型的價值體現在其能否在核心業務場景中發揮實際作用,如通過綜合分析用户信息以支持風險評估、客户畫像繪制、精準營銷策略,或通過企業數據分析支持财務審查、智能投顧和行業研究。

金融大模型的最終目标是提高企業 ROI。這意味着,高效的金融大模型應當能夠在實際應用中,如客服場景,通過提升對話處理、指令遵循和意圖理解能力,不僅短期内提高客服效率,長期還可能實現機器人客服的全面替代,重塑客户服務流程,推動金融服務向更高智能化水平邁進。

結束語

關于度小滿「軒轅」大模型

度小滿軒轅大模型系列具有以下特色:

·  多尺寸開源,開發者友好。

·  版本快速迭代,社區持續更新。

·  持續面向金融行業夥伴交流共建。

在今年的政府工作報告中,提出了 " 大力發展科技金融、綠色金融、普惠金融、養老金融、數字金融 "。在這樣的宏觀背景下,AI 大模型落地金融場景,為行業帶來全新的智能化發展機遇,是金融行業本身的發展意願,也是 " 新質生產力 " 的客觀要求。

作為 " 實戰派 " 的度小滿軒轅,已經應用在金融領網域的各個業務場景,并且初見成效。未來,度小滿軒轅會成為金融行業的一個支點,為更多智能化探索打開大門。

欲知 " 軒轅 " 大模型詳情,可移步 Github 官網。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們