大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

中科大ICLR2025:特定領網域僅用5%訓練數據,知識準确率提升14%

2025-04-07 简体 HK SG TW

今天小編分享的科學經驗:中科大ICLR2025:特定領網域僅用5%訓練數據,知識準确率提升14%,歡迎閱讀。

讓大語言模型更懂特定領網域知識,有新招了!

來自中國科學技術大學 MIRA 實驗室的王傑教授團隊提出了提出了一個創新的框架——知識圖譜驅動的監督微調(KG-SFT),該框架通過引入知識圖譜(KG)來提升大語言模型(LLMs)在特定領網域的知識理解和處理能力。

實驗結果表明,其在多個領網域和多種語言的數據集上取得了顯著的效果,成功入選 ICLR 2025。

截至目前,LLMs 在常識問答方面表現越來越出色,但它們對領網域知識的理解和推理能力仍然有限。

由于難以深入理解專業領網域問答背後所蘊含的復雜知識和邏輯關系,因此在面對這類問題時,往往無法準确地給出正确的答案和詳細的推理過程,這極大地限制了其在專業領網域的應用價值。

尤其是在數據稀少和知識密集型的場景中,如何讓 LLMs 更好地理解和操縱知識,成為了研究的關鍵。

而中科大 MIRA 實驗室的這項工作即圍繞此展開。

KG-SFT 是如何工作的

KG-SFT 針對 LLMs 難以理解領網域問答背後的知識和邏輯,導致推理能力弱的問題,提出基于知識圖譜增強的大語言模型監督微調技術。

KG-SFT 首先通過解析領網域知識圖譜中的多條推理路徑,設計圖上推理路徑與文本推理過程的聯合生成機制。使 LLMs 在監督微調過程中,能夠同步輸出推理答案以及蘊含豐富領網域知識和邏輯關系的推理過程,從而提升其對領網域知識的理解與推理能力。

KG-SFT 框架的核心在于将知識圖譜與監督微調相結合,通過生成問答背後的邏輯嚴密的推理過程解釋來增強 LLMs 對知識和邏輯的理解。

該框架包含三個關鍵組件:

Extractor(提取器)

Generator(生成器)

Detector(檢測器)

1、Extractor:精準提取知識關聯

Extractor 首先對問答對(Q&A)中的實體進行識别,并從外部知識圖譜中提取相關的推理子圖。

這一步驟揭示了 Q&A 對背後的知識關聯和邏輯,為後續的解釋生成提供了基礎。

通過命名實體識别(NER)和多條推理路徑的檢索,Extractor 能夠有效地從大規模知識圖譜中獲取與問題相關的知識。

2、Generator:生成流暢的解釋

Generator 利用圖結構重要性評分算法(如 HITS 算法)對推理子圖中的實體和關系進行評分,選擇高分部分作為重要内容。

然後,使用大型語言模型(如 ChatGPT)生成流暢的解釋草稿。

這些解釋不僅邏輯清晰,而且能夠幫助 LLMs 更好地理解問題和答案之間的關系。

3、Detector:确保解釋的正确性

Detector 對生成的解釋草稿進行句子級别的知識衝突檢測,确保解釋的正确性。

通過自然語言推理(NLI)模型(如 DeBERTa)和重新引導機制,Detector 能夠标記并糾正可能存在的知識衝突,從而提高解釋的可靠性。

實驗結果及創新點

實驗結果表明,KG-SFT 在多個領網域和語言設定中均取得了顯著的性能提升。

特别是在低數據醫學問答任務上,KG-SFT在英語場景中僅使用 5% 的訓練數據就比傳統方法提高了近 14% 的準确率。

從創新之處來看,KG-SFT 不僅關注數據的數量,更注重數據的質量。

通過生成高質量的解釋,KG-SFT 幫助 LLMs 更好地理解和操縱知識,從而在特定領網域實現更優的性能。

此外,KG-SFT 還可以作為插件式模塊與現有的數據增強方法結合使用,進一步提升性能。

在多領網域數據集上的實驗結果進一步驗證了 KG-SFT 的廣泛适用性。

盡管在某些需要復雜推理的領網域(如形式邏輯和專業會計)中表現稍遜,但整體性能依然具有較強的競争力。

概括而言,KG-SFT 框架通過結合知識圖譜和 LLMs,有效地提升了監督微調數據的質量,從而顯著提高了 LLMs 在特定領網域的性能。

這一方法不僅在低數據場景中表現出色,還展示了其作為插件式模塊與現有數據增強方法結合的潛力。

論文作者第一作者陳瀚鑄是中國科學技術大學 2021 級碩博連讀生,師從王傑教授,主要研究方向為大語言模型、知識圖譜和推理數據合成。

更多細節歡迎查閱原論文。

論文地址:

https://openreview.net/pdf?id=oMFOKjwaRS

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

—  完  —

學術投稿請于工作日發郵件到:

[email protected]

标題注明【投稿】,告訴我們:

你是誰,從哪來,投稿内容‍

附上論文 / 項目主頁鏈接,以及聯系方式哦

我們會(盡量)及時回復你

點亮星标

科技前沿進展每日見

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們