大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

大模型中的「羅翔老師」!北大兔展聯合團隊搞出ChatLaw,發布即登頂熱榜,可提供法律咨詢

2023-07-04 简体 HK SG TW

今天小編分享的科學經驗:大模型中的「羅翔老師」!北大兔展聯合團隊搞出ChatLaw,發布即登頂熱榜,可提供法律咨詢,歡迎閲讀。

大模型中的 " 羅翔老師 ",出現了!

北大團隊打造的法律大模型 ChatLaw,發布即衝上知乎熱搜第一。

它具備大模型能力和充足法律知識,能給法律小白們答疑解惑、提供法律建議。

比如針對網絡熱議事件,它能給出應該參考的法條,并針對具體案例進行分析:

還可以生成專業的法律文書:

仿佛就像是在和真人律師對話。

如果它察覺到人類需要尋求人工服務時,還會推薦相應的法律援助中心。

同時 ChatLaw 也能成為專業律師們的小助手,幫他們處理繁瑣的基礎工作。

這就是北京大學深圳研究生院 - 兔展智能 AIGC 聯合實驗室(主任:北大田永鴻教授)帶來的最新工作。

他們在通用大模型基礎上,使用大量法律領網域結構化文本數據進行訓練,并找來資深律師輔助人工标注、進行高質量事實型多輪對話,最後煉成了 ChatLaw。

與此同時還開源了 3 個模型:ChatLaw-13B、ChatLaw-33B 和 ChatLaw-TextVec。

效果到底如何?我們已經拿到内測資格實際體驗了 ~

而且和主創團隊問了問 ChatLaw 背後更多細節。

大模型中的 " 羅翔老師 "

進入主頁後,可以發現 ChatLaw 提供對話、寫作、知識庫三種模式。

以對話模式為例,又可分為普通類和專業類。對話模型包括快速、均衡和詳細三種,可以按照自己的需要來做選擇。

然後就可以用最普通的大白話,來向 ChatLaw 描述自己的遭遇了。

和常見的通用大模型不同,ChatLaw 不是一上來就回答問題,而是會先引導你補充更多詳細信息。

這也符合一般法律咨詢的情況,當事人往往很難一次性提供全面的信息,很多表述都不明确。

在得到補充信息後,它就能做出相應的分析了。

當然 ChatLaw 還能處理更加復雜的情況,比如從檔案中抽取關鍵信息做出分析。

在下面的場景中,當事人描述了自己突然被公司強制解雇的情況,ChatLaw 簡單分析後認為,這可能存在勞務糾紛,為了能更準确提供建議,它需要當事人提供勞動合同以及解雇通知等。

可以看到 ChatLaw 是支持上傳檔案的。

在拿到對應後,它将信息總結成了一個清晰的樹狀圖,并将事實用法律語言進行描述,和當事人确認情況。

而且 ChatLaw 也能處理多模态信息,比如讀取錄音檔案。

更進一步還可以生成法律文書。

而且不光是給普通人提供法律咨詢服務,ChatLaw 還能充當專業律師的助手。

比如可以基于上下文批量生成文書。

所以,ChatLaw 是如何實現如上效果的?

先驗知識約束 + 模型調度

在構成上,ChatLaw 是由1 個調度模型和 3 個子模型組成。

這使得它能更加專業地解決具體問題。

主要創新性工作有兩方面:

先驗知識約束

模型調度

這兩方面工作可以有效降低模型幻覺,并讓它能更加靈活智能地解決問題。

先來看先驗知識約束方面。

研究團隊認為,對于一個垂直領網域大模型而言,需要既專業又準确。

尤其是法律這種嚴肅的行業,一定要盡可能降低模型回答的錯誤率。

但對于通用大模型來説,訓練數據集中往往沒有包含非常充足的專業法律知識。比如 ChatGPT 顯然是沒有拿國内法條訓練過的,亂回答的現象非常嚴重。

這也就是常説的 " 模型幻覺 " 問題。

想要避免就需要進行大量的專業知識訓練,即先驗知識約束。

在這方面,研究團隊使用大量判例文書、法律法規和司法解釋,建立了一個大規模知識庫。

同時和北大國際法學院、行業知名律師事務所合作,确保數據專業性。

然後在訓練階段将這些法律數據注入大模型中,專門建立一個微調子模型,可以進行關鍵詞檢索,來改善單純依賴矢量數據庫檢索時不準确的問題。

同時在推理階段也引入多個模塊,将通識模型、專業模型和知識庫融為一體,在推理中進行約束,以保證 ChatLaw 生成正确的法律建議,盡可能減少模型幻覺。

具體模型架構如下:

目前這一方法也同步在 arXiv 上發表。

據了解,團隊還特地整理了過去十年的法考考試題,建立了一個包含 2000 個問題的司法考試測試集。

通過 ELO 機制進行檢驗,ChatLaw 模型在測試集上成功擊敗 GPT4,獲得最高分。

同時也論證了在專業領網域,百億參數量的模型可以保持卓越的準确性。

而在實際應用場景中,僅僅有強大的專業能力還不夠,還需要能夠靈活應對各種提問。

在這方面,ChatLaw 提出了一個 "調度模型" 的概念。

研究團隊使用針對性微調訓練了一個專用調度模型,它能夠對問題進行分析,然後對子模型和插件進行調度重組,最終呈現出多個模态的輸入和輸出。

這樣一來,ChatLaw 就能将檔案、音頻、文字整合在一起分析,同時支持法律文書、思維導圖等輸出,還能推薦專業的法律援助。

值得一提的是,除了發布 ChatLaw,團隊還一并開源了三個模型。

ChatLaw-13B,此版本為學術 demo 版,基于姜子牙 Ziya-LLaMA-13B-v1 訓練而來,中文各項表現很好,但是邏輯復雜的法律問答效果不佳,需要用更大參數的模型來解決。

ChatLaw-33B,此版本為學術 demo 版,基于 Anima-33B 訓練而來,邏輯推理能力大幅提升,但是因為 Anima 的中文語料過少,導致問答時常會出現英文數據。

ChatLaw-Text2Vec,使用 93w 條判決案例做成的數據集基于 BERT 訓練了一個相似度匹配模型,可将用户提問信息和對應的法條相匹配,例如:

" 請問如果借款沒還怎麼辦?"

" 合同法 ( 1999-03-15 ) : 第二百零六條 借款人應當按照約定的期限返還借款。對借款期限沒有約定或者約定不明确,依照本法第六十一條的規定仍不能确定的,借款人可以随時返還;貸款人可以催告借款人在合理期限内返還。"

兩段文本的相似度計算為 0.9960.

在官方展示的測試中,ChatLaw 還可以具備聯網能力,效果可以更好。

不過由于目前伺服器資源不足,暫時關閉了法條檢索模塊。

以及在用户隐私保護方面,ChatLaw 會對上傳的檔案數據進行脱敏處理。

和 ChatExcel 團隊師出同門

不過為啥研究團隊想要做一個法律領網域的專業大模型呢?

這就還得從一家跑路的雅思機構説起了……

主創團隊小哥表示,2018 年他報名的雅思課,才開課一星期機構就卷錢跑路了。他想要通過法律途徑維權,結果發現這還真不是一件容易的事:

請一個律師至少要 3000 塊,包括法律咨詢、寫訴訟狀等……成本太高了。

但普通人自己來搞定這些,又确實很難。比如需要使用 " 法言法語 " 描述問題等……

結合今年的趨勢他就想到,能不能讓大模型來給普通人提供法律咨詢服務。

畢竟大數據也顯示,2022 年,全國法院共受理案件 3372.3 萬件,其中由律師辦理訴訟案件僅有 824.4 萬件。74% 的案件沒有律師參與,當事人只能自己寫材料、訴訟、協商。

而且主創團隊還從專業法律人士方面了解到,律師們也很希望有一個 AI 工具能夠幫自己提升工作效率,輔助完成一些基本工作。

(工作發表後馬上有專業人士留言希望 AI 能提供更強大的功能)

ChatLaw 的幕後團隊是北京大學深圳研究生學院 - 兔展智能 AIGC 聯合實驗室。

值得一提的是,他們和之前爆火過的ChatExcel 團隊師出同門。

都是來自北京大學信息工程學院袁粒老師課題組。

袁粒是北京大學信息工程學院助理教授、博士生導師。

團隊主創成員有三位,分别是課題組内的準博士生伯華、家熙,以及研究生晏陽。

此外他們也聯合了北京大學國際法學院、阿爾法律師事務所提供法律專業建議和指導。

對于法律領網域大模型,團隊表示他們認為這在國内有着巨大的發展空間。

只有中國,擁有如此巨大規模的人口,統一的法律服務市場,規範的法律判例。

因此,我們堅定的向這個項目投入算力、資源、人力。也許我們的產品現在還有諸多未完善的地方,但技術的發展是非線性的。也許在未來某個時間點,我們能夠超越 GPT,為這片土地的普通人帶來普惠的法律服務。

據了解,目前 ChatLaw 已經有一些落地合作,而法律領網域還只是北大 - 兔展智能 AIGC 實驗室的第一步。

未來兩個月内,他們預計會陸續推出政務、金融等領網域的大模型。

并且已經有了商業計劃," 想做中國版 Cohere"。專注于企業服務。基于法律、政務、金融 3 個領網域,不斷完善行業級大模型。

但同時這些能力也會繼續向普通人開放。

感興趣的童鞋,可戳下方體驗鏈接申請内測 ~

官方地址:https://www.chatlaw.cloud/?

GitHub 地址:

https://github.com/PKU-YuanGroup/ChatLaw

論文地址:

https://arxiv.org/abs/2306.16092

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們