今天小編分享的科學經驗:大模型中的「羅翔老師」!北大兔展聯合團隊搞出ChatLaw,發布即登頂熱榜,可提供法律咨詢,歡迎閱讀。
大模型中的 " 羅翔老師 ",出現了!
北大團隊打造的法律大模型 ChatLaw,發布即衝上知乎熱搜第一。
它具備大模型能力和充足法律知識,能給法律小白們答疑解惑、提供法律建議。
比如針對網絡熱議事件,它能給出應該參考的法條,并針對具體案例進行分析:
還可以生成專業的法律文書:
仿佛就像是在和真人律師對話。
如果它察覺到人類需要尋求人工服務時,還會推薦相應的法律援助中心。
同時 ChatLaw 也能成為專業律師們的小助手,幫他們處理繁瑣的基礎工作。
這就是北京大學深圳研究生院 - 兔展智能 AIGC 聯合實驗室(主任:北大田永鴻教授)帶來的最新工作。
他們在通用大模型基礎上,使用大量法律領網域結構化文本數據進行訓練,并找來資深律師輔助人工标注、進行高質量事實型多輪對話,最後煉成了 ChatLaw。
與此同時還開源了 3 個模型:ChatLaw-13B、ChatLaw-33B 和 ChatLaw-TextVec。
效果到底如何?我們已經拿到内測資格實際體驗了 ~
而且和主創團隊問了問 ChatLaw 背後更多細節。
大模型中的 " 羅翔老師 "
進入主頁後,可以發現 ChatLaw 提供對話、寫作、知識庫三種模式。
以對話模式為例,又可分為普通類和專業類。對話模型包括快速、均衡和詳細三種,可以按照自己的需要來做選擇。
然後就可以用最普通的大白話,來向 ChatLaw 描述自己的遭遇了。
和常見的通用大模型不同,ChatLaw 不是一上來就回答問題,而是會先引導你補充更多詳細信息。
這也符合一般法律咨詢的情況,當事人往往很難一次性提供全面的信息,很多表述都不明确。
在得到補充信息後,它就能做出相應的分析了。
當然 ChatLaw 還能處理更加復雜的情況,比如從檔案中抽取關鍵信息做出分析。
在下面的場景中,當事人描述了自己突然被公司強制解雇的情況,ChatLaw 簡單分析後認為,這可能存在勞務糾紛,為了能更準确提供建議,它需要當事人提供勞動合同以及解雇通知等。
可以看到 ChatLaw 是支持上傳檔案的。
在拿到對應後,它将信息總結成了一個清晰的樹狀圖,并将事實用法律語言進行描述,和當事人确認情況。
而且 ChatLaw 也能處理多模态信息,比如讀取錄音檔案。
更進一步還可以生成法律文書。
而且不光是給普通人提供法律咨詢服務,ChatLaw 還能充當專業律師的助手。
比如可以基于上下文批量生成文書。
所以,ChatLaw 是如何實現如上效果的?
先驗知識約束 + 模型調度
在構成上,ChatLaw 是由1 個調度模型和 3 個子模型組成。
這使得它能更加專業地解決具體問題。
主要創新性工作有兩方面:
先驗知識約束
模型調度
這兩方面工作可以有效降低模型幻覺,并讓它能更加靈活智能地解決問題。
先來看先驗知識約束方面。
研究團隊認為,對于一個垂直領網域大模型而言,需要既專業又準确。
尤其是法律這種嚴肅的行業,一定要盡可能降低模型回答的錯誤率。
但對于通用大模型來說,訓練數據集中往往沒有包含非常充足的專業法律知識。比如 ChatGPT 顯然是沒有拿國内法條訓練過的,亂回答的現象非常嚴重。
這也就是常說的 " 模型幻覺 " 問題。
想要避免就需要進行大量的專業知識訓練,即先驗知識約束。
在這方面,研究團隊使用大量判例文書、法律法規和司法解釋,建立了一個大規模知識庫。
同時和北大國際法學院、行業知名律師事務所合作,确保數據專業性。
然後在訓練階段将這些法律數據注入大模型中,專門建立一個微調子模型,可以進行關鍵詞檢索,來改善單純依賴矢量數據庫檢索時不準确的問題。
同時在推理階段也引入多個模塊,将通識模型、專業模型和知識庫融為一體,在推理中進行約束,以保證 ChatLaw 生成正确的法律建議,盡可能減少模型幻覺。
具體模型架構如下:
目前這一方法也同步在 arXiv 上發表。
據了解,團隊還特地整理了過去十年的法考考試題,建立了一個包含 2000 個問題的司法考試測試集。
通過 ELO 機制進行檢驗,ChatLaw 模型在測試集上成功擊敗 GPT4,獲得最高分。
同時也論證了在專業領網域,百億參數量的模型可以保持卓越的準确性。
而在實際應用場景中,僅僅有強大的專業能力還不夠,還需要能夠靈活應對各種提問。
在這方面,ChatLaw 提出了一個 "調度模型" 的概念。
研究團隊使用針對性微調訓練了一個專用調度模型,它能夠對問題進行分析,然後對子模型和插件進行調度重組,最終呈現出多個模态的輸入和輸出。
這樣一來,ChatLaw 就能将檔案、音頻、文字整合在一起分析,同時支持法律文書、思維導圖等輸出,還能推薦專業的法律援助。
值得一提的是,除了發布 ChatLaw,團隊還一并開源了三個模型。
ChatLaw-13B,此版本為學術 demo 版,基于姜子牙 Ziya-LLaMA-13B-v1 訓練而來,中文各項表現很好,但是邏輯復雜的法律問答效果不佳,需要用更大參數的模型來解決。
ChatLaw-33B,此版本為學術 demo 版,基于 Anima-33B 訓練而來,邏輯推理能力大幅提升,但是因為 Anima 的中文語料過少,導致問答時常會出現英文數據。
ChatLaw-Text2Vec,使用 93w 條判決案例做成的數據集基于 BERT 訓練了一個相似度匹配模型,可将用戶提問信息和對應的法條相匹配,例如:
" 請問如果借款沒還怎麼辦?"
" 合同法 ( 1999-03-15 ) : 第二百零六條 借款人應當按照約定的期限返還借款。對借款期限沒有約定或者約定不明确,依照本法第六十一條的規定仍不能确定的,借款人可以随時返還;貸款人可以催告借款人在合理期限内返還。"
兩段文本的相似度計算為 0.9960.
在官方展示的測試中,ChatLaw 還可以具備聯網能力,效果可以更好。
不過由于目前伺服器資源不足,暫時關閉了法條檢索模塊。
以及在用戶隐私保護方面,ChatLaw 會對上傳的檔案數據進行脫敏處理。
和 ChatExcel 團隊師出同門
不過為啥研究團隊想要做一個法律領網域的專業大模型呢?
這就還得從一家跑路的雅思機構說起了……
主創團隊小哥表示,2018 年他報名的雅思課,才開課一星期機構就卷錢跑路了。他想要通過法律途徑維權,結果發現這還真不是一件容易的事:
請一個律師至少要 3000 塊,包括法律咨詢、寫訴訟狀等……成本太高了。
但普通人自己來搞定這些,又确實很難。比如需要使用 " 法言法語 " 描述問題等……
結合今年的趨勢他就想到,能不能讓大模型來給普通人提供法律咨詢服務。
畢竟大數據也顯示,2022 年,全國法院共受理案件 3372.3 萬件,其中由律師辦理訴訟案件僅有 824.4 萬件。74% 的案件沒有律師參與,當事人只能自己寫材料、訴訟、協商。
而且主創團隊還從專業法律人士方面了解到,律師們也很希望有一個 AI 工具能夠幫自己提升工作效率,輔助完成一些基本工作。
(工作發表後馬上有專業人士留言希望 AI 能提供更強大的功能)
ChatLaw 的幕後團隊是北京大學深圳研究生學院 - 兔展智能 AIGC 聯合實驗室。
值得一提的是,他們和之前爆火過的ChatExcel 團隊師出同門。
都是來自北京大學信息工程學院袁粒老師課題組。
袁粒是北京大學信息工程學院助理教授、博士生導師。
團隊主創成員有三位,分别是課題組内的準博士生伯華、家熙,以及研究生晏陽。
此外他們也聯合了北京大學國際法學院、阿爾法律師事務所提供法律專業建議和指導。
對于法律領網域大模型,團隊表示他們認為這在國内有着巨大的發展空間。
只有中國,擁有如此巨大規模的人口,統一的法律服務市場,規範的法律判例。
因此,我們堅定的向這個項目投入算力、資源、人力。也許我們的產品現在還有諸多未完善的地方,但技術的發展是非線性的。也許在未來某個時間點,我們能夠超越 GPT,為這片土地的普通人帶來普惠的法律服務。
據了解,目前 ChatLaw 已經有一些落地合作,而法律領網域還只是北大 - 兔展智能 AIGC 實驗室的第一步。
未來兩個月内,他們預計會陸續推出政務、金融等領網域的大模型。
并且已經有了商業計劃," 想做中國版 Cohere"。專注于企業服務。基于法律、政務、金融 3 個領網域,不斷完善行業級大模型。
但同時這些能力也會繼續向普通人開放。
感興趣的童鞋,可戳下方體驗鏈接申請内測 ~
官方地址:https://www.chatlaw.cloud/?
GitHub 地址:
https://github.com/PKU-YuanGroup/ChatLaw
論文地址:
https://arxiv.org/abs/2306.16092