大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

大模型中的「罗翔老师」!北大兔展联合团队搞出ChatLaw,发布即登顶热榜,可提供法律咨询

2023-07-04 简体 HK SG TW

今天小编分享的科学经验:大模型中的「罗翔老师」!北大兔展联合团队搞出ChatLaw,发布即登顶热榜,可提供法律咨询,欢迎阅读。

大模型中的 " 罗翔老师 ",出现了!

北大团队打造的法律大模型 ChatLaw,发布即冲上知乎热搜第一。

它具备大模型能力和充足法律知识,能给法律小白们答疑解惑、提供法律建议。

比如针对网络热议事件,它能给出应该参考的法条,并针对具体案例进行分析:

还可以生成专业的法律文书:

仿佛就像是在和真人律师对话。

如果它察觉到人类需要寻求人工服务时,还会推荐相应的法律援助中心。

同时 ChatLaw 也能成为专业律师们的小助手,帮他们处理繁琐的基础工作。

这就是北京大学深圳研究生院 - 兔展智能 AIGC 联合实验室(主任:北大田永鸿教授)带来的最新工作。

他们在通用大模型基础上,使用大量法律领網域结构化文本数据进行训练,并找来资深律师辅助人工标注、进行高质量事实型多轮对话,最后炼成了 ChatLaw。

与此同时还开源了 3 个模型:ChatLaw-13B、ChatLaw-33B 和 ChatLaw-TextVec。

效果到底如何?我们已经拿到内测资格实际体验了 ~

而且和主创团队问了问 ChatLaw 背后更多细节。

大模型中的 " 罗翔老师 "

进入主页后,可以发现 ChatLaw 提供对话、写作、知识库三种模式。

以对话模式为例,又可分为普通类和专业类。对话模型包括快速、均衡和详细三种,可以按照自己的需要来做选择。

然后就可以用最普通的大白话,来向 ChatLaw 描述自己的遭遇了。

和常见的通用大模型不同,ChatLaw 不是一上来就回答问题,而是会先引导你补充更多详细信息。

这也符合一般法律咨询的情况,当事人往往很难一次性提供全面的信息,很多表述都不明确。

在得到补充信息后,它就能做出相应的分析了。

当然 ChatLaw 还能处理更加复杂的情况,比如从檔案中抽取关键信息做出分析。

在下面的场景中,当事人描述了自己突然被公司强制解雇的情况,ChatLaw 简单分析后认为,这可能存在劳务纠纷,为了能更准确提供建议,它需要当事人提供劳动合同以及解雇通知等。

可以看到 ChatLaw 是支持上传檔案的。

在拿到对应后,它将信息总结成了一个清晰的树状图,并将事实用法律语言进行描述,和当事人确认情况。

而且 ChatLaw 也能处理多模态信息,比如读取录音檔案。

更进一步还可以生成法律文书。

而且不光是给普通人提供法律咨询服务,ChatLaw 还能充当专业律师的助手。

比如可以基于上下文批量生成文书。

所以,ChatLaw 是如何实现如上效果的?

先验知识约束 + 模型调度

在构成上,ChatLaw 是由1 个调度模型和 3 个子模型组成。

这使得它能更加专业地解决具体问题。

主要创新性工作有两方面:

先验知识约束

模型调度

这两方面工作可以有效降低模型幻觉,并让它能更加灵活智能地解决问题。

先来看先验知识约束方面。

研究团队认为,对于一个垂直领網域大模型而言,需要既专业又准确。

尤其是法律这种严肃的行业,一定要尽可能降低模型回答的错误率。

但对于通用大模型来说,训练数据集中往往没有包含非常充足的专业法律知识。比如 ChatGPT 显然是没有拿国内法条训练过的,乱回答的现象非常严重。

这也就是常说的 " 模型幻觉 " 问题。

想要避免就需要进行大量的专业知识训练,即先验知识约束。

在这方面,研究团队使用大量判例文书、法律法规和司法解释,建立了一个大规模知识库。

同时和北大国际法学院、行业知名律师事务所合作,确保数据专业性。

然后在训练阶段将这些法律数据注入大模型中,专门建立一个微调子模型,可以进行关键词检索,来改善单纯依赖矢量数据库检索时不准确的问题。

同时在推理阶段也引入多个模块,将通识模型、专业模型和知识库融为一体,在推理中进行约束,以保证 ChatLaw 生成正确的法律建议,尽可能减少模型幻觉。

具体模型架构如下:

目前这一方法也同步在 arXiv 上发表。

据了解,团队还特地整理了过去十年的法考考试题,建立了一个包含 2000 个问题的司法考试测试集。

通过 ELO 机制进行检验,ChatLaw 模型在测试集上成功击败 GPT4,获得最高分。

同时也论证了在专业领網域,百亿参数量的模型可以保持卓越的准确性。

而在实际应用场景中,仅仅有强大的专业能力还不够,还需要能够灵活应对各种提问。

在这方面,ChatLaw 提出了一个 "调度模型" 的概念。

研究团队使用针对性微调训练了一个专用调度模型,它能够对问题进行分析,然后对子模型和插件进行调度重组,最终呈现出多个模态的输入和输出。

这样一来,ChatLaw 就能将檔案、音频、文字整合在一起分析,同时支持法律文书、思维导图等输出,还能推荐专业的法律援助。

值得一提的是,除了发布 ChatLaw,团队还一并开源了三个模型。

ChatLaw-13B,此版本为学术 demo 版,基于姜子牙 Ziya-LLaMA-13B-v1 训练而来,中文各项表现很好,但是逻辑复杂的法律问答效果不佳,需要用更大参数的模型来解决。

ChatLaw-33B,此版本为学术 demo 版,基于 Anima-33B 训练而来,逻辑推理能力大幅提升,但是因为 Anima 的中文语料过少,导致问答时常会出现英文数据。

ChatLaw-Text2Vec,使用 93w 条判决案例做成的数据集基于 BERT 训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配,例如:

" 请问如果借款没还怎么办?"

" 合同法 ( 1999-03-15 ) : 第二百零六条 借款人应当按照约定的期限返还借款。对借款期限没有约定或者约定不明确,依照本法第六十一条的规定仍不能确定的,借款人可以随时返还;贷款人可以催告借款人在合理期限内返还。"

两段文本的相似度计算为 0.9960.

在官方展示的测试中,ChatLaw 还可以具备联网能力,效果可以更好。

不过由于目前伺服器资源不足,暂时关闭了法条检索模块。

以及在用户隐私保护方面,ChatLaw 会对上传的檔案数据进行脱敏处理。

和 ChatExcel 团队师出同门

不过为啥研究团队想要做一个法律领網域的专业大模型呢?

这就还得从一家跑路的雅思机构说起了……

主创团队小哥表示,2018 年他报名的雅思课,才开课一星期机构就卷钱跑路了。他想要通过法律途径维权,结果发现这还真不是一件容易的事:

请一个律师至少要 3000 块,包括法律咨询、写诉讼状等……成本太高了。

但普通人自己来搞定这些,又确实很难。比如需要使用 " 法言法语 " 描述问题等……

结合今年的趋势他就想到,能不能让大模型来给普通人提供法律咨询服务。

毕竟大数据也显示,2022 年,全国法院共受理案件 3372.3 万件,其中由律师办理诉讼案件仅有 824.4 万件。74% 的案件没有律师参与,当事人只能自己写材料、诉讼、协商。

而且主创团队还从专业法律人士方面了解到,律师们也很希望有一个 AI 工具能够帮自己提升工作效率,辅助完成一些基本工作。

(工作发表后马上有专业人士留言希望 AI 能提供更强大的功能)

ChatLaw 的幕后团队是北京大学深圳研究生学院 - 兔展智能 AIGC 联合实验室。

值得一提的是,他们和之前爆火过的ChatExcel 团队师出同门。

都是来自北京大学信息工程学院袁粒老师课题组。

袁粒是北京大学信息工程学院助理教授、博士生导师。

团队主创成员有三位,分别是课题组内的准博士生伯华、家熙,以及研究生晏阳。

此外他们也联合了北京大学国际法学院、阿尔法律师事务所提供法律专业建议和指导。

对于法律领網域大模型,团队表示他们认为这在国内有着巨大的发展空间。

只有中国,拥有如此巨大规模的人口,统一的法律服务市场,规范的法律判例。

因此,我们坚定的向这个项目投入算力、资源、人力。也许我们的产品现在还有诸多未完善的地方,但技术的发展是非线性的。也许在未来某个时间点,我们能够超越 GPT,为这片土地的普通人带来普惠的法律服务。

据了解,目前 ChatLaw 已经有一些落地合作,而法律领網域还只是北大 - 兔展智能 AIGC 实验室的第一步。

未来两个月内,他们预计会陆续推出政务、金融等领網域的大模型。

并且已经有了商业计划," 想做中国版 Cohere"。专注于企业服务。基于法律、政务、金融 3 个领網域,不断完善行业级大模型。

但同时这些能力也会继续向普通人开放。

感兴趣的童鞋,可戳下方体验链接申请内测 ~

官方地址:https://www.chatlaw.cloud/?

GitHub 地址:

https://github.com/PKU-YuanGroup/ChatLaw

论文地址:

https://arxiv.org/abs/2306.16092

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們