一周打完1000场官司，中科院发布首个AI法庭AgentCourt

今天小编分享的科技经验：一周打完1000场官司，中科院发布首个AI法庭AgentCourt，欢迎阅读。

在人工智能重塑各个行业的今天 , 法律界也迎来了前所未有的变革。传统的法律实践面临着效率低下、成本高昂等挑战，而 AI 技术的出现为解决这些问题提供了新的可能。

从最初斯坦福小镇火遍全网，25 个由大语言模型（LLMs）驱动的智能体生活交友，打开了多 Agent 新视角。

而现在，AI 法庭也来了！

最近，来自中科院深圳先进研究院的研究团队开发了一个名为 AgentCourt 的模拟智能法庭，

它是一个基于大语言模型 ( LLMs ) 的法庭模拟系统 , 旨在通过 AI 驱动的虚拟法庭来革新法律教育、案例分析和法律研究。

论文地址：https://doi.org/10.48550/arXiv.2408.08089

代码：https://github.com/relic-yuexi/AgentCourt

AgentCourt 实战演示：https://b23.tv/e6eQMfM

该系统能够模拟完整的法庭程式。法官、原告律师、辩护律师以及其他参与者均由大型语言模型驱动的自主代理扮演。他们的主要目标是通过模拟法庭流程来帮助律师代理学习如何有效辩论案件，并提高其整体法律专业技能。

该篇文章的主要贡献有：

1. 全面模拟，真实再现

AgentCourt 不仅仅是一个模拟工具，它是一个高度复杂的系统，能够精确模拟民事法庭的設定，实现多方互动和复杂的法律推理。这是首次将 AI 技术应用于法庭环境模拟中，为法律教育和实践提供了前所未有的可能性。

2. 对抗性互動，强化法律推理

在 AgentCourt 的模拟过程中，大型语言模型（LLMs）的法律推理能力通过智能体之间的对抗性互動得到了显著增强。这种利用对抗性多智能体互動的方法，不仅超越了简单的信息传递，更为未来的相关研究提供了新的视角和思路。

3. 高效模拟，真实案例验证

该工作成功模拟了 1,000 个中国真实的民事案例，这些案例在 AgentCourt 中仅用数天时间完成，而在现实世界中，这可能需要律师们花费十年时间。通过自动和人工评估方法，验证了智能体进化的有效性。

为了尽量真实的模拟法庭，研究人员設定了以下的人物：

1. 原告与被告代理

模拟开始于案件发生之前，两名由 ERNIE-Speed-128K 驱动的代理分别扮演潜在的原告和被告。一旦涉及案件，他们将自动寻求律师事务所的法律援助，这是法律纠纷中的典型行为。系统配置使得原告或被告在与律师的互动中可以直接获得诉状或答辩状，无需从头起草。

2. 律师代理

设计了两名律师代理，同样由 ERNIE-Speed-128K 驱动。当原告和被告在律师事务所寻求帮助时，这些律师代理将被随机分配为原告律师和被告律师。他们与各自的客户沟通，收集案件相关信息，并利用丰富的法律经验、案例先例和法定代码，按照规定程式进行法庭辩论，维护各自客户的利益。

3. 法官代理

在法庭中，法官负责监督整个过程，听取双方律师的论点，并在适当时候提问。最终，法官总结并评估律师的每一轮论点，然后作出最终判决。

4. 法庭书记员代理

为了创造更真实的法庭环境并促进代理的进化，他们设计了法庭书记员代理，负责宣布审判的开始和记录审判的全过程。

这些由大模型驱动的 Agent，可以根据初始数据，自发地进行法庭的模拟，而无需任何人工的监督。

数据集

研究人员利用中国裁判文书网的数据，编译了一个包含 10,000 个民事判决的数据集。预处理的重点是提高数据集质量，精心清洗并选择了 1,389 个高质量案例，这些案例同时包含原告的诉求和被告的辩护。

为了解决潜在的重复问题，他们采用了 BERT 进行「案件介绍」部分的语义向量化，并使用 K-Means 聚类对相似文档进行分组。这产生了 1,000 个代表性文档，用于模拟法庭训练和测试。

数据生成与匿名化

利用 ERNIE-Speed-128K API（百度智能云文档 2024）生成并匿名化高保真模拟文本，这些文本专门针对民事判决。这产生了一个精选的数据集，包含 1,000 个训练样本和 50 个测试样本，旨在支持模拟法庭环境中强大的法律论证和判决预测，从而推进法律分析技术。

通过这些严格的数据处理步骤，AgentCourt 确保了模拟环境的真实性和数据的可靠性，为法律 AI 的发展奠定了坚实的基础。

在得到数据后，各个 Agent 各司其职，根据一定的流程展开法庭的辩论。该论文的模拟过程如下：

在模拟完 1000 个民事案例后，原告律师和被告律师的能力都得到了很大的提升，文章中的自动评估和人工评估展示了实验结果：

实验基于 1,000 个真实世界的民事案件，通过自动评估和人工评估两种方式，全面检验了 AgentCourt 系统的效能。自动评估采用了 LawBench 评估标准，涵盖了法律知识的记忆、理解和应用三个层面。人工评估则由经验丰富的法律专家进行，评估了智能体的思维敏捷性、专业知识性和逻辑严谨性。

实验结果显示，在 AgentCourt 中经历了数千次对抗性法律案件模拟（相当于现实世界律师十年的工作经验），律师代理在处理法律任务的能力上有了显著提升。无论是在自动评估还是人工评估中，进化后的代理都展现出了更快的响应速度、更深的法律知识和更强的逻辑推理能力，在复杂案件分析、法律推理和辩论策略上 , 部分 AI 律师甚至超越了人类专家的表现。