今天小编分享的互联网经验:瞄准大模型赋能法律行业新机会,「语炎智能」推出法律行业垂直模型,欢迎阅读。
作者|沈筱
编辑|王与桐
法律和金融被认为是 AI 技术落地应用的两大理想垂直领網域。
一方面,领網域积累的高质量数据规模够大,足以训练专业的 AI 模型;另一方面,领網域企业客户通常涉及大量语言互動、文本处理等劳动密集的,但又需专业知识支撑的业务流程。而这些流程又是价值创造的关键环节,如前端咨询、重要材料审核。因此,这些企业在特定场景中采用 AI 技术降本增效需求旺盛,同时付费意愿强。
过去几年里,以 AI+ 法律为例,涌现出百智诚远、法狗狗、幂律智能等一众旨在基于人工智能技术,提升法务人员工作效率、降低消费者法律咨询门槛的创业公司。而在当前大语言模型掀起的又一次 AI 技术发展浪潮中,法律行业再次成为新技术应用落地的首选垂直领網域之一。
基于 GPT 面向律所提供模型定制服务,打造法律 AI 产品的初创公司「Harvey」已获由 OpenAI Startup Fund 领投的首轮 500 万美元融资,以及红杉领投,OpenAI Startup Fund 再次跟投的 2100 万美元 A 轮融资。
放眼国内,百智诚远、幂律智能等已陆续开始基于大模型推出新的产品、服务,同时,新进入者也趁势而起。36 氪最近接触到的上海语炎智能科技有限公司(以下简称:语炎智能),也是 AI+ 法律的新入局者。
语炎智能成立于 2023 年 2 月,由「上海元语信息科技有限公司」和「安可觅(武汉)智能科技有限公司」合资组建,并与隆安律师事务所等法律行业伙伴建立了战略合作关系。
语炎智能定位于法律行业垂直模型层,聚焦家事法和劳动法两个细分领網域。现阶段,公司主要基于自身开发的微调模型,面向律师事务所等专业客户,以及非专业企业客户提供模型运用以及专属模型开发、训练,以及专属知识库搭建等工程服务。
目前,语炎智能已经推出百亿参数模型,并于 5 月 15 号、16 号邀请了数百位法律专业人士进行测试,同时开启了面向 C 端用户的内测工作。语炎智能总经理刘迎晖,当前,公司已收到了来自数家律所、大型企业客户的专属知识库搭建和模型定开需求,并已开始推进与部分客户的合作流程。
关于入局契机,刘迎晖告诉 36 氪:" 我们是一个多元团队,两家股东公司一直在 AI 领網域探索,有深度学习、NLP 等方面的技术沉淀,战略合作团队有法律行业 know-how 和专业数据等资源。在大模型取得突破性进展后,大家一拍即合。股东公司希望有机会能尝试把过往经验,尤其是算法方面的积累,应用到新的领網域,做新的探索。而合作伙伴也希望激活行业资源价值。"
语炎智能总经理刘迎晖,本科毕业于浙江大学,硕士研究生毕业于上海交通大学,曾任职于中软、IBM(上海),具有多年算法和軟體开发经验;CTO Revive,本科毕业于北京大学,博士毕业于德国慕尼黑工业大学,有丰富的模型、算法及深度学习技术研究经验;COO Peter 毕业于英国斯旺西大学,有多年律所和大型企业法律执业和法务高管从业经历。
作为新入局者,需要找准市场切入口。谈及选定家事法和劳动法两个细分领網域的原因,刘迎晖介绍:" 一是 C 端用户需求较强,B 端市场增长空间够大。同时,相较于公司法等,婚姻、继承和劳动法场景更丰富,方便公司后续及时调头或更加聚焦;二是相较于合同法等,这两个领網域强制规定更多,训练难度更低、模型效果更好;三是源头数据可获得性较高,数据质量和规模能得到保障。"
然而,上述三方面因素在为语炎智能带来市场进入机会的同时,也提出了产品服务差异化的挑战。如何争夺存量市场,或者开拓增量市场,是语炎智能需要关注的重点。
刘迎晖表示,法律服务行业的产业链条够长,足够容纳大量市场玩家,给了语炎智能锚定细分领網域深挖场景的机会。她告诉 36 氪:" 准确性是法律行业的生命线,和其他对模型效果有较高要求的专业领網域一样,高质量数据、工程化技术能力和经验都很重要。尽管数据可获得性高,但仍需要做细致的数据清洗、挑选和指令学习数据标注工作。同时,模型微调本身是一项工程化技术,而法律的语言环境更加复杂,没有捷径可走,需要在既有能力的基础上进一步积累经验。我们在这两方面做了大量努力。"
尽管大模型更让新一代 AI 应用更智能,但要用于法律这样的严肃行业,还需要解决一系列难题,尤其是对模型准确性的保障。就在近期,美国还上演了律师使用 ChatGPT 错误援引虚假案例打官司的闹剧。
刘迎晖也坦言:" 尽管目前从测试反馈来看,我们的模型表现超出了预期,但公司未来确实还需在提升长文本可控度和模型准确性这两个方面持续探索。现阶段,如果企业客户对数据安全和模型准确性有较高要求,我们也支持以 embedding 的方式,将大模型能力与企业知识库相链接。另外,我们认为随着数据规模的上升和对模型的不断优化,准确性会进一步提升。"
目前,语炎智能的模型还在迭代完善中,主要以开放 API 接口的方式交付,尚不支持私有化部署。刘迎晖表示,实现数据飞轮后,会拓展此类交付模式,并探索新的业务模式,例如针对特定场景开发具体 AI 法律应用。