Unilaw法律大模型
该AI大模型由华院计算投递并参与数据猿与上海大数据联盟联合推出的《2024中国数智产业AI大模型先锋企业》榜单/奖项评选。
华院计算Uni-law法律大模型以大语言模型(LLM)为技术底座,通过运用高质量法律领域知识对大模型进行训练以及在模型推理阶段与司法知识库的高度融合,大幅提升了该法律大模型在法律领域的表现。
该模型采用了多阶段的模型训练策略,以提升模型整体能力。微调过程中引入多任务学习的策略,让模型能够同时学习多种有关联的司法子任务。通过大语言模型与知识检索增强的结合,提升模型的知识覆盖面与模型回答的专业性。
以法院高发的民间借贷纠纷、婚姻家庭纠纷、合同纠纷等几类案件为主要问题纠纷导向,通过法律大模型对判决书和起诉状进行语义理解、年龄层等信息进行统计计算以及其他指标的计算,发现在司法案件方面全区或街道共有的一些问题以及各村社的突出个性问题,最后依据已有的司法建议和文本生成的司法建议由专家进行校验后得到的专家经验,针对各类问题给出合适可行的司法建议。
在某市法院的司法建议报告生成项目中,华院作为唯一的项目承接方,负责算法和软件的相关开发内容,主要通过法律大模型对各类文书进行语义理解以及其他指标的计算,并依据已有的专家司法建议,针对各类问题给出合适可行的司法建议。该场景构建了一个自动化、智能化的司法建议报告生成流程,大幅度减少了法院工作人员数据统计分析以及司法建议报告生成的工作量和工作时间。
华院计算Uni-law法律大模型赋能法治,法律大模型主要包含以下能力和应用场景:
法律咨询:满足法律咨询等日常场景。
案情分析:根据案件描述,提取案情关键要素等。
司法推理:梳理案情争议焦点,给出审理建议等。
案情摘要:根据案情内容进行摘要生成
法律文书生成:生成法律答辩状、判决书。
主要包含两大功能模块,分别为智能对话和文书生成,可以通过点击界面上方按钮来切换功能模块。
以下是界面截图:
法律咨询:
案情分析:
司法推理:
案情摘要:
法律文书生成:
提供SaaS及私有化部署两种形式,通过结合SaaS的便捷性和私有化部署的定制化能力,法律大模型可以更有效地满足不同客户的需求,同时通过不断学习和优化,将特定的高频场景解决方案转化为可广泛提供的标准服务,从而推动整个法律服务行业的创新和发展。
1、提升法律服务质量:法律大模型能够提供全方位的智能辅助办案应用,提升法律服务的专业性和质量。
2、加强司法公正:通过法律大模型的智能审查和量刑预测功能,有助于实现司法公正,减少人为偏见和错误。
3、普及法律知识:法律大模型可以使法律知识更加易于获取和理解,提高公众的法律意识和法律素养。
4、提高司法透明度:法律大模型的应用可以增强司法工作的透明度,通过自动化和智能化的手段,让司法过程更加公开和可追溯。
1、多阶段训练策略,通过两个阶段的模型训练,将海量司法知识灌输给模型并针对性提升模型在司法任务上的能力表现。首先通过收集整理的40G中文司法知识数据(法律法规、司法解释、法律书籍等)对大模型进行二次预训练以实现司法知识注入。再通过精心构造的10万条指令微调数据对模型进行微调训练,进一步提升模型在特定子任务上的表现以及模型问答的能力。
2、多任务学习策略,让法律大模型同时学习多种有关联的司法子任务,以提升其整体司法能力。在指令微调训练阶段,梳理了20种司法子任务,针对每个子任务进行微调数据的收集与改造,共构建了10万条高质量多轮指令问答对。通过数据混合以及模型批量训练策略,让模型能够同时学习多种司法子任务。(参考图1)
3、大模型结合知识检索增强,提升模型知识覆盖面以及模型回答的专业性与准确率。通过构造司法知识库(包含法条、案例、法考题、法学书籍、法律文书模板、法律日常问答,详见图2),并结合知识增强模块(见图3),针对用户的提问进行意图识别及语义向量检索来召回相关法律知识,将检索到的知识作为大模型的知识增强输入,提升了法律大模型的专业性并缓解了模型的幻觉缺陷。
图1 - 法律大模型训练流程
图2 - 法律知识库
图3 - 知识检索增强
某地市级人民法院、某区县级人民法院、某地市级社会治理中心、某区县级信访局。
·华院计算
华院计算技术(上海)股份有限公司(简称“华院计算”),成立于2002年,是中国认知智能技术的开拓者。公司以算法研究、算法创新和算法应用为核心:基于数学应用与计算技术发展,聚焦认知智能技术、创新自研底层算法;基于认知智能引擎平台的场景应用,为智能制造、社会治理、数字文旅、零售金融等行业提供AI+行业解决方案、实现全面赋能,从而推动行业智能化的转型和升级,让世界更智慧。
华院计算以赋能企业数字化、智能化为使命,从计算智能、感知智能到认知智能, 始终专注于智能引擎技术研究和开发,致力于打造1+X模式,“1”是指核心算法引擎,“X”是基于核心算法引擎,开发通用认知智能引擎平台、实现API/SDK接入和调用服务。华院计算自主研发的认知智能引擎平台作为人工智能基础算法平台赋能多个行业,解决生产、决策、服务和研发等业务流程中四大重要环节的核心问题。
华院计算
华院计算以算法研究和创新应用为核心,着力发展认知智能技术,为金融、零售、社会治理、工业制造和医疗教育等行业提供智能化的产品和服务,推动行业智能化的转型和升级。致力于数学应用与计算技术发展,提供底层智能引擎,引领算法自主创新,让世界更智慧。
★以上由华院计算投递申报的项目案例,最终将会角逐由数据猿与上海大数据联盟联合推出的《2024中国数智产业AI大模型先锋企业》榜单/奖项。
该榜单最终将于7月24日北京举办的“2024企业数智化转型升级发展论坛——暨AI大模型趋势论坛”现场首次揭晓榜单,并举行颁奖仪式,欢迎报名莅临现场