基于中文法律知识的大语言模型

TJ君 2023-07-03

大家好，我是TJ

一个励志推荐10000款开源项目与工具的程序员

大家好，我是TJ

大语言模型持续火热，继续给大家推荐最近快速增长的相关开源项目，以开拓大家的日常工具库和创新思路。

今天要介绍的是一个关于中文法律知识的开源大语言模型：LaWGPT

项目地址：https://github.com/pengxiao-song/LaWGPT

该系列模型在通用中文基座模型（如 Chinese-LLaMA、ChatGLM 等）的基础上扩充法律领域专有词表、大规模中文法律语料预训练，增强了大模型在法律领域的基础语义理解能力。在此基础上，构造法律领域对话问答数据集、中国司法考试数据集进行指令精调，提升了模型对法律内容的理解和执行能力。

快速开始

命令行推理（可选，支持批量测试）

首先，参考 resources/example_infer_data.json 文件内容构造测试样本集；
其次，执行推理脚本：bash scripts/infer.sh。其中 --infer_data_path 参数为测试样本集路径，如果为空或者路径出错，则以交互模式运行。

注意，以上步骤的默认模型为 LaWGPT-7B-alpha ，如果您想使用 LaWGPT-7B-beta1.0 模型：

本项目基于如下开源项目展开，在此对相关项目和开发人员表示诚挚的感谢：

更多相关信息，读者可以前往其开源项目地址查看：

https://github.com/pengxiao-song/LaWGPT

往期推荐

阿里开源！集成了 AIGC 的免费数据库工具：Chat2DB

点击下方卡片，关注公众号“TJ君”

每天了解一个牛x、好用、有趣的东东