法律实证研究,是一种以数据分析为中心的验证性法学研究;其运用数理统计等知识,对包含司法经验的数据进行加工,期以发现问题,提炼规律,寻求对策。
法律实证,“难”在何处?
当前我国法学实证研究方兴未艾,但也困难重重;其突出表现为五“难”:
一、获取数据难
为提高研究样本的代表性,如何获取实时的、分类的、可靠的、海量的司法大数据?
二、筛选数据难
为提高研究样本的有效性,如何对海量司法大数据,进行快捷、高效地筛选?
三、维度标注难
针对研究的具体问题,如何对海量司法大数据,进行维度的标注,以实现数据的分类聚类?
四、数理模型构建难
针对研究的具体目标,如何选择、构建合理的数理模型,进行快捷统计分析,以实现司法大数据分析的准确性?
五、研究过程验证难
针对研究成果的可靠性,如何实现研究样本的可检验、研究过程的可重复,研究结果的可验证,以实现法律实证研究的可信赖?
小包公法律实证分析平台
突破五“难”
小包公法律实证分析平台运用人工智能技术,司法大数据发掘分析+NLP(自然语言学习)技术+法律知识图谱,让复杂的法律大数据深度分析变得简单高效。
1、提供亿级全量数据库
·提供亿级司法大数据库;通过规则与算法将文书数据进行清洗、核对与校验,解决案号重复、内容重复、性质匹配错误等问题;
·数据持续自动更新,确保数据的客观性与真实性;
·自由接入自有数据,实现研究的“私有化”。
2、提供智能精准的标注工具
·国内首创以亿级裁判文书为对象的大规模预训练模型,将法律信息、法律关系和法律逻辑的推理认知能力智能化;
·模型使用NLP技术、深度学习+预训练,为实证分析提供数据维度体系;
·根据研究需求设定研究维度,支持自定义数据维度,可生成多样化、个性化维度体系;
·全生态多人协作共建标签数据库;支持同一项目多人协作,实时同步保存,共享进度。
3、提供快捷的数据清洗流程
·构建“大数据+司法文书规则+先进算法”的智能模型,充分满足司法数据清洗的特定要求;
·应用命名识别与实体消歧、关系抽取的关键技术;
·快速、便捷地完成:数据纠正-删除重复项-修正数据逻辑-语义转换-颗粒度转换-数据标准化-数据压缩。
4、提供丰富的数据分析模型
一键快速生成基于简单运算和统计分析的数据模型。支持多种高级数据分析模型。
·多元线性回归
·趋势预测
·双重差分法
·判别分析
·时间序列模型
·聚类分析
·关联性分析
·一元线性
·显性
·差分
5、提供丰富的可视化数据分析图表
·根据数据模型可灵活选择可视化图表类型,自动生成图表;
·实时解释图表各值的含义;
·可视化图表类型丰富,且支持图表下载。
6、首创实证分析验证工具
系统存储用户实证分析的数据、维度、模型和结果,支持研究样本的可检验、研究过程的可重复,研究结果的可验证;支持自动校验与人工校验。
·自动验证:一键自动数据校验,实时展示数据校验结果;
·人工验证:提供自动化的划词手动标注工具,实现数据校验快又准。
小包公真心希望:突破五“难”的法律实证分析平台,能大幅度提升我国法律实证分析能力和水准,推动法治研究本土化,为法治中国贡献自己的一份力量!