网眼观法大数据司法的学术观察.docx
- 文档编号:17698585
- 上传时间:2023-04-24
- 格式:DOCX
- 页数:6
- 大小:20.76KB
网眼观法大数据司法的学术观察.docx
《网眼观法大数据司法的学术观察.docx》由会员分享,可在线阅读,更多相关《网眼观法大数据司法的学术观察.docx(6页珍藏版)》请在冰豆网上搜索。
网眼观法大数据司法的学术观察
【网眼观法】大数据司法的学术观察
作者:
刘品新,中国人民大学刑事法律科学研究中心副主任、法学教授。
本文发表于《人民检察》2017年第23期,系根据作者于2017年10月12日在中国人民大学法学院第91届教授沙龙上所做演讲及其他相关讲座整合而成。
2014年是中国的大数据应用元年。
自此以后,“司法+大数据”就很快跃升为中国法治领域的一个大热门。
近三年来,司法部门的许多重要会议都与大数据司法相关。
人们不论是采取主动还是被动的态度待之,它都对法治生活的方方面面产生了潜移默化的巨大影响。
一、为什么为什么现在司法领域特别强调大数据呢?
有些人被表面现象所迷住,单纯以为是因为受政法系统大领导的重视;有些人则错误地认为主要是时代的原因,在“大数据”与“人工智能”等成为热词的环境下,也理所应当地要强调大数据。
实际上,我们可以从以下两个角度进行更深刻的分析:
首先,紧密把握法治领域的体制机制创新与科技创新之间的关系。
当前的讨论表明,大数据司法与司法改革之间的关系有四种看法:
(1)司法改革与大数据司法是车之两轮、鸟之双翼,都是实现让每一个人民群众在司法中感受到公平正义的手段;
(2)大数据司法是司法改革的一部分,与员额制改革、司法责任制改革等共同构成司法改革的整体;(3)司法改革是大数据司法的一部分,司法改革为科技应用到司法领域做了准备,比如以审判为中心的刑事诉讼制度的改革;(4)大数据司法促进了司法改革,如运用大数据来改变办案过程中的“审批制”,以达到司法责任制的确立。
因此,我们如何认识大数据司法,需要结合对司法改革的理解。
要认识大数据司法的价值,必须厘清其与司法改革之间难以界定的关系。
从目前来看,大数据司法具有与司法改革同等甚至更加重要的地位。
其次,我国的大数据司法应用是在为全球治理探索和贡献中国方案、中国经验。
有一种说法是,在当前中国法治的现代化转型的过程中,如果中国能将司法与大数据进行深度结合,就可以实现“换道超车”。
从技术上看,我国与发达国家之间的发展是同步的,但在大数据与司法结合的应用上看,我国已经较为领先,主要原因在于我们能够掌握更多的数据。
在我国,掌握大数据的主体主要包括政府、企业、公安司法机关等,它们掌握了海量的数据信息,通过利用这些数据也实现了许多成就,比如近年来我国法院系统“智慧法院”和检察院系统“智慧检务”的建设。
同时,我国大数据司法这一方案还具有更加重要的价值,即它回避了是否必须依靠西方法治模式来实现司法公正的问题。
司法的最终目的是要实现每个案件的公平,让人民群众感受到公平正义。
西方国家声称其依靠三权分立做到公平与正义,而我们不可能实行于西方一样的法治模式,但就当前来看我们完全可以通过“科技+司法”来实现司法公正。
比如通过实现“类案推送”功能,可能就相当于产生了一种“现代新型的判例法”。
这是将总书记“科技创新”思想深刻地应用于司法领域的生动实践,它能为全球治理提供中国智慧。
总之,当前我国开展大数据司法实验和大数据司法研究,都恰逢其时。
二、是什么什么是大数据司法?
是“大数据+司法”吗?
我认为不能够这样简单的理解。
目前来看,大数据司法应当是与“智慧法院”、“智慧检务”相关的概念,强调数据的运用应当产生智慧。
今年5月在济南召开的全国法院第四次信息化工作会议上,周强院长对“智慧法院”的作出了如下定义:
智慧法院是建立在信息化基础上人民法院工作的一种形态,具有网络化、阳光化和智能化的特征,并以是否达到“全业务、全流程、全方位”作为评价智慧法院的基本标准和主要依据。
同时要求准确把握智慧法院与人民法院信息化3.0版的关系,深刻认识到信息化是人民法院组织、管理和建设的运行载体。
随后最高检9月在苏州召开的全国智慧检务工作会议上,曹建明检察长将“智慧检务”解读为:
是依托大数据、人工智能等技术手段,进一步发展检察信息化建设的更高形态;是遵循司法工作规律和检察权运行规律,从科技保障到科技支撑到进一步上升为科技引领,实现检察工作全局性变革的战略转型;也是影响深远的检察工作方式和管理方式的重大革命。
即是一种迭代形态,由“科技保障”(IT时代)到“科技支撑”(DT时代)再到“科技引领”(DT+AI时代)。
总的来说,我认为,大数据司法主要体现为法官和检察官的决定权中含有相当科技支撑的成分。
下面举例说明。
1.类案、关联案件(法条)推送类案推送是探索引入人工智能深度学习技术,在完成要素信息抽取研究的前提下,实现依据案由、犯罪手段、量刑情节、刑罚、法院、地区、相关法条等多种关联因素综合检索同类案件的方法。
在今年3月山东“辱母杀人案”持续发酵后,我们试着进行了类案搜索。
具体做法是,对中国裁判文书网上100多万起故意伤害案,选择反映案件独特信息的关键词如高利贷、辱母、警察在场等等,进行技术搜索。
结果共搜索到很多类似的案件(示例如图)。
研读这些案件发现审判结果可以归为两类:
一类是轻判的,比如保定的一个案件认定为正当防卫,判了七年;一类是重判的,比如安徽黄山的一个案件,没有认定为正当防卫,判了死缓。
两种情况的差别在于是否认定了正当防卫。
这样,可以继续使用类案搜索技术进一步搜索“正当防卫”案件。
这样的高级搜索功能,可以快速找到同类案件。
如此进行推送,就是类案推动,可以起到促进“同案同判”的作用,使得司法裁判更具有说服力。
从实践来看,有的地方司法机关还可以实现从裁判文书中自动抽取出可以反映该案特点的关键词,通过类案搜索进而发现许多类似案例。
同时,可以对某一类案件使用法条情况进行大数据分析,统计得出哪些法条使用最多,从而提供参考。
2.大数据定罪基于大数据辅助定罪量刑是借助文本相似度分析等技术,挖掘隐藏在历史司法文书中的法官、检察官定罪量刑集体经验,计算出各定罪量刑情节对刑罚的影响程度,赋予各情节不同的影响系数,从而使定罪量刑方法更具个性化、合理化。
我们当前做过对重点罪名裁判文书的辅助定罪量刑研究,得出的初步经验如下。
关于盗窃罪与诈骗罪的大数据定罪。
我们做了一个实验,选择“盗窃罪”和“诈骗罪”这两个罪名,各找两万个案件来进行机器学习,截取从关键字“经审理查明”到关键字“本院认为”之间的文本交给机器,通过分词的技术进行学习。
机器在学习了这些样本案件之后,对测试案件(1000个)做出的判断结果和人工的结果基本是一样的,准确率分别达到98.4%和97.6%。
这是通过实验数据测试后对训练效果进行验收,只要与法官做出的结论相比达到90%以上相同,就可以用于辅助定罪了。
还有另一种验收方法是将这一系统放在某一检察院内办案三个月,再与实际的办案结果做对比,也能发现其效果如何。
3.大数据量刑大数据量刑的关键点在于能否得出精准的量刑建议?
一些地方检察院的智慧公诉系统目前能够针对交通肇事罪进行精准量刑。
系统选取的因素包括:
是否造成人员死亡、财产损失数额(5000或5万)、是否醉驾(醉驾酒精含量多少),通过公检法机关人为地制定出一些标准,从而再通过机器进行量刑。
相当于将系统变为了一台计算器,计算出具体结果,从而实现“精准求刑”。
与以往的辅助量刑相比,精准求刑可以带来更好的认罪认罚从宽效果,因为可以使被告人看到其实施的不同行为所可能带来的具体不同后果。
我们曾对破坏公用电信设施罪进行过大数据量刑研究。
我们做了一个实验,通过对1767份破坏公用电信设施罪判决书进行初步处理,抽取出其中触犯相关刑法并判刑的判决书372份,并提取以下3个特征:
造成财产损失数额(x1)、造成通信中断用户数(x2)、造成网间通信中断时间(x3),上述特征均体现出了社会危害性,接着计算这些特征与判处刑期(y)之间的关系。
在机器学习了这部分判决书后,输入各变量值x1:
85000(元);x2:
1365(人);x3:
48(小时)。
结果输出判决期限39.83(月)。
从而,我们可以利用这一方法提供辅助的量刑建议。
在这一基础上,还可以实现量刑偏离度分析。
4.案件偏离度分析通过大数据,还可以进行案件偏离度分析。
这最早是由贵州提出的,但经过我们调研时发现,其所说的案件偏离度分析是指公检法三家对同一案件的不同判断结果之间的偏离度分析,但这样的认识是有误解的。
实际上,我们可以通过使用案件偏离度分析功能进行监管,比如我们设置一个偏离度标准(假定30%),在此范围内的偏离都是可以接受的,如某一个案件与样本库中案件的偏离度超过了30%,那么就需要对判决结果进行合理的解释。
但存在问题是设定这样的具体数量标准可能过于机械,不同罪名的刑罚设置不同,重罪与轻罪相比在同一偏离度下的刑罚绝对量的差异较大。
因此还需要设置其他标准的偏离度,如罪名偏离与量刑偏离等。
从而可以对不同法官、检察官甚至不同部门进行考核。
其背后的原理相当于挖掘出了司法人员办案的规律,再以此规律为标准,测试具体现实中的工作人员办案是否符合这一规律。
如我们通过使用北京的检立方系统,针对海淀区所有批捕人员进行了测试,发现这些人员的不捕率普遍在20%以下。
后发现其中某位人员的不捕率为90%,且办案数量很多,因此其就进入了监管视野。
5.数据化的证据标准时下有一种流行说法,认为冤假错案产生的主要原因之一是公检法的证据标准不统一。
如果推行统一的、数据化的证明标准,就可以避免冤错案件的发生。
这种观点并非无可挑剔,但基于大数据技术改造证明标准缺失是一个方向。
现行法律对证明标准的规定是诉讼法中的“案件事实清楚,证据确实充分”,即认定罪与非罪的标准,是给全案证据下结论的标准。
这一标准如何进行大数据改造呢?
我国司法大数据的先行地区如贵州、上海进行了宝贵的探索。
贵州的做法是,针对故意伤害罪等罪名,按照犯罪构成的四要件、三阶层,转化为十个证明要件,再进一步看每一个证明要件中通常需要哪些证据(下图中标绿的部分)来证明。
这一做法的关键是构建犯罪构成知识图谱(图8),将案件信息数据化,从而形成一个统一的标准。
[图:
基于大数据的统一证据标准之贵州应用-犯罪构成十要件][图:
基于大数据的统一证据标准之贵州应用-犯罪构成知识图谱]上海政法系统研制了“刑事案件智能辅助办案”系统,其核心内容同样也是证据的认定。
在其证据指引标准中,对于立案、侦查、初查、审查起诉等每个阶段需要哪些证据,就嵌入进系统,将证据规则的软要求,变为平台的硬约束,达不到要求就无法进入到下一步。
通过这种方法,可以解决取证不规范的问题。
这两个系统的效果如何,值得特别关注。
从目前的情况来看,他们研发的是统一的数据化的证据标准(即应该有什么样证据、证据是否有效的标准),还不是统一的数据化的证明标准;他们取得的成绩主要是在证据的数据及合法性规范方面,也遇到了如何教会机器审查判断证据的关联性、真实性的挑战;他们在证据合法性自动审查方面取得的进步是形式审查方面,在实质审查方面还有一些障碍。
我们的研究表明,基于大数据的证据审查应当以全案证据的审查评断为主,重点突破反向审查而非正向审查,即什么情况下案件中的证据还不足以支持做出肯定性裁判。
这就需要转变一下思路,比如通过对最高法院不予核准死刑或者高级法院未判死刑立即执行的案件,进行机器学习,确定出一个不会被判处死刑的公式。
通过这样机器学习得来的辅助办案系统,可以在很大程度上给办案人员做出提示、进行预警。
6.自动生成文书在这方面,杭州的检察院有过一些初步尝试。
可以基于海量文书,为司法人员自动产生文书草稿。
因为所有文书看似不是表格,但实质上相当于有一个无形的表格,通过将内容部分抽出,再填入到相应位置上,最终也能以“表格”的形式展现出来。
针对少数部分机器无法填入的,可以结合智能语音输入功能,未来还可考虑通过机器学习进行填写。
目前有多地的自动生成文书已经做的比较成熟,比如可以通过机器自动生成审查报告、起诉书、判决书、送达通知等等。
如此便能极大解决司法人员人手不够的问题。
7.法律咨询基于大数据的司法应用,目前做的比较好的一块还有法律咨询。
比如控申部门通过电话、网络接待老百姓的访问。
在银行领域,已经能够实现机器接访了,如通过电话进行自动答疑,待机器无法回答时就自动切换到人工。
同时机器还可事先采用人的发音,从而询问者可能无法区别是机器还是人在回答。
自动问答可以通过搜索互联网上相关法律问题出现次数最多的回答,自动推送给询问者;或是搜集全国司法人员通过电话进行回应的资料,对这部分再做归纳,进而推送。
三、怎么办总的来看,目前国内在大数据司法方面处于初步尝试的阶段,科研也处于初步探索阶段。
我们应当清醒地认识到,还有许多问题需要在未来加以解决。
未来的大数据司法应当要形成良好的生态系统,构成大数据法治的生态圈。
如由司法机关提出需求和数据资源,通过科研院所进行攻关,企业将其变现。
最近,最高人民检察院与中国人民大学等单位共同发起成立了“智慧检务创新研究院”,对推进现代科技与检察工作的深度融合,加强“产、学、研、用”紧密合作提供了一个极具前景的平台。
未来还需要深入地研究,产生真正的人工智能,如在证据摘录、法条匹配等关键环节由人工智能有所作为。
未来的大数据司法还应当顺应潮流寻求积极的转变,实现与科技的高水平融合。
这具体包括:
一是由低层次的大数据支撑司法转向大数据引领、驱动司法,不断提升司法领域中人工智能应用的广度和深度;二是由大数据司法转向大数据立法、大数据普法、大数据法学研究,实现全方位的大数据法治。
新时代中国的法治模式如何走向辉煌?
国人拭目以待。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网眼 观法大 数据 司法 学术 观察