作者:张迪,华东政法大学中国法治战略研究院副研究员。
2023年2月,中共中央、国务院印发《数字中国建设整体布局规划》
, 为 “数字引擎”助推中国式现代化作出了顶层设计。“数字中国”建设在各个领域不断深入,不仅推动着社会生产力的前进,也深刻影响着上层建筑。
中国司法机关(包括侦查机关)将以数治国的新理念融入依法治国战略之下,相应的实践创新成果相继脱颖而出,先后成立杭州互联网法院、北京互联网法院和广州互联网法院,开展数字政府、数字检察和数字法院建设,在法治实施环节依法化解网络空间的矛盾纠纷,积累了依法防范和应对数字社会科技风险的有益经验。
由此形成包含数字侦查、数字检察和数字法院的数字司法改革新格局。数字司法是司法改革的未来走向,面对实践中的一系列改革创新,我们有必要近距离审视和提炼这些司法数字化改革的样态和机理,评估其潜在风险,提出相应的优化建议。有鉴于此,本文将先从总体上对数字司法改革的实践面向进行划分,进而在数字侦查、数字检察和数字法院这三个维度下,对近年来相关典型事件进行系统观察。
一、数字司法的三个改革面向
关于数字司法的界定,有广义和狭义之分。广义说认为,数字司法指司法体系的数字化变革,其典型实践样态有数字检察、数字法院和数字法治政府。
狭义说认为,数字司法主要指法院的数字化变革,具体表现为实践中的“智慧法院”或“数字法院”改革,这些改革力图将数字技术全面应用到司法审判实践中。
广义说、狭义说无对错之分,仅是不同研究者在特定情境下对特定语词的话语范围界定。但是,从司法改革的推行视角来看,司法改革的推进一般都包含检察院和侦查机关的配套推进措施(特别是在刑事司法改革领域),因此,数字司法改革原则上应包括公检法三机关的数字化改革。此外,“数字”这一语词与“网络”“线上”“智慧”等语词有别,其更加强调数字建模路径和平台数据统筹。基于这两点,为聚焦研究对象,本文持折中说,认为数字司法主要指司法的数字化变革形态,主要包括数字侦查、数字检察和数字法院三种典型样态。
数字侦查是运用大数据、人工智能技术等所进行的侦查模式改革,是一种数据驱动型的主动、新型侦查模式,其实践典型样态是“专业+机制+大数据”的新型警务模式。数字侦查的关键在于对大数据的有效使用,其与个人信息保护之间的冲突又决定了其需要受到权力限制。
在侦查实践中,以人工智能、大数据为代表的新型技术不断创新和普及,刑事犯罪模式不断迭代升级,犯罪手段更加多样,新型技术与犯罪的深度融合不仅在普遍意义上改变着各类犯罪的模式、逻辑和手段,同时也对打击犯罪提出了一系列全新挑战。为了应对这一问题,侦查机关坚持“专业+机制+大数据”新型警务运行模式,将数据资源与情报挖掘功能融入侦查体系,立足于打主动战,积极探索打造系统集成、集约高效的侦查中心。比如,有侦查部门按照“统一进口、分类研判、统一出口”的原则,制作完善新型涉网、黄赌毒、食药环、黑恶、非法集资等案件侦破流程图,进而依托侦查中心,不断激发既有海量数据的侦查潜能,推动刑事犯罪打击的全面提质增效。
关于数字检察的界定,有广义和狭义之分。广义说认为,数字检察为一种整体性概念,是指对检察业务全方位、全流程的再造;狭义说则认为,数字检察是指检察机关运用数字化、智能化技术建构法律监督模型及配套系统所形成的法律监督新模式。
广义说下的数字检察范围过大,狭义说下的数字检察更能凸显检察改革的“智能”色彩和“迭代”特性,故本文持狭义说。数字检察改革不仅响应了“数字中国”这一顶层设计,同时与中共中央关于新时代检察机关法律监督工作的要求相适配。《中共中央关于加强新时代检察机关法律监督工作的意见》要求,面对新发展阶段人民群众在民主、法治、公平、正义、安全、环境等方面的新需求,应加强新时代检察机关法律监督工作。
正是在这些背景下,检察机关积极作为,提出了“数字检察”这一改革方案,得到了理论界和实务界的响应。
以数字行政检察改革为例,其将“数字”与新时代行政检察的融合,二者结合后生成了一种穿透式、类案式、一体化的新型行政检察监督模式。从实践部门的反馈意见来看,新的法律监督有利于找准、破解、预防社会治理层面隐蔽性、深层次、老大难问题。
数字法院建设,是指将数字技术从单纯的辅助工具升级为一种贯穿法院工作全流程的工作方法,运用这一工作方法,构建覆盖立案、审判、执行、诉讼服务以及社会治理的全场景数字模型,进而对特定领域的海量司法大数据进行筛选、比对、碰撞,发现隐藏在案件中的问题线索,由此实现不间断的监督管理和社会治理风险预警。
数字法院与传统的智慧法院建设不同。传统的智慧法院更多的是将司法工作从线下转向线上,信息技术只是服务性的工具,法院的核心工作模式和机理并没有发生大的改变。数字法院则是以问题为导向的数字化变革,在法院工作理念和制度上进行了根本性改造。
数字法院的建设和发展极大地拓展和深化了数字技术在司法领域的应用,
是对数字中国战略的坚定贯彻和有力落实。数字法院建设正是撬动了社会治理领域的变革,从“抓末端、治已病”向“抓前端、治未病”延伸,推动人民法院在社会治理中的角色发生重要转变。
例如,上海市法院通过其构建的“执行终本案件财产查控监管”应用场景及时发现222 件终本案件的被执行人名下住房公积金账户有余额可扣划,
其中61件案件已全额执行到位。
二、数字侦查的改革实践观察
数字侦查是一种运用大数据、人工智能技术的主动侦查、智能侦查,其要求侦查人员转变陈旧的侦查思维,借助新型技术实现侦查思路的变革与创新。数字侦查的核心功能在于犯罪预测、案件侦破等。通过大数据、人工智能等技术,数字侦查使得犯罪信息都被展示在大数据这张无形的“大网”之下。
(一)数字侦查改革的基本样态
近年来,我国也开始注重利用大数据、人工智能提高预防和打击犯罪的能力。2019年10月31日,党的十九届四中全会通过《中共中央关于坚持和完善中国特色社会主义制度
推进国家治理体系和治理能力现代化若干重大问题的决定》,明确要求“提高预测预警预防各类风险能力,增强社会治安防控的整体性、协同性、精准性”。同年,中华人民共和国公安部(以下简称为“公安部”)成立了情报指挥中心,承担情报分析、研判预警、指挥调度等职责,并下发了《情指勤舆一体化实战平台建设任务书》,这标志着预测警务正式成为我国公安机关警务建设的重要内容。
在预防为主导的侦查理念引领下,公安部印发《加强新时代公安派出所工作三年行动计划(2023—2025年)》,明确提出推行预防警务,将派出所工作重心转移到源头防范管理等基层基础工作上来。
实践中,巴彦淖尔市公安局通过实施“专业+机制+大数据”的新型警务运行模式,将大数据与科技创新结合,对公共安全事故的历史数据进行深度挖掘,有效预测潜在的犯罪风险,从而提前做好防范措施。
又如,天津公安机关利用新型警务运行模式提升工作效能。 天津公安机关建立完善“专业+机制+大数据”
新型警务运行模式,虽然未明确提及“预测警务”,但这种模式可能涉及对各类案件数据的分析和处理,以实现对犯罪趋势的预判和对治安形势的掌控等,从而提升工作效能。再如清远市公安局以“专业+机制+大数据”新型警务运行模式为抓手,警务工作前置、预防为主,通过优化轮值勤务机制、组建网格轮巡队、践行“社区民警的岗位在社区”等措施,全面掌握社会治安要素底数情况,滚动排查化解矛盾纠纷,做实基层基础工作,有效确保了全市社会大局平安稳定。
(二)数字侦查改革的实践挑战
数字技术在侦查领域的应用愈加广泛,这能够帮助公安机关更有效地打击犯罪,但数字侦查改革带来侦查权力的扩张,公民权利面临被侵犯的风险,与数字侦查相关的法律规范和行为规制亟须完善,以保障公民的合法权益和社会公平正义。
其一,技术层面的挑战。就数据而言,一方面,数字侦查中的数据准确性难以保障。数字侦查依赖大量的数据,但数据来源广泛,质量参差不齐。数据录入错误、数据缺失、数据重复等问题,可能导致侦查线索的误判和错误引导。如在一些案件中,因数据库中的犯罪嫌疑人身份信息错误,导致侦查方向出现偏差。另一方面,数字侦查中数据完整度不高。实践中,侦查数据的共享与整合存在一定困难。不同地区、不同部门之间的数据壁垒依然存在,如检察机关、金融机构、电信运营商等各自掌握着大量有价值的数据,但由于体制机制、安全保密、利益分配等因素,数据共享难以实现。这使得侦查人员在获取全面数据进行综合分析时面临重重困难,无法形成有效的侦查合力。
就算法而言,第一,数据偏差导致算法偏见。大数据侦查依赖大量数据作为算法的输入,如果数据存在偏差,例如,数据收集过程中只侧重于某一类案件、某一区域或某一群体的数据,而忽略其他部分,那么算法就会基于这种有偏差的数据进行学习和分析,从而产生偏见。
第二,算法设计导致算法偏见。算法的设计和开发过程也可能引入偏见。开发人员的主观意识、经验、价值观等因素可能会影响算法的设计。比如,在设计犯罪预测算法时,开发人员可能会根据自己对某些犯罪特征的固有认知,赋予某些因素过高的权重,导致算法对具有这些特征的人群或行为产生过度关注,而对其他可能的犯罪因素关注不足。第三,算法内部运行机制难以理解。许多复杂的算法,如深度学习算法,其内部结构和运行机制非常复杂,类似于一个“黑箱”。即使是专业的技术人员也很难完全理解算法是如何从输入数据中提取特征、进行推理和做出决策的。在大数据侦查中,当算法给出一个犯罪嫌疑人的预测名单或线索时,侦查人员很难确切知道算法为什么会做出这样的判断,是哪些具体的数据特征和逻辑导致了这一结果。除此之外,由于算法黑箱的存在,对算法输出结果进行合理、准确地解释变得十分困难。在司法实践中,这可能会引发一系列问题。例如,当算法生成的证据或线索被用于法庭审判时,法官、律师和陪审团可能难以理解和评估其可靠性和关联性,从而影响对案件的公正裁决。
其二,制度层面的挑战。数字侦查改革中的部门协作机制不完善。数字侦查需要多个部门之间的密切协作和配合,但目前部门之间的协作机制还不够完善。在案件侦查过程中,存在各部门之间职责不清、沟通不畅、协调不力等问题,导致侦查工作效率低下,甚至出现重复劳动和资源浪费的现象。例如,在涉网犯罪案件中,公安机关内部的网安、刑侦、经侦等部门之间以及与其他执法部门之间的协作配合还不够紧密。除此之外,数字侦查需要既懂侦查业务又精通数字技术的复合型人才。然而,目前这类复合型人才相对匮乏,侦查人员的技术水平和数据分析能力普遍不足,难以满足数字侦查工作的需求。例如,在面对复杂的网络犯罪案件时,缺乏能够熟练运用数据分析工具和技术进行线索挖掘和案件侦破的专业人员。数字侦查涉及多个领域的知识和技能,包括计算机科学、数据分析、法学、侦查学等。培养一名合格的数字侦查人才需要较长的周期和系统的培训,且需要不断进行知识更新和实践锻炼。这对于侦查机关和教育机构来说,是一项艰巨的任务。
其三,规范层面的挑战。数字侦查作为一种新兴的侦查方式,相关的法律法规还不够完善。例如,对于数字侦查技术的使用范围、程序规范、证据效力等方面,缺乏明确的法律规定,导致在实践中侦查机关的行为缺乏明确的法律依据,容易引发争议和法律风险。数字侦查涉及不同地区、不同国家的法律适用和协调问题。在跨国网络犯罪案件中,不同国家的法律制度和证据标准存在差异,给侦查机关的跨境侦查和证据收集带来了很大的困难。如何在国际范围内实现法律的协调和统一,是数字侦查改革面临的重要挑战之一。此外,在数字侦查过程中,涉及大量公民个人信息和敏感数据。一旦数据泄露,不仅会侵犯公民的隐私权,还可能导致犯罪分子利用泄露的数据进行反侦查或实施其他犯罪活动。因此,如何在保障数据安全的前提下,充分利用数据进行侦查是一个巨大的挑战。传统侦查程序规范对新型数字侦查措施难以有效控制,侦查机关运用新型数字侦查措施存在冲击刑事正当程序,过度干预公民隐私权与个人信息权的问题,数字化、全景化侦查引发全民监控的风险。
三、数字检察的改革实践观察
(一)数字检察改革的基本模式
《中共中央关于进一步全面深化改革、推进中国式现代化的决定》多次提到
“数据”“数字”等关键词,明确提出要“加快新一代信息技术全方位全链条普及应用”,强调要推进国家安全科技赋能,为大数据、人工智能在检察工作中的应用明确了改革方向。特别是在“社会治理”部分,要求创新社会治理体制机制和手段,这为数字检察工作提供了重要的价值追求和政策依据,数字检察通过运用大数据等技术,从个案办理到类案监督,再到推进系统治理,契合了这一要求。
2022年6月29日,全国检察机关数字检察工作会议召开,对加快数字检察建设,以“数字革命”驱动新时代法律监督提质增效作出部署。11月,最高检数字检察办公室成立,围绕数据获取和使用、监督模型的培育和推广、类案线索管理和反馈等开展工作。2023年1月8日,全国检察长会议强调把数字检察工作作为前瞻性、基础性工作来抓,以数字革命赋能法律监督。2023年8月,《2023—2027年检察改革工作规划》围绕完善“六大体系”部署36项改革任务,以专章、三项具体改革部署数字检察战略,即建立健全数字检察工作机制、加强数据整合和技术支撑、推进数字检察深度应用,并提出构建“业务主导、数据整合、技术支撑、重在应用”的数字检察工作模式。
2024年12月,最高人民检察院下发《关于全面深化检察改革、进一步加强新时代检察工作的意见》,明确指出要“以科技赋能法律监督”“积极探索大数据、区块链、人工智能等技术辅助司法办案”。有效推进了高新技术与检察工作的有机结合,也为各地检察机关设置了一道如何因地制宜实现创新发展的“必答题”。安徽省人民检察院在《2024年全省数字检察工作方案》中明确提出“要探索开展人工智能认知大模型在检察机关的落地应用”以来,积极利用当地人工智能产业蓬勃发展态势,以“人工智能+”行动为基点,稳步构建生成式大模型应用系统,打造服务于全省检察机关的生成式大模型应用系统,逐步探索场景试点等工作,用大模型的“小练兵”“微创新”摸索数字检察发展路径,以数字赋能驱动检察工作提质增效。
(二)数字检察改革的实践挑战
其一,技术层面的挑战。数字检察改革在数据层面的突出问题是数据壁垒未打通。法律监督的数字化改革需要大量数据作为支撑,但各机关部门间数字壁垒尚未完全打通,检察数据的存储和利用仍存在不畅通的问题,因此司法数据、政务数据等无法实现有效的共享和整合,这限制了数字检察效能的发挥。在数据安全管理制度尚未健全的情况下,数据在传输、保存、共享过程中存在泄露和权益侵害的风险。数字检察改革在算法层面的突出问题是算法运用存在两极分化现象。智能型的法律监督模型虽然能够提速增效,但也会带来机械应用导致司法正义失衡的风险,如算法错误、算法偏见等固有问题的存在会影响法律监督的公正性和准确性。况且,数字技术不断更新迭代,检察机关需要不断投入资金和精力进行技术升级和设备更新,以适应新的工作需求。然而,部分地区检察机关由于经济水平、工作重心、领导重视程度等因素的影响,难以在技术创新方面跟上步伐,导致技术水平滞后,影响数字检察工作的开展。简易版的法律监督模型主要依赖excel表格等技术,这些法律监督模型较为简单,不存在算法歧视、黑箱等问题。但正如前文所述,此类监督模型所依赖的数据一直存在获取困难的问题。
其二,制度层面的挑战。首先,数字化的法律监督存在跨层级协作难的问题。在模型跨地域建用、线索多层级协作等跨层级、跨地域融合履职时,仍依赖于政策协调,而不是制度约束,缺乏明确的权责划分和规范的协作机制,容易导致工作衔接不畅、责任推诿等问题。其中,最重要的是部门间协作障碍。模型建用、线索核查等工作涉及多项检察职能,单靠一个部门无法高质效完成,但各部门更关注与自身密切相关的业务,对挖掘、移送其他部门的线索往往缺乏敏感性及参与感,影响了数字检察工作的整体效能。究其原因,数字检察的融合履职机制不健全。具体来说,检察机关内部各项职能一体融合履职的机制不健全,无法打破单兵作战的思维习惯和履职模式,这影响了数字检察工作的协同性和高效性。除此之外,数字检察改革也存在专业人才稀缺的问题。数字检察需要既懂检察业务又熟悉数字技术的复合型人才,但目前这类人才相对稀缺,检察机关在人才培养和引进方面面临较大压力,难以满足数字检察工作的需求。数字检察还面临人员适应困难的问题。部分检察机关和检察人员不能较好适应数字检察工作新模式,还没有充分认识到大数据赋能法律监督的意义和方法,缺乏数字思维和技术应用能力,在工作中难以有效运用数字技术开展监督和办案工作。
其三,规范层面的挑战。数字检察改革在法律监督权限和监督流程上缺少统一、明确的法律规范依据。一方面,数字化的法律监督在监督范围、监督方式以及监督规模等维度上对传统的法律监督进行拓宽。
然而,数字化的法律监督在监督范围上的拓展缺少一定的法律依据,以数字行政检察为例,此类数字化法律监督在监督权限上的扩张主要以《中共中央关于加强新时代检察机关法律监督工作的意见》中的相关规定为依据。
另一方面,法律监督缺乏统一标准。目前数字检察尚处于初始阶段,未出台统一的规范性文件,对于数据管理、线索核查、模型应用等各项制度尚在探索完善中,导致各地检察机关在实践中缺乏明确的标准和规范可依,工作开展存在一定的盲目性和随意性。
四、数字法院的改革实践观察
(一)数字法院改革的基本架构
《人民法院第六个五年改革纲要(2024—2028年)》明确提出要完善数字货币等新兴领域金融纠纷裁判规则,健全司法审判行为风险防控系统应用机制,结合司法大数据及时发现和纠治司法不规范行为,强化廉政风险防控体系建设等,为数字法院在金融纠纷处理和审判监督管理等方面的改革提供了方向和要求。重庆市渝中区人民法院强调要从党的二十届三中全会精神中找依据、找遵循,牢牢把握指导思想,通过科技赋能司法改革。要强化系统集成,注重安全规范,突出高效便捷,坚持动态开放。还提出要认真落实全国法院“一张网”建设要求,丰富数字法院应用场景,聚焦群众需求延伸数据服务触角等,为数字法院的建设原则、发展方向和具体举措提供了明确指引。
早在2023年,上海市各级法院就启动了“数字法院”建设,通过“场景申报、数字建模、推广评查、嵌入测试、检验反馈、优化完善”六步走全闭环工作模式,将应用场景融入审判执行全流程,在数助办案、数助监督、数助决策、数助便民、数助政务等方面发挥了作用,为各地数字法院建设提供了实践经验和参考范例。
举例来说,上海法院围绕便民利民,从多个维度推进数字法院建设。在诉讼流程可知方面,实现全流程网上办案和电子卷宗“单套制”归档,设置“数字导诉员”和“智慧舱”。在诉讼服务可感上,将离婚裁判文书等纳入“一网通办”,开发相关应用场景,设置手语窗口和配备转换设备,推广“涉家暴信息沟通共享机制”应用场景。在诉讼结果可期上,通过数字法院建设提升司法效率,让司法服务更“聪明”。
又如,崇州法院构建“数字法庭”运行模式,为基层智慧法治建设赋能。在建设“一体贯通”应用体系上,从机制、数据平台和业务流程多方面发力,融入智慧城市建设,打造数据中台,实现电子卷宗全流程应用。在“数字+服务”方面,创新便捷诉讼服务模式,解锁新场景,提供“不打烊”服务,配置“数字法庭驿站”。在“数字+调解”上,利用司法审判大数据指导调解,构建联调联治机制,畅通司法确认渠道。在“数字+审判”方面,构建“速裁快审”工作格局,探索新模式,借助线上线下资源提升审判质效。
总而言之,这些数字法院建设的典型案例,为其他地区法院提供了宝贵的借鉴经验,推动着我国司法体系在数字化道路上不断前进,更好地服务于社会和人民。
(二)数字法院改革的实践挑战
其一,技术层面。数字法院主要问题之一是法院内部数据存在共享壁垒、质量参差不齐。司法数据来源广泛,包括立案、审判、执行等各个环节,但部分数据存在录入不规范、不准确、不完整等问题,影响了数据分析和应用的准确性。同时,不同部门之间的数据标准不一致,也给数据的整合和共享带来了困难。除此之外,数字法院涉及大量的当事人个人信息、案件敏感信息等,一旦数据泄露或被篡改,将给当事人的合法权益和司法公信力带来严重损害。在数据采集、存储、传输和使用过程中,存在着数据被窃取、泄露、滥用等安全风险,需要加强数据安全防护措施。
数字法院主要问题之二是技术系统存在兼容性差、功能不完善等问题。不同地区、不同层级的法院可能采用了不同的信息化系统,这些系统之间存在兼容性问题,导致数据难以共享和交互,无法实现全流程的数字化办案。数字技术发展迅速,法院需要不断投入大量的资金和人力进行技术更新和系统维护,以确保数字法院的正常运行。然而,部分基层法院由于经费有限,难以承担高昂的技术更新和维护费用,导致技术设备老化、系统运行缓慢,影响了数字法院的建设和发展。虽然一些数字法院系统具备了网上立案、在线庭审、电子送达等基本功能,但在实际应用中,这些功能还存在一些不足之处,如系统稳定性差、操作复杂、功能单一等,无法满足法官和当事人的实际需求。除此之外,目前,有些地方法院的数字建设较慢,相关模型和系统的智能化程度低。目前数字法院的智能化应用还处于初级阶段,人工智能技术在案件分析、裁判预测、法律适用等方面的应用还不够成熟,无法真正实现智能化的审判辅助,距离实现“智慧审判”
的目标还有很大差距。
其二,制度层面。一方面,数字司法让法官落入一种全景敞视结构,审判活动被全流程、实时、动态地置于审判监管主体的“注视”之下,这可能会给法官带来较大的心理压力,影响其独立思考和裁判,甚至可能导致法官为了避免被监管发现问题而采取保守的裁判策略。另一方面,数字司法使得审判监督管理的权力具有弥散性,监督管理者可以借助信息化手段,全程、动态地监督法官的审判活动,虽然审判权运行更加强调规范性,但容易使法官过度关注流程规范,而忽视案件的实质正义,导致裁判尺度的形式化统一。除此之外,数字法院建设需要既懂法律又懂技术的复合型人才,但这类人才在法院系统中相对较少。大多数法官和司法辅助人员缺乏技术背景,而技术人员又对法律业务不够熟悉,导致在数字法院的建设和应用过程中,技术与业务难以深度融合。目前针对数字法院相关人才的培训体系还不够完善,缺乏系统性、针对性的培训课程和培训机制。培训内容往往侧重于技术操作层面,而忽视了数字思维、法律与技术融合等方面的培养,导致培训效果不理想,难以提升司法人员的数字应用能力。
其三,规范层面。数字法院改革在规范层面的问题较多,就要点而言,其主要问题有三。首先,数字法院改革中算法用于案件分配、风险评估等,但算法的设计、运行和监督缺乏公开透明的程序规范。公众和当事人难以了解算法的原理和决策过程,无法判断其是否公正合理,也难以对算法可能出现的错误或偏差进行有效监督和救济。其次,数字流程与传统流程衔接不畅。虽然数字法院推动了线上诉讼等流程的发展,但在与传统线下诉讼流程的衔接上存在问题。例如,部分案件可能需要在线上线下切换进行,涉及证据移送、程序转换等环节时,缺乏清晰明确的规范来保障衔接的顺畅性和一致性,容易导致程序混乱和效率低下。最后,数字法院改革中新技术应用不断涌现,如人工智能、区块链等,但法律对这些技术在司法领域的应用规范相对滞后。例如,对于人工智能生成的裁判建议等内容的法律效力,法律没有明确规定,导致法官在参考使用时缺乏明确的法律依据。
五、数字司法潜在风险的治理
本文的观察仅选取数字侦查、数字检察、数字法院的核心改革部分,指出这些改革在技术层面、制度层面和规范层面的问题。想要解决这些问题,也要从这三个层面入手,提出相应的解决方案。
(一)技术层面:数据和技术的双维合规
技术工具主义已经被理论界和学界所认可。在技术辅助的视角下,司法机关仍然需要提升数据和算法的技术标准,提高对数据的广度和算法的精度的要求。整体来说,可供参考的技术标准主要包括如下几个方面。
一是明确数据获取规程。司法机关获取数据的方式主要有二:一是数据采集,二是数据调取。就数据采集而言,其一,需要准备采集工具。根据数据获取方式选择合适的工具,如问卷调研需要问卷设计平台,网络爬虫需要编写爬虫程序等。其二,明确采集操作流程。按照预定的方法和计划进行数据采集,确保采集过程的规范性和准确性。其三,记录采集信息。记录数据采集的时间、地点、采集人员、数据来源等信息,以便后续追溯和验证。就数据调取而言,有如下几种方式:其一,数据库查询和调取。这是从各种已有的数据库中获取数据,这些数据库可以是企业内部的业务数据库,也可以是公开的学术数据库、政府统计数据库等。其二,网络爬虫。利用网络爬虫工具或程序,按照一定的规则自动从网页上抓取数据。例如,一些互联网公司会通过网络爬虫收集竞争对手的产品信息、用户评价等。其三,数据接口获取。通过应用程序接口(API)从其他系统或平台获取数据。例如,很多地图应用通过调用交通数据API获取实时路况信息。司法机关要尽可能地明确这些数据获取方式的具体使用流程。
二是明确数据清洗规程。数据清洗规程是对获取到的数据进行处理,以提高数据质量,为后续分析做准备的规范和流程,主要包括以下方面:其一,数据审核标准。司法机关需要对数据进行全面检查,查看数据是否存在错误、缺失值、重复值、异常值等问题。例如,在个人信息表中,检查年龄字段是否存在负数或明显不合理的数值。去除重复值主要指识别并删除数据集中的重复记录,确保数据的唯一性。例如在客户订单数据中,可能存在因系统问题或操作失误导致的重复订单记录,需要将其去除。处理缺失值主要指,针对数据中的缺失部分,根据具体情况选择合适的处理方法,如删除包含缺失值的记录、使用均值、中位数、众数等统计量填充缺失值,或者基于机器学习算法进行缺失值预测填充等。处理异常值主要指,检测并处理数据中的异常值,可采用基于统计方法识别异常值,然后根据实际情况决定是删除异常值、对其进行修正还是进行特殊标记。除此之外,数据标准化与规范化也是数据清洗的重要一环。司法机关应将数据转换为统一的格式和标准,如将日期格式统一、将数据进行标准化缩放,使不同变量具有可比性,或者将文本数据进行编码处理,转换为计算机能够处理的数值形式。
三是明确数据检验规程。数据检验规程应主要包括数据一致性检查、数据准确性验证、数据完整性检查。其一,数据一致性检查。确保数据在不同来源或不同部分之间保持一致,如在多个数据表中,相同客户的信息应该保持一致,若存在不一致,需要进行核对和修正。其二,数据准确性验证。对从不同来源获取的数据进行交叉核对,如将财务系统中的销售收入数据与销售管理系统中的数据进行比对,检查是否一致。其三,数据完整性检查。检查数据是否涵盖了所需的全部时间范围和业务内容。
四是明确数据分析规程。这一流程主要包括六个步骤。其一,明确分析目标。确定要通过数据分析解决的问题或达到的目标,如分析销售数据以制定营销策略、分析用户行为数据以优化产品设计等。其二,选择分析方法。根据分析目标和数据特点,选择合适的数据分析方法,如描述性统计分析用于了解数据的基本特征,包括均值、中位数、标准差等;相关性分析用于研究变量之间的关联程度;回归分析用于建立变量之间的数学关系模型,进行预测和趋势分析等。其三,数据建模与计算。利用选定的分析方法和工具,对数据进行建模和计算,如使用统计软件或编程语言进行数据处理和模型训练。其四,结果解读与评估。对分析结果进行解读和评估,判断结果是否合理、是否符合预期,是否能够回答最初设定的分析目标。同时,评估分析结果的可靠性和有效性,例如通过交叉验证、误差分析等方法来评估模型的准确性。其五,报告与呈现。将分析结果以清晰、直观的方式呈现出来。分析报告应包括分析背景、目标、方法、结果和建议等内容。其六,持续优化。根据分析结果和实际应用情况,对分析过程和模型进行持续优化和改进,以提高数据分析的质量和效果。
(二)制度层面:双向推动与人才培养
数字司法改革需要由顶层统筹推动,遵循“自上而下”的推行进路。司法机关需要整合数据、算法和平台,为数字司法改革打好基础。但数字司法的具体改革方向需要秉持“自下而上”的思路,立足司法实践中的真正需求,从“小切口”入手,推动数字司法的整体变革。当然,数字司法改革的推动依赖数字人才的智识创新,构建数字人才的培养制度是推动数字司法改革的前提。
首先,数字司法改革需要由顶层推动数据、算法和平台的整合。其一,整合司法数据,合理打破数据壁垒、算法壁垒等问题。司法数据主要指在司法过程中形成的,主要由公安、检察、法院等司法机关工作人员获取或录入,由信息化系统承载的、存储在各自数据库中的信息,是司法过程的数据化表现形式。首先,司法机关要努力整合内外基础数据。司法数据主要有以下几种类型:一是以案件基本信息为代表的个案数据;二是以案件流转记录为代表的流程信息;三是以数据报表为代表的整体宏观数据;四是以操作流程留痕为代表的后台信息。除整合内部数据外,现阶段数据共享的对象应为第一类和第二类,第三类也可以共享。
其二,整合各地平台和算法。针对各地算法和平台的开发乱象,应以省级机关为单位,整合各省市所构建的平台和算法。以数字侦查为例,各省级、市级侦查机关都在委托开发各类系统。公安部应牵头统计、整合既有的平台类型、数量、特点及应用情况。同时,应明确由省级以上司法机关牵头开展大型的数字司法模型改革。此处的大型数字司法模型改革主要指开销很大或具有战略性地位的改革项目。此外,这种大型的数字化建模工作应当由省级单位牵头,最高司法机关监督,并由最高司法机关进行试点评估和全国推广。
其次,数字司法改革还要以实践为导向,从“小切口”入手。在司法改革中,“小切口”是一种聚焦于具体、局部问题,以细微、精准的方式推动改革的策略,具有明确性、可行性等优势。“小切口”意味着改革不追求大而全的整体变革,而是着眼于司法实践中某个具体的、较为微观的问题或环节。比如,数字法院建设中建立的“执行完毕未解除限制措施提示”“公告案件送达瑕疵提示”“胜诉当事人诉讼费退还提示”等程序类监督模型,都是“小切口”改革的典型例证。通过对这些具体小问题的有效解决,实现局部的改革突破,进而以点带面,逐步影响和推动整个司法系统的变革和完善。比如在一些基层法院开展刑事案件速裁程序试点,这是一个相对“小切口”的改革举措,但通过在速裁程序上的成功实践,积累经验,为其他案件审理程序的改革以及整个司法效率的提升提供借鉴和示范,最终推动司法体制整体的优化。具体而言,“小切口”式的数字司法改革具有如下优势。
第一,实施可行性。由于“小切口”改革涉及的范围相对较小,复杂性较低,在人力、物力、财力等资源的投入上相对较少,实施难度相对较低。同时,较小的改革范围也使得改革方案的设计和调整更加灵活,能够根据实际情况及时进行优化和完善,增加了改革成功的可能性。
第二,风险可控性。小范围的改革如果出现问题或偏差,所带来的负面影响和风险相对局限,更容易进行纠正和弥补,不会对整个司法系统造成过大的冲击。这为改革提供了一个相对安全的试验环境,有利于在改革过程中积累经验、总结教训,为后续更大范围的改革奠定基础。
第三,社会接受度高。“小切口”改革往往是从解决人民群众最关心、最直接、最现实的司法问题入手,能够让群众在具体的司法实践中快速感受到改革带来的变化和好处,从而更容易得到社会各界的理解和支持,减少改革的阻力,为改革的顺利推进创造良好的社会氛围。
第四,经验可复制性。当“小切口”改革在某个地区或领域取得成功后,其经验和做法具有很强的可复制性和推广价值。此时,可以根据不同地区和司法实践的具体情况,将成功的改革经验进行适当调整和应用,以点带面,推动整个司法系统的改革和发展,实现改革成果的最大化利用。
最后,应加强数字司法人才培养。以数字侦查的人才培养为例,存在以下两种可以并行的方案:其一,在相关院校中,拓展数字相关专业与课程。例如,提倡在高等院校和职业院校中,设置数字侦查、网络犯罪侦查等相关专业,构建完善的课程体系。课程应涵盖计算机科学基础、网络技术、数据挖掘、电子证据分析、犯罪学、侦查学等多领域知识,让学生具备扎实的跨学科知识基础。其二,邀请公安机关、互联网企业、法律机构等具有丰富数字侦查经验的专家学者到学校讲学,分享最新的行业动态、技术手段和实践经验,拓宽学生的视野,使学生了解数字侦查领域的前沿发展趋势。针对已经从事数字侦查工作的人员,应建立完善的继续教育体系,定期开展培训课程和学术交流活动,帮助他们更新知识和技能,跟上数字技术和侦查工作的发展步伐。
(三)规范层面:遵循正当程序的要求
在法律规范层面,数字司法改革需要遵循正当程序的要求。在数字司法改革过程中,要依据正当程序理念,明确数据获取、算法引入、算法启用和数据保存、删除的具体规范。
第一,明确数据获取程序规范。数字司法改革的推进不仅需要挖掘内部数据,还需要从外部获取海量数据。但目前中国法律尚未对侦查机关、检察机关和审判机关的海量数据调取提供明确依据。比如,检察机关在进行数字化建模时,需要从行政机关、法院等调取有效数据。然而,从法律规范上看,检察机关向外部调取数据的行为并无法律依据,这就导致数据获取难的困境,数字检察改革难以开展。其实,侦查机关、检察机关和审判机关向外部调取数据的行为会影响到权力机关的相互关系。法律在明确此类行为的标准和程序时,需要尽量让侦查机关、检察机关和审判机关保持谦抑,在遵循各个机关基本法律定位的前提下,依据比例原则,明确向外部调取数据的标准和程序。除此之外,由于政府、企业、社会组织在大数据赋权、赋能方面存在严重的非均衡性。这些机构往往成为大数据技术的被动接受者,因此,除强化对公民隐私权等基本人权的保障外,还需要加强对这些机构的知情权、表达权、参与权和监督权的保障。
第二,明确算法引入程序规范。在运用人工智能模型进行数字建模时,对于智能算法的引入需要设置明确的标准和程序。具体可从内部和外部两个维度,强化侦查机关、检察机关和审判机关对算法引入的监管。一是内部审批。司法机关内部要建立严格的审批程序,由相关领导和专业委员会对算法进行审查。审查内容包括算法的技术性能、法律合规性、伦理合理性等,确保算法符合司法工作的要求。二是外部备案。将算法的相关信息和审批结果向有关监管部门备案,接受监管部门的监督。监管部门可以对备案的算法进行抽查和检查,确保算法的应用符合法律法规和政策要求。其中,内部审批至关重要,在审批时,应当着重审查如下内容。
首先,评估算法性能。其一,准确性。考察算法在处理司法数据和解决司法问题时的准确程度。例如,对于量刑辅助算法,要评估其给出的量刑建议与实际判决结果的吻合度;对于证据分析算法,要检验其对证据的识别和分析是否准确无误。其二,效率值。考虑算法处理数据的速度和响应时间。在面对大量案件数据和紧急案件时,算法能否快速给出结果至关重要。如在案件管理系统中,算法需要能够快速对案件进行分类和排序,提高案件流转效率。其三,可解释性。选择具有可解释性的算法,以便司法人员理解算法的决策过程和依据。对于影响当事人权利义务的算法结果,如智能裁判算法,司法人员和当事人需要清楚算法是如何得出结论的,确保司法公正和透明。
其次,审查法律合规性与伦理合理性。其一,法律合规性。确保算法的应用符合法律法规的要求。例如,算法不能违反宪法和法律的基本原则,不能侵犯当事人的合法权益,要在法律框架内进行数据收集、处理和算法决策。其二,伦理合理性。考虑算法是否符合伦理道德标准,避免算法产生歧视、偏见等不公正的结果。如在社会危险性风险评估算法中,要防止算法因地域、性别等因素产生不公平的评估结果。
最后,考察供应商与技术支持。其一,供应商信誉。选择具有良好信誉和资质的算法供应商。考察供应商的行业经验、客户评价、成功案例等,确保供应商有能力提供高质量的算法和可靠的服务。其二,技术支持能力。供应商应具备强大的技术支持团队,能够及时解决算法在应用过程中出现的问题。在算法运行过程中,可能会遇到技术故障、性能优化等问题,需要供应商提供及时有效的技术支持。
第三,明确数据保存和删除的程序规范。具体需要从以下三方面入手构建相应的程序规范。首先,需要制定详细的数据分类分级保存制度。依据数据的敏感程度、重要性及与案件的关联程度等因素进行分类分级。如将涉及国家机密、个人隐私、商业秘密的数据列为高等级敏感数据,一般的案件流程信息等列为普通数据。对不同级别的数据设定不同的保存期限和保存条件,高等级敏感数据保存期限可能较短且需更严格的加密存储条件,普通数据可按常规期限和存储方式保存。其次,明确数据删除的触发条件和审批流程。规定在案件审结后超出法定保存期限、数据主体要求删除且符合法律规定、数据已失去保存价值或存在安全风险等情况下,应触发数据删除程序。此外,删除操作需经过严格的审批流程,如由案件承办人提出申请,部门负责人审核,分管领导批准等。最后,建立数据管理责任制度。明确数据管理各环节的责任主体,如数据采集人员、存储管理人员、使用人员等各自的职责,确保数据从收集到删除的全过程都有专人负责,出现问题可追溯问责。这就需要建立数据变更跟踪机制,当数据来源发生变化或数据进行调整时,及时记录变更情况,并对相关分析进行更新,以保证数据的一致性和分析结果的可靠性。
(原文刊载于《数字法学评论》第五辑(2025年第2期))
《数字法治》专题由上海市法学会数字法学研究会特约供稿,专题统筹:秦前松