数字法治|左卫民：大数据时代法学研究的谱系面向：自科法学？_中视智库_中视新媒

作者：左卫民四川大学法学院教授，本文来源于《政法论坛》2022年第6期。

关于法学研究方法、派别的探讨早已有之。自本世纪初苏力将新中国成立以来的法学研究范式归纳为政法法学、诠释法学以及社科法学三大类后，法学界针对研究者所采取的进路与方法的争论大多围绕此展开。随着学术研究的不断成熟、学术市场的需求逐渐变化，政法法学在改革开放后不久便基本退出历史舞台，故当前相关探讨主要集中在后两者。诠释法学(多称法教义学)，根据苏力的总结，其特点是高度关注具体的法律制度和技术问题，注重研究现实法律生活中的法律问题。由于契合特定历史需要，并且具有知识生产、传授成本较低等优势，法教义学在20世纪80年代以后迅速占据了中国法学研究的“大半江山”，影响力持续至今。但受到演绎逻辑的影响，法教义学的盛行也在某种程度上导致了中国法学知识体系的理想化与“元理论”化。

社科法学的出现与法教义学的上述特性有一定的关联。因不满足于演绎或推理，并希冀探索具体的司法过程，部分学者开始将其他社会科学的知识和方法引入法学研究。客观地说，社科法学在中国法学研究范式的发展历程中留下了浓墨重彩的一笔，受到其影响，经验而非规范、田野调查而非逻辑推演逐渐得到了越来越多的关注，深化了学者、决策者甚至是普通公众对中国法律实践的理解。“法律是一种地方性知识”的观点也以一种全新的方式重回大众视野。

随着社科法学的影响不断扩大，进一步的探索开始围绕社科法学的多元化而展开。其中有一个争论就是对与社科法学有着关联的法律实证研究的定位。本质上，法律实证研究是一种以数据分析为中心的经验性研究范式，即通过数据的收集、整理、分析、运用来把握、解读真实的法律实践，从而为法律的修改提供政策建议或依据。在社科法学看来，实证研究方法的兴起不过是其自身分工与研究方法不断细致化以后的结果，有论者直接提出，“实证法律研究不就是......社科法学吗?”事实果真如此吗?这是本文首先要回应的问题。进一步，在司法信息化、公开化程度不断加深的当下，司法大数据已经为实证研究者们所运用，这种大数据法律研究与传统的小数据研究有何异同?这是本文要回答的第二个问题。尔后，随着统计模型、机器学习等自然科学的思想和方法在法律实证研究中应用范围的不断扩大、运用程度持续加深，我们是否可以认为一种名为“自科法学”的新型研究范式正在形成?倘若果真如此，那么“自科法学”未来应该如何发展?这是本文要回答的第三个也是最重要的问题。

一、旧问重提：法律实证研究与社科法学的关系

法律实证研究与社科法学的关系影响到前者是否具有独立的学术地位。在当代中国法律实证研究出现的初期，其不够成熟，多限于对数字、样本简单的列举和分析，专业的学术群体更是尚未形成，远比不上社科法学的欣欣向荣。彼时的学术生态确实容易令人产生实证法学只是社科法学之附庸这样的判断，实际上法律实证研究也往往认同自己属于广义的社科法学范式。但在实证研究已愈发显现出自己独特的学术追求与旨趣、思维方式与研究方法之后，尤其在自然科学与实证研究的融合程度不断加深的当下，法律实证研究已相当程度上区别于社科法学，成为一种独立的研究范式。

（一）从“Empirical”一词谈起

根据《布莱克法律词典》的解释，“Empirical”一词意为“属于、关于或基于经验、实验或观察”(of, Relating to, or based on Experience, Experiment, or Observation)。延伸开来，任何奠基于实践经验之上的法律研究在最宽泛意义上都可以被称为“Empirical Legal Research”。有学者用其概括式地指代偏重量性分析的定量研究和质性分析的定性研究。但“法律实证研究”一词的内涵并非毫无争议，也有学者专以其指代以数据分析为中心的定量研究。笔者认为，真正值得关注的是操作中如何把握这一概念。首先需要解释的是何谓“经验”?在法学研究的语境中，其简单来说就是指研究的出发和归宿都应当确定为客观层面上法律的基本运行状态，以解决实际问题为最大追求。“经验”与“规范”应当并列属于法学研究的本原性概念。既然“经验”是理解“Empirical Legal Research”的核心，那么紧随其后的另一个关键问题则是，如何获取这种经验?社科法学是“经验”的，但这并不意味着法律经验研究等同于社科法学。上个世纪90年代，在以苏力为主要代表的学者推动之下，社会科学包括社会学的知识开始被法学界所接受，学者们对真实的法律运行表现出浓厚兴趣。但社科法学并非单独推动了法律经验研究在中国的形成和发展，因为在社科法学兴起不久，已有学者在实践另一种形式的经验研究——注重定量分析的法律实证研究。例如，刑法学界的白建军教授自90年代后期便开始从事实证研究，这可以说开创了刑事法学领域法律实证研究的先河。

可以看出，社科法学和实证研究在中国的发展具有不同的进路。二者共同点在于它们均推动着中国法学研究从“形而上”向“形而下”转变。有必要说明，虽然社科法学之“社科”是一个较为宽泛的学科领域，但就法学研究而言，最具影响力的可能还是社会学中偏定性的方法，尽管当下的西方社会学研究越来越多地偏向定量研究。正因如此，社科法学长于对个案进行“麻雀解剖式”的具体分析。相比之下，法律实证研究更加追求数据的代表性，因为在这一研究范式看来，只有通过大范围数据的收集和运用，才能较为完整地反映法律制度运作的实际状态，而对于个案的研究，即便细微到无以复加，也难以全面、准确地把握法律活动的真实脉络。

一个值得注意的新趋势是，随着大数据、人工智能等新兴技术的不断发展，一向善于借鉴新事物、新理念的中国法学界迅速将相关理论与方法引入法学研究中，且影响力不断扩大，典型的是“计算法学”成为目前学界炙手可热的话题。对于计算法学的形成与发展，有学者指出，其可以归属为实证法学范畴，是法学实证研究进入大数据时代的产物。逻辑上而言，计算法学应该是一种建立在数理、定量分析基础之上的研究方法，与专注于个案分析的社科法学研究不同。

基于上述分析，笔者认为再次厘清现有概念体系的逻辑关系是必要的。具体而言，法律的经验研究(Empirical Legal Research)应当与专注于理性思辨的法律价值/规范研究并列为法学研究的两大基本范式，社科法学与法律实证研究均属于法律经验研究，前者偏重于质性研究，而后者注重量性分析，两者无法产生简单的包含与被包含关系，具体如下图所示。

图1

（二）“实”而不“证”还是“实”“证”并举？

应当承认，社科法学与法律实证研究之间存在重要差别。对这一差别的厘清有利于我们更加全面地理解当下法学研究格局的整体脉络。简单来说，上述差别主要体现在研究特点的“实”与“证”关系处理上。在社科法学看来，即便社科法学可以包含偏重定性的经验研究与偏重定量的实证研究，但也承认这其中以定性研究为主，定量研究则始终处于边缘地带。例如，侯猛就认为国内的社科法学界，不论是法律经济学还是法律社会学，都以个案见长。当然，这并不足以证成关于社科法学与实证研究划分的合理性。因为关键在于社科法学者如何运用个案呢?

与其他法学研究范式类似，社科法学同样承载着提升中国法治化水平的历史使命。根据社科法学的研究惯习，这一历史使命主要是通过对司法过程中出现的某些具有重大历史或现实意义的个案进行深入分析来完成的。社科法学如何发挥此番功用呢?苏力在阐述社科法学的核心问题时曾指出，社科法学所关心的并不是某一具体的法律概念、法条，而是法律或具体规则与社会生活诸多因素之间的相互影响和制约，注重发现个案“背后”或“内在”的道理。可见，即便是社科法学内部，在关于学科功用的问题上也存在不同声音。

就社科法学善于揭示个案背后某种深刻的原理或具有普适性的原则来说，这一研究方法在推进中国法治化进程中贡献颇大。不过，前引观点实际上已经隐隐约约透露出社科法学以提供“道理”为主。但何谓道理，似乎很难充分明言，因为较之法律原则，它或许更加抽象。社科法学的道理又是从何而来?如前所述，社科法学重视个案在研究中的重要性，如果缺乏典型个案，研究几乎无法开展。然而，个案毕竟只是个案，它所能提供的仅仅只有案件本身，以此为基础展开的分析依赖于研究者本人的理论拓展与延伸，这一过程可能就是社科法学所强调的道理的展现。在笔者看来，所谓的拓展与延伸实际上是研究者想象力的展现。但显而易见，不论是学术直觉抑或想象力，二者在本质上都比较抽象。这也决定了社科法学中道理的作用往往是带给读者某种在智识上“恍然大悟”的愉悦感。

应当说，“实”而不“证”是社科法学最显著特点。社科法学是“经验”的，也是“实”的，但由于建立在想象力与直觉基础上的道理比较抽象，社科法学一些时候是不“证”的或者说是“论而不证”的。这种不“证”主要有两方面原因：一是研究者不愿“证”。陈兴良指出，与法教义学相比，社科法学更多是在整体意义上考察法，或者说它研究的原本便是整体法。笔者以为，即便是与法律实证研究相比，这一见解依然成立。对社科法学来说，尽管切入点通常较为细微，但研究者问题意识往往不是单个或若干法条，而是整部甚至是整个法律体系。这使得社科法学在具备宏大视角的同时，又往往缺乏相对集中的研究焦点。典型体现是，在社科法学研究中，权力、政治、制度等“大词”出现频率较高，但对于何种权力、何种政治、何种制度等问题，研究者不少时候则语焉不详。故此处的不愿“证”，指的是研究者为了保持社科法学的独特性，往往不从微观角度对研究进行经验性的验证。二是研究本身难以“统证”。社科法学的道理不仅抽象，同时也高度个性化。当研究结论几乎完全依靠研究者个人在理论上的延伸与拓展时，结论的正确性至少在研究者设定的语境内得到保证。然而，即便对同一案例，不同研究者由于知识背景、研究旨趣等差异可能也有不同解读，进而可能得出相异甚至完全相反的结论。但不论何种情况，只要未超出研究者安排的逻辑，这种结论始终都是正确的，研究与研究之间无法相互证伪。甚至可以认为，社科法学的某些研究只有信服与不信服的区别。

与社科法学不同，法律实证研究强调“实”“证”并举。在“实”这一层面，二者没有太大差别，均是经验的，关键区别体现在对“证”的态度与具体展开上，主要表现为数据在各自研究中的重要程度，以及是否可以核实数据并根据数据论证或推翻某个学术假说。在笔者看来，数据在社科法学中往往只是一个论证理论主张的依据。苏力认为，统计分析不能代替文字说理，数学往往只是装点，为读者选好实例并说透理更加重要。相比之下，研究者的想象力在法律实证研究中尽管也十分重要——事实上对于任何研究来说想象力都必不可少——但远未达到可以决定研究精彩程度的地步。原因很简单，法律实证研究所给出的道理建基在数据与样本的深度利用(主要是数据使用技术)上。

在具体表现上，法律实证研究与社科法学是相对的。一方面，法律实证研究者愿意“证”。在法律实证研究中，研究者更倾向于通过丰富的数据来强化研究结论的代表性。就研究对象而言，法律实证研究的出发和落脚点均是单个或若干个具体的法律规范，在对这些规范的实际运行情况予以考察后——针对效果不佳的——给出一定的完善意见。至于微观层面上法律规范的运行效果如何说明，研究者则更多以数据阐释来取代理论演绎，这一说明过程便是法律实证研究“证”的表达。另一方面，法律实证研究也是可以“证”的。与社科法学理论建构的高度个性化不同，法律实证研究对于样本的使用虽然可以有多种方式，但基本的数据却是给定的，分析机制是共通的，所得出的结论也将相差无几。一言以蔽之，法律实证研究不仅可以有信服与不信服的区别，研究方法本身也有正确与错误之分。除专业的研究者以外，法律实证研究对于一般读者和司法实务人员来说也是可以证伪或证成的。

需要再次说明，两种研究范式并无优劣之分，其实二者完全可以且事实上往往形成一种合作关系。具体而言，社科法学可以凭借其宏大的理论背景、细致入微的经验分析，从琐碎的“事理”中提炼出“法理”，在整体上指出中国法律制度某一方面的显著特点与不足;而对于法律实证研究来说，社科法学的分析则可以作为问题意识的来源，其所要做的就是将社科法学的分析进行可“证”化处理，并由此介入对具体制度规范的分析。这相当于以一种数据的方式将社科法学的论断予以呈现，同时这也是对社科法学结论正确性的检验。

黄宗智认为，在方法论上，中国领域的研究实际上一直被理论与经验的对立或截然分开所主宰。虽然社科法学与法律实证研究在本质上都是经验的，但前者的经验在向实用主义转换的过程中有时似乎遇到了些许阻挠。其重要原因就在于社科法学研究难以证伪。相比之下，法律实证研究不易存在这一现象，其数理化特征既可以接受评判，在出现错误时也可以被发现并矫正。因此，在持续向现代化法治国家转型的中国，我们尽管需要智识的满足感和愉悦感，但也需要具有现实意义的为改革决策提供的强大经验支撑。换言之，我们当然需要“精彩”，但也需要“有用”。

二、方法论视阈下的法律大数据研究

法律大数据研究是实证研究在近年来发展出的全新形式，它肇始于裁判文书的集中统一上网催生了一些新型法治实践。在此之前，法学研究当中能够以一定规模呈现的数据主要是中央及地方司法机关、统计部门发布的工作报告或各类法律年鉴、统计年鉴等。相较于此类数据，裁判文书上网最大的突破即体现在官方首次以如此之大的规模公开带有结构化、数字化特征的司法文书。在这种情况下，裁判文书网所公开的文书数量以及研究者利用各种手段所获取的文书数量在相当程度上决定了一项研究的规模，而这也直接引发了如下的疑问：司法大数据的出现是否意味着实证研究的价值有了某种客观的评判标准，即是否获取的文书数量越大，则代表性就越强、研究质量越高?

理论上讲，如果我们可以获得全样本的大数据，那么研究本身的质量和研究结论的信度与效度能够得到保障，因为“当样本等于总体时，抽样误差为零。”但这一场景仅仅是“可欲”的，实际上裁判文书网的数据往往不全面且变动不居，甚至会因为公开策略的变化而有所限缩。对此，有学者便直言不讳地指出，目前的法律大数据研究只是一张虚构的“大饼”，对有志于从事相关研究的学者来说，现阶段还只能是“画饼充饥”。实践情况的确如此：虽然裁判文书上网为法律大数据研究带来了前所未有的良机，但实际上能够真正充分、有效利用这一资源的研究仍然有限。

既然裁判文书的获取与使用存在挑战，那么这是否就说明真正意义上的法律大数据研究并不存在呢?笔者以为，这取决于我们如何认识大数据这一概念。白建军认为，大数据并不在于样本绝对量的大小，关键在于“全”。此处的“全”是指研究所采用的数据量对于问题意识来说是“全”的。这提醒我们，一方面，大数据并不一定“大”。以笔者一项针对地方法官遴选机制的研究为例，虽然样本仅有不到6000名的员额法官，但仍足以为我们提供一个观察窗口，发现遴选过程中的某些根深蒂固的惯习与权力逻辑以及法官遴选机制所存在的不足。很显然，从数据量角度来看，不到6000例的样本难以称之为大数据，但就研究的问题而言，它就是一个“全”数据。另一方面，大体量数据并不一定就是好数据。程金华指出，裁判文书网虽然能让我们得到海量信息，但未必能得到科学的信息。除裁判文书缺失外，文书本身的结构化不足也在一定程度上影响了样本数据的信度。由此可见，数据量是否庞大与真正意义上的大数据研究之间并不存在必然、直接的联系。采用大数据方法的研究在质量上未必就能得到很好保障，问题的关键在于所选取的数据是否能够满足研究所需。

然而，在主张研究者对于大数据研究方法的认识应当进行“降温”的同时，不得不承认的是：当下研究样本的体量早已超出了此前的任何一个时期，正在不可逆转地向“海量级”发展。这自然就产生了另一个问题：数据量越大，完全依靠人工进行分析的可能性就越小，这是否意味着传统的实证研究将不再受到重视，甚至没有生存空间?

所谓传统的实证研究方法，是指研究者对有限的数据进行基于人力计算的整理、分类与分析。在某种程度上，也可以简单地认为传统实证研究实际上往往就是小数据研究。其并未失去价值。首先，选择何种研究方法，应当由研究任务决定。当下中国法学研究的根本目的之一仍然是客观了解法律实践。虽然数据量的大幅提高的确有可能加深或者扩展这一认识实践的过程，但如前所述，大数据法律研究也面临着包括数据失真等一系列问题，这将在一定程度上阻碍这一进程的深入。我们应当关注数据量是否契合研究的问题意识，小数据也有可能产生大数据或“全”数据的研究价值。其次，在数据利用的主动性上，传统定量研究要远远强于大数据研究。表面上，大数据技术似乎有着无与伦比的数据利用能力，但从另一个方面来讲，大数据方法又是被动的，因其只能等待特定量的数据生成后才能开启后续的处理;而研究者本身无法介入数据的生成过程——即便是大数据所引以为傲的预测功能也需要建立在这一基础之上。相比之下，传统实证研究往往拥有较高的数据利用主动性，可以依照研究者的需要“定制”数据。当然，此处的“定制”绝非按照既定结论收集数据加以“验证”，而是指研究者可以针对特定问题，有目的、有方向地主动获取高质量的信息数据。不仅如此，大数据法律研究与传统实证研究的重要区别在于它们对如下关键问题的回答不同，即因果关系还是相关关系。简言之，大数据法律研究偏重的是分析变量与变量、变量与结论之间是否具有统计学意义上的相关性(尽管有的研究者也倡导依据大数据的因果分析，但笔者对此有所保留)。而传统的小数据实证研究则更加注重——从一个发生学的角度——对各种社会、法律现象及其生成原因展开深入探究。

需要指出，挖掘并展现事物之间的相关关系似乎是大数据技术天生的优势。对此，国外有学者认为在相关关系的帮助下，通过探求“是什么”而不是“为什么”，我们可以更好地了解这个世界，而这一切又是以人类进入大数据时代为前提。但从另一个层面来说，当样本量被几何级放大后，寻找特定对象之间的相关关系原本便不是一件十分困难的事情。在特定情况下，相关关系甚至有可能因为样本量的放大而被“创造”出来。有学者便指出，在数据库中，由于数据量十分庞大，通常很容易得出统计意义显著的回归系数，但这并不代表两个变量之间就存在因果关系。例如，大数据分析很可能会告诉我们，2006-2011年，美国的谋杀率与微软公司的IE浏览器的市场份额密切相关，因为二者都呈现一个急剧下降的趋势，但两者之间实际上并没有任何因果关系。

王天思认为，对因素产生相互作用之前的相关关系进行分析固然重要，但在因素分析的基础上深化到相互作用过程的因果分析，仍然在人类认识的深化中具有更为重要的地位。在法学领域，这一结论同样适用，因为至少对于当下的中国法学研究而言，探求各类法治问题的成因并提供相应解决方案，显然有着不可置疑的地位——我们更需要追问“为什么”。由于在数据利用上的相对被动，大数据法律研究产生于大数据，同时也受限于大数据。特别是当大数据被想当然地赋予全样本特点进而可以避免因样本不足所带来的置信度问题以后，研究者们可能就放弃了进一步理论阐析的努力。

在小数据研究中，对于因果关系的追寻显然更易受到关注。可以说，归纳并分析原因与结果之间的相互作用过程是传统实证研究一个重要目的，也是其魅力所在。传统实证研究寻求因果关系分析的原因是多方面的。一方面，传统实证研究是一种关于解释的研究范式，“当我们想要解释一个事件时，自然是期望找到该事件的原因。解释只能是因果式的表述，这使得仅仅使用相关关系对解释不会有所帮助。”其遵循一种从“问题到数据”的进路，所得出的结论往往也是对问题的直接解释。另一方面，传统实证研究对于数据利用的精确性要求也能够分析因果关系。大数据时代数据量的庞大在某种程度上意味着数据的混杂，这使得大数据研究方法只能在这些庞杂的数据中寻找相关性的蛛丝马迹。相比之下，传统实证研究所选取的样本是在特定、细微的问题意识的引导下，经过仔细筛选的精细化、小范围数据，更可能探求因果关系。

尽管因果关系与相关关系存在区别，但笔者的目的并非给出一个孰优孰劣的主观判断。恰恰相反，笔者始终认为，在贴近中国法律实践、解决中国法律问题的过程中，不论是因果关系还是相关关系，我们都不能偏废。诚如有学者所言，虽然因果关系是人类理性行为与活动的基本依据，我们本身不可能否定它，但大数据技术所更易凸显的相关关系，的确也在实践层面推进了我们对传统因果概念的深入反思。但随着大数据概念的愈发炙热，基于大数据的相关性分析有遮盖因果关系之势。典型表现为，一些大数据研究在认为或者发现变量之间存在相关性以后，便直接对某一问题得出肯定或否定的结论，而有意或无意忽略了对社会背景的分析，即认为“只要有了足够的数据，数字本身便可以说明一切。”然而，不假思索的大数据分析得到的变量之间的相关性有可能是假相关，有些时候可能只是巧合。实质上，不管数据多大，只要没有理性的设计、控制和分析，结论都可能出错。

三、昙花一现还是未来主流：“自科法学”的发展前瞻

吉登斯曾言：“现代性以前所未有的方式把我们抛离了所有类型的社会秩序的轨道，从而形成了其生活形态。在外延和内涵方面，现代性卷入的变革比过往时代的绝大多数变迁特性都更加意义深远。”这种现代性的影响在法学研究领域表现得尤为明显：本世纪头十年，大数据对于法学界来说几乎是完全陌生的，但如今大数据技术与法律研究的融合已经似乎成为不可逆转的新趋势，并产生了一些研究成果。同时，诸如机器学习、语义识别、社会科学实验等自然科学或计算机科学领域的知识与方法涌入法学研究当中，并逐渐形成了相应的学术团体。

目前来看，法学与其他学科的交融似乎开始由社会科学扩张到自然科学。这种交融的产物似乎可与社科法学相对应地称之为“自科法学”，即运用自然科学的思维方法以及技术，特别是统计学、数据科学等来研究法律问题与现象的法学研究范式。毫无疑问，“自科法学”是当下法学研究领域开始出现的新趋势，远未充分展开，本文的研究也是探索性、框架性的。其中有两个问题值得思考：第一，“自科法学”是否会昙花一现，还是有可能成为未来法学研究的重要方向?第二，如果“自科法学”的研究进路想要进入主流，努力方向又是什么?对此，下文着重以两个方面的分析来回应。

（一）

已有学者探讨了关联于“自科法学”的问题。如有学者在论述人工智能法学发展现状时曾提出，领域名称的不统一是一个亟待解决的问题，因为目前尚未出现一个特别具有涵括力的概念能够得到研究主体的一致认可——至少有大数据与人工智能法学、计算法学等多元化称谓。在笔者看来，采用上述任一概念都无法周延地涵盖相关领域最新发展趋势，人工智能法学实际上不单单是人工智能技术在法学研究中的运用，它同时还牵涉到多个领域的专业技术与知识。同样的道理，计算法学等概念在周延性上亦值得推敲。鉴于我们面临的是作为典型社会科学的法律研究与自然科学之间不断交融、产生勾连的整体趋势，因此我们应当站在全局角度看待法学研究领域出现的这种变化，就此而言，笔者所提出的“自科法学”便不单纯是一种研究方法，更是对上述学科交融趋势的涵括。

需要指出，如果说社科法学的出现是为了使法学研究“经验化”，那么“自科法学”则是在此基础上为了法学研究的“科学化”。如何科学化呢?有学者指出，计量法学、计算法学等都是法律与技术密切化的一种体现，均尝试用客观的标准减少法律体系中的主观性、增强科学性，都对法律系统的科学化产生了积极意义。值得注意的是，这种科学化的探索在司法领域较丰富。例如，李学尧与刘庄使用实验方法发现法律人的司法判决说理可以被称为一种“矫饰的技术”。又如，唐应茂等人采用实验方法分析了庭审直播对于审判活动的影响。应当承认，上述尝试对于推动法学研究科学化具有一定作用。

有论者指出，在大数据的时代背景下，大数据所要进入的应是一个能够尽可能数学化表达的法学，而非主要依赖传统分析方法的法学。自然科学之所以在客观性、准确性等方面相对于社会科学有优势，原因在于如果把握得当，一些问题、概念以及原则都可以适当简化为数字或公式，再将不同的变量套嵌入后科学分析即可得到相应结论。相反，传统的法律研究方法以文字描述为主，这种基于主观认识的描述时常是高度个性化的，同样的问题在不同学者那里很可能得出截然相反的结论。这使得有关法律问题的描述有时很难在研究者当中顺畅“流通”，甚至在某些基本问题上都难以取得共识。当然，这也与自然科学与社会科学在研究性质上的差异有关：前者在具备条件的情况下可以多次地重现特定的实验环境，以对某一结论进行验证;对于后者来说，要重现特定环境则困难重重。

在笔者看来，所谓的“自科法学”，首先包含思维理念的变革。即这种新的法学研究范式看问题的理念，不是简单借助统计工具解决传统法学研究的问题。其力图打造具有科学思维属性的法学知识，在逻辑和实验的二元结构下建立法学研究体系。需要指出，“自科法学”并不意味着要对法学研究进行完全的数字化、公式化处理——这既无可能，也无必要，而是要将法律问题当中的适宜部分——法律经验现象——转化为可供识别甚至可以客观计算的符号，代入所建立的模型进行计算机或人工运算，以尽可能地消除这一过程中由研究者主观认知所带来的影响。季卫东认为，在数据资料呈几何级增加的当下，利用数学模型、统计学知识以及算法等在复杂性中寻找最优或者次优的解答，从而为决策提供客观的科学根据就是政治算术的应有之意。季卫东的观点在一定程度上涉及“自科法学”的核心要义，即将运行于研究者主观世界中的逻辑推演、概念演绎转变为可视化、类似于解决算术题的过程。国内有学者将这一过程概括为是继物理计算、生物计算以后的“社会计算”，并认为其完全有可能成为科学计算研发的新焦点。

其次，“自科法学”强调法学研究的证伪思维，这也是“自科法学”关键功能之一。当下法学研究的问题意识主要来源于两个方面：一是源于书斋，根据逻辑推演或域外经验判定法律实践中的某一现象应当成为法学研究的“问题”;二是走向实践，通过数据收集、田野调查等方法获得启发。从表面上来看，通过亲历式、经验式的途径发现的问题通常有着较高的可靠度。但由于这种经验是研究者个人在调查中形成的，必然受到能力与条件的限制，且往往依靠的是研究者的主观判断，这其中也不可避免地存在“伪问题”。就此而言，“自科法学”价值即在于对理论问题进行去伪存真，因为“自科法学”在借助数学、统计学、计算机科学等学科方法的帮助下，可以尽可能地排除研究者个人的主观影响;同时也可以利用适当数据来判断某一法律问题究竟只是局部、偶然现象还是制度流弊，从而帮助研究者证伪。“自科法学”不仅倾向于收集、利用代表性更强的广域数据，而且注重对未来的科学预测，即通过特定的统计模型、机器分析等手段来评估研究结论或改革方案可能造成的后果与取得的成效。在笔者看来，这种前瞻性的研究显然有意义，因为改革资源的有限和法律制度运行稳定性的追求势必要求决策者只能挑选最有可能实现事半功倍或至少“收支平衡”的方案进行试验。对此，“自科法学”即相当于一次初步但精确的筛选，有能力为决策者挑选最具有现实价值的改革方案。换言之，我们可以将“自科法学”视为一场研究范式革命，它将一改以往社会科学以理论假设驱动为根本的研究特点，在其中加入数据驱动元素，形成“数据驱动+理论假设驱动”的新范式，最终实现法学研究由“软科学”向“硬科学”的转变。

“自科法学”的发展对于传统法律分析方法可能会造成一定冲击，原本长于感性思考与概念推演的法学研究者可以关注这一潮流。从法律体系角度来说，科学特别是数字技术具有创新性强、更新迭代快的特征，而这又将与前者的相对稳定性产生冲突。但我们更应当看到的是“自科法学”为法学研究转型所带来的契机。具体而言，“自科法学”的价值至少体现在以下两方面。

首先，“自科法学”可能解决法律分析语义模糊、主观化倾向明显的固有问题。有论者指出，法学表达数学化可以尽可能地将法学从过度的价值判断、修辞依赖与变量任意处理中解放出来，从而促进更为科学的法治实现。笔者虽然不太赞同“法学表达数学化”这一提法，但也承认过度主观倾向化的表达与分析对于法学研究的发展并无助益，甚至有可能加深法学研究群体内部的“裂痕”。因为一些法学观点之争的本质其实只是提法或表达的不同，而学者给出的“解决方案”也大多局限于表述上的调整。“自科法学”的提出并非是为了在形式上创造一种新的法学研究范式，而是意在促进法学研究“通约化”程度的提高，减少由于无必要的个体化表达而造成学术交流之间的堵塞。

其次，“自科法学”的发展可以强化理论研究的“实用性”。新文科是数字社会时代学科建设与发展的重点路径，在笔者看来，新文科的“新”虽然有多个角度的解释，但就法学研究而言其中最为根本的一个方面在于强调法学研究解决法治问题的能力之“新”。然而，就当下整体情况来看，法律的学术研究能对此产生的实际贡献有限。这是因为理论研究或许在逻辑层面上是自洽的，但时常无法转化为具有执行力的操作方案。对于决策层而言，更希望看到的是有关“怎么办”的回答，而非“是什么”或“为什么”的叙述。在“怎么办”这一问题上，传统法学研究大多数情况下只能给出基于研究者主观思考的大致意见，但时常难以回答诸如改革范围应当如何确定、改革应当如何开展、改革所产生的可能后果等需要基于中立、严格评估才能给出答案的问题。可以认为，当下的法学理论较为欠缺基于“数目字”的研究能力，而这又恰恰是“自科法学”所擅长的，即通过提升法学研究数目字化的程度来强化理论研究成果的说服力，最终提高法学理论研究为解决实际法治问题的能力。

（二）在技术与思想之间：“自科法学”的未来

“自科法学”依赖信息技术，而法学研究者对自然科学包括计算机科学往往是“知其然，而不知其所以然”，这种智识上的模糊可能会催生牵强附会的所谓“自科法学产品”。在笔者看来，“自科法学”需要谨慎地处理好“技术”与“思想”之间的关系，研究者只有在二者之间求得平衡，才能使“自科法学”成为法学研究格局中的“新势力”。

1.技术：增强“自科法学”的实质科学性

囿于既往教育，大多数法律人无法与技术人员进行充分的对话和沟通，这造成了不少问题。如在司法人工智能设计中法律人的参与度较为有限，最终也限制了司法人工智能产品效果的发挥。在教育深层之处，还隐藏着固有的对于法学与自然科学的割裂认知，即二者被视为相互隔绝的两块领地，一些学者对在法学研究中融入自然科学元素有所抗拒。就“自科法学”的未来发展而言，紧迫的任务是提升研究群体在知识与技术上与自然科学的融贯程度，特别是把握通过数据科学的成熟技术展开法律研究的能力。换言之，“自科法学”研究者需要真正掌握并利用相应的信息技术手段，从而生产有实际价值的学术成果。实际上，上述现象与长期的文理分科有关，当下提倡学科交叉包括新文科，其实有补救之感，即法学教育本身就需要科学化。

应当追问，当下“自科法学”研究中亟待解决的瓶颈问题是什么?有学者指出，当下法律模型对处理简单明确的法律关系效果较好，但在司法预测等涉及诸多因素的复杂事物中则表现欠佳，并认为其中的原因有三：一是法律数据结构不规则;二是模型生产的结论不具有解释性;三是司法判定理由的开放性与计算机系统、语言的封闭性产生冲突。换言之，目前“自科法学”仅能产出变量关系简单的产品，无法应对综合性更强的法律现象。笔者大致赞同这种见解，但同时认为，自科法学不仅是数据问题，更主要是法学本身的思维范式问题，当然也有法学的价值判断如何量化的问题，人们看重的文本挖掘的困难其实只是技术层面的问题。至于上述法律关系与自然科学模型的实际契合度不够，则可以被一并归结为法律语言的表达问题。

值得注意的是，纸面上的文字转化仅仅只是法律语言表达问题的一个方面，真正考验“自科法学”的是相对抽象的法律价值评价标准的自动化问题。从逻辑上来说，在将法律现象转化为机器语言以后，需要提供计算机或法律模型一个参考规则，使其能够根据参考规则确定的标准来自动识别应当在何种情况下作出何种判定。笔者以为，在纯人工分析中，法律标准的选择适用依靠裁判者的主观价值分析，如何让机器或模型来替代人力完成这一任务是极具挑战性的，甚至在许多疑难案件的事实认定或法律裁判中几无可能：因为“硅基”智能能否把握乃至超越“碳基”人类实在是未定之数。有学者认为，“大数据无论多么全面，它只能记录人的行为，不能确切描述人的思维。”在笔者看来，强求计算机去描述人的思维固然不太现实，但这并不意味着计算机完全无法模拟人的思维，特别是在事实清楚的前提下，把握并适用边界明确的法律规则是可欲可为的。由于模拟所依赖的是计算机基于大量经验数据进行机器学习后的成果，其成功模拟是可能的，原因大致有两方面：第一，现行的法律评价标准已经存在基本框架，这意味着即便法律现象复杂，大体上仍然可以套用现有的框架，游离在框架之外的特殊性问题相对来说只是少数。因此，这在一定程度上缩小了机器学习的任务范围。第二，机器学习所依据的都是业已形成的数据材料，对此类材料的分析学习并不涉及价值判断，我们所要做的就是“投喂”给机器尽可能多的样本，使其不断掌握各种简单、复杂的情况，进而提高拟合度。概言之，“自科法学”下一步的研究重点应该是开拓并夯实其中的计算机认知功能，通过模拟法律人的认知思维来提高智能系统理解法律数据、开展逻辑思维和进行自我学习的能力。

显然，传统自然科学、人文科学、社会科学对于“人”“事”“物”研究相互独立的局面已经脱节于时代步伐，破除文科与自然科学之间的壁垒，实现二者的交融发展已经成为必然趋势。“自科法学”的当务之急是强化现有研究者对于自然科学、信息技术的运用能力，但从长远来看，我们更需要不断扩大“自科法学”在法学研究领域的影响力，而这又有赖于学科之间的深度交流。例如，中国计算机学会便于2021年10月成立了计算法学行业分会，并举办了首届计算法学研讨会。毋庸讳言，这种通过为不同学科的学者搭建交流平台的举措是促进法学与自然科学深度融贯的良好途径。

2.思想：避开技术至上的陷阱

技术不是万能的。对于“自科法学”的发展而言，我们必须清醒地认识到，技术永远无法取代人的思想，过分强调技术的作用与价值，很容易陷入一种技术主义的陷阱，并最终导致这一学科的发展走向末路。从表面上来看，是人类进入大数据时代以后才促成了“自科法学”的出现。然而，进一步思考会发现，法律人的需求才是这一全新研究范式形成的原因。具体而言，随着社会条件与法律现象日趋复杂化，处理法律问题的成本已非人力所能承担，因此，不得不借助自然科学技术来描述和分析法律现象，以补足人力所不能的缺憾，最终使处理问题的逻辑清晰化。

需要指出，虽然计算机系统可以模拟人的思维进行“仿生”运算，但模拟毕竟只是模拟，无法也不应等同于人的创造性思考。申卫星认为，法律实践需求的提炼是保障计算技术能够在法律领域得到科学且规范应用的重要条件之一。单就精准度而论，“自科法学”可以努力，这种一般基于相关性分析的大规模演算、归纳以及汇总能力是人类所无法企及的。然而，我们一旦将是否契合法律发展的实践需求这一变量引入，就会发现单纯的精准度并非我们唯一所需。换言之，精准的并不一定就是正确的。以司法裁判为例，至少在中国语境下，判决结果不仅要符合“制度之法”，同时也要对勘“观念之法”“实践之法”，而将后者完全交由计算机系统来完成，显然是不切实际的。因此，在“自科法学”的发展中，偏重于相关性分析的问题无法克服。要避开这种技术主义的陷阱，可能较为可行的策略是保持法律人的创造性思想，并扩大其在技术运用中的作用。

“自科法学”研究者需要谨记，对于真实法律世界的人文关怀永远是法学研究的第一追求。“自科法学”所产出的，应当是“有温度”的产品，而非冷冰冰的数据。我们应当不断开发并利用“自科法学”的优势，但同时又应清醒认识到，信息与技术只是工具，而非目的，当中的逻辑也与“大数据还是小数据”这一问题的答案遥相呼应。近年来，“自科法学”凭借其诸多优势，开始吸引了法律人的眼球，并在法学研究领域崭露头角，但这种优势同时也极具迷惑性——优势之下是随处可见的技术至上的陷阱。在此前研究中，笔者指出，对于人性的关切是立法产品得到司法人员遵守的首要前提，未来不论是立法还是理论研究均应转向一种主体式的发展进路。否则，实务与理论最终都有可能成为“镜中花、水中月”。对于“自科法学”来说又何尝不是如此?即便法律计算系统的精准度得到持续提升，运算能力大幅增强，最终所给出的也仅仅只是“should be”式的结果。如何从“should be”转化成“could be”，仍然需要重视法律人传统逻辑思维的作用，强调主体性与人性的关键价值。

“自科法学”的发展还需要注意诸多问题，如“算法黑箱”(Algorithm Black Boxes)、实验伦理危机等。可以说，在任何一个问题的应对上，“自科法学”稍有不慎便有可能导致学科发展走向歧途。在笔者看来，处理好这些问题的关键依然是尊重法律人的思想在法律计算当中的主导地位。前述问题实际上也是技术主义陷阱的不同表征而已，因为一旦形成技术万能主义的思维模式，我们很容易忽略技术本身所存在的纰漏，而只有充满人性温度的思考才能照亮接连不断的陷阱。

结语

从大历史角度看，中国法学研究格局无疑正在变得愈发复杂，凭借传统、单一概念早已无法概括层出不穷的研究范式。在新名词、新技术不断涌现的当下，游走于其间的研究者很容易失去方向感，这也导致学科归属之争接连不断。毋庸讳言，这种争论对于实现法学服务法治的根本目的来说意义有限。本文虽然重提社科法学、实证研究等概念，并提出尝试性、框架性的“自科法学”这一新范畴，但无意介入绵绵不休的学科之争。因为本文的“理论红线”始终都明朗：学科与学科、研究范式与研究范式之间或许存在程度不一的差别，但对于研究者来说，如何将理论研究成果转化为具有现实意义的法治生产力才是根本使命。在向现代法治国家转型的过程中，我们的身份并无差别——都是需要砥砺前行，为实现法治国家的目标而贡献自己绵薄之力的法律人而已。“自科法学”的未来如何?这取决于是否有一批创造性的交叉学科研究者持续奉献与努力。就让我们拭目以待吧。

《数字法治》专题由华东政法大学数字法治研究院供稿。专题统筹：秦前松

• 中国实践智库丨徐汉明伊力夏提·艾合麦提：中华	• 中国实践智库｜秦前红：现有备案审查规定难承其
• 中国实践智库｜徐汉明教授团队撰写的“推动司法	• 双节送祝福！中国实践智库融媒矩阵祝全国人民中
• 中国实践智库｜徐汉明：提升社会治理法治化水平	• 深度剖析：为什么说坚决反对和抵制西方“宪政”
• 聚焦国内首部社会治理法学教材：《社会治理法学	• 聚焦国内首部社会治理法学教材：《社会治理法学
• 聚焦国内首部社会治理法学教材：《社会治理法学	• 海华法务参考：加强环境资源保护大环境下关于“