量刑前沿

彭雅丽:量刑指导意见的司法实践与重构

来源:《法学研究》2021年第4期,第171-189页。 发布时间:2021-09-01 01:51

  自20世纪70年代弗兰克尔法官指出“量刑无法”的问题以来,各国在量刑规范化上做出了积极尝试。其中,美国明尼苏达州首先采用表格式量刑指南的形式,限制法官的裁量权。我国的量刑实体改革主要采用了量刑指导这一形式。2010年《人民法院量刑指导意见(试行)》标志着我国量刑规范化的全面推进。近年来,量刑指导意见虽几经修正,但其内容仍饱受学者诟病。

  刑罚立法是刑事立法必须考虑的一个基本方面,量刑指导意见作为刑罚立法的重要补充,其制定及适用是制定机关和学者都应当仔细研究的问题。这首先当然是一个法教义学问题,但却无法仅凭法教义学就能够解决。量刑指导意见有没有效果、有什么样的效果,只有实证研究才能给出答案。有了答案之后,法教义学改进量刑指导意见的看法才有了根基。另外,法教义学的有关主张无法脱离立法技术或规范制度技术而径直被成文法或规范性文件吸纳。因而,改进量刑指导意见,不仅要讨论“道”即法教义学,也要研究“术”即规范制定技术。在这一问题上,借鉴域外立法是有益的。

  就量刑指导意见的实际效果以及如何改进量刑指导意见这两个问题,本文试图通过定量研究和比较研究的方法,为已有研究提供一些补充性的和实用性的知识。本文的结构安排如下:(1)讨论量刑指导意见的实践问题以及重构困境,并引出本文所采用的方法论。(2)列明研究假设、数据与方法。(3)报告线性回归的结果,同时归纳总结量刑指导意见在具体适用上的问题。(4)对这些问题背后的结构性缺陷进行反思,并在比较研究的基础上提出重构的建议。(5)对整篇文章作简短总结,呼吁学界作更深入的研究。

  一、实践问题、重构困境与研究方法

  (一)实践问题与定量研究

  目前,关于量刑指导意见的实际效果,存在两个主要问题:一是它到底有没有效果;二是如果有效果,有没有一些副作用。毕竟,量刑指导或量刑指南存在一些宏观上的通病。其一,难以完全解决量刑失衡的问题。虽然相比起没有量刑指导或量刑指南的无序状态,指导或指南几乎确定能够提高量刑的一致性,但其本身存在应用上的问题以及深层次矛盾。比如,“一些法院或者法官对《意见》的内容和精神理解的不够透彻,在实践中不免出现了这样那样的问题。其中,既有对‘定性定量法’运用不当的问题,也有机械量刑、‘数字化’量刑的问题”。更深层次的矛盾是,量刑的目标是同案同判且异案异判,二者缺一则难言均衡,但量刑指导或量刑指南在一个方面的改进,往往意味着另一个方面的牺牲。例如,明尼苏达州式的表格法量刑指南对法官的限制较多,在促进同案同判的同时,也降低了异案异判的可能。过高的审判确定性,也使美国检察官在辩诉交易中获得了不必要的优势。然而,一旦放松对法官的制约,必然会放大同案不同判的问题。因此,量刑指导或量刑指南的制定者必须小心地在这二者之间寻找适当的平衡。在这一维度上,我国量刑指导意见的实际效果仍有待考察。

  其二,量刑指导或量刑指南可能实质上助长重刑主义。在美国,这主要体现在监禁率的提高上。实证研究表明,一些州的量刑指南恶化了过度监禁的问题。在英国,暴行罪的量刑指南公布后,对其的跟踪研究发现该罪的平均刑期显著提高。另外,量刑指导或量刑指南的制定依据若是既有的量刑实践,则可能吸收“沉疴”,阻碍未来的刑罚轻缓化。

  在上述通病之外,学界从量刑指导意见的内容出发,指出了我国特有的技术层面的问题。首先,在量刑基准上,由于目前的指导意见在量刑起点上主张“幅的理论”,法官难以准确把握量刑起点。其次,在量刑情节的确定与整理上,指导意见简单地按量刑情节的宽严进行分类和排列,法官对情节只能“同向相加、逆向相减”,在某些情节上“部分连乘、部分相加减”,而不区分责任刑情节和预防刑情节。

  那么,我国量刑指导意见对量刑均衡和重刑主义的实际作用是什么?一些缺憾能否通过技术调整加以解决?这些问题,都需要进一步的实证研究。但遗憾的是,我国在官方层面并未对量刑指导意见的实际效果进行公开的跟踪研究。与此形成对比,英国明确规定,量刑委员会的重要职责是监督量刑指南的实施和效果。实际上,英国对每一罪行的量刑指南都提供了相应的评估报告。量刑指南的发源地美国明尼苏达州,也会每年对该年度的量刑实践进行梳理。

  同时,我国学界也缺乏对量刑指导意见实施效果的实证研究。现有围绕量刑的研究,多是针对某个具体罪名量刑实践的检讨。在为数不多的文献中,对量刑指导意见作用的实证评估,一是通过走访调研,形成比较直觉的认识。但这种方法更侧重学者的主观感受,可能存在较大的个人偏误,因而难以成为有力的证据。二是通过实证研究探究结果类指标,比较典型的如被告人最终的宣告刑是否在量刑指导意见所容许的幅度内,即考察合规率。这种方法是英美评估量刑指南的重要办法,但并不适合我国。

  若将量刑过程想象成一个包含自变量、因变量和算法的公式,我国的量刑指导意见相较英美量刑指南有明显的区别。美国的表格式量刑指南针对各罪行等级,根据横轴(累犯分数)与纵轴(罪行轻重)给出量刑结果,直接提供了自变量和因变量。英国根据各具体罪行提供量刑指南,在这些指南的步骤一中提供自变量(应该考虑的量刑情节)以区分罪行轻重,并在步骤二中提供各类别的量刑表。综而言之,英国也提供了自变量和因变量。区别于英美,我国量刑指导意见并不提供因变量,而是提供了自变量(常见量刑情节)及算法(基于量刑情节所能调整的幅度)。

  由于英美并不对算法进行规制,法官只能对量刑情节进行整体考量,所以研究者难以定量地区分各量刑情节的作用,只能以合规率为标准来确定量刑实践是否符合量刑指南。但是,由于我国量刑指导意见提供了明确的算法,定量地研究指导意见的作用机制,成为了一条切实可行的路径,也是更优越的路径。这是因为,在我国语境下仍使用合规率作为评估标准,存在两个问题:其一,由于量刑情节上机械的“同向相加、逆向相减(部分连乘)”并不符合学界在规范上要求责任刑作为量刑上限的共识,所以作为合规率评价基础的量刑标准本身就存在纰漏。简言之,更高的合规率并不一定意味着更优的量刑。其二,这种方法只能比较量刑结果,而无法解释量刑过程。它无法回答是什么在影响着合规率,量刑指导意见的作用机制仍然像是一个“黑匣子”,这种方法无法提供进一步改善量刑指导意见的重要信息。

  由此,本文针对司法实践如何应用量刑指导意见这一问题,使用定量的回归分析模型,辅以对广州市基层法院法官的访谈,探究量刑指导意见的作用机制。与过往的评估路径不同,本文并不探究最终的合规率。本文关注的是,指导意见所规定的量刑情节在实践中如何影响量刑过程。这种方法可以直观地揭示量刑指导意见的具体效果,更好地判断法官量刑实践的优劣。

  值得一提的是,在认罪认罚从宽制度背景下,检察官的量刑建议权得到了进一步凸显。2021年最新修订的《关于常见犯罪的量刑指导意见(试行)》由最高人民法院、最高人民检察院联合印发,通知中明确规定各级检察院对于符合规范范围的23种常见犯罪的量刑应当按照该意见提出量刑建议。因此,研究量刑指导意见的作用机制,也有利于未来更好地规范检察院的量刑建议工作。

  (二)重构困境与比较研究

  量刑指导意见面临的重构困境是,学界的争鸣似乎对意见的修正并无影响。量刑基准问题是指导意见需要解决的重要问题,本文以这一问题为例说明学界影响实务的难度。学界过往对量刑基准问题有两种研究路径。实证研究者希望通过定量研究,从司法实践中直接归纳出量刑基准。然而,实然并不当然代表应然。在美国明尼苏达州确定其量刑指南时,过往的量刑实践并未发挥作用;其纯粹从公共政策出发,平地起高楼般地建立了一套全新的量刑体系。再者,确定量刑基准的标准(量刑均值、量刑中值、其他值)并无定论。因此,量刑指导意见难以将实证研究成果纳入体系。相较之下,法教义学者希望通过论理演绎式地对量刑基准提供指导。由于量刑基准理论本身就是一个舶来品,法教义学的研究在一定程度上有比较研究的成分,不过其并不探讨立法技术或规范制定技术,而仅借鉴理论。但是,法学理论的较量往往少有结果,因此相关理论难以被量刑指导意见所采纳。责任刑到底应当是一个范围(幅的理论)还是一个点(点的理论), 如何对“幅的理论”和“点的理论”进行调和,“相关理论比较烦琐,与实践不能很好对接。”或许正是因为这样,目前的量刑指导意见与学界的研究存在较大脱节。

  在具备司法实践信息的基础上,本文通过与英美量刑指南立法技术的比较研究,尝试打破上述僵局。这一尝试的贡献有两个方面:其一,通过比较研究,提供能够被量刑指导意见直接吸收的规范制定技术。其二,根据定量研究所展现的司法实践情况,选择当下最能解决实践问题的理论。

  需要明确的是,英美在改进量刑指南上与我国处于不同阶段。英美量刑指南的改进,更多是在具体问题上“小修小补”,使其更精致、更准确。例如,英国量刑委员会在2011年对因走私毒品而被监禁的女性犯罪人(典型如人体藏毒者)进行了访谈。通过对这些犯罪人的形象刻画,让她们讲述自己的故事以及犯罪原因,量刑委员会决定降低该类犯罪人的刑期。然而,我国的量刑指导意见尚有结构性调整的空间。基于这种考虑,本文侧重对英美立法技术的借鉴,而非量刑指导或量刑指南本身的比较。

  本文选择盗窃罪作为研究的切入点。选择盗窃罪,是因为:其一,盗窃罪的发案率在我国刑事案件中高居前列,对盗窃罪的量刑实践进行实证研究,具有相当的代表性。其二,在实证研究上,盗窃罪具备特别的优势。为了准确探究各情节与量刑之间的关系,需要尽可能控制其他因素。而盗窃罪中,盗窃数额是相当精确的量化指标;同时,盗窃罪的案情也相对简单。其三,盗窃罪样本在罪质和刑罚上存在人为缺失、错误的情况很少,如有疏漏,更大可能是源于裁判文书上传的误差。因而,该类案件样本较其他样本(如中国裁判文书网上的死刑案件样本)更少样本偏差。

  二、研究假设、数据与方法

  (一)研究假设

  量刑统一有两个方面,一是结果统一,二是手段统一。美国明尼苏达州的量刑指南追求的主要是结果统一。从公共政策的立场出发,该量刑指南的重要任务是精确预测并控制监禁人数。表格式量刑指南卓越地完成了这一任务,因为在知晓被告人罪行及犯罪历史的情况下,就能预估其将要受到的刑罚。相较之下,我国更追求手段统一。量刑指导意见并未将管控监禁人数列为目的之一,而是旨在提供统一的量刑方法与步骤,期待法官在使用统一的方法后得到令人满意的结果。以盗窃罪为例,法官应当遵循的步骤是:首先,依据基本犯罪构成事实在法定刑幅度内确定量刑起点。其次,在量刑起点的基础上,根据盗窃数额、次数、手段等其他影响犯罪构成的犯罪事实增加刑罚量,确定基准刑。最后,根据量刑情节调节基准刑,并综合考虑全案情况,依法确定宣告刑。

  法官的量刑实践应当在何种程度上受指导意见的规制,可以从意见的行文沿革中获得线索。2014年《关于常见犯罪的量刑指导意见》较2010年《人民法院量刑指导意见(试行)》,在常见量刑情节的适用上删去了“可以在相应的幅度内确定具体调节比例”的规定。删去这一规定,意味着法官若选择适用指导意见所规定的某一具体量刑情节,就必须在所规定的幅度内确定具体的调节比例。发布2021年量刑指导意见的通知中也再次强调,各级法院对纳入规范范围的案件应当按照该意见规范量刑。

  据此,本文构建假设A:量刑情节与量刑之间的相关性与量刑指导意见所规定的一致。例如,指导意见规定,累犯情节应当增加基准刑的10%—40%,那么,累犯情节与刑罚之间应当具备显著相关性。同时,依据作用幅度对量刑情节排序,作用幅度大的量刑情节,其作用力应当大于作用幅度小的量刑情节。对于非法定量刑因素,由于其并非犯罪事实,也不属于任何法定和酌定量刑情节,故不应显著影响量刑。

  另外,量刑指导意见要求,“量刑时要充分考虑各种法定和酌定量刑情节”,而其列明的只是“常见量刑情节”,这说明意见所涵盖的量刑情节并不周延,即量刑指导意见本就不期待其规定的量刑情节能百分百地解释量刑。不过,盗窃罪属于量刑指导意见所规制的常见犯罪之一,且盗窃罪案情比较简单。笔者在阅读判决书时也发现,指导意见所规定的量刑情节覆盖了影响盗窃罪量刑的绝大部分量刑情节。据此,本文构建假设B:量刑指导意见所规定的因素应当解释大部分的盗窃罪量刑。

  (二)数据与方法

  本文的研究对象是一审盗窃罪案件。本文的样本均来自中国裁判文书网,选择“刑事案件”为案件类型,案由选择“盗窃”,文书类型限定为“判决书”,裁判年份为“2015”,法院地域为“广东省”,选择广州市辖下的各基层法院,剔除重复案件、无法辨认案件与最终判定为他罪案件,共获得999份有效一审判决书。若文书有多个被告人的,进行分项列出,共获得1226个样本,将未遂与判处管制、拘役的样本剔除,最终获得916个样本。排除管制样本,是因为量刑指导意见确定宣告刑的最后一条是“综合全案犯罪事实和量刑情节,依法应当判处无期徒刑以上刑罚、管制或者单处附加刑、缓刑、免刑的,应当依法适用。”这就意味着,指导意见所规范的对象不包括管制。排除拘役样本,是因为实务界并无如何统一拘役与有期徒刑的认识。诚然,白建军、胡昌明提出过构建刑罚量以统一拘役与有期徒刑的方法,但没有哪个法官在判案时会想着拘役是有期徒刑的75%抑或90%。对法官而言,拘役就是拘役,无法与有期徒刑进行替换。本文要探究的问题是量刑指导意见的作用机制,而非某个因素或情节如何影响刑罚量,这就意味着本文的视野只能是法官的视野,如果将拘役和有期徒刑用法官所没有的观念统一起来,反而会得到不恰当的结果。同时,对拘役进行单独建模必要性不大,因为有期徒刑已足够代表自由刑,而且拘役的样本量较小。排除未遂样本,是因为在阅读判决书的过程中,笔者发现未遂样本中既有普通未遂,也有多次盗窃中的某一次盗窃未遂,后者既有未遂又有既遂,作用机制较为复杂,可能扰乱模型对真实系数的贴近。

  在选定样本后,笔者阅读了所有判决书,并记录了样本的基本信息、裁判理由部分认可的所有量刑情节以及最终的刑罚。本文设置的因变量,一是有期徒刑刑期,二是罚金刑数额。本文设置的自变量有:(1)非法定量刑因素:案件所属行政区人均GDP水平是否高于全市人均水平、被告人是否有辩护人、是否外来人口;(2)裁判理由部分提出的量刑情节:盗窃数额、次数,是否入户、扒窃、携带凶器,是否使用破坏性盗窃手段,被告人是否有前科、累犯、特殊的身体状况、是否属于限制刑事责任能力人,是否达成谅解、退赃退赔缴回、未缴犯罪所得、自首、坦白、当庭认罪、立功,被害人是否弱势。

  本文选择多元线性回归方法,以公式表达如下:

  log有期徒刑i=α+β非法定量刑因素i+γ量刑情节i+εi

  以及

  log罚金刑i=α+β非法定量刑因素i+γ量刑情节i+εi

  其中,ε代表无法被观测到的情节,β与γ代表系数。

  三、量刑情节的实证检验

  (一)有期徒刑模型

  有期徒刑模型的线性回归结果如表1所示。

  表1 有期徒刑线性回归模型

  

  (续表1)

  注:括号内为标准差 *p<0.05,**p<0.01,***p<0.001

  

  表1中的模型一包含所有记录的自变量,模型二包含所有达到统计数量的自变量以及未达到统计数量但仍有显著性的自变量,模型三则去除了模型二中的非法定量刑因素。模型的Adjusted R2均在0.54左右,拟合优度较好。去除非法定量刑因素(行政区、是否有辩护人、被告人是否外来人口),模型的Adjusted R2并无改变,意味着模型涵盖的所有量刑情节能解释约54%的量刑,且非法定量刑因素不仅没有显著性,解释力也很小。这佐证了假设B,即量刑指导意见可以解释大部分的有期徒刑量刑。值得一提的是,盗窃数额的一元模型的Adjusted R2为0.36,意味着这一个情节就解释了36%的有期徒刑量刑,说明法官的量刑是以盗窃数额为核心的。

  假设A的检验需具体讨论各量刑情节。经稳健性检验,非法定量刑因素与有期徒刑之间无显著相关关系。盗窃数额、次数、是否入户、扒窃这些犯罪构成事实,以及前科、累犯、被害人弱势这些趋重情节均表现出显著性。但在趋轻情节中,仅自首和坦白体现出显著性。

  表2列举了量刑指导意见所规定的各情节的基准刑调节幅度。

  表2 量刑指导意见规定的基准刑调节幅度

  

  基于表1的系数及注29给出的有关名义变量系数的解释方法,在其他因素不变的情况下,存在前科情节,增加了被告人约9%的刑期;存在累犯情节,增加了约34%的刑期;存在自首情节,减少了44%的刑期;存在坦白情节,减少了约13%的刑期。结合表2可以发现,在调节幅度的选择上,法官对趋重情节的适用更为大胆。并且,“谅解退赃退赔缴回”和“当庭认罪”这两个趋轻情节的作用并不显著。但是,据表2,它们的作用力最起码不应低于前科。根据有期徒刑模型报告的结果,首先,存在不显著的量刑情节,这意味着量刑不均是有可能的。其次,上述发现说明,我国法官在趋轻情节的适用上较趋重情节保守。不过,不显著的趋轻情节以“可以”适用的情节为主,所以法官在形式上并未违背量刑指导意见的规定。但在实质上,量刑情节的作用力排序并不符合量刑指导意见“做到该宽则宽,当严则严”的要求。当然,“可以”适用的规定根源于刑法,量刑指导意见只能在刑法的规定之下进行具体幅度的规定。不过,未来对量刑指导意见的修正,应当考虑到法官保守适用趋轻情节的司法现实。如果忽略这一点,量刑指导意见的实际效果就可能会偏离期待,即虽然结果满足形式要求,实质上却只是“当严则严”,该宽时不够宽,从而无法有效因应重刑主义的量刑实践。

  (二)罚金刑模型

  注:括号内为标准差 *p<0.05,**p<0.01,***p<0.001
表3 罚金刑线性回归模型

  

  表3报告的模型与有期徒刑模型的建模思路一致,模型的Adjusted R2均约为0.35,即所有法定因素能解释约35%的罚金刑量刑。这一结果并不符合假设B,量刑指导意见对罚金刑的规制较弱。此数据较有期徒刑模型低,说明罚金刑在量刑上有更大的任意性。与有期徒刑模型类似,盗窃数额这一个情节就可以解释28%的罚金刑量刑,是解释力最强的因素。

  对假设A的检验,各因素的显著性基本与有期徒刑模型一致。与有期徒刑模型不同的是,立功、当庭认罪等趋轻情节表现出显著性,而被害人弱势因素不再显著。基于表3的系数及注29给出的有关名义变量系数的解释方法,累犯的作用大幅降低,只能增加约17%的罚金刑(有期徒刑模型中约34%);前科的作用大幅增加,达到18%(有期徒刑模型中约9%);自首的作用有所减轻,约为33%(有期徒刑模型中约44%);坦白的作用大幅增加,约为25%(有期徒刑模型中约13%);当庭认罪的作用幅度约为20%。

  综而言之,罚金刑量刑整体上较轻。相较有期徒刑模型,有更多趋轻情节体现出显著相关性,并且趋轻情节的作用幅度也较大。但是,罚金刑量刑中递进的量刑情节(当庭认罪、坦白、自首;前科、累犯),幅度区别较小,一些情节的作用幅度甚至超越了量刑指导意见所容许的范围。另外,罚金刑模型的解释力较有期徒刑模型约少19%。量刑指导意见以有期徒刑量刑为纲,其应当如何指导罚金刑量刑,或者如何构建罚金刑指导意见,乃未竟之难题。

  (三)两个模型的进一步分析

  回顾实证研究的结果,可以推断出量刑指导意见确实在影响着司法实践,但这种影响并不尽如人意。其一,有期徒刑量刑中,趋重情节的作用力大于趋轻情节。其二,量刑指导意见对罚金刑指导不足,其列明的量刑情节对罚金刑量刑的解释力较小,作用幅度也不理想。本文采用访谈方法,继续探究背后的原因。

  1.趋轻情节与有期徒刑量刑

  应当说明的是,法官的量刑步骤经常是“反推”(先估堆结果,再用量刑表确认,或者只估堆而完全不用量刑表)而非“正推”(通过量刑表计算出结果)。估堆的根据是法院过往判决的类似案件。这就意味着,法官对类似案件的判断、对类似案件量刑的印象、数学能力、估算方法、一时的手松手紧,均会影响最终的判决结果。这些因素均未体现在判决书中,是模型的不可观测项。

  那么,不显著的量刑情节究竟缘何而成?有期徒刑量刑中,法官为什么偏重使用趋重情节,而非趋轻情节?首先,量刑情节不显著,并非量刑指导意见规定某些情节“可以”适用而非“应当”适用所导致。实际上,法官在访谈中表明其并不特别区分“可以”适用和“应当”适用,只要认定案件存在量刑指导意见所规定的情节,就会做相应的调整。对模型结果的一种有力的解释是,这可能是量刑起点靠近法定最低刑所造成的。例如,数额较大的盗窃罪,按照量刑指导意见,顶格量刑起点为1年有期徒刑,那么趋轻情节下,量刑为1年有期徒刑以下;趋重情节下,量刑为1至3年有期徒刑。这意味着在有期徒刑范围内,趋轻情节的调整空间仅为趋重情节的四分之一(6个月v.2年)。在这种情况下,趋重情节的实际调整幅度很可能大于趋轻情节。试想某法官承办了一起盗窃案件,其将数额较大的盗窃罪的量刑起点确定为6个月有期徒刑。如果该案同时具备当庭认罪、退赃退赔这两个趋轻情节,但该法官认为判处有期徒刑合适,他就必须对这两个趋轻情节的作用做打折处理。但是,如果该案具备的是前科、被害人弱势等趋重情节,法官完全可以按照其认为应当适用的幅度量刑,而无需对趋重情节的作用幅度打折。更何况,量刑指导意见规定的常见量刑情节大部分是趋轻情节,在调整空间本就局促的情况下,各趋轻情节必然要牺牲一定的作用幅度。这种结构性缺陷难以简单地通过增加趋轻情节的数量、扩大其作用幅度来弥补。2021年量刑指导意见在基本结构没有变化的前提下增加了数个趋轻情节,这能在一定程度上促进刑罚轻缓化,但应当注意的是,其作用效果在量刑实践中可能会被打折。

  同时,法官的主观认知不完全等同于客观行为。当量刑结果主要由估堆得出时,法官“认为”自己从轻了,但实际上可能并没有。法官估堆的依据是自己过去处理的类似案件,即便是新任法官,其量刑也要依据所任职法院的集体经验。这些经验结果即便形式上符合量刑指导意见,其形成方式也可能并不与量刑指导意见完全一致。

  2.罚金刑量刑指导体系的缺位

  完美状态下,所有量刑情节应能解释绝大部分的量刑结果。不过,量刑过程中的变量纷繁复杂,且很多变量无法被记录,所以模型拟合值小是正常的。然而,在有期徒刑模型的拟合度达54%的情况下,罚金刑模型的拟合度却只有35%,有着19%的差距。同时,在罚金刑量刑中,体现出显著性的量刑情节在作用幅度上,也不完全符合量刑指导意见的要求。

  就量刑指导意见的内容看,虽然它确实着重于对有期徒刑量刑的规定,但并未否定其对并处罚金刑的适用。就此而言,量刑指导意见应当对有期徒刑和罚金刑的量刑发挥同等作用,但不可否认的是,将指导意见直接适用于罚金刑有其困难。在罚金刑上,法院并不存在对量刑起点与基准刑的共识。法官的回应是,罚金刑量刑的主要考虑因素并非量刑情节,而是罚金刑与自由刑的对应关系。某法官表示,1年自由刑通常对应2000元罚金。这种对应并无法律依据,只不过是法院的内部经验。因此,这种对应并不绝对,该法官也曾对1年有期徒刑搭配并处3000元罚金。这一点也被实证数据所证实:有期徒刑与罚金刑一元模型的Adjusted R2为31.5%,远超盗窃数额的解释力。

  另外,罚金刑量刑有更多影响量刑的不可观测项。对法官的访谈表明,在罚金刑量刑中,被告人的给付能力是仅次于盗窃数额的影响因素。倘若认为给付能力仅影响罚金刑量刑,且其他因素对罚金刑和有期徒刑量刑的影响程度一致,则给付能力对罚金刑量刑的影响可达到两个模型的Adjusted R2之差,即19%。在给付能力并未被量刑指导意见正式认可的情况下,司法实践注重对被告人给付能力的考量,根源于罚金刑的执行难问题,是量刑对执行妥协的结果。毕竟,罚金刑的执行率畸低。其中,流动人口犯罪的罚金刑执行难问题尤为突出。在本研究中,被告人中的87%是外来人口,且从显示学历、职业等被告人信息的部分判决书看,大部分被告人为无业人员或农村人口。

  除上述以外,量刑指导意见是以有期徒刑量刑为核心构建的,其对罚金刑的指导意义不强。也正因此,法官在罚金刑的量刑中更容易受法外因素的影响。所以,建立罚金刑的量刑指导体系是有必要的。

  四、量刑指导意见的深层次问题

  基于实证研究结果,本文通过比较研究,继续检讨对量刑指导意见进行结构性调整的必要性和方法。

  (一)量刑起点问题

  量刑指导意见赋予法官的刑罚裁量幅度较大,其并未将量刑起点规定为一个具体的点,而是将其规定为一个幅度:盗窃数额较大的,在1年以下有期徒刑、拘役幅度内确定量刑起点;达到巨大起点的,在3至4年有期徒刑幅度内确定量刑起点;达到特别巨大起点的,在10至12年有期徒刑幅度内确定量刑起点。通常,法院对基本犯罪构成事实所对应的量刑起点存在共识,例如,某法院普通盗窃3000元所对应的量刑起点通常为6个月有期徒刑。如果按照通常量刑起点计算的结果无法让法官感到公正,一个便捷有效的做法就是调整量刑起点,例如从6个月调整到8个月,甚至12个月。实际上,笔者比较了一位法官提供的量刑表后发现,案件类似而量刑起点不一的情况并不罕见。

  实践中,量刑起点往往是法官估堆反算的结果。由于量刑起点被规定为一个较大的幅度,所以估堆结果往往符合量刑指导意见的形式要求。这意味着量刑指导意见的实质约束力或许不足,趋轻情节的作用不显著也从侧面佐证了这一点。若法官对公正刑罚的经验一致,且贴近理想的量刑基准,问题也称不上严重。但棘手之处正是法官对公正的把握存在差异,且法官的能力、水平也难称一致。在这种情况下,一个被告人可能仅因分配的法官不同而在最终量刑上有数月之别。

  面对司法实务从量刑终点反推量刑起点的现实,笔者赞同张明楷的意见,即“点的理论”于当今中国较“幅的理论”更优,因为“点的理论”能带给法官更为明确的指引,能使量刑指导意见的约束落到实处。实际上,法官从过往经验中获得确信,直接得到所处理案件的初步结论,并不当然是一件坏事。如若有良好的制度将此种经验上的确信规范在理想的量刑结果附近,自拟定的宣告刑出发,利用基准刑和量刑情节获得确信并进行修正,不失为一种经济便宜的做法,而只有精确的“点”才能使这种修正不沦为形式。实际上,法院内部对基本犯罪构成事实所对应的量刑起点的共识说明,法官在司法实践中已经对量刑起“点”有了一个粗浅的把握。英国的量刑指南就是将量刑起点确定为一个具体的点,并在此基础上依据量刑情节确定一个将该点包含在内的量刑上下限。例如,当被告人具备较高的有责性(例如是共同犯罪的主犯),且盗窃数额在10万英镑以上时,量刑起点是确定的3年6个月监禁刑,量刑范围是2年6个月到6年。

  (二)以盗窃数额为基础的问题

  无论是有期徒刑还是罚金刑,盗窃数额都是影响量刑最重要的情节。可以说,盗窃罪的量刑指导是以数额为基础构建起来的。但是,类似我国规定普通盗窃情形达到数额较大起点方构成犯罪的做法,并非通常现象。在许多法域,盗窃数额只是区分轻罪与重罪的依据,而不是区分罪与非罪的材料。

  以广州市为例,盗窃数额与量刑起点的对应关系如表4。从表4可见,我国盗窃罪量刑体系确定的三个基本点(数额较大、巨大、特别巨大)对应的量刑幅度没有重叠,这使得数额临界点的边际刑罚量在相邻区间内最大;而且数额越大,单位数额所背负的刑罚量越小(即第四栏数字的倒数),减小的曲线十分陡峭。简言之,当前的效果是,犯罪门槛的震慑力很高,而一旦行为人跨过门槛开始犯罪,门槛之后的震慑极其不足,并未形成逐步升高的震慑阶梯。

  表4 广州市盗窃数额与量刑起点的对照

  

  我国当前的量刑规范思路是,确定的自变量(盗窃数额)对应确定的因变量(量刑起点范围),自变量、因变量均不重叠。这是因为我国刑法也规定了几乎不相重叠的法定刑档次,例如3年以下有期徒刑、3至10年、10年以上,仅在分界线上重叠。因此,边际数额具有决定性作用。然而,3000元与2999元这一元之差,难以承担区分法定刑档次的重责。

  对于数额临界点的问题,英国的处理方式是使临界点左右所对应的刑期互有重叠,而不是在临界点制造一个泾渭分明的界线(表5)。根据量刑指南的使用方法,“量刑者应当确定这些因素(指量刑情节)或其他相关因素的组合对于量刑起点向上或向下的调整……在某些情况下,超出量刑范围的刑罚幅度可能是适当的。”由此,表5中的量刑范围指代广义的量刑基准,而非基准刑。只有在例外的情况下,量刑基准才能超出量刑范围。边界点左右量刑范围的重叠给了法官更大的裁量余地:边界点的作用不再是决定性的,其更像是一个“路标”。美国明尼苏达州的量刑指南也采纳了类似的思路(表6)。

  表5 英国量刑指南关于高有责性盗窃罪被告人量刑起点和量刑范围的设置(39)

  

  由此不难看出,通过使刑罚档次边缘范围重叠,可以缓和边际数额的决定性作用。这与前述量刑起点应当为一个具体的点并不矛盾。因为量刑起点的问题是,当其为一个幅度时,量刑指导意见的约束力不足,所以应当补足其约束力。而边际数额的问题则是确定性太强,应当予以一定的缓和。

  表6美国明尼苏达州量刑指南关于盗窃罪量刑起点和量刑范围的设置(40)

  

  注:刑期的单位为月。阴影部分为推定缓刑,非阴影部分为推定实刑。121=1年零1天

  难题在于我国的法定刑档次有确定的分野,故无法对边际数额左右的量刑范围进行调整。如果无法直接对刑法进行修正,仍有解释空间的只有“数额较大”“数额巨大”“数额特别巨大”的含义。一个次好的方法是将数额较大、巨大、特别巨大的边缘范围重叠起来。例如,如果原本认为数额较大、巨大、特别巨大的范围应为3000—10万元、10万—50万元、50万元以上,那么可以探索将其范围修改为3000—12万元、10万—55万元、50万元以上。当然,容许多大的重叠范围可以达到法官自由裁量与规范确定作用的平衡,需要继续研究。这种方法的疏漏之处是,只要我国盗窃罪的成立依然需要达到一定的盗窃数额,就很难从技术上缓和该特定数额的决定性作用。因而,应当考虑直接修正刑法的可能性。2020年美国明尼苏达州法典第609.52节第3分项对盗窃罪就仅规定了法定刑的上限。我国如果贯彻责任主义的思考方向,在法定刑中仅规定上限,反而可以使量刑指导意见更为系统且灵活地满足刑事政策的需要。

  对于单位数额所背负的刑罚量随着数额增加而减少这个问题,首先需要说明这是各国共同面临的问题。此种情况似乎有悖罪刑均衡原则。由于人的生命有限(且我国的有期徒刑存在上限)而可能的盗窃数额无限,盗窃罪的自由刑量刑必然带有单位数额的刑罚量随着数额增加而减小的特质。一种可能的改良方案是,在自由刑贬值的区间内搭配更严厉的罚金刑以达到惩戒目的。

  (三)量刑步骤问题

  量刑指导意见列明的盗窃罪量刑步骤为:(1)根据基本犯罪构成事实确定量刑起点;(2)根据其他影响犯罪构成要件的事实(盗窃次数、数额、结果等)在量刑起点的基础上增加刑罚量,确定基准刑;(3)根据量刑情节调整基准刑,并综合全案确定宣告刑。照此方法,一个通常的盗窃罪量刑公式可以被理解为:

  

  这是一个历经三步,从量刑起点到基准刑再到量刑终点(宣告刑)的方案。具体到个案,在普通盗窃8000元的情形下(以3000元为数额较大的起点),依据量刑指导意见,第一步为使用盗窃3000元为确定量刑起点的事实,在第二步用剩余的5000元作为调节刑罚量、确定基准刑的事实。但是,量刑指导意见并未明确确定基准刑的具体方法。狭义的量刑基准针对抽象的个罪,是不考虑量刑情节的前提下,仅就犯罪构成的基本事实所判处的刑罚。如果认为狭义的量刑基准是依据个案的整个犯罪构成事实而确定的,例如,应当对“普通盗窃8000元”进行整体性地量刑基准考量,则狭义的量刑基准论会要求合并考虑第一、二两个步骤。如果认为量刑基准应依据基本犯罪构成事实来确定,则狭义的量刑基准论会主要讨论第一个步骤,即量刑起点问题。

  与狭义量刑基准论的两种分野对应,司法实务中对第一、二两个步骤是分开考虑还是合并考虑,也有两种取向。合并考虑的做法是,依照盗窃数额在法定刑区间内按比例确定基准刑。例如普通盗窃8000元,合并考虑和分开考虑的计算方法(若认为数额较大的起点为3000元,量刑起点为6个月;每10000元增加6个月刑期)分别如下:

  合并考虑:8000/(10000+3000)×(6+6)≈7

  分开考虑:6(步骤一)+(8000−3000)/10000×6(步骤二)=9

  合并考虑的好处是,其更加有利于实现刑罚谦抑;并且,每1元数额之于刑罚量的边际价值是一致的,前3000元和后5000元在合并考虑的方案中对刑罚量的影响相同。在分开考虑的场合,一个明显的问题是,在同一个犯罪中,定罪所考虑的数额(前3000元)的边际价值明显高于量刑调整数额(后5000元),而这种价值上的区别并无充分依据。

  当然,合并考虑也有问题。一是计算更为复杂,需要分档后再根据各档次的算法进行计算,而分开考虑的算法是固定的。二是合并考虑的算法决定了分界数额以上一定范围内(分母数额的二分之一以下)的盗窃数额都对应着基准刑期。例如在本例中,盗窃3000元至6500元的基准刑就都为6个月。但是,存在这两个问题并不意味着分开考虑就更好。首先,合并考虑的算法并未复杂到法官无法掌握的程度,而且对各档次都固定的算法(即分开考虑的计算方法)往往意味着对公正性的部分牺牲。其次,决定法定刑档次的边际数额以上一定范围内的数额对应基准刑期,并不当然是一件坏事。如上所述,我国用盗窃数额划分法定刑档次的构造,本来就造成了一些问题。合并考虑的算法实质上拉长了边际数额的范围,呼应了前述降低边际数额决定性作用的主张,有利于平衡单位数额所背负的刑罚量。而且,美国联邦量刑指南中初犯的前八个罪行等级,也都对应着同一个量刑范围。但在我国司法实务中,分开考虑的方法占据主流。因此,在修订量刑指导意见时,笔者建议应当明确规定对第一、二两个步骤进行整体性考量。

  (四)量刑情节问题

  有学者认为,量刑指导意见违背了责任主义,因其将责任情节与预防情节一概而论,未对二者作考量步骤上的先后区分。我国量刑指导意见至今有关量刑情节的构建似有英美量刑指南的影子,即不特意区分责任刑情节与预防刑情节,仅做趋轻情节与趋重情节的区分。但是,英美并不在量刑指南中确定各情节的作用范围,而是直接规制量刑结果。英美不给出量刑算法的原因主要在于两个方面:其一,两类情节的考量过于复杂,应当交由法官裁量。其二,对趋重情节和趋轻情节的考量应当着重罪犯的个人改造因素,而英美量刑指南主要基于责任刑情节。但是,有学者明确反对这两个论点,认为在量刑指南中进行明确规定、用集体智慧对量刑情节进行规制,将有助于量刑的统一性。从这个角度看,我国其实比英美走得更远一些。但我国对量刑情节一概而论的做法,确有值得探讨的地方。

  量刑基准理论,无论是“点的理论”还是“幅的理论”,均要求只能在责任刑以下考虑预防刑,故基于有责性的情节(例如携带凶器)是第一位的,基于预防性的情节(例如累犯、自首)是第二位的,实质上形成了量刑上的“二阶层论”。公式表达如下:

  

  量刑指导意见与量刑基准理论并非完全不可调和。指导意见所规定的第一、二两个步骤合并起来即是步骤a1,只需在第三步注意应当先考虑责任刑情节,从而获得责任刑的点,之后基于预防刑情节只能降低刑罚量即可。要想达到这样的目标,只需删去“同向相加、逆向相减”这一机械适用的原则性规定。当然,更理想的解决方案是对量刑指导意见进行彻底调整,将有关责任的情节与有关预防的情节进行分类,并采用先责任刑情节、后预防刑情节的编排模式,使其完全满足在责任刑范围内确定预防刑的理论要求。

  在这个基本框架下,针对趋轻情节作用不显著的司法现状,应当考虑对量刑指导意见的内容进行调整。导致这种现状的两个可能原因是,量刑起点靠近法定最低刑以及法官的前见,这二者都无法轻易改变。如果为了让趋轻情节和趋重情节的调整幅度一致而将量刑起点拉升至中点位置,无疑会加重量刑,此乃舍本逐末之举。法官的前见依托于过往审判的案件,不以人的意志为转移。在这两个前提不变的情况下,可以探索如何将拘役和有期徒刑(本质上都是监禁刑)有机地衔接起来,扩大法官的视线范围。同时,为了让量刑指导意见真正限制法官的量刑估堆结果,可以考虑缩小量刑情节的幅度范围,真正区分“可以”适用和“应当”适用的情节。例如,将当庭认罪情节的量刑调整范围规定为“可以减少基准刑的5%—10%”。这样一来,在有当庭认罪情节的案件中,法官既有根据案件实际情况不减少刑罚量的灵活选择,同时也能受到有效约束,因为其一旦选择减少刑罚量,就必须体现出该情节应有的分量。

  (五)罚金刑的量刑指导问题

  过往对罚金刑的研究集中在执行难与罚金刑的适用范围这两个问题上。我国量刑指导意见主要着眼于有期徒刑,在罚金刑量刑的指导上作用不突出。罚金刑模型较低的Adjusted R2也佐证了这一点。2021年量刑指导意见发布之前,量刑指导意见并未对罚金刑作明确指引,相关规定散见于个罪的司法解释。例如,盗窃罪罚金刑的量刑指导见于2013年最高人民法院、最高人民检察院《关于办理盗窃刑事案件适用法律若干问题的解释》第14条:“因犯盗窃罪,依法判处罚金刑的,应当在一千元以上盗窃数额的二倍以下判处罚金;没有盗窃数额或者盗窃数额无法计算的,应当在一千元以上十万元以下判处罚金。”该条为2021年量刑指导意见所吸纳。类似地,该意见在部分常见犯罪中(如抢劫罪、诈骗罪)也设置了相应的罚金刑条款,但遗憾的是,这些条款较为宽泛,并未给出如何适用罚金刑的具体指引。

  张明楷认为,量定罚金数额时应当考虑以下因素:犯罪情节、支付能力、行为人将来的职业状况与其他情况。高铭暄等人认为:“罚金刑数额立法原则应遵循数额相对确定原则、罚金数额适度原则、与自由刑形成比值原则、不断适应通货膨胀原则、相对平等原则。”学界过往曾对判处罚金刑时是否应当考虑被告人的给付能力进行过探讨。 值得肯定的是,2021年量刑指导意见明确了“应当以犯罪情节为依据,并综合考虑被告人缴纳罚金的能力,依法决定罚金数额”,承认了被告人给付能力的作用与独立价值。

  然而,2021年量刑指导意见并未提供考量被告人给付能力的方法。这可能导致对其的考量会让位给各法院的实际需要,使得以提高执行率为目的的实用逻辑取代以促进公平公正为主的道德逻辑,加重量刑不均。首先,在没有道德逻辑指引的情况下,法院自发适用的实用逻辑可能会有很大的偏差值。其次,野蛮生长的实用逻辑并不一定能解决实践中的问题,因为这种逻辑能够成立的前提是:当罚金较低时,被告人更可能如期缴纳罚金;如果罚金完全超出被告人的支付能力,被告人当然不可能缴纳罚金。但值得注意的是,法院因此而调低的罚金额,或许并不是从一个超出给付能力的罚金额调整到匹配其给付能力的罚金额,而是在两个匹配被告人给付能力的罚金额中选择较低的那一个。例如在本文样本中,罚金额大部分在2000元以下,这个数额似乎并未超出一般被告人及其家庭的给付能力。即便如此,罚金刑执行难的问题依然存在。因此,若任由罚金刑量刑的实用逻辑野蛮生长,则可能既降低了罚金刑量刑的公正性和严肃性,也不能从根本上改善罚金刑的执行。

  综而言之,我国有必要建立更为细致的罚金刑量刑体系。具体到盗窃罪,英国的做法是将可能的罚金分为六组,每组确定量刑起点和量刑范围。如A组的量刑起点是50%的周薪,量刑范围是25%—75%的周薪;B组的量刑起点是100%的周薪,量刑范围是75%—125%的周薪。但是,英国的罚金是单处罚金,在盗窃罪量刑中主要适用于低有责性的被告人。而且,英国仅在例外的情况下可以考虑并处罚金。相较之下,美国的做法与我国更为相似。根据美国联邦量刑指南第5E1.2(a)节的规定,罚金为必并罚金,“法院应当在所有案件中判处罚金,除非被告人证明他现在且未来并无任何支付能力。”联邦量刑指南为盗窃罪提供了统一的罚金表,部分内容见表7。

  表7 美国联邦量刑指南盗窃罪罚金表(52)

  

  在接受罚金刑量刑时被告人的给付能力应当发挥调节作用的基础上,美国盗窃罪罚金表所提供的启示是:应当区分盗窃数额档次并确定其对应的罚金范围;考虑到被告人的给付能力天差地别,罚金范围应当设置的比较大,罚金范围也应互有重叠。同时,为了保证刑罚与社会危害性的最基本均衡,应当谨慎设置罚金档次的最小值。当然,如果被告人能够证明其现在与未来并无给付能力(如其本身即需要他人扶养的重度残疾者),那么可以超出本档次最小值量刑。考虑被告人给付能力对罚金刑量刑的调节作用,意味着需加强相关配套措施,如被告人银行账户、经济收入的审查等。从精细化司法的角度出发,进一步的措施是允许判处有整有零的罚金。本样本中,罚金相差不低于500元,多为1000元以上,强求整数罚金反而可能丧失罚金刑本身的灵活性。

  当罚金刑与自由刑并处时,还需考虑其搭配问题。美国联邦量刑指南规定,“在量定罚金刑时,必须保证其数额与其他刑罚的搭配是惩罚性的”, 其采用的方法是将各罪划分等级,使各等级对应不同的自由刑和罚金刑。由于我国没有对各罪划分等级,所以很难直接借鉴美国的方法。实践中1年自由刑对应2000元罚金的经验估堆方法显然过于粗糙,如果量刑指导意见无法给出单独的罚金刑量刑指导,最起码也要对如何搭配罚金刑和自由刑这一问题提供明确指引。

  结 论

  本文以盗窃罪为样本实证性地探究了我国量刑指导意见下法官的量刑实践,发现量刑指导意见尚缺乏对罚金刑的充分指导;而在有期徒刑的量刑中,趋轻情节的作用不如趋重情节。这些发现表明,量刑指导意见虽然在我国的量刑规范化进程中发挥了重要作用,但仍有很大的改进空间。在使用量刑指导意见促进量刑均衡这一道路上,我们必须不断从实践中汲取养分,及时对指导意见进行调整。

  本文在实证研究的基础上,结合与英美量刑指南的比较,对量刑起点、以数额为量刑中心、量刑步骤、量刑情节、罚金刑的量刑指导等这些量刑指导意见的深层次问题,进行了细致检讨。对于量刑起点,本文综合实践情况,建议将其规定为一个具体的点而非幅度。在数额问题上,本文借鉴英美量刑指南的构造,建议通过重叠边际数额范围的方式,模糊边际数额所背负的单位刑罚量,以缓和边际数额的决定性作用。在量刑步骤上,本文基于单位刑罚量的考量,建议合并考虑确定基准刑的两个步骤。在量刑情节上,本文认同在责任刑范围内确定基准刑的做法,并针对法官在趋轻情节适用上的保守,建议量刑指导意见作出更为积极的调整。在罚金刑的量刑指导上,本文吸取域外经验,呼吁构建更细致的罚金刑量刑体系。

  

  【参考文献】

  [1]量刑的实践及其未来走向[J]. 周光权.中外法学.2020(05)

  [2]贪污罪量刑规范化的中国实践——基于《刑法修正案(九)》生效后的案例分析[J]. 李冠煜.法学.2020(01)

  [3]刑事案件中财产性判决“执行难”问题研究[J]. 赵一戎.法律适用.2019(23)

  [4]被告人身份差异对量刑的影响:基于1060份刑事判决的实证分析[J]. 胡昌明.清华法学.2018(04)

  [5]醉酒型危险驾驶罪量刑影响因素实证研究[J]. 文姬.法学研究.2016(01)

  [6]量刑规范化改革视野下的量刑基准研究——以完善《关于常见犯罪的量刑指导意见》规定的量刑步骤为中心[J]. 李冠煜.比较法研究.2015(06)

  [7]量刑失衡的克服:模式与选择[J]. 蔡曦蕾.中外法学.2014(06)

  [8]体系性思考与量刑的规范化——以《量刑指导意见》及实践为分析对象[J]. 王瑞君.政法论丛.2014(06)

  [9]受贿罪数额权重过高的实证分析[J]. 林竹静.中国刑事法杂志.2014(01)

  [10]中国量刑改革:理论、规范与经验[J]. 熊秋红.法学家.2011(05)

  [11]量刑如何实现均衡——以量刑规范性文件为分析样本[J]. 刘军.法学.2011(08)

  [12]从量刑基准到基准刑:量刑方法的革新[J]. 张向东.中国刑事法杂志.2011(03)

  [13]量刑治理的模式之争——兼评量刑的两个指导“意见”[J]. 周长军.中国法学.2011(01)

  [14]责任主义与量刑原理——以点的理论为中心[J]. 张明楷.法学研究.2010(05)

  [15]中国量刑程序改革:误区与正道[J]. 左卫民.法学研究.2010(04)

  [16]量刑实证研究的方法论检视 从实证观念到实证技术[J]. 李安.中外法学.2009(06)

  [17]论解决罚金刑执行难题的立法途径[J]. 刘明祥.法学家.2009(02)

  [18]对常见犯罪量刑基准的经验分析[J]. 王利荣.法学研究.2009(02)

  [19]宽严相济刑事政策与罚金刑改革[J]. 高铭暄,孙晓.法学论坛.2009(02)

  [20]量刑基准实证研究[J]. 白建军.法学研究.2008(01)

  [21]罪刑关系的反思与重构——兼谈罚金刑在中国现阶段之适用[J]. 冯亚东.中国社会科学.2006(05)

  [22]论中国罚金刑的改革与完善——以探寻罚金刑执行难之解决方案为视角[J]. 钱叶六.法学论坛.2006(04)

  [23]罚金刑执行难之克服[J]. 周光富.政治与法律.2003(06)

  [24]刑罚轻重的量化分析[J]. 白建军.中国社会科学.2001(06)

  [25]刑法学[M]. 法律出版社 , 张明楷, 2016

  [26]量刑规范化典型案例[M]. 人民法院出版社 , 最高人民法院中国应用法学研究所, 2011