台湾宪法法庭为何要求死刑一致决? 能根除“恣意”问题吗?
从过往十余年的生死之辩案件的量刑实证研究结果来看,很难说恣意的问题不存在。
今年9月20日,台湾宪法法庭针对死刑是否违宪的问题做出判决。 这则宪法法院判决出炉后,不少媒体以“实质废死”的方式定位这号判决,意思是:虽然判决本身并未直球对决去否定死刑制度的存在,但却加上了非常严格的程序性要求,让死刑的宣判变得更加困难。
倘若这个说法是正确的,似乎意味着我们目前关于生死之辩——选择死刑或自由刑——的量刑判断本身其实没有问题。 从而,才会认为当宪法法庭不直球对决死刑制度的正当性,而是提出更严格的程序性要求时,除了想利用程序性要求来偷渡废死立场外,该要求并不具备任何实质意义。 但,关于生死之辩的量刑判断真的没问题吗? 假设有问题,那么大法官提出的程序性要求有何意义?
跟从以上问题意识,以下本文尝试在台湾死刑论辩的脉络中,一步步思索宪法法院提出的程序性要求究竟有何意涵。
不直球对决刑罚制度正当性是近来趋势
的确,如果单从本号宪法法庭判决来看,判决中并未对于死刑所承担的刑罚功能以及相应的理论基础问题有太多着墨。 这与宪法法庭4月的言词辩论所呈现的景象,似有存在极大差异。
言词辩论时,宪法法庭找来的鉴定人们大多直接针对死刑制度的正当性问题加以探讨; 与之相反,宪法法庭9月所呈现的判决,则更多是对生死之辩的程序问题给予指示,或对可判处死刑的“最严重犯罪情节”例示可参考的判准。 换言之,我们可看到大法官们并不想针对死刑本身的正当性问题给予直球对决,做出一锤定音的论述。
但事实上,若在更大的时间区间下,观察过去几年牵涉“刑罚违宪审查”的大法官解释或宪法法庭判决,会发现大法官们在给出刑罚规范合宪与否的“说法”时,已经不是第一次不直球对决“刑罚制度本身是否(罪刑)相当”的问题。
举例来说,从释字第775号(累犯)、释字790号(栽种大麻)到本号判决(死刑),大法官在回答这些刑罚制度的合宪性问题时,通常不会直接回答这些刑罚相关规定是否有正当的刑罚目的,也不会对是否符合罪刑相当原则提出详尽的操作。 相反地,大法官往往都会以“现有规定或程序不够细致、完备”为起点,检讨这些刑罚规范。 由于这些讨论并不会直接触及相关规范是否违反罪刑相当原则的深入探讨,因此大法官通常也不会全盘否定这些被端上宪法法庭的刑罚规范的合宪性。
好比说,释字775号解释中,大法官们并未深究刑法的累犯加重制度本身有无正当性,而是反省不区分过去犯罪的样态就一律加重二分之一的刑度是否合理。 或者,大法官在790号解释中只讨论“目前的规定没有考量栽种大麻的具体状况(是种很多还很少? 是不是只自用? ),就不分青红皂白都科以重刑”这件事有问题,认为需要检讨改进。
与这一套论述脉络相似,大法官在本次判决给出的“说法”——犯罪情节最严重且符合最严密正当程序时死刑合宪——中,并未详论死刑制度本身的正当性依据及是否符合罪刑相当,而将重点放在目前进行“生死之辩”的判断与程序仍不够严谨。 就此而言,大法官在本号判决给出一套说法时,其实是延续其过去几年来,面对刑罚规范合宪性问题时的常见论述方式。
宪法法庭给出程序要求:职业法官一致决
到底在本号判决中,大法官做出什么样的程序性要求呢? 除了言词辩论、强制辩护外,在本号判决中最重要也最受瞩目的要求,就是当法官在生死之辩的案件中要宣告死刑时,必须采职业法官一致决(以下简称:一致决)的方式,而不能仅满足于多数决的要求。 而此程序性要求,也遭遇许多批评。 好比说,在近来立法院中,民众党立委黄国昌便批评这种即便是法律审都必须一致决的要求,不但在比较法上缺乏可见的例子,且也变相让少数法官可能决定生死之辩的判决结果。
若一致决真的存在上述问题的话,那么为什么宪法法庭还会觉得这一项程序性要求有意义? 为什么采取一致决本身就能赋予被告“最严密”的程序保障?
虽然大法官没有明说,但一个可能的答案或许是:如果生死之辩的案件必须透过一致决才能给出死刑判决,那么生死之辩案件的恣意程度在“理论上”是会下降的,也就可达成更严谨的死刑量刑。 本文猜想,这或许是本号判决之所以要求死刑必须经一致决的一种可能理据。
不过,此理据能否言之成理,还有几点需要厘清。
首先,生死之辩案件中的“恣意”到底意味着什么? 其次,关于生死之辩的量刑中的“恣意”,在过去量刑实践中的样貌究竟为何? 毕竟,历年来生死之辩案件的量刑中,若都能被证实不存在恣意的问题时,那大法官加上这样的程序性要求,不只多此一举,也更显可疑。
因此,在回头检视大法官的论述前,透过展示交给宪法法庭的法庭之友意见书的主要内容,呈现关于生死之辩的量刑是否存在恣意的初步实证研究成果,让读者能掌握过去台湾十余年来的量刑状况。
如何探讨“恣意”问题?
在概念上,所谓恣意的决定,通常意味着决定本身并非出于理性。 而非理性则通常会表现在两点上。 一方面,若决定本身非出于理性,那么整体趋势会变得难以预测,或说“无迹可循”——此意味着这些决定受到某些不好的影响,而偏离了应有的轨迹或方向。 但另一方面,有迹可循本身不见得都是理性的,若这种有迹可循,是出于人们决策过程中存在的系统性偏误(如:种族或性别歧视),那似乎也不合理。
因此,如果要讨论过去生死之辩的案件中,其量刑决定是否恣意,是否受到前文提及的不好因素的影响,我们或可从判决结果是否存在一些可疑现象,进而推敲判决过程是否受到非预期的影响,而可能存在恣意。
为此,我们观察了2013年开始,所有因为故意杀人而至少被判过一次死刑或无期徒刑,并且在2024年3月前已经定谳的有罪判决(主要观察这些判决最后一次的量刑决定),希望能够观察到,这些判决是否出现一些让人觉得有恣意可能的可疑现象。 在此范围内,我们总共察看了336个法官宣告的量刑决定(有时候一个人会被宣告很多个死刑,如郑捷)。
对于这些案件,根据前文概念分析,我们得出的初步判准是:要证明不恣意,就不应出现“案件特征类似,但获得的量刑结果有较大落差”的状况。 或者说白一点,相似案件应该获得相似的量刑结果。 如果相似案件都不能获得相似的量刑结果,那么似乎就很难说量刑的决定本身是有迹可循的,而要证成不恣意似乎就很困难。
如果我们同意以上判准,那么接下来有两个问题需要进一步澄清:第一,如何判断量刑相关的特征有多相似? 第二,量刑结果差多大,才会被认为有问题?
如何判断案件是否相似?
要怎么判断案件特征相似? 我们参考司法院给法官们在审判杀人罪时可参酌的量刑系统,以及司法院、国内外专家学者们认为在做这些杀人罪的量刑时可能需要参酌的事项,总共设计出了149个小题,来记录法院判决如何描绘这些案件。
这些小问题包含了犯罪情状,如是否预谋、是否随机杀人、被害者被砍几刀、中几枪、是否被性侵、是否弃尸; 犯罪行为人的一些个人特征,如学历、工作经验、前科、被家暴经验、有没有人格障碍、精神病或情绪障碍; 以及犯罪后的表现,如是否自首、是否表达歉意、是否获家属谅解。 其目标在于借由这些小题目标举出每个案件的特征,借此衡量这些案件之间是否相似(即彼此的远近关系),并且观察这些比较近似的案件,是否在量刑结果也不会相去甚远。
这种远近关系的判断,在需要考虑的小题较少时,或许还很直觉。 好比说,只考虑“有无自首”时,可将案件分成有/没有自首的两群,并以此判断说有自首的案件跟没有自首的案件在这个维度上并不相似(亦即:疏远)。 而如果同时考虑“有无自首”及“有无道歉”时,因考虑的题目增加,情况就比较复杂(此时为二维,分成四个象限):(1)有自首有道歉; (2)有自首无道歉; (3)无自首有道歉; (4)无自首无道歉,并以此判断案件之间是相似或相异。
然而,像这样只考虑两三种特征,或许并不充分; 是此,我们的目标,是一口气从149个维度(149种情状)来通盘思考这336个案件是否相似,并以统计学的方式帮助达成目标。
此方法的基本想法是:如果在149个维度中看不出来,那么让资料在不失真的情况下,将原本在高维度的远近(相似)关系投射到二维,是不是就可以看出来了? 此概念通称为“降维”(Dimension Reduction,降维的方法很多,我们使用的是 UMAP)。 透过降维,即可观察这些案件是否相似——在高维度中较相似(距离较近)者,在二维的图上会被画在一起、彼此靠近并群聚在一块; 而在高维度不相似者,在画面上就会被分得比较散。 一个较理想、较不分散的示例,见下图。
何谓量刑结果有落差?
此前,台湾已在2009年将两公约内国法化,自愿接受两公约的内容为国内法。 因此,如果要落实公约的要求的话,那么只有公约所称的“情节最严重犯罪”(the most serious crime)才能判死刑。 换言之,有被明确说是情节最严重犯罪的无期徒刑,在法官眼中应该是一种较值得非难的状况(反之,明确说不是情节最严重犯罪的,大概可非难程度较低)。 因此,我们将量刑结果从轻至重分五类:(1)有期徒刑; (2)非情节最严重犯罪的无期徒刑; (3)无期徒刑; (4)情节最严重犯罪的无期徒刑; (5)死刑。
理想上,降维投影出的图中,死刑案件旁边不应突兀地出现:(1)有期徒刑; 以及(2)非最严重犯罪的无期徒刑。
在进入分析结果之前必须提醒的是,这里对于恣意的分析并不是直接指出哪个特定的死刑判决是有问题。 相对的,这里的恣意指的是“有相似特征的案件,结果却存在落差”,因此这个分析方式并没有指出“什么才是合理、应得的量刑标准”。
用比较形象化的方式来说,如果情节最严重犯罪是靶心,而死刑就是要打在靶心上时,这个分析不能告诉我们“正确的靶心”在哪。 因此,这种分析方式并不能明确指出哪一个判决的量刑结果“判错了”,也无法说明哪一个判决偏离了它应得的量刑结果。
反之,如果我们的分析发现一群特征相似的案件却有大相迳庭、轻重有所落差的量刑结果时,可能意味著:第一,某些案件获得了不应得的重判(白话:不该死的被判了死刑);其次,某些案件获得了不应得的轻判(白话:该死的确获得轻判)。但至少,我们可以透过分析知道,这些相似特征却有大相迳庭量刑结果的判决,在裁量空间下不太可能通通都是正确无误。
下图是把336个量刑利用149个变量捕捉其特征后,通过统计软件计算其远近关系,并投影在二维平面后的结果。
从图中可以看到,画面一大区块(画面中间偏左区域,略为较下方一带),都没有死刑的观察值,因此在这个如“净土”般的区块中,并无出现死刑与自由刑混杂交错,甚至也没有“情节最严重犯罪”与“非情节最严重犯罪”案件混杂交错的情况。
而在这块“净土”外,则又可观察到死刑和“非情节最严重犯罪”之案件甚至是和有期徒刑相邻的状况。 与死刑案件在特征上相似的其他案件(也就是下图黄色方框处),则依然存在被认为“非情节最严重犯罪”及有期徒刑之案件(如翁仁贤、彭建源、黄麟凯、邱合成等死刑案件附近都可以看到)。
此外,图中也可以看到有一些情节最严重犯罪的无期徒刑与有期徒刑比邻的情况。 按照本文对于恣意所设下的判准,初步(prima facie)而言,似乎缺乏较明确的证据可以认定法院在生死之辩的量刑中不存在恣意。
一致决能多大程度减少量刑恣意?
从前文可见,法院在关于生死之辩的量刑中,似乎仍难以完全避免恣意的问题。 那么,大法官开出的“一致决”药方,会让恣意问题从此药到病除吗?
纯从理论上来说,当死刑只有在一致决的情况下才能宣判时,意味着死刑和其他量刑结果,将被拉开一段距离。 由于死刑的宣判必须满足更严格的条件,因此理论上法官们判出死刑的可能性将降低。 而一但死刑被宣判的可能性降低,那具有相似案件特征却“有的获判死刑,有的只判有期徒刑”的情况自然也可能因此减少。 就此,在程序上采一致决的做法,或许仍不失是帖药方。
但是,到底这帖药方能有多少“疗效”? 老实说,不清楚。
虽然过往的死刑量刑在法制上并不要求一致决而只需要多数决,但由于我们无从获知法官们内部讨论的结果为何,因此难以获知过去的量刑决定到底是怎么做出的。 究竟有多少案件是法官们异口同声决定量处死刑; 又有多少案件是法官们基于“票多的赢、票少的输”的多数决就做出量刑决定? 还是法官们会因为是生死之辩而更慎重,因此即便在多数决的规则下仍尽量达成一致意见?
实际上,由于法官内部的评议资料不公开,在缺乏相关公开资料的情况下,上述问题我们都无从得知,也因而难以评估一致决这帖药方可获得多少疗效。
总结
总结前述,大法官在本号判决中选择用更为严格的程序去限制死刑,而没有直接针对死刑此刑罚制度本身的正当性进行详述。 但这项作法其实并不是本号判决才出现的状况,而是大法官们近年来处理刑罚规范违宪审查时的常见作法。 而从最严格的程序出发及给出的职业法官一致决要求,最合理的解读是,这是为了追求严谨的死刑量刑,希望避免量刑决定之恣意。
而从过往十余年的生死之辩案件的量刑实证研究结果来看,很难说恣意的问题不存在。 是此,宪法法庭企图消除恣意的想法,似乎不是无的放矢。 但是,不论是一致决或多数决,针对的都是法官们“内部”的决策程序所施加的限制。 因此,这种要求即便在理论上可能降低恣意问题,也会因为缺乏可进行进一步检验的相关公开资料,很难具体评估其实际成效。
就此而言,不论是死刑制度本身的正当性争议,或是关于生死之辩的量刑有无恣意的疑问,或许都不会因为本号判决的出炉便一锤定音(或一刀毙命)地画下休止符; 那些在台湾社会一次次上演的死刑论辩,未来仍会继续受到关注。