主页 > 案例大全 > 论文技巧案例-大数据分析报告司法适用的证据问题研究

论文技巧案例-大数据分析报告司法适用的证据问题研究

2021-03-30 11:31:47

  在无法脱离数据的现实社会中,大数据成为信息时代不可或缺的部分,大数据分析报告常呈现于法庭,就其作为证据的可行性进行探讨,对司法实践具有重要意义。本文立足于大数据分析报告司法运用现状,通过对新法定证据主义视野下大数据分析报告不能作为法定证据种类的批判,认为将大数据分析报告纳入新证据种类进行审查具有理论价值及司法实践价值基础;大数据关联关系与传统证据因果关系具有关联性,大数据相关关系作为因果关系的延伸,其与案件事实之间具有关联性,与网络相关的新类型案件认定、审查和判决过程均可运用大数据分析报告作为证据支撑;由于大数据算法黑箱及证据偏在可能会导致证据能力的问题出现,可以在技术和机制上进行规制,并通过完善制度构建来最大程度降低由此产生的风险,以保证大数据分析报告的证据能力。

  如今,大数据广泛运用于社会生活的各方面,成为不可缺少的部分。大数据材料介入司法实践成为现实。当前,刑事侦查活动已经着眼于利用海量的非结构化的大数据,比如大量的不同人的话单数据、网购数据、出入境数据、住宿登记数据。[参见倪春乐:《大数据背景下的侦查创新与现实局限》,载《公安学研究》2019年第4期。]同时,以大数据分析报告作为证据提供至法庭的现象已经出现,“e租宝”案及“快播”案等使得大数据分析报告进入法庭视野。

  大数据既具有在案件事实发生后证明所发生的案件事实的作用,也具有预测的功能,即作为侦查手段进行应用。对预测性的大数据分析报告不纳入讨论的原因在于预测型大数据分析报告易导致偏差,且不能直接确定案件事实是否真正发生。若在案件事实发生后将其作为证据在法庭上使用,预测型大数据分析报告无法印证相关案件事实,将冲击传统的印证模式,并且其因果关系难以进行认定。因此,本文中讨论的大数据分析报告仅为作为案件事实发生后所产生的数据而进行分析的大数据分析报告。

  当前,学者对大数据分析报告能否作为证据进行了讨论。有以下三种观点。首先为肯定说。[参见杜鸣晓:《大数据作为诉讼证据的可行性分析——以互联网租车行业为例》,载《南华大学学报(社会科学版)》2017年第1期。]由于大数据已对数据内容进行筛选挖掘,大数据与案件事实之间有直接关联性。且大数据分析报告是由大数据所获取的核心信息所提炼,所以无需对此类证据加以限制,能够直接认定其作为证据进行适用。其次为否定说。[参见付艳茹、马强:《大数据背景下职务犯罪预防途径和方法》,载《中国人民公安大学学报(社会科学版)》2015年第6期。]该说认为,大数据分析报告不能作为证据有以下几个理由。第一,大数据分析为碎片化的、弱相关性的、对精确性要求较低的定量分析,无法用传统的因果关系分析解释。第二,随着信息技术发展,“人类经验”中无法获知内容可以用“数据经验”填补,能够在人类所认知的案件事实这一大框架下进行补充。其作为对案件事实认知的补充而无需将其纳入证据范围进行讨论。第三,大数据分析过程及结论往往会存在计算黑箱、大数据证据偏在等问题,导致大数据分析报告可能存在一定误差,不适宜作为证据进行使用。最后为普遍观点的折中说,该说认为应当谨慎适用大数据及大数据分析报告。[参见刘建华:《大数据时代挖掘隐私证据的可采性原则研究》,载《江西社会科学》2018年第9期;张吉豫:《大数据时代中国司法面临的主要挑战与机遇》,载《法制与社会发展》2016年第6期。]第一,若是大数据来源及大数据的收集方式符合相关技术规范要求,则可将其作为证据进行适用。若对获取其结论的程序上存疑,则不适用。第二,大数据分析报告可作为补强证据进行适用。当大数据分析报告有利于犯罪嫌疑人时,将其作为补强证据进行适用。第三,对大数据中的电子数据进行相关关系分析,形成初步证据链条后依传统证据收集方法证明因果关系。

  本文就大数据分析报告能否作为证据进行探讨,以期能够实现大数据分析报告在司法实践中有效应用。

  2大数据分析报告的内涵及其司法运用

  随着信息网络迅猛发展,加之政府主导构建大数据库,大数据已成为社会发展所需利用的重要手段。大数据多元化的特征可运用在社会实践的不同方面,特别是在司法实践中发挥着无可替代的作用。

  2.1什么是大数据与大数据分析报告

  当前,“大数据”这一名词已为大众所知悉。但何为大数据这一问题并无明确答案。因此,可以通过对大数据的特征分析进而了解大数据内涵。普遍认为,大数据即为大量的分散数据,“有着4‘V’特征,即Volume(容量大)、Variety(种类多)、Velocity(速度快)和Value(价值密度低)”。[刘智慧,张泉灵:《大数据技术研究综述》,载《浙江大学学报(工学版)》2014年第6期。]数据分散在不同角落,且类型多样,需要依靠信息系统云计算等方式对其进行收集处理。只有在数据足够充足并经过相关处理之后,方能实现大数据应有的价值。近年来,伴随着互联网迅速发展,大数据信息系统建立,海量数据得到有效收集与利用,由此大数据的威力及其价值不断得到凸显。

  经由信息系统对海量、多种类及价值密度较低的数据进行挖掘、梳理、分析,并依靠计算机逻辑得出相关结论,将其内部的原理、结构等隐含内容进行外部化展现的文件即为大数据分析报告。[参见童飞霜、向培权:《大数据分析报告作为刑事证据的可能与限度——以权利保护为中心的制度回应及规则探求》,载《司法体制综合配套改革与刑事审判问题研究——全国法院第30届学术讨论会获奖论文集(下)》人民法院出版社,第1751页。]也就是说,第一,要对元数据进行收集筛选,获得与案件相关的全部数据;第二,构建相关的数据分析系统即信息系统;最后,大数据经由信息系统获取最终的结论,由此而产生大数据分析报告。在当前海量数据的背景下,大数据分析报告在现实的司法实践中加以使用成为客观现象。

  2.2大数据分析报告在司法实践中的运用

  由于信息技术的快速发展,社会由传统的工业社会转型至风险社会,并向数据化社会转型。近年来非法吸收公众存款、网络诈骗等运用网络进行的刑事犯罪不断增加,加深了风险社会的程度。由此,也带来了刑法观念上的转型,从而使大数据分析报告可能成为证据的重要组成部分。

  其次,在当前的司法工作中,案件不断专业化、信息化,越来越多的犯罪通过计算机进行,涉众型犯罪越来越普遍。面对这些越来越专业、越来越复杂、需要依赖大数据分析的新型案件,多数司法工作人员需要依赖大数据分析得出相关结论并加以适用,实现其证明相关事实的目的。大数据分析报告逐渐成为证据的重要组成部分。以传销类案件为例,此类案件涉及人数众多,且存在大量的资金链。资金通过支付宝或微信等电子支付平台进行流动,必须经过大数据对资金流向进行分析,获取相应信息,将其凝结为大数据分析报告,以确定涉案金额、涉案人数等多个案件重要因素,最后能够成为证明案件事实的证据材料。可见,依赖大数据分析报告证明案情并加以进行判决成为司法实践的现实需要,在司法实践之中发挥不可取代的作用。

  截至2020年1月,搜索关键词“大数据分析报告”及“大数据报告”,共可查询到相关案件78件。[数据来源于中国裁判文书网,见http://wenshu.court.gov.cn/,2020年1月10日。]其中,民事案件共计76件,刑事案件共计2件。[由于大量判决书中并未提及“大数据分析报告”或“大数据报告”,因此无法检索到相关案例。在传销案件、非法吸收公众存款案件等涉众型犯罪及网络犯罪中,常使用大数据对数据进行处理。]对所有可搜索到的裁判文书进行筛选处理,并对民事案件中同案的多个当事人判决文书进行合并,[合并的判决书为同一案件的不同当事人的判决书,且判决内容相同。因此在本文中,对案号为(2019)琼0105民初799号、(2019)琼01民终3532号、(2019)琼0105民初796号等案件共计42件进行合并进行分析。]剔除无关案件1件。[详见判决书(2018)京73民终1134号。判决书中所提及“大数据报告”仅为证明当事人获奖情况的论据之一,并非为案件中涉及大数据相关问题。]最终,共获得样本案件34件。根据判决书中查明事实及说理部分进行梳理,提取判决书中与大数据相关的内容,就大数据分析报告证据认定情况,运用Excel表格进行统计如下:

  表1:判决书中对大数据分析报告认定情况

  认定证据否定证据共计

  民事3 29 32

  刑事0 2 2

  共计3 31 34

  数据来源:依据中国裁判文书网所发布的裁判文书进行整理。

  上述样本案件之中,否定证据主要有以下几种表现形式。第一,对该证据并未进行不予适用的阐述。[详见(2019)琼01民终3459号,中国裁判文书网,http://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=3aa7ba0efbd345d69a55aab90184231d,2020年1月10日。]第二,由于该大数据分析报告与案件无关,因此不予适用。[详见(2019)甘02民初92号,中国裁判文书网,http://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=6f2137d897a3463ea79eab21010d07a1,2020年1月10日。]第三,由于该证据不具备法律效力,故对此份证据法院不予采信。[详见(2017)吉0203刑初417号,中国裁判文书网,http://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=95dfef666c214d9c8e47a8b800cbb82c,2020年1月10日。]对上述判决书进行整理后发现,在民事审判之中,认定大数据分析报告作为有效证据的仅占9.3%。且在大量案件中,并未标明“大数据分析报告”或“大数据报告”等字样,无法通过关键词进行搜索。由此可见,“大数据分析报告”的字样出现于判决书中的情况较少,法官在判决时对大数据分析报告适用持谨慎态度。

  然而,不可否认的是,在与大数据相关案件之中,运用大数据作为证据认定案件事实的判决不在少数,并且大数据在认定案件之中发挥着不可或缺的作用。加之,“法官在心证过程中更倾向于采纳对大数据分析判断得出的事实。”[杜鸣晓:《大数据作为诉讼证据的可行性分析——以互联网租车行业为例》,载《南华大学学报(社会科学版)》2017年第1期。]因此,认定解析大数据的大数据分析报告为证据已成为客观需要。

  3新法定证据主义视野下的大数据分析报告

  当前,我国证据法满足于对证据法律资格的规范和限制,而且还对单个证据的证明力和案件证据的综合评判确立了明确的限制性规则。[陈瑞华:《以限制证据证明力为核心的新法定证据主义》,载《法学研究》2012年第6期。]即为利用法条条文对证据分类进行明确规定,并通过学理等多种方式解释其内涵而对证据进行运用,与传统的法定证据主义存在一定差异,由此称之为“新法定证据主义”。在此背景下,大数据分析报告作为新兴的证据材料进入法官审查视野。由于立法滞后性而无法及时将新出现的大数据分析报告纳入法定证据审查范围,导致在理论界及司法实践中对其运用持不同看法。由此提出以下问题,大数据分析报告是否属于传统证据种类,若不属于法定证据种类能否作为单独证据种类适用?

  3.1大数据分析报告是否属于传统证据种类

  由于大数据分析报告并非法定证据之一,是否将大数据分析报告纳入传统证据种类进行审查,如何认定大数据分析报告的性质在理论上有不同的观点,在实践中司法工作人员也有不同做法。

  3.1.1鉴定意见

  主流观点认为,大数据分析报告为鉴定意见,应当将其纳入司法鉴定范畴。一方面,传统大数据本为静态数据,而加入了计算机逻辑使其成为动态的数据。就此而言,其并非为传统电子证据,而是鉴定意见。另一方面,大数据分析报告作为司法鉴定,可利用现有关于司法鉴定的司法解释对证据进行审查,有利于司法实践。在实践之中,部分大数据分析报告也由司法鉴定机构出具。“安徽平泰司法鉴定所平泰司鉴字〔2018〕002号司法鉴定意见证实:平台数据反映运营中心共发展会员5737人,吸收会员投资298884000元,并造成其中4464名会员损失89821160元。”[(2019)皖刑终118号,中国裁判文书网,http://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=3126b4c36785424788c3ab2600386125,2020年2月18日。]“重庆市科信电子数据司法鉴定所[201705]鉴字第015号《司法鉴定意见书》证明,李志超会员账号WWac001、WWac002、WWac003的下线层级、会员及获利的情况。”[(2018)皖1323刑初41号,中国裁判文书网,http://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=79d0e2accf974a66b797aaff00993bb6,2020年2月18日。]法官将上述内容纳入鉴定意见进行认定。虽在判决之中并未点明大数据分析报告,但是,法官将其作为鉴定意见进行审查认定及适用。

  有学者质疑该观点,认为将其纳入鉴定意见存在问题。首先,鉴定方式存在差异。大数据分析报告依赖云计算完成,与司法鉴定中的鉴定所依赖的科技手段存在差异。大数据分析报告以计算机逻辑完成对数据的挖掘、审查及处理;司法鉴定中虽然在DNA、指纹鉴定中利用“数据碰撞”等方式获取相关信息,但仍以传统的DNA、指纹分析采样为主。其次,法律规定存在差异。由于人的鉴定模式与计算机的鉴定模式之间存在一定差异,因此审查模式的构建应存在一定差异,不能一概而论。传统鉴定意见具有较为完善的法律及司法解释以保证该鉴定意见有较高的准确性,以满足证明力的要求。若对传统司法鉴定意见产生疑惑,则可以再次进行鉴定。然而,大数据分析报告所使用的信息系统可能存在唯一性,更换信息系统再次分析可能导致数据偏差,导致司法资源浪费。

  3.1.2其他证据

  第一,有学者认为其为书证,大数据分析报告为具有特殊性的书证。[参见胡铭、龚中航:《大数据侦查的基本定位与法律规制》,载《浙江社会科学》2019年第12期。]理由为大数据分析报告是运用数据查询、比对和挖掘技术对收集到的大数据进行处理得出的关于案件事实的内容,并以之证明案件事实。然而,书证为案件发生过程中所形成的证据,而大数据分析报告是对案件事实形成过程中对大数据的提炼分析产生的结论性报告。大数据分析报告为结论性意见与书证存在实质上的差异。因此,大数据分析报告在证据的审查判断规则上与书证具有显著差异性。运用书证的审查规则对其进行证据审查及认定,可能存在一定问题。

  第二,有学者认为应将其为证人证言,将其作为机器证言进行认定。[参见Andrea Roth,Machine Testimony,126 Yale L.J.1972(2017).转引自刘品新,《论大数据证据》,载《环球法律评论》2019年第1期。]但是何为“机器证言”没有明确的定义,在学界内也很少承认机器证言为证人证言的一部分。因此在既无法律依据也无学理依据的情况下,贸然认定其为证人证言的组成部分,无法为大多数司法工作人员接受,且若作为判决依据进行判决,也无法为普通公众所接受而失去其应有的社会影响力,进而影响其公信力。就此,将其纳入证人证言较为不合理。

  第三,作为侦查材料进行表述。“根据通话详单、活动轨迹、大数据分析等手段发现‘土匪’系邵阳县塘渡口镇江边村的龚某良,还经李某辨认予以确认,从而对其进行重点侦查,最终将其抓获”[(2018)湘05刑终25号,中国裁判文书网,http://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=1b7720f7afe44efbb2f2a9be00d10e4b,2020年2月18日。]。在本案判决中,虽然是用以证明其他犯罪嫌疑人的犯罪行为以成立该犯罪人的立功,但在本判决文书中可以看出,法官对于大数据分析的态度是将其看作侦查的过程,并未列入证据范围进行考量。

  3.1.3新证据种类

  有学者认为,应当将大数据分析报告列为新证据种类。[张建伟教授认为,应当将其列为新证据类型。参见何家弘等:《大数据侦查给证据法带来的挑战》,载《人民检察》2018年第1期。]由于大数据分析报告具有其独特性,归入任一法定证据种类均不能完全体现其在诉讼中的价值,若将其列为独立证据种类并建立与之相适应的制度,能够高效利用大数据分析报告,以实现其价值。且若不将其作为新的证据种类,司法人员在进行审查时可能出现困惑。

  上文对大数据分析报告证据种类的论述,体现了理论界及实务中对于大数据分析报告的思考,在论证过程之中具有一定的合理性,符合当前的实践需求。但少部分判决将其纳入书证、证人证言等理论并未从实质上分析了解大数据分析报告的特性。大数据分析报告与书证、证人证言的性质存在较大差异而无法纳入其范围进行审查。

  通过裁判文书表述可知,将其纳入鉴定意见进行审查为当前普遍做法,将其纳入鉴定意见进行审查适用。鉴定意见有较为完善的审查模式及法律依据,由此避免大数据分析报告作为结论性意见产生误差的风险,能够更便宜地适用。参照鉴定意见的规定对大数据分析报告进行审查,可以提高司法效率,满足司法经济性需求。然而,两者虽均通过科学技术手段获取所需的信息,但是传统鉴定意见与大数据分析报告存在一定差异。因此,将大数据分析报告纳入鉴定意见进行审查较不适宜。

  首先,两者之间得出结论方法存在一定的差异。传统鉴定意见以人的逻辑加之科学逻辑得出相关结论,传统的DNA、指纹比对等均依靠大数据库进行数据碰撞完成,但仅通过数据碰撞确定相关人员信息,为简单的利用数据信息系统。仅为获取鉴定结论性意见中的一个步骤,即为专业人士借助相关仪器获取最终结论,并非完全依赖机器逻辑完成。大数据分析报告为机器逻辑,全程依赖机器逻辑得出最终结论,无需人的参与。其次,传统的鉴定意见针对其结论有较强的可解释性,但是大数据分析报告无法结论作出相关解释可能性较小。

  最后,从实践角度看,第一,鉴定意见的司法解释经由长时间司法实践而成,构建了较为完善的审查规范。但是,在当前的立法及司法解释中并未明确规定将大数据分析报告纳入鉴定意见进行适用,因此,直接纳入鉴定意见审查范围其合法性仍待探究。第二,由于我国立法及司法解释相对落后于当前社会发展的审判需求,司法解释往往依赖相关案件判决经验总结形成,无法在短时间内完成相关立法及司法解释的工作,对司法工作人员应当如何适用大数据分析报告产生影响。第三,“大数据分析报告如果作为新的证据形式呈现,并且能够将数据可靠地、或者较高概率地向结论传递,即满足了证明力要求。”[周蔚:《大数据在事实认定中作用机制分析》,载《中国政法大学学报》2015年第6期。]面对司法实践的新情况、新变化,大数据分析报告应当独立成为证据种类,针对其独特性相应构建相关的规范,更为贴切地将大数据分析报告作为证据进行审查。

  3.2不属于法定的证据种类能否作为证据使用

  所谓“法定证据种类”,即为利用专门法律条文对证据种类进行规定,由法律进行明确规定的证据种类。[参见林劲松:《法定证据种类的解释视角反思——以刑事诉讼为中心的分析》,载《浙江大学学报(人文社会科学版)》2016年第4期。]对证据进行详尽划分的目的在于更方便地对呈堂证据进行审查,方便对不同特点的证据进行把握,不允许将法律未规定的证据材料作为证据适用。我国在《刑事诉讼法》中对证据种类进行了明确规定,构建了封闭的证据体系,对证据进行细致划分。大数据分析报告作为新兴证据材料无法及时纳入证据范围进行审查,从而导致在实践中大数据分析报告无法直接用作证据。在证据种类法定主义背景下,大数据分析报告未列入法定证据种类。由此提出疑问,未列入法定证据种类范畴的证据材料是否就不能作为证据使用?

  从实质上看,长时间运用法定证据种类,对证据作出静态理解,忽略了证据涵义的多重性、证据形态的多样性、证据的动态性及证据与举证的不可分性。[龙宗智:《进步及其局限——由证据制度调整的观察》,载《政法论坛》2012年第5期。]即为忽视了诉讼程序中对证据的内涵、形态及诉讼过程证据的适用,无法更为全面的反映证据的内涵及价值,更无法及时涵盖不断涌现的证据材料,对新兴证据材料的运用产生影响。作为新出现的大数据分析报告,其基础为大数据。大数据在形成的过程中往往记载大量与案件相关的数据,承担记录相关数据的重要作用。元数据存在一定的分散性,数据之间也存在弱相关性,审查分析数据所需的强专业性,在一定程度上也增加了篡改、删除数据的难度。因此,在一定程度上能够保证元数据的真实性,从而在一定范围内满足大数据分析报告作为证据的真实性及关联性要求,在与大数据相关的案件中可以作为证据证明相关案件事实。当前,由于法定证据制度的限定,无法将大数据分析报告纳入证据审查范围,对相关案件的事实认定可能会产生一定的难度,导致在司法实践中大部分判决未直接将大数据分析报告作为证据适用,而是将其变通纳入鉴定意见进行审查,或在判决中将其作为书证、侦查材料加以利用。

  综上,若对证据载体作开放式规定,则可以规定证据定义,以便将符合证据内涵要求而法律又未明确规定的证据载体用作诉讼证据。[龙宗智:《进步及其局限——有证据制度调整的观察》,载《政法论坛》2012年第5期。]在一定程度上减少由于证据种类法定对大数据分析报告运用的影响,能够及时将其纳入证据范畴进行审查,并及时构建与完善大数据分析报告的审查机制。

  4大数据分析报告作为证据的可行性

  当前,随着网络的不断发展,在案件中将大数据分析报告作为证据使用的现象将迅猛剧增,这给传统法律理论下如何应用大数据分析报告提出了迫切的现实要求。实际上,通过法理及司法实践事实分析,大数据分析报告作为证据有其理论和实践价值基础;尽管其所蕴含的机器思维对传统证据的因果关系特征形成了挑战,但实质上两者仍具有关联性,只要在技术和机制上对大数据算法黑箱及证据偏在加以规制并构建相应的制度,大数据分析报告作为证据在当前及未来就必然有其适用的可行性。

  4.1纳入证据审查的理论及实践价值基础

  将大数据分析报告纳入证据范围需从两个角度进行分析。一方面,在理论上大数据分析报告是否可以作为证据纳入当前的法定证据范围内进行审查,以适用当前的相关法律及司法解释;另一方面,在实践中该分析报告作为证据是否能够发挥其相应价值,提高司法效率。

  4.1.1理论价值基础

  近年来,学界对大数据分析报告是否纳入证据范围审查进行深入研究,对其能否作为证据也进行了广泛探讨。在引言中所论及的三种观点,均有其合理之处。然而,在信息技术迅速发展的当下,持肯定说的观点未关注到大数据分析报告可能存在的问题,在无明确法律及司法解释规定的情况下,若全盘接纳,无计算机专业知识司法人员如何确定此类证据是否需要排除,如何将其纳入证据审查范畴进行审查?否定说中,虽然认为“数据经验”[在事实认定过程中基于大数据分析的“数据经验”能够填补人类对繁杂信息的认知能力。详见周蔚:《大数据在事实认定中作用机制分析》,载《中国政法大学学报》2015年第6期。]能够作为补充,无需对“数据经验”进行相应的证据审查。但是“数据经验”能够在事实架构下更为完整的解决争议焦点,也具有作为证据存在的意义。在此基础上,若运用其他与之不相符的方式进行审查,可能导致审查结果出现差异,因此需纳入证据范畴进行讨论。这些有益的探讨,深化了对大数据分析报告作为证据的理论价值的认识,也为其在实践中运用奠定了理论基础。

  将大数据分析报告作为证据,是以客观存在作为认定案件事实的法律需要。证据的形成过程实质上就是人对法律需要的过程,在法律需要的视角下审视大数据分析报告证据,实质是以客观存在作为认定案件事实的基础的一种法律需要。在当下众多观点中,折中说不失为对待大数据分析报告较为合理的看法。首先,在司法审判的过程之中,不可避免的会接触大量的信息数据。近年来,“e租宝”及“快播”案等互联网相关案件,均需处理海量数据来认定相关案件事实。其次,在计算机信息系统不断发展完善的情况下,可以在一定程度上依靠信息技术系统对大数据进行分析处理。虽然可能存在数据偏差及计算黑箱的问题,但是从数据采集及信息系统的构建及完善到最终得出结论,有一系列完善的证据采集规则进行支撑,可以在很大程度上降低大数据分析报告出现偏差的风险。当然需要通过构建严密的证据审查程序对证据进行审查。

  将大数据分析报告作为证据,是主动运用科学技术更新证据制度的需要。飞速发展的大数据对现代证据制度带来了前所未有的冲击,大数据技术对证据制度产生极大影响,为此,讨论大数据作为证据的理论基础,必然要去关注其科学基础。大数据分析报告纳入证据审查,是对科学理性的认同与尊重。在大数据技术迅猛发展时,主动运用大数据技术去更新证据制度就成为必然。

  4.1.2司法实践价值

  通过上述大数据分析报告在司法实践运用现状分析,大数据分析报告发挥了其作为证据的价值。可以预见在将来的司法实践中,其效用价值会不断得到加强和凸显。

  首先,司法实践依赖大数据成为现实,大数据分析报告发挥不可替代作用。当前,通过OA系统、支付宝等依靠互联网进行办公、交易,大数据成为了社会生活的客观需要。在以网络为主要媒介的案件之中,更能凸显大数据的重要性。以贺某组织、领导传销活动罪一案为例[参见(2019)湘1281刑初37号刑事判决书。http://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=a844a4fcdad8450f992aaa9b0098b4c5,2020年2月18日。],本案中,通过开发的网络平台及手机APP,以收取会员会费的方式进行传销。通过推荐人拿到月码,并通过“静态”及“动态”获得收益。该犯罪人账号所在层级为25,并拥有下层层数23,下级会员总数为2967人。由此可见,该传销网络、数据体量巨大。其依赖网络平台进行资金流通,并通过其后台统计一账号下线数量及所获金额。其资金流及数据流均通过网络平台,均需依靠计算机获取上述数据流及资金流以证明相关的案件事实,且须对所有材料进行甄别。海量数据由司法工作人员逐条筛选并获取证据并不现实,且在海量数据中提取相关数据无法进行解读,因此必须依赖大数据通过云计算进行处理获取所需数据并得出结论。

  其次,“证据是一种稀缺的资源,证据短缺是人类司法的永恒规律。”[刘品新:《论大数据证据》,载《环球法律评论》2019年第1期。]人在不断寻找降低证明难度的方法。在网络犯罪高发的情况下,当大数据海量且难以审查时,提炼大数据关键内容的大数据分析报告就具有了存在的价值和意义,在案件的审查和处理过程之中,更具有可操作性。虽然,在判决书中明确点出使用大数据分析报告的判决书较少,但事实上,在判决过程中大数据及其分析报告在判决中发挥着作用。

  综上,无论是对从理论上还是在司法实践中,大数据分析报告均具有重要价值。将其纳入证据范围进行审查是具有可行性的。其能在一定程度上降低司法人员处理数据难度,降低司法成本,提高司法效率。

  4.2大数据相关关系与传统证据因果关系具有关联性

  从传统法理看,大数据分析报告作为证据是否可行,其中的依据的是大数据分析报告与案件事实是否存在因果关系。而大数据的弱相关性,使人们对大数据分析报告作为证据的可行性产生怀疑。但是,与传统证据所具有的因果关系特征对比分析来看,在强调两者在特征上差异的同时,也不能忽视两者之间的联系。大数据的相关关系是因果关系的衍生与突破,是作为因果关系的补充而存在,并非全然瓦解对因果关系的传统理解。为此,大数据分析报告作为证据运用的可行性有其哲学意义上的理论依据。

  具体来说,传统证据与案件事实存在的因果关系具有较强的关联性,在司法实践之中其不断得到强调应用,从我国《刑事诉讼法》的排除非法证据这一规则中得到体现。《刑事诉讼法》第56条规定:“采用刑讯逼供等非法方法收集的犯罪嫌疑人、被告人供述和采用暴力、威胁等非法方法收集的证人证言、被害人陈述,应当予以排除。收集物证、书证不符合法定程序对该证据应当予以排除”。即若运用暴力、威胁等方式获得的证据与取得证据之间存在因果关系,则该证据需要排除。因此,传统证据的因果关系具有较强的关联性,是传统证据适用在法理上的要求。而大数据对相关关系的分析是通过数值的变化来体现现象之间关联的强弱,即为大数据之中的已知数据和未知数据之间的关联性分析由数值变化体现。大数据在其所涵盖的数据之中找到关联关系,寻找已知数据与未知数据的关联性。大数据所强调的是量化,“包含物的数据化和数据物化的两个范畴。”[倪春乐:《大数据侦查的样态和机理——基于大数据认识论的思考》,载《中国人民大学学报(社会科学版)》2019年第5期。]均基于数据对所需的条件及内容进行筛选。在当前的司法实践中,特别是依赖大数据的案件,需证明的案件事实散落在不同的元数据之中,成为信息碎片。需要在获取的所有数据之中筛选分析所需数据,对庞大的数据进行云计算并直接获取相关结果,以获得相关信息,使混在无序的数据中的所需数据得到精确。可见,大数据分析是典型的机器思维,具有相关关系弱的特征。

  基于上述分析,两者之间的特质差异,使大数据的弱相关性对因果关系的传统理解造成了极大冲击。传统的因果关系这一强关联关系,与大数据之间的弱相关性发生冲突。直接得到的结果使大数据分析报告不能满足对证据的关联性、真实性及合法性的要求。当弱相关性与传统的因果关系发生纠缠,使得人们对大数据分析报告具有的相关性特征能够应用于传统的因果关系的印证模式产生疑惑,对大数据分析报告能否作为证据持否定态度。

  但是,尽管大数据相关关系表现与因果关系可能存在差异,但其与案件存在关联性是不可否认的,在对案件事实的确认上与因果关系是殊途同归。表面上看,大数据基于的机器逻辑与人的逻辑格格不入,存在冲突。但事实上,通过大数据的相关关系挖掘潜在联系,弥补人类经验之中无法获取的相关关系,是为相关关系对因果关系的补充。大数据在结构内弥补人无法认知大量数据的缺陷,使得各方所需证明主体之间能够获得联系,构建较为完整的案件事实架构。大数据实质上在已知事实与未知事实之间搭建桥梁,通过大数据挖掘以获得关联。大数据通过对传统思维模式的丰富而提供更为完整的因果关系链条,为因果关系的发展提供更为广阔的空间。通过挖掘“人类经验”无法获知的关联关系,提供更为全面立体的案件事实。思维的转换并非是降低证明标准,仅是思维之间存在差异。

  因此,不必纠结于大数据本身与分析报告结论之间是否存在严密的因果关系,可在认定整体大数据与分析报告结论关系的过程中改变传统逻辑推导模式,适应“机器逻辑”的推导过程;在大数据分析报告与案件事实的认定推导过程依然沿用传统的因果关系证明模式,该部分依然需要“人类经验”才能保证大数据分析报告真正能够发挥效用。认定的思维模式即为“机器逻辑—因果关系”,即对大数据及大数据分析报告之间的关联关系依靠机器逻辑进行分析,大数据分析报告与案件事实之间的联系仍依靠传统的因果关系进行确认。通过认定思维的转换完成对整体大数据与大数据分析报告与案件事实之间的关联性联结,从而可以认定大数据分析报告作为证据运用。

  4.3大数据算法黑箱及证据偏在可以进行规制

  大数据分析存在算法黑箱及证据偏在,也使人们对大数据分析报告作为证据运用产生疑虑。确实,大数据算法黑箱及证据偏可能导致大数据分析报告运用过程中存在偏差,导致证据运用过程中存在问题,最终可能影响判决结果。但是,可以通过对算法黑箱及证据偏在进行规制,以降低对其对证据证明力的影响,保证其作为证据能够适格。

  4.3.1算法黑箱之应对

  由于大数据需通过云计算及信息系统得出相关结论,其具有一定的隐秘性。算法的“黑箱性”可能天然地与法律决策的“透明性”要求相冲突。[左卫民:《人工智能在中国运用前景的若干思考》,载《清华法学》2018年第2期。]由于大数据分析中存在一定的特殊性,其由数据算法得出,也有可能涉及数据模型对数据进行处理。算法设计的内在缺陷以及外部数据诱导将算法从原本的中立性运作轨道转向带有价值评断的岔口,这也引发了包括算法偏见和算法歧视等诸多现实问题。[杜小奇:《多元协作框架下算法的规制》,载《河北法学》2019年第12期。]由于算法黑箱是一直以来的技术难题,其原理具有不可解释性和得出结论过程的不透明性,对法庭质证产生影响。[参见童飞霜、向培权:《大数据分析报告作为刑事证据的可能与限度——以权利保护为中心的制度回应及规则探求》,载《司法体制综合配套改革与刑事审判问题研究——全国法院第30届学术讨论会获奖论文集(下)》人民法院出版社,第1756页。]例如,2016年美国威斯康星州法院在State v.Loomis案件量刑时,借助了COMPAS软件技术即利用大数据及算法的技术进行量刑。COMPAS为简单的类型化的输出数据,被告人以侵犯其的正当程序权利和平等保护权为由提起上诉,即其具有获得个别化量刑的权利。而引发利用信息系统获取大数据分析报告作为证据适用的讨论。[汪庆华:《人工智能的法律规制路径:一个框架性讨论》,载《现代法学》2019年第2期。]这说明大数据分析报告虽然应用在司法活动中,但是由于其算法黑箱而对判决结果产生了一定程度的不信任,进而对判决的公信力产生影响。

  也有人提出,技术中立不会对输出结果产生影响,因此可以信赖该结果并作为证据适用。表面上看技术的使用不会存在偏差,但技术背后是人,因此大数据程序在编写过程中可能会产生由人的偏见而产生的误差,可能会形成人为的不正当的干预。且算法存在之初便以追求效率而存在,通过信息系统获取输入的数据及获取的结果的过程无法为常人所理解。如此就无法判断是否存在人为的不正当干预。在一些预测性的大数据分析报告中,由于编程原因可能导致对某固定群体产生预测偏见。例如,非营利机构ProPublica曾对COMPAS的评分数据进行统计分析,得出结论“黑人被告有45%的可能比白人被告得到更高的分数”。[Compas—analysis,https://github.corn/propublica/compas—analysis/blob/master/Compas%20Analysis.转引自崔靖梓:《算法歧视挑战下平等权保护的危机与应对》,载《法律科学(西北政法大学学报)》2019年第3期。]由此可知,大数据分析报告的利用往往会受到算法黑箱的影响,即算法黑箱会对该证据的证明力产生影响。因此,要保证提高大数据分析报告作为证据的可行性,需对算法黑箱进行规制,提高其作为证据的证明力。可以从以下三个角度保证其真实性。

  首先,要对云计算的信息系统的构建进行审查监督,并建立相关机制。信息系统编程规制主要目的在于减少由于数据偏差及算法偏见造成的大数据分析报告的误差。须由法律工作人员及技术人员共同对可视化的算法结构进行探讨,完善规制及审查模式。法律工作人员提出构建信息系统构建需求,技术人员在了解法律需求之后,对云计算信息系统进行构建,以满足相关法律规范的要求。通过对构建过程的规制,以减少技术人员的技术偏见。并对算法逻辑的备案,也可以要求算法开发设计人员进行注册。此举在一定程度上减少算法偏见,保证输出结果的准确性。对开发人员的注册事实上为监督方式之一,能够有效限制技术权力。

  同时,既然基于机器逻辑的大数据分析报告被作为证据提交法庭,那就应当要求设计者公开获取结论信息系统的技术方案。如果不公开,大数据证据就难以满足真实性标准。在上述State v.Loomis案审判认为,算法为公司的商业秘密,无法对其进行公开。欧盟《一般数据保护条例》赋予数据主体以免于自动化决策的权利,在保障个人数据权利的同时,也对智能算法进行一定程度上的规制,以保证在维护个人权利的同时保障大数据的顺利应用。就此而言,要对算法在一定程度上进行公开。在对算法公开的同时,可以对司法裁判所需数据可对其算法进行可视化处理。例如,谷歌大脑团队公布了一项题为“可解释性的基础构件”的研究成果,解决了算法的可视化问题。[Chris Olah,“The Building Blocks of Interpretability”,https://distill.pub/2018/building-blocks/,accessed on March 15,2018.参见郑戈:《算法的法律与法律的算法》,载《中国法律评论》2018年第2期。]通过对算法的可视化,普通人对其具有直观感受,即直观了解如何对数据进行提取简化,以可视化的方式对算法进行公开,以获得最终分析结果,以保证判决结果具有公信力。

  其次,需通过司法鉴定所对大数据分析报告进行鉴定。若能有相应的鉴定机构对大数据分析报告进行更为科学的审查判断,进行技术上的测试,司法裁判则更具有公信力。虽然不能将其作为鉴定意见进行审查,但吸收第三方的力量进行监督以提高大数据分析报告的真实性。前期虽有监督力量介入以保证信息系统偏差减少,但对输入数据也需要鉴定审查,确保其输入数据整体与案件事实相关。将数据审查纳入该环节,从整体与个体角度对数据进行审查。一方面,专业性极强的大数据需由专业人士进行数据审查;另一方面,可以减少司法工作人员在审查数据的时间,提高司法效率。

  最后,对可通过法庭对大数据分析报告进行质证,以保证大数据分析报告的证明力,通过法庭质证确定证据的真实性。在现实审判案件之中,对证据进行审查运用的方式之一即为以法庭对抗认定证据。法庭质证为当前学者所认为的最为灵活的确保大数据证据真实性的方式。组织法庭对抗,对大数据分析报告的进一步认识能够对证据实现最终确信。需要组织听证会听取各方专家意见一样,法官在评估一个(机器)算法的方法论与可靠性时,同样可以召集听证会听取双方专家的作证意见。[刘品新:《论大数据证据》,载《环球法律评论》2019年第1期。]其一,通过听取专家辅助人的意见保证大数据分析报告的准确性。其二,在法庭上进行相关证据质证,能够对普通人所不理解的问题进行阐释,从而揭开大数据的面纱,以解决大众对大数据分析报告的疑惑,从而降低对大数据分析报告适用的排斥心理,以保证司法公信力。其三,依靠专家辅助人对争议焦点进行关于证据真实性、关联性的辩论,以厘清案件事实,让法官对相关问题得到更明晰的判断。

  综上所述,尽管大数据存在影响其作为证据证明力的黑箱算法,但可以在技术及机制上进行规制,保证其作为证据真实性的要求。

  4.3.2证据偏在之应对

  所谓证据偏在是双方证据掌握可能性的差异较大,即一方当事人更易获取相关证据,从而具有证据优势,导致出现控辩双方权利不对等的情况。由于大数据得出结论需依靠信息系统,因此,在获取证据的过程中可能会存在证据偏在问题,即由于技术的专业性而导致的双方获取证据权利不平衡,从而出现法庭双方举证质证权利不均衡,也可能导致技术压制问题。当前学者认为庭审理想的状态为,改革现有规则,以实现控辩双方在面对包括大数据内的电子数据证据时,在搜集、获取、分析、呈现等方面具有大致相当的能力。[裴炜:《个人信息大数据与刑事正当程序的冲突及其调和》,载《法学研究》2018年第2期。]由此,大数据分析报告作为技术结论报告,将其作为证据适用,可能无法实现控辩双方权利平等的理想状态。

  同时,数据在成为权利的同时与公权力在不断进行互动,逐步演化成数据权力。大数据获取、分析等技术具有极强专业性,算法技术的先发组织和商业主体掌握了算法的设计标准和设计权力,从而就获得了以数据为基础进行算法决策的权力。[崔靖梓:《算法歧视挑战下平等权保护的危机与应对》,载《法律科学(西北政法大学学报)》2019年第3期。]掌握相关技术的信息系统掌控者,可通过大量所收集的数据获得相关证据内容;公权力通过与技术掌握者进行合作,由此获得其所需数据及分析结果;大型互联网公司通过其所掌握的数据及其资金优势获取相关证据更为便捷。在民事或刑事案件审判过程中,掌握技术一方往往更具证据优势,从而导致由于技术产生的偏在问题更为严重。国家权力加之技术权力的优势压制,在辩方与控方之间造成信息鸿沟,导致控辩双方权利失衡,从而出现技术压制权利的情况。以刑事诉讼为例,首先,辩方与控方相较而言,辩方不具备相应的专业知识及资金能力以获取相关的证据,导致了其在实质上无法进行辩护。以李某、叶某安、徐某奎等集资诈骗罪二审刑事判决书为例,本案中,平台数据反映运营中心共发展会员5737人,吸收会员投资298884000元,并造成其中4464名会员损失89821160元。[参见(2019)皖刑终118号,中国裁判文书网,http://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=3126b4c36785424788c3ab2600386125,2020年2月25日。]且存在大量的支付宝平台流水记录,获取该海量数据需依靠具有专业技术的平台加以收集,并与阿里巴巴公司合作获取支付宝流水记录。由此可见控辩双方获取相关信息能力差异较大。

  其次,对被告人而言,在不同条件下获取证据能力存在差异。其一,若其人身受到限制且无相关能力获取上述信息,导致在对相关证据进行质证时,无法发挥法律赋予其的权利,个人的权利受到压制。其二,若被告人为掌握数据一方,可能会对数据进行销毁、处理或篡改,甚至可对基础数据进行造假,从而导致控方证据收集困难,利用技术优势地位而减轻或逃避处罚。在民事诉讼中,若一方运用大数据进行举证,另一方因无相关专业知识而无法有效质证。

  由上可知,大数据分析报告可能存在证据偏在。因此,要解决证据偏在问题以保证证据的证明力。我国《个人信息安全规范(草案)》中,第7.10条“约束信息系统自动决策”也只是赋予了个人提出申请的程序性权利,并不涉及实质约束。[许可:《人工智能的算法黑箱与数据正义》,载《社会科学报》2018年3月29日。]在该草案作为行政法规规范个人信息安全,以减少由于技术导致个人信息权受到过度侵犯,事实上是对个人权利的保护。说明了职能部门已意识到技术强权环境下对个人权利压制,由此,在证据偏在的情况下重点在于如何维护弱势一方的质证权。对个人权利的维护可以从以下三个途径保障弱势方的权利:

  首先,赋予其获取大数据的权利。若弱势一方认为,其需要获取相关大数据内容,可以通过法庭向对方或掌握大数据的第三方调取数据,法院对其所需数据进行审查后,向申请方提供相关数据。“人工智能的发展让公检法享有了独立的数据源,实现了内部数据共享。”[马靖云:《智慧时代商谈式刑事辩护的情境构建与司法功效》,载《安徽大学学报(哲学社会科学版)》2019年第4期。]因此,通过向法院申请,也能够调取其内部共享之数据。此方式一方面保证申请方能获取所需数据,另一方面,经由法院对其审查,数据质量得到保证且符合证据要求。其次,授予其大数据分析权利,即在申请获得大数据原始数据后,可向第三方申请对大数据进行分析以获取相应结果。

  最后,对作为证据的大数据分析报告有申请再次鉴定的权利。若对鉴定结果存疑,可向司法鉴定机构再次申请鉴定,以保证弱势方的质证权得到有效实现。同时,也可以通过庭前会议三方对分析报告进行解读,使得无法获取大数据一方能够及时对大数据分析报告及其所包含的数据内容进行提前了解,决定法庭上是否对该证据提出异议而要求再次进行鉴定。在刑事诉讼中,若检方掌握数据信息系统,则可向当事人进行开放共享。当事人也可由此方式获取大数据及分析报告,可对数据提取分析等过程进行监督,提高司法效率。

  5大数据分析报告证据收集、保全与审查制度的构建

  大数据分析报告能够成为证据,且“证明力问题主要交由法官自由心证,同时严格证据能力(或者资格)审查,实现审判程序对审前活动的制约。”[杨波:《审判中心下印证证明模式之反思》,载《法律科学(西北政法大学学报)》2017年第3期。]要对其进行证据审查,并根据大数据分析报告的特性构建与之相适应的法律制度,以完善对大数据分析报告的审查制度及证据保全模式,以保证证据的适格。

  5.1大数据分析报告证据收集保全制度构建

  对证据既需要从实体上进行审查分析,也要从程序上保证证据采集及保全的完整性。大数据分析报告是衍生于大数据的证据材料,须通过对所需数据进行合理的采集及保全,以求大数据的完整及准确性,减少大数据分析报告的偏差。由此,需对大数据采集过程进行控制,于程序上降低大数据证据采集而导致偏差的风险。

  由于大数据与电子证据有一定的相似性,可以在一定程度上参照电子证据的收集及保全方式,对其储存介质及设备、储存内容、系统状况及其形成过程,提取过程进行严格的程序控制。

  首先,对大数据提取过程需要进行详尽的记录及录像。记录内容包括提取时间、地点、方式、人员及用于大数据分析的信息系统。通过记录以判断司法工作人员收集取证过程之中是否违背程序要求,而对数据采集结果产生影响。并公开相关信息系统代码,以保证信息系统有一定透明性,保证数据分析过程得到监督。其次,要对原始介质需要进行封存并对相关数据进行备份。若存在客观原因无法对大数据原始介质进行封存,需通过对大数据备份以保全所有数据。若元数据产生误差或出现问题,可及时通过封存介质再次提取、收集相关数据。通过对介质及数据的封存备份,在一定程度上方便后续对大数据完整性的审查,保证所有相关数据能够进入大数据分析范围内,最大程度减少大数据分析的误差。再次,需要对所封存及扣押的原始介质进行完整登记,细化相关内容。若后期需对数据进行补充,可以通过相关登记尽快找到所需数据进行分析。最后,通过对完整的、与案件相关的所有数据进行提取保全后,通过信息系统获取大数据分析报告。从程序上对大数据进行限制能够在一定程度上保证大数据分析报告的真实性。

  5.2大数据分析报告证据审查制度构建

  大数据分析报告是通过云计算对大数据分析得出结论,对大数据分析报告的审查需分层次进行审查。由此,提出以下方案对大数据分析报告进行审查,以保证大数据分析报告的真实性。

  图1:大数据分析报告分析路径

  通过上图可知,对大数据分析报告的审查需从大数据中的单条数据、大数据整体及大数据分析报告进行审查。因所需审查的三个方面均有不同的特性,因此需依据不同的审查要求进行审查。

  首先,要对大数据分析报告本身进行审查。因大数据分析报告本身与鉴定意见有相似性,因此可以类比鉴定意见进行审查。第一,审查大数据分析报告的形式要件。该报告是否为具有资质的机构,具有资质的鉴定人员所进行的报告;报告的内容是否与案件事实相关。第二,在通过云计算获得该报告时,需对云计算的编程内容进行相应的审查,判断是否符合相关的算法规则及程序。在编写系统程序时虽为专业人士构建,但可派遣相关人员对算法构建及运行过程进行监督。

  其次,是对整体数据进行审查。第一,主要审查范围为是否已经获取了与案件有关的全部数据。若大数据本身存在偏差,有可能会造成大数据分析结论内容存在误差。并且,可能存在数据偏见,所以必须要对数据源进行严格把关,以降低整体大数据偏差的可能。第二,所提取的大数据是否具有真实性需进行审查。即为从信息系统之中提取的大数据是否为在案件事实发生过程之中客观产生的数据,与案件是否具有真实联系。

  最后,是对元数据的真实性进行审查。大数据由元数据构成,因此也需对元数据的真实性进行相关的审查。众所周知,大数据由海量元数据构成,对每一条元数据进行审查是不现实的。由此须以抽样的方式对元数据进行审查。然而有学者对抽样产生质疑,抽样取证中样本证据与待证事实之间只有部分同一性,但依据推理样本证据证明了全部待证事实。[杨帆:《海量证据背景下刑事抽样取证的法治应对》,载《法学评论》2019年第5期。]该说法存在一定合理性,即其他的非样本证据无法通过传统的一一对应的方式进行证明,未经审查而无法直接发挥证明作用。但是,从概率论来看,当样本数据足够多时,样本数据中事件发生的概率接近于总体事件发生的概率。[徐惠:《大数据证据之可行性研究》,载《山东警察学报》2019年第6期。]即在获取大量数据样本后,事件最终发生的概率,即为事件可能发生的概率。所以遵照相应的科学化的方式进行抽样,可以尽量避免数据偏差的情况发生。加之,在印证模式之中,推定也是对部分案件事实进行印证而推导出部分事实。在涉及重要部分案件事实,依然适用“非法证据排除”规则对证据进行审查。因此,在审查相关证据时,结合现实因素进行考量,则无需对抽样审查是否降低证据证明标准这一问题过于担心。通过完善对样本的提取、质证、审查的过程监督,保证样本质量。