生成式人工智能辅助识别虚假诉讼的审视与展望Generative AI in False Litigation Detection: Current Landscape and Future Directions
杨春磊,刘聪
摘要(Abstract):
虚假诉讼是现行民事诉讼制度下的难以根除的痼疾。晚近兴起的大数据建模因其技术路线的固有缺陷而未能承接虚假诉讼治理的多方需求,DeepSeek等生成式人工智能的底层技术逻辑则与这一司法场景高度契合,有望在知识构建、交互能力、场景兼容三大维度上推动虚假诉讼治理的技术变革。然而,现有的生成式人工智能技术尚无法完全克服技术可靠性风险,亟需在虚假诉讼识别场景中通过规范与技术协同加以规制。展望未来,应依照技术演进规律对基础模型进行“精耕细作”;遵循司法安全要求,通过本地部署与联邦学习构建互联互通的大模型体系;按照社会正义实现的理性需求,设立耦合规范对办案过程中的人机关系加以调整;围绕均等化原则,在技术扩散规律与司法应然公平之间寻求平衡,从而实现更高效、更公正的虚假诉讼治理。
关键词(KeyWords): 生成式人工智能;虚假诉讼;法律大模型;大数据建模;DeepSeek
基金项目(Foundation): 教育部产学合作协同育人项目“地方立法卓越人才培养模式研究”(230804647160258);; 湖北省域基层治理研究中心课题“数字技术赋能地方网络暴力信息治理路径研究”(20241217)
作者(Author): 杨春磊,刘聪
DOI: 10.19828/j.issn1673-2391.2025.05.012
参考文献(References):
- [1]周翔.司法人工智能对裁判说理的辅助价值和实现路径[J].法学杂志,2024(1):111-127. [2]周维栋.生成式人工智能类案裁判的标准及价值边界[J].东方法学,2023(3):47-60. [3]郑曦.生成式人工智能在司法中的运用:前景、风险与规制[J].中国应用法学,2023(4):81-93. [4]陕西省人民检察院课题组,王旭光.民事虚假诉讼检察监督研究[J].法律科学(西北政法大学学报),2024(2):67-80. [5]孙宋龙,彭曦,曹俊梅.大数据法律监督模型的理论与实践[J].检察风云,2024(5):60-62. [6]贾宇.大数据法律监督办案指引[M].北京:中国检察出版社,2022:145-146. [7]刘品新.论大数据法律监督[J].国家检察官学院学报,2023(1):76-92. [8]胡铭,陈竟.大数据法律监督建模的定位、流程与方法[J].北方法学,2024(1):5-19. [9]刘金瑞.生成式人工智能大模型的新型风险与规制框架[J].行政法学研究,2024(2):17-32. [10]赵精武.DeepSeek法律人使用指南[EB/OL]. https://mp.weixin.qq.com/s/JdSJHQPhA_Eks9Fx CZcApw,2025-02-03. [11]SuperCLUE.中文大模型基准测评2024年度报告[EB/OL]. www.cluebenchmarks.com/superclue_2024,2025-02-03. [12]Dhoni P. Exploring the Synergy between Generative AI, Data and Analytics in the Modern Age[J]. Authorea Preprints,2023(1):1-13. [13]Rahul Agarwal, Andreas Kremer, Ida Kristensen,et al. How generative AI can help banks manage risk and compliance[EB/OL]. https//www.mckinsey.com/capabilities/risk-and-resilience/our-insights/how-generative-ai-can-help-banks-manage-risk-and-compliance,2024-10-03. [14]龚善要.生成式人工智能赋能公共法律服务的范式转型[J].东方法学,2024(5):88-100. [15][德]尤尔根·哈贝马斯.交往行为理论(第1卷)[M].曹卫东译.上海:上海人民出版社,2018:132. [16]王禄生.ChatGPT类技术:法律人工智能的改进者还是颠覆者?[J].政法论坛,2023(4):49-62. [17]沈明磊,张龑.司法大数据的功能——以“套路贷”虚假诉讼智能预警系统的应用为视角[J].法治现代化研究,2022(1):152-162. [18][法]米歇尔·福柯.规训与惩罚[M].刘北成,杨远婴译.上海:生活·读书·新知三联书店,2012:226. [19]朱体正.人工智能辅助刑事裁判的不确定性风险及其防范——美国威斯康星州诉卢米斯案的启示[J].浙江社会科学,2018(6):76-85+157. [20]Starr S B. Evidence-based Sentencing and the Scientific Rationalization of Discrimination[J].Stanford Law Review,2014(4):803-872. [21]Mayson S G. Bias in, Bias Out[J]. YAle Law Journal,2018(1):2218-2300. [22]PLI Chronicle. Generative AI and Courts:How Are They Getting Along?[EB/OL]. https://www.prd.uscourts.gov/sites/default/files/20231206-CLE_Prof-Hedges-PLI-Chronicle-GAI.pdf,2025-02-15. [23]邓建鹏,赵治松.DeepSeek的破局与变局:论生成式人工智能的监管方向[J].新疆师范大学学报(哲学社会科学版),2025(4):1-10. [24]郑曦.刑事司法中的数据安全保护问题研究[J].东方法学,2021(5):80-92. [25]王惠敏,古剑.ChatGPT的技术逻辑、类型化风险与法律进路[J].湖北警官学院学报,2024(4):5-15. [26]Neha F, Bhati D. A Survey of DeepSeek Models[J]. Authorea Preprints,2025(1):1-6. [27]黄锫.人工智能大模型训练数据的风险类型与法律规制[J].政法论丛,2025(1):23-37. [28]Zhang Y, Li Y, Cui L, et al. Siren’s Song in the AI Ocean:A Survey on Hallucination in Large Language Models[J]. Computational Linguistics, 2025(1):1-46. [29]潘雪娇,聂建强.数据共享法律原则证成[J].学术探索,2023(11):94-101. [30]汪会瑶.大数据侦查模式的正义困境与出路[J].湖北警官学院学报,2025(1):40-49. [31]现代快报.DeepSeek引入司法办案,要注意别把“人的命运”交给机器[EB/OL]. https://view.inews.qq.com/k/20250220A062GD00? web_channel=wap&openApp=false,2025-02-22. [32]最高人民法院.国家级AI基础设施正式发布!最高法召开“法信法律基座大模型”研发成果新闻发布会[EB/OL]. https://mp.weixin.qq.com/s/Dya3YvbZ9oKSTqaGoXUQSQ,2025-02-16. [33]孔祥稳.面向人工智能风险的行政规制革新——以自动驾驶汽车的行政规制为中心而展开[J].行政法学研究,2020(4):18-33. [34]庄建,腾海云,庄金兰.大模型实战:微调、优化与私有化部署[M].北京:电子工业出版社,2024:45. [35]王力,张秉晟,陈超超.隐私保护机器学习[M].北京:电子工业出版社,2021:166. [36]刘泽刚.人工智能时代联邦学习隐私保护的局限及克服[J].中外法学,2025(1):65-84. [37]Surden H. Artificial Intelligence and Law:An Overview[J]. Georgia State University Law Review, 2018(4):1305-1337. [38]法治时代杂志.贾宇:以审查、调查、侦查“三查融合”,全面提升新时代检察机关法律监督质效[EB/OL]. https//mp.weixin.qq.com/s/SRVwD0qyCLWwK48GaOcRjA? scene=25#wechat_redirect,2025-02-29. [39][德]伊曼努尔·康德.法的形而上学原理[M].沈叔平译.北京:商务印书馆,1991:21. [40]赵维双.技术创新扩散的环境与机制[M].北京:中国社会科学出版社,2007:37. [41]邱泽奇,张樹沁,刘世定,等.从数字鸿沟到红利差异——互联网资本的视角[J].中国社会科学,2016(10):93-115+203-204. [42]王燕玲.论命名实体识别技术在司法大数据中的适用[J].政法论坛,2022(5):40-52. [43]陈欢,刘聪,齐浩宇.AIGC技术辅助刑事审判的优势、风险与规制——以ChatGPT为例[J].长江大学学报(社会科学版),2024(4):113-118. [44]Bench-Capon T. Neural networks and open texture[A]. ICAIL.Proceedings of the 4th international Conference on Artificial Intelligence and Law[C]. New York:Association for Computing Machinery, 1993:292-297.
- (1)公元前321年,迅速崛起的罗马人征伐萨莫奈人时,受假情报误导,进入一个两头窄、中间大、四周陡峭的山谷——卡夫丁峡谷(Caudine valley)。面对居高临下的敌人,困守多日的罗马军队最后不得不选择投降。他们被迫放下武器,脱下铠甲,从萨莫奈士兵长矛架成的轭形门中俯首穿过。这是罗马军队遭受的空前屈辱,也是罗马历史上的著名败仗。“卡夫丁峡谷”常被用来描述艰难险恶的处境,马克思曾用它比喻跨越资本主义社会发展阶段所遇到的极大挑战。 (1)本文将生成式人工智能价值链中的角色简要划分为提供者(provider)和部署者(deployer)。前者负责训练、提供基础模型,如提供DeepSeek系列模型的深度求索公司;后者负责将基础模型的能力集成于各种下游系统,确保其在垂类场景中稳定运行。类似观点参见参考文献[9]刘金瑞.生成式人工智能大模型的新型风险与规制框架[J].行政法学研究,2024(2):17-32. (1)尽管DeepSeek以低算力著称,但这只是相较于ChatGPT等消耗算力巨大的大模型而言,单从绝对数量来看,其算力负担对于基层司法机关仍是一个难题。如俗称满血版DeepSeek-R1,参数规模高达6710亿,最低算力要求是双H100GPU和1TB内存,推荐使用8张A100 80G的服务器集群,还需要相关的硬件配置与优化、管理维护等能力。