查看原文
其他

美国司法部2021年AI用例清单解读

郭馨懿 清华大学智能法治研究院
2024-08-28

美国司法部(Department of Justice)2021年AI用例清单详细列出了四项AI技术和应用的使用案例(AI use case),分别是毒品数字签名算法、投诉线索价值率工具、智能记录整合工具、保密资料应用程序。本文将对该清单进行解读,帮助读者理解美国司法部AI技术的应用实例。


1

美国司法部2021年AI用例清单的背景


根据《促进美国人工智能法案》(Advancing American AI Act)第7225(a)条[1]和行政命令14110(Executive Order 14110)第10.1(e)条[2]的规定,联邦机构必须每年对其人工智能使用案例(AI use case)进行清单盘点。除有限的例外情况外,各机构必须:(1)每年对其人工智能使用案例进行清单盘点,(2)提交不需要单独列入清单的人工智能使用案例的指标,(3)提供关于OMB备忘录M-24-10第5节[3]的决策和豁免的信息。


管理和预算办公室(Office of Management and Budget, OMB)主任负责向各机构发布指令,指导其收集、报告和发布关于机构人工智能使用案例的信息,包括如何管理使用人工智能带来的风险。


本清单对人工智能使用案例(AI use case)的定义是,为推进机构任务的执行及其项目和服务的提供,增强决策能力,或为公众提供特定利益,而设计、开发、获取或使用的任何AI应用。[4]



2

对美国司法部2021年AI用例清单的解读


美国司法部2021年AI用例清单列出的四项用例分别是毒品数字签名算法、投诉线索价值率工具、智能记录整合工具、保密资料应用程序。每项用例都包含对九类问题的回答,分别是1. AI用例标识信息;2. 联系方式;3. AI工作简要总结;4. AI所处阶段;5. 使用的具体的AI技术;6. 数据方法;7. 技术解决方案;8. 信息系统;9.用例的可公开性。

 

用例一:毒品数字签名算法(Drug Signature Program Algorithms)


毒品数字签名算法(Drug Signature Program Algorithms)的主要目的是通过科学分析追踪毒品的来源和流通路径,帮助执法机构更有效地打击毒品犯罪和防止毒品滥用。例如,通过识别特定区域生产的海洛因和可卡因的数字签名,执法机构可以更好地了解毒品走私和分销网络的操作方式,从而采取更有针对性的执法和预防措施。这些算法还包括检测异常和低信度结果的功能,以确保数据分析的准确性和可靠性。毒品数字签名算法能够助力缉毒局更科学、更系统地处理与毒品相关的复杂数据,提高执法效率和效果。

1. AI用例标识信息:


毒品数字签名算法是缉毒局(Drug Enforcement Administration)开发的一项AI应用。


2. 联系方式:


联系人Monique Bourque,电子邮件地址monique.bourque@usdoj.gov。


3. AI工作简要总结:


缉毒局特别测试和研究实验室(Special Testing and Research Laboratory)利用人工智能和机器学习(AI/ML) 技术,开发了一套包括多变量统计分析工具的强大的统计方法,可自动对缉毒局海洛因和可卡因数字签名程序收集选取的样本的地理来源进行分类。该系统还能检测样品中的异常和低信度结果。[5]


4. AI所处阶段:


该AI处于生产阶段已超过1 年。缉毒局特别测试和研究实验室根据需要更新人工智能和机器学习(AI/ML),包括趋势、新的真实样本、新的毒品数字签名。


5. 使用的具体的AI技术:


使用的具体的AI技术是利用真实的毒品样本或数据和验证规则进行机器学习。


6. 数据方法:


司法部用自行生成的数据对该AI技术进行了训练。企业数据清单中不包括训练数据、验证数据和测试数据。该数据不公开,但每年对于各个项目公开发布 1-2 份未分类的摘要报告。


7. 技术解决方案:


只有缉毒局特别测试实验室能够访问与此用例相关的代码。该代码不包含在机构源代码目录中。司法部能够对代码进行持续测试,也能够监控和评估其运行表现。


8. 信息系统:(未提供)


9.用例的可公开性:该用例不应从公共清单中删除。

用例二:投诉线索价值率工具(Complaint Lead Value Probability)


投诉线索价值率工具(Complaint Lead Value Probability)是一个用于评估接收的投诉的潜在价值和优先级的算法工具,该算法可能会考虑多种因素,如投诉的内容、相关性、涉及的法律问题的严重性等,计算每个投诉的潜在价值和优先级。该AI工具能够助力执法机构和相关部门有效识别和处理具有较高重要性或紧急性的投诉案件。

1. AI用例标识信息:


投诉线索价值率工具是联邦调查局(Federal Bureau of Investigation)开发的一项AI应用。


2. 联系方式:


联系人Monique Bourque,电子邮件地址monique.bourque@usdoj.gov。


3. AI工作简要总结:


威胁接收处理系统(Threat Intake Processing System, TIPS)数据库使用AI算法准确识别、确定优先级、及时处理可操作的线索。该算法能帮助进行分类和处理紧急威胁,以便联邦调查局外勤办公室和执法部门优先响应最严重的威胁。根据算法评分优先级最高的线索会优先进入人工审查队列。[6]


4. AI所处阶段:


该AI处于生产阶段已超过1 年。


5. 使用的具体的AI技术:(未提供)


6. 数据方法:


司法部用自行生成的数据对该AI技术进行了训练。企业数据清单中包括训练数据、验证数据和测试数据。


7. 技术解决方案:


司法部能够对代码进行持续测试。


8. 信息系统:(未提供)


9.用例的可公开性:


该用例不应从公共清单中删除。

用例三:智能记录整合工具(Intelligent Records Consolidation Tool)


智能记录整合工具(Intelligent Records Consolidation Tool)是一个利用人工智能(AI)和自然语言处理(NLP)技术来优化记录管理流程的应用工具。该应用的技术方法通常包括文本相似性分析,通过聚类算法将相似的记录项目自动归类。这样的自动化处理大幅减少了手动审查记录计划的时间,提高了效率和准确性。此外,这种技术的应用不仅限于司法部门,还可扩展到需要文本相似性分析的其他领域,不仅减轻了记录管理的负担,还提升了操作的精准性和策略性。

1. AI用例标识信息:


智能记录整合工具是司法管理司(Justice Management Division)开发的一项AI应用。


2. 联系方式:


联系人Monique Bourque,电子邮件地址monique.bourque@usdoj.gov。


3. AI工作简要总结:


记录管理政策办公室使用人工智能和自然语言处理(Natural Language Processing, NLP)工具评估整个部门记录计划的相似性。该应用将相似项目进行聚类分析,从而大幅减少记录管理者(the Records Manager)手动审查和合并计划所需的时间。由AI驱动的仪表板为计划的合并和审查提供建议,同时还允许记录管理者(the Records Manager)按照聚类记录或单个记录进行审查。这种技术方法也适用于需要进行文本相似性分析的其他领域。[7]


4. AI所处阶段:


该AI处于生产阶段已超过1年。Savan Group的技术解决方案在过去三年里已应用于多个信息管理领域。


5. 使用的具体的AI技术


使用的具体的AI技术包括:主题建模(Topic Modeling)、词嵌入(Word Embedding)、最优传输(Optimal Transport)、聚类分析(Clustering)。


6. 数据方法:


没有利用数据对该AI技术进行训练。企业数据清单中不包括训练数据、验证数据和测试数据。该解决方案使用了公开可用的glove-wiki-gigaword-50预训练模型。


7. 技术解决方案:


司法部不能访问与此人工智能用例相关的代码。Latent Dirichlet Allocation(LDA) 的部分代码[8]和glove-wiki-gigaword-50预训练模型[9]是公开可用的。


司法部不能对代码进行持续测试,也不能监控和评估其运行表现。


8. 信息系统:


与该用例相关的信息系统是司法记录控制计划(Justice Records Control Schedule, JRCS),包含了该解决方案使用的源数据。


9.用例的可公开性:


该用例不应从公共清单中删除。

用例四:保密资料识别应用程序(Privileged Material Identification)


保密资料识别应用程序(Privileged Material Identification)利用人工智能和自然语言处理(NLP)技术,自动检测和识别文档中的保密信息,如律师和当事人之间的通信内容。这种信息通常是受到法律保护的,不应在法律程序中公开或用作证据。此应用能够助力法律团队在审查大量文档时,快速准确地识别出需要保密处理的信息,从而保护当事人的合法权益并遵守法律规定。

1. AI用例标识信息:


保密资料识别工具是税务司(Tax Division)开发的一项AI应用。


2. 联系方式:


联系人Monique Bourque,电子邮件地址monique.bourque@usdoj.gov。


3. AI工作简要总结:


该应用程序根据系统操作员输入的关键词,扫描文档并查找律师/当事人的保密信息。[10]


4. AI所处阶段:


该系统处于生产阶段不足6个月,正在一个非常有限的试点项目中对生产案例数据进行测试。


5. 使用的具体的AI技术:(未提供)


6. 数据方法:


没有利用数据对该AI技术进行训练。企业数据清单中不包括训练数据、验证数据和测试数据。司法部不能访问与此AI用例相关的代码。


7. 技术解决方案:


司法部不能对代码进行持续测试,但能够监控和评估其运行表现。


8. 信息系统:


与该用例相关的信息系统是税务办公自动化系统 (Office Automation System, OAS)。


9.用例的可公开性:


该用例不应从公共清单中删除。



3

美国司法部2021年AI用例清单完整版[11]






[1] Pub. L. No. 117-263, div. G, title LXXII, subtitle B, §§ 7224(a), 7224(d)(1)(B), and 7225 (codified at 40 U.S.C. 11301 note), https://www.congress.gov/117/plaws/publ263/PLAW-117publ263.pdf.

[2] Executive Order 14110, Safe, Secure, and Trustworthy Development and Use of Artificial Intelligence,

https://www.govinfo.gov/content/pkg/FR-2023-11-01/pdf/2023-24283.pdf.

[3] OMB Memorandum M-24-10, Advancing Governance, Innovation, and Risk Management for Agency Use of Artificial Intelligence, https://www.whitehouse.gov/wp-content/uploads/2024/03/M-24-10-Advancing-Governance,-Innovation,-and-Risk-Management-for-Agency-Use-of-Artificial-Intelligence.pdf.

[4] DRAFT GUIDANCE FOR 2024 AGENCY ARTIFICIAL INTELLIGENCE REPORTING PER EO 14110, https://ai.gov/ai-use-cases/.

[5] Drug Signature Program Algorithms,https://www.actiac.org/et-use-case/drug-signature-program-algorithms.

[6] Complaint Lead Value Probability,https://www.actiac.org/et-use-case/complaint-lead-value-probability.

[7] Intelligent Records Consolidation Tool, https://www.actiac.org/et-use-case/intelligent-records-consolidation-tool.

[8] Latent Dirichlet Allocation(LDA)的相关链接: https://scikit- learn.org/0.16/modules/generated/sklearn.l da.LDA.html.

[9] 预训练模型的相关链接:https://radimrehurek.com/gensim/auto_ex amples/howtos/run_downloader_api.html.

[10] Privileged Material Identification, https://www.actiac.org/et-use-case/privileged-material-identification.

[11] The Government is Using AI to Better Serve the Public-Department of Justice, https://ai.gov/ai-use-cases/.




撰稿 | 郭馨懿,清华大学智能法治研究院实习生 

选题&指导 | 刘云

编辑 | 沈廖佳


注:本公众号原创文章的著作权均归属于清华大学智能法治研究院,需转载者请在本公众号后台留言或者发送申请至computational_law@tsinghua.edu.cn,申请需注明拟转载公众号/网站名称、主理者基本信息、拟转载的文章标题等基本信息。

继续滑动看下一个
清华大学智能法治研究院
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存