机器学习在反洗钱领域的应用

2025 年 6 月 18 日 | 阅读 9 分钟

当我们谈论金融犯罪时,洗钱是金融世界中最大的威胁之一。洗钱是将黑钱转换为白钱的最著名的方式之一。尽管各种金融机构遵循一些法案和规则来防止洗钱活动,但在当今这个一切都数字化并被金融软件记录的技术时代,用传统方式预防此类活动并非易事。因此,所有金融机构都在采用并装备强大的技术和分析工具来打击洗钱。

Anti-Money Laundering using Machine Learning

机器学习在金融机构检测洗钱活动中也扮演着重要角色,并能自动限制用户使用其账户,直到问题解决。机器学习采用各种算法来识别洗钱活动并极大地阻止它们。在本主题“使用机器学习进行反洗钱”中,我们将学习机器学习模型如何帮助识别可疑账户活动,并为反洗钱(AML)团队提供更好的支持。因此,在开始本主题之前,我们必须了解洗钱和反洗钱(AML)这些术语。那么,让我们从快速介绍洗钱、反洗钱,然后是使用机器学习模型的反洗钱开始。

什么是洗钱?

洗钱被定义为将大量从非法来源获得的金钱转换为来自合法来源的过程。

简单来说,这是一个将黑钱变成白钱的过程。

洗钱的来源

洗钱可以通过多种来源进行,例如黑工资、循环交易、走私、非法武器、赌场、在高现金管辖区多次现金提取等。

什么是反洗钱?

反洗钱被定义为银行和金融机构为防止洗钱活动而遵循的法律、法规和程序。

它包括以下三个阶段:

  • 放置(Placement):这是从非法来源获得的资金首次存入金融机构的步骤。
  • 分层(Layering):在这些步骤中,洗钱者通过将资金分散到多个银行账户来制造多层结构,以迷惑银行分析师和机器学习算法,使他们无法识别洗钱的真实来源。
  • 整合(Integration):这是将这些分层后的资金发送到洗钱者账户的最后一步。

使用机器学习应用的反洗钱(AML)

机器学习在预防金融行业的洗钱活动中扮演着重要角色。为了防止洗钱,它使用一种监督式机器学习技术,其中机器学习模型使用各种类型的数据或趋势进行训练,以识别银行内部系统标记的警报和可疑交易。这些机器学习模型有助于识别这些可疑交易、汇款人和收款人的财务记录、他们使用交易历史进行交易的模式等。

机器学习算法有助于反洗钱,并大大减少了人为错误。机器学习模型使用一些技术来防止洗钱。

自然语言处理(NLP)帮助机器处理人类语言并识别警报、处理抵押贷款、负面新闻筛选、支付筛选等。此外,这些机器学习技术有助于监控各种可疑活动和交易。机器学习教导机器检测和识别交易模式、行为、相关的可疑用户/账户,并根据风险类别(如高风险、中风险和低风险)对警报进行分类。此外,它会检查警报,根据账户行为和所需文件自动清除一些警报,并使账户完全恢复正常操作。

机器可以被训练来识别、评分、分类、丰富、关闭或休眠警报。然而,这些过程对人类来说非常复杂和耗时,但借助机器学习技术,它们变得比传统方法相对容易。自然语言生成(NLG)有助于填写可疑活动报告(SAR)并为其提供叙述。这样可以减少对人类操作员执行常规任务的依赖,减少分类警报所需的总时间,并使人员能够专注于更有价值和更复杂的活动。

随着将机器学习引入反洗钱交易监控警报分类,可疑活动报告(SAR)的转化率应该会从目前银行业不可接受的约1%的水平有所提高。

Anti-Money Laundering using Machine Learning

为什么在反洗钱(AML)中使用机器学习

机器学习在银行和金融行业中被广泛使用,而反洗钱是使用机器学习的最佳范例之一。以下一些重要原因表明机器学习扮演着至关重要的角色:

  • 减少反洗钱过程中的误报

机器学习有助于识别和检测反洗钱过程中98%的误报,而合规团队估计只有1%到2%的反洗钱警报是真实的。在反洗钱过程中,一些警报是错误生成的,通过施加一些限制来影响客户的账户。然而,这些警报本不应该在用户账户上触发。机器学习通过使用语义分析和统计分析来识别导致真阳性结果的风险因素,从而帮助降低误报率。机器学习算法有助于在交易监控过程中消除这些误报。

  • 检测客户行为的变化

机器学习教计算机学习过去的交易及其个人资料,这有助于检测客户行为。这些机器首先用旧数据学习,然后根据客户的交易历史进行分析。根据他们的交易行为/模式,这些机器检测所有可疑活动以及过去与任何可疑活动相关的所有关联用户。使用传统方法来发现客户行为既不准确又耗时;机器学习技术减少了人为错误的机会。此外,它通过使用规则引擎监控客户交易,减少了调查时间。

因此,机器学习使这个过程相对更快,因为洗钱者通常领先一步。

  • 分析非结构化数据和外部数据

银行和金融机构分析客户数据,如“了解你的客户”(KYC)、筛选、居住国、职业、政治公众人物(PEP)状态、社会地位等,以检查他们的行为。这些都是影响任何金融机构业务的主要因素。为了降低金融风险,金融机构使用许多外部数据集,如领英(LinkedIn)、彭博(Bloomberg)、BBL、Norkom、社交网络、公司登记处和其他开源数据。

BBL和Norkom是帮助使用外部数据查找匹配项或进行姓名搜索的软件,并告诉计算机是否有任何客户与任何欺诈/可疑活动、政治公众人物、高风险实体相关。因此,NLP取代了这些传统方法,并帮助分析这些非结构化数据并建立联系。

因此,与传统方法相比,机器学习技术以更高精度的方式显著地帮助分析非结构化数据和外部数据。

  • 反洗钱(AML)和“了解你的客户”(KYC)中的机器人流程自动化(RPA)

RPA在银行和金融领域扮演着重要角色。许多银行仍在采用RPA来自动化其业务流程。此外,当RPA与机器学习相结合时,它变得更加强大。它在不同的银行业务中提供了智能自动化技术,如“了解你的客户”(KYC)、交易监控、筛选、警报消除等。

RPA与机器学习结合在以下方面有所帮助:

  • 它有助于创建客户数据的360度视图,包括后端的数据去重和对账。
  • 它有助于使用外部数据源创建和更新客户个人资料数据。
  • 它有助于使用外部和内部数据消除警报。此外,它还支持增强客户数据,如定期KYC、警报、个人资料、风险状况、客户信息组合和地理位置数据。
  • 它有助于使用外部数据源对最终受益所有人进行账户分析。

机器学习在反洗钱中面临的挑战

在反洗钱或其他金融服务中实施机器学习时,已发现一些挑战。

这些挑战包括数据质量管理(数据质量差)、资料更新、缺乏客户的360度视图、对银行、金融和反洗钱流程(如“了解你的客户”KYC)的知识不足、监管机构的接受度有限、以及缺乏实施机器学习的直接流程。

  • 数据质量管理与资料更新

数据质量管理是在反洗钱中实施机器学习应用最重要的因素之一。这对于监控和分析目的都是必需的。在静态和动态客户资料记录中都发现缺乏数据可追溯性和数据谱系。静态数据可以是KYC文件,动态数据可以是他们的收支交易。

有时,也会发现一些警报在客户账户上错误生成,即误报,但实际上它们不应该在账户上生成。这可能导致对客户账户的各种限制,并影响整个业务。这些问题减少了用户账户上噪音或误报的再次发生。此外,也可以使用其他技术来代替这些方法,例如大规模、一次性的数据核对或刷新等。许多金融机构在过去几年中已经开展了大型且成本高昂的数据修复项目以提高数据质量,并实施了管理数据质量的框架。因此,金融专家总是认为数据质量是一个主要问题。另一方面,资料更新也可以是管理质量数据的重要解决方案。客户关系经理和后端助理可以通过联系客户并验证其文件,在一定期限内进行资料更新。

  • 缺乏客户的360度视图

这是在反洗钱流程中实施机器学习应用的另一个重要问题。金融机构从不披露其客户数据来建立一个全面的网络。此外,金融机构在反洗钱方面不合作以在监管机构之间建立客户的360度视图,因为这是一种成本高昂的方法。金融机构不支持上述方法,而是支持提交带有适当自动叙述的可疑活动报告给监管机构,并使用像KYC这样的外部数据集在金融机构和监管机构之间安全地共享信息。金融机构还制定了一些法案和规定,如美国爱国者法案314 a、314 b和PSD2。此外,英国财政部也帮助通过开放银行API/开放银行工作组共享数据。

  • 对银行、金融服务和机器学习知识的有限了解

机器学习是市场上一种非常新的技术,行业中的机器学习工程师和专业人士非常少。此外,分析师在银行和金融业务方面的知识缺乏也导致了初创公司和成熟供应商的各种主要问题。这是在反洗钱和其他银行业务中实施机器学习时最常见的因素之一。

  • 监管机构的接受度有限

监管机构需要一个理想的机器学习模型,在将其应用于反洗钱流程之前,该模型需要将所有选择、限制和结果以文件形式记录下来。机器学习算法不允许用给定的输入重现结果,但监管机构期望在反洗钱流程中实施时结果是可重现的。一些监管机构希望为交易监控提供智能和自适应的解决方案,这已成为机器学习应用的复杂场景。

  • 缺乏直接的流程

机器学习是一项非常新的技术,甚至仍在发展中。因此,几乎没有成熟、直接的流程可供遵循来实施它。在不知道要寻找什么的情况下,教系统检测特定类型的金融犯罪可能很棘手。例如,如何教一个系统识别恐怖主义融资?欺诈有一个“旋转木马”流程,但恐怖主义融资没有类似的东西(除了与恐怖分子名单进行姓名匹配之外,什么也没有)。虽然其中一些问题更适合无监督学习,但模型验证者应该对期望的结果有把握。

结论

反洗钱是银行和金融行业的一个广阔领域,也是防止非法资金流动最重要的关键因素之一。机器学习在反洗钱流程中扮演着重要角色,以更高的效率和效果获得更好的结果。尽管许多金融机构也在其业务流程中采用自动化,如机器人流程自动化(RPA),但一些机构相信机器学习和人工智能来运营其业务。然而,机器人可以训练机器学习模型,而机器学习模型则帮助机器人建立强大的决策能力(以NLP的形式)或阅读能力(通过光学字符识别)。


下一主题Dropout率