技术 - JuicyScore 博客

在线公司通常很难组建一支内部团队来跟踪所有数字风险管理领域的趋势,并有效地将其应用于公司的利益。尤其是在不断变化的技术和市场趋势条件下,这项任务变得更加复杂,需要时刻了解最新的创新,并准备快速适应。

对于那些在组建风险管理团队方面遇到困难的客户,我们开发了一款新工具叫JuicyScoreAI。该工具旨在自动化定制反欺诈评分模型的构建过程和最优变量的选择。它结合了强大的分析能力和直观的用户界面,使其对初学者和数据专家都同样友好和易用。

JuicyScoreAI是什么?

JuicyScoreAI的主要目标是促进机器学习模型的高效开发和部署。通过自动化数据分析和变量选择等重要步骤,JuicyScoreAI帮助金融机构优化其预测建模工作,从而提供更准确的评估并取得优异的成果。JuicyScoreAI在需要快速迭代和验证模型的场景中特别有用,这使用户能够快速适应新数据或变化的条件。

实际上,这款新产品包含了基于JuicyScore基础设施的在线功能,用于自动化定制反欺诈评分。它不仅增加了JuicyScore数据的整体实用性,还特别适用于难以在现有在线业务基础设施上创建定制反欺诈模型的情况。

JuicyScoreAI对谁有用?

JuicyScoreAI为广泛的用户群体而创建:从需要进行快速数据探索分析的数据分析师,到开发可靠预测模型的经验丰富的数据处理专家。

通过与现有数据处理工作流程的集成,JuicyScoreAI将成为任何依赖数据驱动决策的组织的重要工具。例如,在金融领域,数据具有决定性作用,JuicyScoreAI扩展了从复杂数据集中提取有意义信息的能力。该产品将帮助风险专家找到更简便的方法来构建定制化模型。

JuicyScoreAI的关键功能:

  • 数据准备: 用户可以直接将他们的数据集上传到个人账户。JuicyScoreAI支持多种数据格式,并保证从上传到分析过程中的数据完整性。
  • 数据分析:该工具自动对提供的数据进行统计分析,计算基尼系数、KS统计量、信息价值(IV)、p值等重要指标。此分析帮助用户确定最合适的变量,并了解数据的统计显著性。
  • 模型开发:JuicyScoreAI提供灵活的模型开发功能,包括广义线性模型(GLM)、决策树和梯度提升(此列表不断扩展)。用户可以根据分析结果选择最合适的建模方法,并根据具体的业务需求调整其方法。

此外,通过JuicyScoreAI解决方案,用户可以识别对业务增长最重要的变量,比较不同的AI欺诈风险评估方法,并邀请JuicyScore的专家进行额外的咨询以构建定制模型。

JuicyScoreAI怎么工作?

需要指出的是,JuicyScoreAI是一个互补产品,是在现有JuicyScore解决方案之上的补充。负责在线业务风险的专家将标志数据上传至系统:一个包含各会话欺诈分数的会话列表。基于上传的文件,JuicyScoreAI提供10个变量或所谓的索引(IDX)的反馈。这些聚合的IDX变量是通过深度机器学习算法将同类稀有事件和因素集合成的单一变量,可以用于建模,也可以嵌入信贷机构的决策系统。

值得注意的是所有IDX指数都被创建为高斯变量。这么做有几个原因:首先,它们可以用于评估/验证统计显著性(经典的p值显著性水平);其次,它们允许根据欺诈事件的类型来结构化所有概率空间。更多关于指数的信息可以在我们的文章《罕见事的风险评估》中找到。基于这些指数构建评分反馈。

Model Development (1).png

模型创建:专家可以选择最适合其模型的指数,并选择用于构建模型的机器学习算法。

基于这10个指数,我们可以获得每个指数的预测力分布。JuicyScoreAI的优势是该解决方案可以使用客户的数据,并在当前会话上进行训练。

通过这种方式,我们可以从通用评分(API v15)中获得指数的有效信息,该评分代表了一组基于IDX1-IDX10聚合变量和一系列辅助变量构建的模型。基础数据来自于JuicyScore或JuicyID产品运行期间收集的数据,随后在这些数据上构建的模型并不是通用或基础的,而是为每个具体业务案例量身定制的。因此,专家可以获得多种模型管理工具:一种是适用于所有人的更基础和通用的模型,另一种是基于公司自身数据的模型,因此评分更加准确和精确。

Data Analysis (1).png

当专家上传其会话数据时,他可以看到三个主要指标,用于评估变量在模型中的信息价值。

统计指标p值用于解释假设检验的结果。如果p值小于5%,则该变量对目标变量(会话欺诈预测)具有统显著性。实际上,p值小于5%的话意思是将该指数添加到定制模型中。还需要单独考虑计算基尼系数的增益和KS统计量的显著性标准。

在模型信息部分,每个指数的IV(信息值)都会被计算。在个人账户中,可以查看哪些指数最适合用于构建定制模型的推荐建议。

可以基于这些数据构建哪些类型的模型

  1. 广义线性模型(Generalised Linear Model)。该模型公式可以包含借款人的各种数据类型(不涉及个人数据)。例如过去发放的贷款数量、预计的可支配收入评估。然而,与简单线性模型不同,广义线性模型能够处理更复杂的数据类型。
  2. 决策树(Decision Tree)。使用决策树可以帮助团队快速评估现有风险。这种模型的主要优点是其简单性和直观性。
  3. 梯度提升(Gradient Boosting)。 这种模型在风险专家团队的协作中非常有效。模型基于初始预测,并在之后的各个阶段和迭代中不断修正和改进预测,从而通过整个团队的努力,使预测变得最为准确。

选择模型构建类型后,风险专家会收到模型指标的描述。根据业务需求,设置可能有所不同。例如,如果贷款机构需要更严格的设置和过滤,以减少更多的申请数量,从而采用更安全的策略,这种情况特别可能在季节性欺诈期间(例如节日前)出现,风险经理可以调整定制模型,使其能够筛除样本中风险标记高于平均水平的更多借款人。

此外,专家还可以调整模型,使其在更宽松的筛选政策下运行,以提高申请批准率。通过JuicyScoreAI,还可以设置优化模型,既能提高批准率,又能根据风险筛选申请流量。此外,每个模型可以通过选择60%的样本进行训练,40%的样本进行验证和测试假设来进行学习。

JuicyScoreAI的每个功能都旨在优化从数据准备到模型部署的整个过程。通过理解和使用这些功能,用户可以扩展其预测建模的能力,并高效地做出基于数据的决策。JuicyScoreAI支持多种常见的数据格式,并提供详细的统计信息以辅助模型构建决策。我们相信,这款新产品将对在线公司非常有用,并有助于显著增强其在在线环境中的竞争力。