UC官网设为首页收藏本站
[讨论交流]

干货!速收藏!如何搭建有价值的反欺诈策略模型?

[复制链接]
戈薇的犬夜叉 UC小班 发表于 2018年1月22日 10:37 最后回复 2018年1月22日 10:37
440 0
本文内容摘自“反欺诈实验室”微信公众号
近年来,金融欺诈犯罪凸显非接触性和隐蔽性的特征,犯罪分子作案更趋向专业化、智能化、集团化,使得很多银行、网贷等金融平台与用户的财产安全受到了严重侵害。

据了解,大中小型商业银行、支付机构在反欺诈工作成效上存在较大差异,大型金融机构体系相对完善,中小型机构仍处于起步阶段。为应对不断翻新的金融欺诈手段,金融类机构必须考虑主动投资反欺诈的技术手段、防控工具和策略,综合利用行内外各类基础数据,构建智能数据库和风控模型,提升欺诈交易识别率,有效减少欺诈带来的风险损失和资本损失。

在这里,主要跟大家分享一下以怎样的开发流程才能搭建一个有效、有用、有价值的反欺诈模型,希望有所启发。

从国内各机构建立反欺诈模型的具体过程可以看出,模型建立流程包含数据采集、数据预处理、风险特征挖掘、模型迭代、模型测试五个环节,如下图所示:

数据采集环节

在数据采集阶段,调研机构不仅整合了内部数据(客户个人数据信息、账户聚合数据信息、交易数据及相关的各类交易日志等),而且集成了诸多外部数据。外部数据来自人民银行、法院、公安部、检察院、工商总局、环保总局、海关总署等多家机构,包含刑事犯罪信息、商业犯罪信息、金融诈骗涉案账户信息、网络犯罪信息、单位违法账户信息,以及由来自国内外同业等提供的各类欺诈信息。

由于数据来源广泛,直接导致数据种类和规模急剧增加。各调研机构在数据处理技术方面除了采用成熟的商用数据库外,还广泛应用大数据分析技术。

模型构建流程

模型构建流程

模型构建流程
数据预处理环节

在数据预处理阶段,主要对数据进行结构化处理,包括检测数据质量、统一格式、剔除无关数据、数据标准转换、数据关联等。以银行为例,采集到的交易数据涵盖了网上银行、手机银行、电话银行、短信银行、ATM、POS、智能终端等各个渠道,数据涉及存折、借记卡、准贷记卡、贷记卡等介质。预处理操作分析渠道、介质等关联关系,并将这些数据按照时间、金额、交易类别、交易状况等维度进行聚类,分析交易行为的主要特征。

对于客户数据,需跨越不同渠道归集客户相关属性,如年龄、账龄、教育程度、地域等要素,建立客户画像档案,描述客户特征。对于商户数据,应根据商户信用评级信息、产品销售量、商户类别等要素,建立商户档案,划分商户风险等级。

风险特征挖掘环节

在风险特征挖掘阶段,常用的分析方法有假设分析、关联分析、模式归纳分析等。假设分析的目的是对问题提出各种可能的假设,并评估假设的分析过程;关联分析的目的是找出各信息片段之间的直接或间接联系,或者已知一个信息片段,找到与之直接或间接联系的另一信息片段;模式归纳分析的主要目的是归纳欺诈的各种规律特点。

在对交易、客户、商户、设备、地理位置等数据进行深入分析之后,以时间、频率、金额、距离、比例等统计口径,构建风险特征库,如近30分钟交易总金额、近1小时同一设备登录次数等。通过具体的分析方法,运用大数据处理技术,可以计算出每个风险特征对欺诈识别的贡献能力,以及风险特征之间的相关性,再选取贡献能力强、相关性弱的风险特征,作为后续模型的预测变量。

模型迭代环节

模型需要不断迭代优化,才能贴近真实情况。在模型迭代阶段,模型迭代样本是由正常交易数据与欺诈交易数据组成的。通过不断优化模型,训练模型各项指标(包括准确率、对数损失函数、精确率-召回率、混淆矩阵等),达到理想的预测效果。
模型测试

对模型进行线上测试,评价模型适用的场景、精度、误差等各项指标(如下图)。
22.webp.jpg
分析知识拓扑表

                                                                        

上UC,有快感!
该帖共收到 0 条回复!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 允许回帖同步到新浪微博