2024机器学习在反欺诈中应用.docx
《2024机器学习在反欺诈中应用.docx》由会员分享,可在线阅读,更多相关《2024机器学习在反欺诈中应用.docx(13页珍藏版)》请在优知文库上搜索。
1、机器学习在反欺诈中应用当前机器学习在金融行业已经运用非常广泛,尤其在金融业的信贷领域。在实践中,欺诈与信贷业务强!联,所以,反欺!镀成机器学习在信贷领域的一大应用。反欺诈TS会用至I版器学习、深度学习以及图谱关系z其中,机器学习与深蜉习多是针对个人欺诈风险,而图蹴系则多用谕嫩泪碱溺】因此,本次分享钏聊网绑特点以及摘学深鲜习和图谱在一、关于反欺诈(一)欺诈风险简介在信贷领域有两类风险,一类是信用风险,一类是欺诈风险。信用风险主要是对借款人还款能力和意愿进行评估,而反欺诈则是对借款人的目的是否正当进行判断。借款人出现信用风险,金融机构可通过风险定价和自有备付金进行防范,风险可控性较尢而当借款人在借
2、款时便以骗贷赚钱为目的,目金融佛未能及时识S峨诈,则会出现未能通过假礴刷息,反而被骗走本金的阖兄,尤其无法识团伙欺i锄,会在短时间内遭受非常严重的后果,会蝴构面h颜蟠问控由嘴小,所Ii擞诈风鲤融m构零容忍的。(二)反欺诈生命周期简介信贷反欺诈要从防御开始做起,所以应从用户申请到放款整个生命周期的各个阶段特点进行分析,针对各个阶段采取具有针对性的反欺诈措施。其生命周期可参见下图:Da反欺诈的几个方面设备与网络层代理检测IDC检测模拟器/虚拟机检痔木马检测用户行为层注册行为登陆行为交易行为事件序列时间间隔异常业务频次层注册频次出陆颜1次交易频次地域频次时间间隰频次业务事件异常层注册异常度黄陆异觉度
3、交易异常度地域异常度时间段异常度欺诈团伙图谱羊毛党发现代理池发现羊毛党设备发现肉鸡网络发现跨应用欧诈团伙如上图,设备与网络防御是反欺诈的第毋,可通过设备和网络层面的检测,防止用户利用设备对金融机构进行欺诈;在第一层进行防御了部分欺诈用户后,再从用户行为层、业务频次层及业务事件解层翊麻够询诈行为;理却前醒绢箱aa期络旗伙欺泪a行I二、机器学习应用(一)反欺诈规则的缺点反欺诈一般通过两种方式,一种是设定规则,另一种是通过算法。规则在反欺诈实践中应用也较多,但是缺点也明显,主要表现为:1 .策略性较强,命中直接拒绝,而且黑名单本身的误伤性也较强;2 .无法给出用户的欺诈风险有多大;3 .未考虑用户从
4、信用风险向欺诈风险的转移,尤其是在行业不景气时。以上缺点机器学习可以进行有效的避免,如可计算用户的欺诈概率有多大,从而采取一定的措施争取客户,而不是高辨绝,同时也可以通过模型计算用户从信用风险转移为欺诈风险的瞬,从而金融机构可及时进行碉解闾隹备。(二)机器学习有监督模型评分卡一般运用在信用风险评估,如:A卡(申请评分卡)和B卡(行为评分卡)等,反欺诈也会运用有监督学习,如评分卡(F卡),具体如下:一般有监督机畔习问题:假i三t三据XM2.xn,i本S匕Y=yl,y2.n)损失函数(IoSSfunction)I(F(X),Y)目标,寻找一个FFa=argminFl(Y,F(x)D做模型的过程中,
5、特征很重要,特征决定模型檄果。反欺诈模型需要从欺诈的角度来做特征,要注意与信用特征区分开,以免与A卡和B卡的耦合度过高。模型算出的多是概率,一般会将用模型算出的概率映射到分数,具体如下图:评分卡分数的计算评分卡触的最终产出是分数,目与违约概辜负相关Score=BasePoint+(-y)1.n(2)P其中,yHogit(p)=log(;)I-PBasePbint:基准分,无实际戢义PDOPoint-toDoubleOdds,好坏比每升高Tg,分散升高PDO个单位(三)部分常规机器学习在反欺诈中应用在反欺诈中用到的机器学习主要有下图几种。其中,iforest通常用来做数据离群点的异常检测,在应用
6、方面,金融公司可根据自身的规则和算法,将检测出的离群点在评分卡入模的数据方面,进行加权或算法调整。svm通常也用来做异常检测;arima则用来作时间序列预测分析;根据现在信贷数据坏样本较少的特点,knn和kmean可以用来做聚类;随机森林则是在做异常检测时进行分类,以Jz机器学习可通过博客进行更多了解,此处不进行深入讲解。三、深度学习应用此部分对人工神经网络(ANN)和时间序列进行简单介绍。神经网络通常需要大量彼此连接的神经元,每个神经元通过特定的输出函数,计算处理来自其他响铃神经元的力哝输入直神经元质检的信息传递强度,通过1三值义,算法会不断自我学习,调黝啾值。神经网络算法的核心溟:计算、连
7、接、评估、纠错和感剖II。时间序列部分介绍RNN(循环神经网络)和1.STM(长短记忆循环神经网络)两种算法。1.STM是RNN的优化版,在特征较多时,RNN计算量会呈指数式增长,其计算复杂度也IFtIOj0,卜“Z4AVOaX时间序列预测分析就是利用过去一段时间内某事件时间的特征来侦测未来一段时间内该事件的特征X为输入层,。为输出层,S为隐含层,而t指第几次的计算;v,w,u为权彘,其中计算第t次的隐含层状态时为St=f(*tWaSM)特点:依赖事件先后发生的顺序或陷:计算量会呈指数式增长,计管复杂度增加St=f(U*Xt+Wl*St-lW2*St-2.+Wn*St-n)1.STM则是在RN
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 机器 学习 欺诈 应用