2024金融风控反欺诈图行算法.docx
《2024金融风控反欺诈图行算法.docx》由会员分享,可在线阅读,更多相关《2024金融风控反欺诈图行算法.docx(17页珍藏版)》请在优知文库上搜索。
1、金融风控反欺诈图算法先介绍下金融借贷业务流程:用户前来申请借贷,会先经过欺诈识别,把欺诈团伙和主观欺诈的个人拒绝掉,然后对通过的人做信用评估,最后根据额度模型,算出利润最大化时放款金额。刚才提到了团队欺诈,举个真实的例子。宜人贷在他们的财报中公布的,他们被一个团伙成功指走了2000多单,当时宜人贷的件均4w,一下损失了8OOOw!那么如何防范这种风险呢。这就是今天要分享的图算法。图可以将这些一个个有良好记录的个体关联起来,一网打尽。再举一些团伙欺诈的行为。比如一个团伙,注册真实的淘宝商家,然后刷出良好的淘宝购物记录。或者来回转账,刷出良好的银行流水。刚才前两位老师都没有提到额度模型,简单介绍下
2、,如果只给用户放款5000,可能坏账风险很小,但是利息也少,如果放款100OO,利息虽然收到利息多了,Graph简介G=(V,E)G=(V,E) V:vertexset E:edgeset(有向,无向,有权重和没有权重)举例,两个人之间的联系,A给B买了东西,A和B之间的通话次数时长多于A和C之间。度中心性(DegreeCentrality)-表示连接到某节点的边数。在有向图中,我们可以有2个度中心性度量:流入和流出。一个节点的节点度越大就意味着该节点在网络中就越重要。 接近中心性(QOSeneSSCentrality)-从某节点到所有其他节点的最短路径的平均长度。反映在网络中某一节点与其他节
3、点之间的接近程度。 介中心性(BetWeenneSSCentrality)-某节点在多少对节点的最短路径上。介数中心性是比较能体现节点在图中桥梁作用的中心性度量方法。介数反映了相应的节点或者边在整个网络中的作用和影响力,具有很强的现实意义。例如,在交通网络中,介数较高的道路拥挤的概率很大;在电力网络中,介数较高的输电线路和节点容易发生危险。社团发现算法一般有: 最小割,正则化割:通过计算图的最小割,即将网络划分为预定的分组数,并使连接各分组的边的条数最少。 非负矩阵分解:基本原理是将原始矩阵分解得到社区指示矩阵和基矩阵 基于模块度的社区划分 基于节点相似性的社区划分最小割算法广泛应用在分布式计
4、算的负载均衡中,对集群节点的分组有利于减少不相关节点之间的通信。然而由于该算法限定了网络最终分组的个数,而不能通过算法发现”节点间的内在联系并自然地构成若干个社区,因此最小割算法应用较为局限。本文主要分享这两类的主要算法,基于模块度的IOUVain和基于信息烙infomap,基于相似度的node2vec模块度(MOdUIarity)公式及简化优化目标:一般认为社团内部的点之间的连接相对稠密,而不同社团的点之间的连接相对稀疏。所以模块度也可以理解是社区内部边的权重减去所有与社区节点相连的边的权重和,对无向图更好理解,即社区内部边的度数(内部的连线数)减去社区内节点的总度数。kikj2m6(4c7
5、)赤1.2,J2ik,Ejkjkj2m3。7模块度公式的解释4。节点i和节点j之间边的权重,网络不是带权图时,所有边的权重可以看做是1;区=4/表示所有与节点i相连的边的权重之和(度数);G:表示节点i所属的社区;m2J可表示所有边的权重之和(边的数目)。其中m表示社区C内的边的权重之和,力。力表示与社区C内的节点相连的边的权重之和,即社区C节点的度之和(包含与其他社区相连边的度)。从概率的角度去看:C表示实际情况下,(:社区内产生边的概率。*C表不在一种理想情况下,给定任意节点i的的度ki,对节点i和节点j进行随机连边,边属于社区C的概率期望。于是上式就表示了社区内连边数与随机期望的一个差值
6、。连边数比随机期望值越高,表明社区划分的越好。一般使用后面简化的公式,简化后的公式删除了判断两个节点是否划为同一个社区的函数,所以在一定程度上大大减少了Q值计算量。1.ouvain1.ouvain算法的思想很简单: 将图中的每个也七行成一个独立的社区,此时社区的数I。节也个数相同; 对每个节点I,依次尝试把节点i分配到其每点所在舟在区,计第配前与分配后的模块度变化Q,并记录Q最大的那个邻居节点,如果maxAQ0则把节点i分配Q最大的那个邻居节点所在的社区,否则保持不变; 7复2,H到所有节点的所属社区不再变化; Jk缩,招所1在同一个社区的节点压缩1.点之间的边的权重转化为新节点的环的权重,社
7、区间的边权重转化为新节点间的边权重,然后重复2,3; M复24,到整个图的模块咬木,发生变化第一阶段称为ModularityOptimization,主要是将每个节点划分到与其邻接的节点所在的社区中,以使得模块度的值不断变大;第二阶段称为CommunityAggregation,主要是将第一步划分出来的社区聚合成为一个点,即根据上一步生成的社区结构重新构造网络。重复以上的过程,直到网络中的结构不再改变为止。移动Ql-m(2m)+m(2m)=Ec+E_to,232-m2mJQ=Q2-Qi_infei,in_(toAggregatiinfomap从信息论的角度出发,假设一个randomworker
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 金融 风控反 欺诈 算法