<案例分享> 汽车金融如何利用知识图谱进行反欺诈?


感谢大家支持消费金融风控联盟公众号,具体欢迎添加管理微信:添加微信wmyd80 ,邀请加入消费金融风控联盟全国交流群。 



知识图谱最早是由谷歌在2012年提出的概念,其最早的目的是为了优化谷歌的搜索引擎效率而出现的。简单的来说,知识图谱是通过把不同种类的多维度信息整合在一起而形成的一种关系网络。这种关系网络通常是以图的形式展现的,容易被人们理解,并能产生启发性的思考。



知识图谱与传统关系型数据库最大的差别在于它是以“关系”为中心进行存储、搜索的,在处理事物关联方面效率远超关系型数据库。例如,在一个包含100万人,平均每人约有50个朋友的数据中查找“朋友的朋友”(3度),关系型数据库大约花费3万秒,而图数据库(知识图谱通常的存储方式)只需要0.168秒。因此使用知识图谱进行描述和查询关系是最为高效的,在现实中已有不少应用场景,例如在汽车金融行业进行关联人反欺诈。



汽车金融包含了汽车研发、生产、流通和消费的各个环节,实际中提到的汽车金融大多是指消费者在购车过程中向银行、公司或者其他机构申请贷款用于购买汽车,简称车贷。一般来说,车贷的贷款金额比较大(几万到几十万),还贷周期比较长。从申请贷款的方式来看,车贷可以粗略地分为两种,一种需要大量证明文件,甚至还需要其他抵押物,手续较为严格和繁琐;另一种则只需要基本的身份信息,不需要其他抵押物,手续比较宽松。通常来说,后者有更大的消费群体,不过因为车贷申请的门槛过于宽松,在实际中车贷公司常常会收到欺诈而产生损失,其中最为严重的要数团伙欺诈。每起团伙欺诈通常会导致十几辆甚至几十辆车的损失,且难以追回;可以说,团伙欺诈是车贷风控最为重要的关注点,而知识图谱则非常适合用于描述和发现申请贷款者之间的关系,通过关联人之间的关系进行反欺诈。经过几年的探索和实践,关联人反欺诈已经被车贷行业普遍认可和采纳。


关联人反欺诈通过构建和描绘申请贷款者之间的联系,识别其中的异常点,并加以控制。目前使用较多的是利用申请贷款者与他人的电话联系,这部分数据格式较为规范,可以通过申请贷款者授权后从网厅爬取。以下基于这种场景介绍三种常见的反欺诈场景。


第一种是代购欺诈,通常是主贷人资质不佳被拒绝后寻找其他人作为主贷人,替其购车。对于车贷公司而言,该笔贷款的风险非常高,代购者的还贷更容易出现逾期,出问题时追索也更困难。从图1中很容易看出,一个新的贷款申请者和之前某个被拒绝的主贷人有较多的共同联系人。与一些业务特征点结合,可以很容易断定这种欺诈类型。


图1 代购欺诈

Fig1. Purchase fraud


第二种是网状欺诈,通常是指多个主贷人之间有较为密切的联系。与代购欺诈相比,网状欺诈更为隐蔽、难以识别,是一种小团伙的欺诈。一方面是车贷公司希望扩大客源,而其中一种传播途径就是通过已经成功放贷的申请者在其朋友圈传播,带来更多的申请者。识别网状欺诈的方法可以从两方面着手,一方面看主贷人之间联系的密切程度,从大量的数据中发现统计规律,对数据异常的小团体予以特别关注;另一方面则从小团体的整体信用分进行控制,例如对于新的贷款申请,不仅需要评估申请者本人的信用分,也要评估其所在团体的信用分,两者都可能产生拒绝申请的可能。


图2 网状欺诈

Fig2. Reticular fraud


第三种是伞型欺诈,多个主贷人间接的指向某个共同联系人,这是最为危险的一种欺诈方式。伞型欺诈的规模一般都很大,而且是有组织的行为,一旦爆发可能数十辆车同时坏账,损失通常都难以追回。这种欺诈的识别和断定要复杂的多,以下仅对一种典型的场景进行介绍。从图3可以看到,许多主贷人之间并无联系,但是他们直接或间接指向了某些客户(这些人注册过、也可能做过申请,但未放贷),而这些客户又指向了某个共同联系人。我们可以试着解释这种关系模型:在伞型欺诈中,存在一些高级人员(黑色联系人),他们复杂策划、招募初级人员进行欺诈业务;这些初级人员会对市场上出现的车贷公司进行了解和调研,通常会伪装成申请者(客),对车贷公司的风控流程进行详细了解,从而有针对性的指导一些申请者(常被称为肉鸡)进行申请。伞型欺诈的许多主贷人在一段时间内通常会表现为相似的特性,而这些特性是针对车贷公司的风控规则动态改变的,是一种针对性极强的欺诈方式。


图3 伞型欺诈

Fig3. Umbrella fraud


以上通过三种关联人欺诈介绍了知识网络在车贷领域中的反欺诈应用,这种方式可以很容易的扩展到其他领域。其关键点在于通过“关系”构建网络,结合业务的实际特点,可以有效进行反欺诈。如果有可能,关系网络的构建不应该只限于电话联系,居住地点、工作单位、短信、社交媒体等各种各样的联系都可以利用起来,通过叠加多张关系可以实现更强大的反欺诈。

来源于信数金服