经典案例CLASSIC CASE

1. 项目背景

针对银行、互联网金融等客户,从海量的结构化信息如客户基本信息(身份证号、手机号、银行卡号、联系人信息、工作单位信息等)、借款信息。半结构化数据如用户通讯记录、银行交易流水、社保、人行征信、信用卡、公积金、电商交易信息从构建知识图谱,辅助风控反欺诈、信审、失联客户修复、潜客挖掘等数据深层分析

2. 解决方案

A. 用户画像

描述:用户画像是根据历史申请用户的基本信息对用户进行描述。用户画像的维度一般包括,年龄、身高、体重、籍贯、芝麻信用评分、工作地址、家庭情况等等。这些维度是对用户的一些基本描述。

B. 知识图谱构建

描述:根据用户画像的数据融合其他的数据构建知识图谱,知识图谱的主要作用是计算用户间的关联。为了构建用户间的关联,通常需要收集用户的通话记录,用户家庭成员或者同事的电话、工作单位基本信息以及用户提供的好友关系、授权的电商交易信息收货人等。构建好的知识图谱如下图所示。知识图谱中每一个节点(张三和李四)都对应了用户画像中的属性如公司电话号码以及工作关联。

图片:

 

C. 规则库构建

描述:构建好知识图谱后需要通过知识图谱的数据挖掘诈骗者的相关特征,因此为了挖掘诈骗者的特征需要构建相应的规则库。规则库中的规则一般有领域专家填写其一般形式为if Colleague(Person1,Person2) and Person1.work_in<>Person2.work_in then False这条规则的含义是如果Person1和Person2这两个人是同事关系但是数据中他们的工作公司不相同则说明其中一个用户存在问题。类似这样的规则一般会具有几百条存在规则库中,这些规则都会作为专家规则抽取用户相关的特征。

D. 特征提取:

描述:这一步骤不仅是通过上一步构建的规则库提取特征,还要根据一些挖掘算法挖掘用户本身的特征,如可能会利用社区发现、PageRank等算法计算用户节点的权重检查用户和诈骗黑名单中的人群是否属于同一个社区。也会根据用户在使用APP或者是网站上的行为挖掘用户的意图作为行为特征。

 

系统样例:

融合来自不同数据源的信息构成知识图谱,通过数据不一致性检测,我们利用绘制出的知识图谱可以识别潜在的欺诈风险。比如借款人张xx和借款人吴x填写信息为同事,但是两个人填写的公司名却不一样。同一个电话号码属于两个借款人,这些不一致性很可能有欺诈行为。

 

3. 方案特色

基于知识图谱的方案更加智能化可扩展,更方便的辅助对隐藏的团伙欺诈、信审、失联客户修复等业务需求的数据分析挖掘。