经典案例CLASSIC CASE

1. 项目背景

此系统是为某互联网法律公司开发的律师推荐系统。该系统通过爬取裁判文书、律师论坛、法律新闻等网站信息,经过语义处理后与公司内部的用户数据结合,构建律师知识图谱。实现不同需求场景下的律师搜索、推荐功能。

2. 解决方案

A. 律师知识图谱构建

描述:通过语义技术从裁判文书、律师论坛、法律新闻等数据源抽取信息,结合公司内部数据构建律师知识图谱。

图片:一张律师和律所关联的图片

B. 用户画像构建

描述:通过分析用户数据和历史记录,构建用户画像知识图谱,并与律师知识图谱进行关联。

图片:一张能表现用户信息的图片

C. 基于知识图谱的搜索推荐系统

描述:根据用户画像及相关条件,找到知识图谱中的关联律师,排序后返回。

图片:一张用户和律师握手的图片,表示找到了合适的律师

 

系统截图:

 

3. 方案特色

随着律师信息及用户数据的增长,律师知识图谱越来越丰富,利用知识图谱的推理和语义关联,可实现信息的不断增值。

案例四:金融-智能投研

1. 项目背景

从招股书、年报、公告、新闻、研报、工商、专利等数据源进行数据结构化处理,构建”公司-行业产业链-高管股东-产品-事件”知识图谱,辅助一级市场VC以及二级市场券商资管、基金公司进行投资标的、股票信用债筛选及风控等投资决策

2. 解决方案

 

A. 智能爬虫爬取海量年报、公告、新闻等半结构化非结构化数据

描述:通过智能爬虫从巨潮信息、财经新闻网站、公司网站、招聘网站、社交媒体等爬取各种数据源。

B. 自然语言处理、对招股书、年报、公告、新闻等进行实体、关系、事件抽取

描述:半自动化方式对爬取的数据进行结构化处理。

C. 知识图谱的关联构建和挖掘

描述:对“公司-产业链-人-事件-产品”等进行本体建模、数据融合,挖掘隐藏的关系和事件传递性影响。

D. 产品应用接口

描述:提供api、语义搜索、可视化终端等方式的应用接口。

系统样例:

当中兴通讯被美国制裁的时候,如果基金经理有中兴通讯的客户供应商、合作伙伴以及竞争对手等中兴关系链数据,在中兴通讯停牌的情况下快速地筛选出受影响的国际国内上市公司从而挖掘投资机会或者进行投资组合风险控制。

 

 

3. 方案特色

基于知识图谱的方案更加智能化可扩展,可对某件事件发生后的传递隐含影响进行深入地分析,提前对风险进行预警。

案例四:金融-风控反欺诈信审、潜客挖掘

1. 项目背景

针对银行、互联网金融等客户,从海量的结构化信息如客户基本信息(身份证号、手机号、银行卡号、联系人信息、工作单位信息等)、借款信息。半结构化数据如用户通讯记录、银行交易流水、社保、人行征信、信用卡、公积金、电商交易信息从构建知识图谱,辅助风控反欺诈、信审、失联客户修复、潜客挖掘等数据深层分析

2. 解决方案

A. 用户画像

描述:用户画像是根据历史申请用户的基本信息对用户进行描述。用户画像的维度一般包括,年龄、身高、体重、籍贯、芝麻信用评分、工作地址、家庭情况等等。这些维度是对用户的一些基本描述。

B. 知识图谱构建

描述:根据用户画像的数据融合其他的数据构建知识图谱,知识图谱的主要作用是计算用户间的关联。为了构建用户间的关联,通常需要收集用户的通话记录,用户家庭成员或者同事的电话、工作单位基本信息以及用户提供的好友关系、授权的电商交易信息收货人等。构建好的知识图谱如下图所示。知识图谱中每一个节点(张三和李四)都对应了用户画像中的属性如公司电话号码以及工作关联。

图片:

 

C. 规则库构建

描述:构建好知识图谱后需要通过知识图谱的数据挖掘诈骗者的相关特征,因此为了挖掘诈骗者的特征需要构建相应的规则库。规则库中的规则一般有领域专家填写其一般形式为if Colleague(Person1,Person2) and Person1.work_in<>Person2.work_in then False这条规则的含义是如果Person1和Person2这两个人是同事关系但是数据中他们的工作公司不相同则说明其中一个用户存在问题。类似这样的规则一般会具有几百条存在规则库中,这些规则都会作为专家规则抽取用户相关的特征。

D. 特征提取:

描述:这一步骤不仅是通过上一步构建的规则库提取特征,还要根据一些挖掘算法挖掘用户本身的特征,如可能会利用社区发现、PageRank等算法计算用户节点的权重检查用户和诈骗黑名单中的人群是否属于同一个社区。也会根据用户在使用APP或者是网站上的行为挖掘用户的意图作为行为特征。

 

系统样例:

融合来自不同数据源的信息构成知识图谱,通过数据不一致性检测,我们利用绘制出的知识图谱可以识别潜在的欺诈风险。比如借款人张xx和借款人吴x填写信息为同事,但是两个人填写的公司名却不一样。同一个电话号码属于两个借款人,这些不一致性很可能有欺诈行为。

 

3. 方案特色

基于知识图谱的方案更加智能化可扩展,更方便的辅助对隐藏的团伙欺诈、信审、失联客户修复等业务需求的数据分析挖掘。