经典案例CLASSIC CASE

1. 项目背景

公检法有海量的卷宗、笔录、案件描述等文本数据,然后这些数据由于技术处理的难度,价值远没有被挖掘出来,而对于公检法业务人员希望通过从里面提取出来”人、事、物、组织、角色、卡号、QQ号”等信息链接到大的信息库里构成一个完整的证据链,辅助案件线索挖掘、串并案、案件审判等业务分析,从而提高打击犯罪和审判的效率

2. 解决方案

A. 自然语言处理、信息抽取

描述:通过人工标注+自动化抽取的方式从卷宗、笔录、案件描述提取出”人、事、物、组织、角色、卡号、QQ号”等信息。

B. 数据源ETL清洗建模

描述:建立动态本体、通过ETL工具导入多数据源的信息进行本体映射等形成大的”人、事、物、组织、事件”等主库。

图片:样图如下图

 

C. 知识图谱的关联构建和挖掘

描述:将笔录等非结构化文本数据中提取的信息与主库中的数据进行实体消歧及链接,构成完整的证据链。

D. 产品应用接口

描述:提供语义搜索、可视化关联分析终端等方式的应用接口进行线索挖掘、串并案分析。

 

系统样例:

 

3. 方案特色

智能语义分析能更好地挖掘公检法海量非结构化半结构化数据中的业务价值,并且基于知识图谱的方案更加适合公检法复杂度高、互联性强、低结构化的业务场景,基于关系和图的分析能力更强,更好地表征和计算公检法真实多维的业务场景。

案例五:科技情报-科技创新城市图谱

4. 项目背景

科技情报行业有海量的论文、专利、城市区域、创新城市政策、科研院所、GDP、人口等数据,此系统是基于知识图谱认知智能引擎为科技部某所做的城市科技创新可视化关联分析系统,通过融合关联专利、论文、城市GDP、城市科技资金投入等数据构建城市科技创新图谱,辅助科技部政策的科学决策。

5. 解决方案

A. 构建本体模型

描述:通过领域专家+半自动化建立城市创新本体数据模型。

 

B. 数据源ETL清洗建模

描述:通过ETL工具导入多数据源的信息进行本体映射等形成大的”城市、专利、论文、人、创新政策、GDP”等知识图谱。

图片:

 

C. 知识图谱的关联构建和挖掘

描述:将笔录等非结构化文本数据中提取的信息与主库中的数据进行实体消歧及链接,构成完整的证据链。

D. 大数据可视化关联分析

描述:提供符合业务人员分析思路的可视化关联分析终端。

 

系统样例:

城市科技创新图谱首页

 

 

创新绩效关联分析页面

 

专利关联分析页面

 

6. 方案特色

城市科技创新知识图谱模型能更好集成专利、论文、城市、政策、科研院所、经济相关的数据进行动态地建模,对于城市科技创新复杂的知识网络以及数据的增删改可以更灵活动态地处理,并且大数据可视化关联分析集成了城市科技创新的业务人员分析思路和模型,更好地辅助业务人员进行分析和挖掘城市科技创新知识图谱的价值。