分布式数据采集系统

获取多源异构的数据,包括互联网页数据、关系数据库、NoSQL数据库以及各种文档,同时还支持第三方数据API接口,并将这些海量内外部数据进行集中清洗和存贮.

分布式数据采集系统

详细介绍及应用场景:获取多源异构的数据,包括如下数据源并将这些海量内外部数据进行集中清洗和存贮:

a) 互联网网页数据(招股书、年报、公告、新闻、公司网站、裁判文书网、电商网站等)

b) 关系数据库(MySQL, Oracle等)

c) NoSQL数据库

d) 文档(Excel, Word, PDF转换为Word)

e) 支持第三方数据API接口