GHD公司

GHD希望通过执行自然语言处理,以找到异常和投资主体多元化的机会,收集从财务数据的商业智能。这个数据科学项目涉及文本挖掘从在线归档海量的非结构化数据。

使用FME,他们建立了一个API来收集2100多万美国安全和交易委员会(SEC)的电子数据收集,分析和检索(EDGAR)网站备案的季度。该工作流程亚搏在线包括读取列对齐文本,非结构化文本和HTML / XML。FME被用来清洁文本数据,它解析为金融信息,利用自然语言处理分析它,并进行情感分析发现随着时间的推移在语言的变化。然后将数据写入到进一步的BI任务SAP HANA。

得到的FME工作流程上大量的非结构化亚搏在线文本数据进行丰富的数据和分析。GHD能够创造谁使用EDGAR系统,整理在SAP HANA财务数据公司的数据库,并在自动化流程执行机器学习算法。

GHD提供建筑,工程,施工,咨询和数字化服务,以私营和公共部门的客户。

“我用FME的一切。”- 史蒂芬Cyphers,GHD