span8
span4
FME的强大之处在于能够从多个来源获取数据并有效地进行操作。那么,为什么不用FME来研究数据科学呢?
我们最近在FME hub中添加了一系列转换器,它们使用RCaller或PythonCaller执行一些基本的统计测试。
如果你没有看到你在这个列表中寻找的统计测试,你可以创建自己的并上传它到FME中心与其他用户共享或创建一个新的理念如果得到足够的票数,就会把它加到列表中。
了解如何使用R或Python创建自定义转换器来执行Shapiro-Wilks测试(以测试分布的正态性)。这个工作流亚搏在线程可以适用于任何使用R或Python的统计测试。
列出的每个transformer都有一个到FME Hub页面的链接,以及一个测试工作区下载。由于R的外部软件需求,这些测试工作区无法上传至hub。每一个R变压器需要[R要安装在用户的机器以及sqldfř包.对于Python转换器,则SciPy的Python包需要安装。
一个相关是两个变量之间的测试,以确定它们之间的关联。
使用R来计算两个变量之间是否存在关联。
RCorrelation-TestWorkspace.fmwt
一个聚类分析是一种确定数据组的方法。
使用R使用三种算法中的一种来计算相似的数据组。这种变压器只适用于2018.0+
RClusterCalculator-TestWorkspace.fmwt
的夏皮罗 - 威尔克斯测试计算数据的随机样本是否来自正态分布。
使用R和RCaller,这个转换器使用Shapiro-Wilks测试来计算数据的随机样本是否来自正态分布。
RShapiroWilks-TestWorkspace.fmwt
使用Scipy和PythonCaller,这个转换器使用Shapiro-Wilks测试来计算数据的随机样本是否来自正态分布。
PyShapiroWilks-TestWorkspace.fmwt
一个学习任务是一种统计检验,用来检验两个样本的均值是否与随机值显著不同。
单样本t检验检验原假设,即总体均值等于某一特定值,换句话说,它告诉你样本均值是否足够接近某一数字,从而具有统计显著性。该测试输出t值、p值、置信区间和估计值。
ROneSampleTTest-TestWorkspace.fmwt
双样本t检验检验两组的均值,以确定是否存在显著性差异,还是随机差异。该测试输出t值、p值、置信区间和估计值。
©2020安全亚搏在线软件公司|法律