span8
span4
FME的强大之处在于能够从多个来源获取数据并有效地进行操作。那么,为什么不用FME来研究数据科学呢?
我们最近在FME hub中添加了一系列转换器,它们使用RCaller或PythonCaller执行一些基本的统计测试。
如果你没有看到你在这个列表中寻找的统计测试,你可以创建你自己的并上传它到FME基金中心与其他用户共享或创建一个新的的想法如果得到足够的票数,就会把它加到列表中。
了解如何使用R或Python创建自定义转换器来执行Shapiro-Wilks测试(以测试分布的正态性)。这个工作流亚搏在线程可以适用于任何使用R或Python的统计测试。
列出的每个变压器的FME中心页面的链接,以及一个测试工作区下载。由于R的外部软件要求,这些测试工作区不能被上传到所述轮毂。每个R-变压器的需要R要安装在用户的机器以及sqldf R包.对于Python转换器,则SciPy的Python包需要安装。
A相关是两个变量之间的测试,以确定他们的协会。
使用R来计算两个变量之间是否存在关联。
RCorrelation-TestWorkspace.fmwt
A聚类分析是一种确定数据组的方法。
使用R使用三种算法中的一种来计算相似的数据组。此变压器仅适用于2018.0+
RClusterCalculator-TestWorkspace.fmwt
的Shapiro-Wilks测试计算数据的随机样本是否来自正态分布。
使用R和RCaller,这个转换器使用Shapiro-Wilks测试来计算数据的随机样本是否来自正态分布。
RShapiroWilks-TestWorkspace.fmwt
使用SciPy的和PythonCaller,该变压器计算数据的随机样本是否来自使用夏皮罗 - 威尔克斯测试正态分布。
PyShapiroWilks-TestWorkspace.fmwt
A学习任务是一种统计检验,用来检验两个样本的均值是否与随机值显著不同。
单样本t检验检验原假设,即总体均值等于某一特定值,换句话说,它告诉你样本均值是否足够接近某一数字,从而具有统计显著性。该测试输出t值、p值、置信区间和估计值。
ROneSampleTTest-TestWorkspace.fmwt
双样本t检验检验两组的均值,以确定是否存在显著性差异,还是随机差异。该测试输出t值、p值、置信区间和估计值。
©2020安全亚搏在线软件公司|法律