概述

一个数据集很少能100%满足使用数据者的需求。在那里。我们说它。但是,仅仅因为这是不可避免的现实,并不意味着没有办法解决它。

数据转换是对数据进行少量或大量更改(由您决定!)以使其对您有价值的过程。数据转换过程中可能发生的更改类型的一些示例是合并、聚合、汇总、过滤、丰富、分割、连接或删除重复数据。

数据转换通常是进一步的数据管理任务所必需的步骤,如数据转换数据集成.数据转换是每个过程中的每个过程的关键步骤,因为它可以帮助构造,标准化和整体创建各种数据集之间的一致性。除了转换之外,您是否需要将数据转换为新的文件格式,这取决于您组织的需求。在许多情况下,没有转换的转型就足够了。最终,数据转换将有助于您有效且有效地将数据移入其目标目的地。

越来越多的企业和组织依赖于数据转换来处理新兴技术和新应用程序产生的海量数据。通过能够转换数据,组织不仅可以最大化其数据的价值,还可以以简单的方式管理数据,并减少信息过载的可怕感觉。

数据转换步骤

数据转换中有五个基本步骤,重要的是要知道您是否正在创建,实现或利用转换工作流程非常重要。亚搏在线无论数据转换如何简单或复杂,都需要考虑这些步骤。通过遵循此粗略指南,您将能够正确地计划和处理数据以实现数据目标。

1.数据发现和数据分析

  • 解释并了解您正在使用的确切数据(以便您可以将您所需的内容转化为您想要的内容)。
  • 注意数据中包含的详细信息,例如属性、结构以及需要转换的内容知道文件的扩展名是不够的!
  • 以下是您可以问自己的一些示例问题:
    • 在结构上:我的数据表格,栅格(像素化)还是三维?
    • 属性:有额外的元数据吗?描述的列标题是什么?有没有数据缺失?
    • 转换:测量记录的单位是什么,我想要更改它们吗?所有的数据是否以一致的方式记录?
  • 确定数据是否需要在转换之前需要任何清洁。

2.数据映射

  • 建立一个经过深思熟虑的计划,确定将转换哪些数据元素以及如何进行。
  • 如果您是出于兼容性的原因转换数据(以便您所选择的应用程序可以访问数据),请确定数据的哪些部分应该更改,哪些部分需要保留原样。
  • 确保您的计划考虑到数据是否会在转换期间丢失,以及在需要时如何减少损失。

3.创建一个工作流亚搏在线

  • 决定是通过编写脚本还是使用数据转换工具来转换数据。考虑以下几个问题:
    • 团队目前的专业技能是什么?为了成功完成我们的数据转换项目,是否有需要填补的空白?
    • 我的数据和转型要求是否会随时间变化?我是否能够轻松更新工作流程以满足这些不断变化的需求?亚搏在线
    • 如果其他人将使用我创建的工作流程,我需要考虑吗?亚搏在线如果我不在身边,我需要让别人更容易理解吗?
    可视化数据转换工具的截图
    FME是一个易于使用的可视数据变换工具的示例
  • 在工作流程中确定输入和输出数据文件格式。亚搏在线
  • 确定数据转换的需求(兼容性、丰富等),并确保这些需求在您的工作流程中得到满足。亚搏在线

4.运行您的工作流亚搏在线

  • 将输入数据连接到工作流程并测试您创建的内容。亚搏在线运行工作流时,它将重建数据以匹配目标亚搏在线格式。工作流程亚搏在线基本上是数据重组过程。
  • 运行工作流程应导致您的旧亚搏在线数据以新的方式呈现。数据是否被转换为新的文件格式取决于您。例如:
    • 具有新键和值的JSON文件添加到每个对象
    • 具有日期的CSV文件更新为以一致的方式录制
    • 一个Shapefile的属性作为一个只有关键标志的KML文件

5.检查数据

  • 检查输出数据的质量和准确性。
  • 如果有必要,创建一个问题列表或审计。
  • 基于您的发现,如果需要,请查看您创建的工作流程,进行更改,然后重试。亚搏在线

数据转换与FME

数据转换最简单的方法之一是通过数据集成软件平台,比如专门从事数据转换的FME。FME不需要编写脚本,因此任何人,无论他们的技术背景如何,都可以轻松地创建和执行自己的数据转换工作流。亚搏在线

转换器是FME的标准数据转换工具,可以用任何你想要的方式修改数据。您可以将转换器看作打包的操作、函数或预先编写的代码片段。有多种yabo live 供您选择,并且您可以按照您想要的任何逻辑顺序将它们添加到您的工作流中,这样数据就可以根据您的需要进行转换。亚搏在线

如果你是一个开发人员,没有必要担心,FME不会取代你。就像没有一个人可以知道所有的事情一样,没有一个软件可以做所有的事情。这就是为什么您可以将自己的代码片段,如Python、R或JavaScript,直接插入到工作流中,这样您和FME就可以一起构建一些伟大的东西。亚搏在线现在,无需编写整个数据转换脚本,您可以快速而简单地创建工作流,从而为您提供更多时间来处理更重要的任务。亚搏在线

总之,无论你是不是一个开发人员,FME的功能和内置的变压器给你的灵活性和选择自定义和扩展你的工作流程,无论你想要。亚搏在线

这是它的工作原理

变压器直接使用FME桌面.您可以很容易地将转换器添加到工作流中,以创建自己的自定义数据转换过程。亚搏在线方法如下:

  1. 通过在工作区中的任何地方键入转换器的名称来添加转换器
  2. 拖放变压器,您需要它
  3. 将变压器连接在一起使用输入和输出端口将工作流程链接亚搏在线
弹出“重投影参数截图”对话框

每个转换器都有您可以控制的参数,以便您能够灵活地按照您想要的方式转换数据。如果您是数据转换的新手,请不要担心。有文档来帮助您理解参数是如何工作的。在您知道它之前,您的新的可视化工作流将完成!亚搏在线

既然您拥有已完成的数据转换工作流程,您可以轻松地重用部分或全部工作流程以获取其他数据转换任务。亚搏在线为了使未来您和其他人更容易了解您在创建原始工作流程的后面了解您的逻辑,利用注释和书签功能将Notes直接添加到工作区中。亚搏在线

这里的所有都是它的!通过您自己的创造性技能和数据专业知识,与FME合作可以让您到达您需要的地方。

数据转换工作流程示例亚搏在线
要了解更多关于上述数据转换的信息,请查看我们的教程转换CSV到Microsoft Excel

FME基金是什么?

FME是目前公认的数据集成平台,对数据集成有最好的支持空间数据全世界。但是,它可以处理不仅仅是空间数据,并且很容易被IT和商业专业人员使用。FME拥有一系列称为变压器的支持性数据转换工具,可以轻松集成450多种格式和应用程序。使用FME,您可以灵活地转换和整合您想要的方式。

亚搏在线FME的制造商Safe Software是科技界的领导者,他们努力走在数据集成趋势的前面。FME不断升级,以确保它能够支持新的数据格式、现有数据格式的更新版本和大量数据。单个部门必须在各自的数据竖井中工作的想法已经不复存在,IT结构限制了公司真正作为一个整体工作的潜力。数据应该能够在任何地方、任何时间、以任何方式自由流动。

相关资源

FME入门:添加变形金刚

如何选择合适的变压器

如何利用FME服务器进行数据转换开发

什么是数据验证?

为什么你应该关心空间数据

什么是应用程序集成?