span8号
第4排
FME基金的Adobe地理空间PDF阅读器可以从PDF文档中提取很多信息。图像,位图,矢量数据,文本,可以读取空间信息和属性。
然而,从PDF文档中提取信息可能很复杂。PDF的一个复杂之处是它是一种文档格式。PDF文档的内容可以有很大的不同:您可能有很多信息分布在许多页面上,或者地图(基本上是嵌入的图片)或者它可能包含一个到处都是线条的CAD绘图。因此,很难知道如何在看到PDF文档之前阅读它,并知道需要从中提取什么。有时你可能会担心信息在PDF的页面上的位置,有时你可能只是想提取内容,位置无关紧要。
FME数据检查器中的PDF文档(左);adobepdf阅读器中的相同PDF文档(右)
PDF阅读器有许多提取数据的选项。您的PDF可能包含:
主要的选择是将PDF读取为空间还是非空间(表格)。换句话说,页面上每个功能的位置是否重要?或者你只是关心整个页面。此外,可以同时选择空间和非空间(表格)PDF阅读器选项。
有关空间参数选项的详细信息,请参阅帮助文档.
空间部分是指PDF文档可能包含在页面上具有某种特定位置的信息,如果有为PDF文档定义的坐标系或坐标系,则可以转换为地球上的特定位置。PDF文档每页可包含多个坐标系。
如果要在带有背景图的数据检查器中显示PDF数据,有必要将坐标单位设置为地理空间(如果可能)。只有在存在坐标系的情况下,才能在数据检查器中显示带有背景地图的PDF数据。
有关非空间参数选项的详细信息,请参阅帮助文档.
如果您的PDF文档包含表格数据,可以提取元数据,文本,甚至光栅化整个PDF页面。非空间元数据参数可用于提取属性等信息,或有关文档的信息,包括创建日期。
本文介绍了如何阅读包含标题的简单PDF,一些地图,一些文本,还有一张桌子。
了解如何检查和提取PDF地图框架的内容。
更多的PDF阅读文章正在进行中,即将发布!
?2019安全亚搏在线软件公司|法律