span8
span4
你好,
我挣扎着从一个PDF阅读一个非常简单的表格,我只是想在输出的东西。
我曾在读者的参数,仅打开“读标记表”,但没有从它出来。是不是在我的窗口中创建读者。我在PDF创建了一个特殊的表从Excel,以确保该表是罚款。
它看起来在FME演示简单...https://www.亚搏在线safe.com/convert/geospatial-pdf/excel/
可能有人的git我什么我做错了什么暗示?
谢谢!
我简单的PDF与它的可读性表:
我的阅读参数:
最多可使用10个附件(包括图像),每个最大值为4 MB,总计为4 MB。
您可以附加PDF,还是使用相同的过程生成的PDF?
可能您使用的excel版本没有创建“标记”表。例如,Excel for MacOS不创建带标记的表。
您的屏幕截图显示的是windows环境,所以这可能不是同一个问题。尽管如此,我还是可以通过查看pdf来了解到底发生了什么:我非常熟悉它们的底层结构。
编辑:似乎有(至少暂时)与工具的问题FME用来读取表结构时,PDF被高度压缩。您可以通过搜索工具解决这个问题,即“解压缩PDF流”,如mupdf文件例如,或在线服务,如这。
解压缩PDF版本:26559-testxls.decompressed.pdf
我能读表,当我试图编辑:解压版本你的PDF。我们已经附上我的输出,以及我的工作区的一些照片(刚刚从PDF读取和写入FFS)和阅读器的设置。
工作区:
设置:
最多可使用10个附件(包括图像),每个最大值为4 MB,总计为4 MB。
嗯,真有趣!现在我意识到,当我将pdf解压到文本编辑器中阅读时,我可能稍微修改了它。另外,也许这是一个平台问题:我在MacOS上使用了FME 2019.1测试版。
将再次尝试使用未接触的pdf和windows。
谢谢@杰克莫尔纳
我设法做了解压,它与我的样本pdf!谢谢!
不过,我有一个“真正的”pdf我需要转换,甚至解压缩没有表会出来。
我相信这些表格并不是按照正确的方式构建的,但是看起来很奇怪,fme吹嘘说,即使扫描了pdf文件,它也在工作,我在想怎么做呢?
“。”要转换扫描的pdf表吗?不用担心,fme也可以使用ocr和数字化变压器直接在您的工作区!“。”
我不能分享我需要的pdf文件,因为它是私人数据,但我想知道你是否有任何想法,如何绕过这一点?这个表在我的pdf文件中是可读的,所以不需要ocr。
如果您对fme如何使用ocr感到好奇,这里有一篇文章演示了一个工作流:亚搏在线https://www.亚搏在线safe.com/blog/2016/10/ocr-for-fme-now-i-know-my-abc/
如果您的pdf已经是文本并且有一个常规的布局,那么您可以使用文本特性边界框来确定每个单元格对应的表单元格,但是我承认这是一个非常费力的过程,并且往往与pdf不同。
fme的pdf阅读器有可能在将来尝试自动化:如果你为pdf阅读器增强创建了一个idea post(或者类似于“tablerater”转换器),那么我相信开发人员会做出回应。
我也一直挣扎在自动和稳定的方式提取表。我的PDF文件来自Excel中也Word等文字处理软件和他们不是经常在FME当前PDFReader回升。这样做的原因是,并非所有的表都标记为表(从Excel正确打印时)。我尝试了一些其他工具,如Tabulapdf,但为安定柯莱特这是一个相当新的球员,但适用于大多数的我的PDF文件。这是一个Python库,可以在这里找到:
https://github.com/socialcopsdev/camelot网站
我做了定位表,并将其写入到CSV文件一个小python脚本。我编译python脚本的CLI的exe文件(使用pyinstaller),我可以从FME调用。
也许我们可以投票,此工具在索姆点建成FME。一个更强大的表格提取方法是因为其全部的PDF文件,我们都生活在一个世界上非常有帮助。:)
最多可使用10个附件(包括图像),每个最大值为4 MB,总计为4 MB。
我在这里发布了一个想法:https://knowledge.亚搏在线safe.com/idea/90905/read-non-taged-tables-in-pdfs.html?
请毫不犹豫地添加评论和解释。
您好,感谢您的答复。
这里是没有什么问题是我想读作为一个例子PDF。我已经在Windows 7环境,并与Excel的最新版本中创建它。testxls.pdf文件
最多可使用10个附件(包括图像),每个最大值为4 MB,总计为4 MB。
对内部内容的快速可视化扫描显示,描述表的结构是那里,因此,需要进行更多的调查,才能弄清楚为什么fme没有意识到这一点。
excel团队可能改变了表元数据的布局方式,或者是其他一些问题(例如,可能是绘制字符而不是打印字符,这会使fme很难阅读)。
正确读取GeoPDF坐标系3个回答
用它作为表属性各功能的PDF报告2个回答
©2019安全亚搏在线软件公司|法律