有人尝试过将Beautiful Soup与FME桌面集成吗

Question

你好,

想知道是否有人尝试过在FME桌面使用Beautiful Soup。

谢谢。

Answer 1 · 2016-06-07T14:17:58Z

是的，我相信我们以前用过FME。以前在知识库上有一篇文章，但它被删除了，因为它已经过时了。如果有用的话，以下是文章的内容:

_____

用漂亮的Python解析HTML文件

BeautifulSoup for Python是一个强大的HTML/XML解析器。它可以很好地替代标准的FME工具，如StringSearcher(又名Grepper)或StringReplacer。它们对HTML解析的使用显示在HTTPFetcher页面上。

附加的示例采用一个包含几个表的HTML页面。其中一些用于设计目的，另一些包含关于FME额外成本插件的有用信息。BeautifulSoup会浏览它们，只拿必要的桌子(

，搜索行( 标签)和单元格(

将它们相应地转换为特性类型、特性和属性。

然后，FME本身负责公开和重命名属性，在必要时清理和替换属性值。

为了使用BeautifulSoup，应该安装Python 2.3或更高版本(更多信息请点击这里)。BeautifulSoup.py应该放在\Python24\Lib\site-packages中(与任何工作空间一起使用)，或者与调用它的工作空间一起使用(使其可移植)。

注意，HTML可能具有非常复杂的结构，不可能对任何HTML文件使用一个Python脚本。使用此示例作为HTML解析的简单介绍。

有关HTML解析的更多细节，请参阅BeautifulSoup文档。
_____

遗憾的是，文章中提到的示例也被删除了，无法使用。但我希望以上几点能有所帮助

马克

添加评论· 显示1· 分享

| 4000角色需要字符左字符超过

附件:最多可使用10个附件(包括图像)，每个附件的最大大小为4.0 MB，总大小为4.0 MB。

gisinnovationsb ·2016年6月7日在下午十一时19分 0

嗨@ mark2ca亚搏在线tsafe我想知道那篇文章在哪里。我一直使用RegEx解析html页面自动提取表，需要删除所有不必要的html标签。一开始工作很乏味，但是你完成了工作。

回答通过 daleat亚搏在线safe ·2016年6月7日下午5点47分

FME 2017有几个变形金刚/阅读器使用这个包。有一个HTML提取器转换器和一个阅读器，它可以从HTML页面读取表和列表。等待测试版的到来…

添加评论· 显示3· 分享

| 4000角色需要字符左字符超过

附件:最多可使用10个附件(包括图像)，每个附件的最大大小为4.0 MB，总大小为4.0 MB。

gisinnovationsb ·2016年6月7日在下午11:20 0

谢谢@daleat亚搏在线safe，肯定会盯紧公测！

gisinnovationsb ·2016年6月7日在下午11:21 0

@ mark2ca亚搏在线tsafe;@daleat亚搏在线safe只是一个随机的思想;不会是伟大的，是能够接受这里的一个问题多个答案？

daleat亚搏在线safe♦♦ gisinnovationsb ·2016年6月8日在上午02时56分 0

是的我同意。我想接受在过去的一个以上的答案了。我会建议它。

7人们都在关注这个问题。

Answer 2 · 2016-06-07T17:47:50Z

回答通过 daleat亚搏在线safe ·2016年6月7日下午5点47分

FME 2017有几个变形金刚/阅读器使用这个包。有一个HTML提取器转换器和一个阅读器，它可以从HTML页面读取表和列表。等待测试版的到来…

添加评论· 显示3· 分享

| 4000角色需要字符左字符超过

附件:最多可使用10个附件(包括图像)，每个附件的最大大小为4.0 MB，总大小为4.0 MB。

gisinnovationsb ·2016年6月7日在下午11:20 0

谢谢@daleat亚搏在线safe，肯定会盯紧公测！

gisinnovationsb ·2016年6月7日在下午11:21 0

@ mark2ca亚搏在线tsafe;@daleat亚搏在线safe只是一个随机的思想;不会是伟大的，是能够接受这里的一个问题多个答案？

daleat亚搏在线safe♦♦ gisinnovationsb ·2016年6月8日在上午02时56分 0

是的我同意。我想接受在过去的一个以上的答案了。我会建议它。