span8
span4
你好,
想知道是否有人尝试过在FME桌面使用Beautiful Soup。
谢谢。
是的,我相信我们以前用过FME。以前在知识库上有一篇文章,但它被删除了,因为它已经过时了。如果有用的话,以下是文章的内容:
_____
用漂亮的Python解析HTML文件
BeautifulSoup for Python是一个强大的HTML/XML解析器。它可以很好地替代标准的FME工具,如StringSearcher(又名Grepper)或StringReplacer。它们对HTML解析的使用显示在HTTPFetcher页面上。
附加的示例采用一个包含几个表的HTML页面。其中一些用于设计目的,另一些包含关于FME额外成本插件的有用信息。BeautifulSoup会浏览它们,只拿必要的桌子(
将它们相应地转换为特性类型、特性和属性。 然后,FME本身负责公开和重命名属性,在必要时清理和替换属性值。 为了使用BeautifulSoup,应该安装Python 2.3或更高版本(更多信息请点击这里)。BeautifulSoup.py应该放在\Python24\Lib\site-packages中(与任何工作空间一起使用),或者与调用它的工作空间一起使用(使其可移植)。 注意,HTML可能具有非常复杂的结构,不可能对任何HTML文件使用一个Python脚本。使用此示例作为HTML解析的简单介绍。 有关HTML解析的更多细节,请参阅BeautifulSoup文档。 遗憾的是,文章中提到的示例也被删除了,无法使用。但我希望以上几点能有所帮助 马克 嗨@ mark2ca亚搏在线tsafe我想知道那篇文章在哪里。我一直使用RegEx解析html页面自动提取表,需要删除所有不必要的html标签。一开始工作很乏味,但是你完成了工作。 相关问题©2019安全亚搏在线软件公司|法律
|