结构化标记处理工具¶
Python支持各种模块来处理各种形式的结构化数据标记。这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
html
---超文本标记语言支持html.parser
---简单的HTML和XHTML解析器html.entities
——HTML通用实体的定义- XML处理模块
xml.etree.ElementTree
---元素树XML APIxml.dom
---文档对象模型APIxml.dom.minidom
---最小的DOM实现xml.dom.pulldom
——支持建立部分DOM树xml.sax
---支持SAX2解析器xml.sax.handler
---SAX处理程序的基类xml.sax.saxutils
---SAX实用程序xml.sax.xmlreader
---XML解析器接口xml.parsers.expat
---使用expat快速分析XML