2. DOCX 文档解析与处理

DOCX 文档是我们常用的文档格式, 作为一种重要的文字来源与输出格式,日常工作中会大量处理Docx格式的文档。 需要解析并处理几百个数量级的文件,手动的编写以及不能够满足项目需求, 与之对应的python库应运而生, 不用再手工编写,减少了许多重复性工作。

Word 软件作为一种文档处理工具,它实现的模型主要是对常见的文档格式, 包括报告、书籍,及简单的页面,都可以进行处理与排版。 但是大部分的用户使用的功能只是 Word 软件功能子集, 用不到所有的功能。 所以为了更好地使用 Python 来处理 DOCX 文件, 需要对 DOCX 模型有更多的理解 。