哈喽,大家好,今天给大家介绍一下,Python如何读取Word文档。

1、读取文档

首先我们导入Document文档,然后写入文档的位置即可:

from docx import Document

document = Document('./这是用Python新建的文档.doc')

2、读取每个段落的文本:

通过上一步我们已经读取了文档,但是上面的方式只能够读取不能显示,因此我们需要通过for循环将每个段落展示出来:

for i in document.paragraphs:

print(i.text)

我们可以看到,每个段落就显示出来了:

python读取word内数据(Python如何读取Word文档)(1)

3、读取文档中的表格:

我们要获取表格中的文本信息,需要这样一步步循环操作:

1)先通过for循环将表格循环出来:

for i in document.tables:

2)然后将每行读取出来:

for m in i.rows:

3)将每行中的每个单元格读取出来:

for n in m.cells:

4)我们就可以都看到每个单元格中的文本信息了:

python读取word内数据(Python如何读取Word文档)(2)

5、新增内容

如果想要在原有文章的基础上新增内容,只需要直接打开文档后,通过新增命令增加相应内容即可:

from docx import Document

document = Document('./这是用Python新建的文档.doc')

document.add_picture('./img.png')

document.save('./这是用Python新建的文档.doc')

好了,今天的内容就先到这里了,明天见!

,