位置：首页-资讯-后端开发

怎么在Python中根据模板批量生成docx文档

2023-06-15 00:41

短信预约 -IT技能 免费直播动态提醒

今天就跟大家聊聊有关怎么在Python中根据模板批量生成docx文档，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

一、需求说明

能够根据模板批量生成docx文档。具体而言，读取excel中的数据，然后使用python批量生成docx文档。

二、实验准备

准备excel数据：

怎么在Python中根据模板批量生成docx文档

这里是关于学生语数英成绩的统计表，文件名为score.xls

准备模板：

怎么在Python中根据模板批量生成docx文档

这是给学生家长的成绩通知书，文件名为template.doc

另外，在使用python进行实验之前，需要先安装第三方库docxtpl和xlrd，直接pip install就行：

pip install docxtplpip install xlrd

然后将xls和doc和python文件放在同一个目录下

三、代码实现

首先打开xls，读取数据：

workbook = xlrd.open_workbook(sheet_path)

然后从文件中获取第一个表格：

sheet = workbook.sheet_by_index(0)

然后遍历表格的每一行，将数据存入字典列表：

tables = []for num in range(1, sheet.nrows):    stu = {}    stu['name'] = sheet.cell_value(num, 0)    stu['class'] = sheet.cell_value(num, 1)    stu['language'] = sheet.cell_value(num, 2)    stu['math'] = sheet.cell_value(num, 3)    stu['English'] = sheet.cell_value(num, 4)    tables.append(stu)

接下来将列表中的数据写入docx文档，其实这个过程可以在读数据时同时进行，即读完一行数据，然后生成一个文档。

首先在指定路径生成一个docx文档：

document = Document(word_path)

然后逐行进行正则表达式的替换：

paragraphs = document.paragraphs    text = re.sub('name', stu['name'], paragraphs[1].text)    paragraphs[1].text = text    text = re.sub('name', stu['name'], paragraphs[2].text)    text = re.sub('class', stu['class'], text)    text = re.sub('language', str(stu['language']), text)    text = re.sub('math', str(stu['math']), text)    text = re.sub('English', str(stu['English']), text)    paragraphs[2].text = text

其实不关心格式问题的，到现在为止就已经结束了。但是这样替换后docx中被替换的文字格式也被更改为系统默认的正文格式，所以接下来是将这些改成自己想要的格式：

遍历需要更改格式的段落，然后更改字体大小和字体格式：

for run in paragraph.runs:            run.font.size = Pt(16)            run.font.name = "宋体"            r = run._element.rPr.rFonts            r.set(qn("w:eastAsia"), "宋体")

最后保存文件：

document.save(path + "\\" + r"{}的成绩通知单.docx".format(stu['name']))

完整代码：

from docxtpl import DocxTemplateimport pandas as pdimport osimport xlrdpath = os.getcwd()# 读表格sheet_path = path + "\score.xls"workbook = xlrd.open_workbook(sheet_path)sheet = workbook.sheet_by_index(0)tables = []for num in range(1, sheet.nrows):    stu = {}    stu['name'] = sheet.cell_value(num, 0)    stu['class'] = sheet.cell_value(num, 1)    stu['language'] = sheet.cell_value(num, 2)    stu['math'] = sheet.cell_value(num, 3)    stu['English'] = sheet.cell_value(num, 4)    tables.append(stu)print(tables) # 写文档from docx import Documentimport refrom docx.oxml.ns import qnfrom docx.shared import Cm,Ptfor stu in tables:    word_path = path + "\\template.doc"    document = Document(word_path)    paragraphs = document.paragraphs    text = re.sub('name', stu['name'], paragraphs[1].text)    paragraphs[1].text = text    text = re.sub('name', stu['name'], paragraphs[2].text)    text = re.sub('class', stu['class'], text)    text = re.sub('language', str(stu['language']), text)    text = re.sub('math', str(stu['math']), text)    text = re.sub('English', str(stu['English']), text)    paragraphs[2].text = text    for paragraph in paragraphs[1:]:        for run in paragraph.runs:            run.font.size = Pt(16)            run.font.name = "宋体"            r = run._element.rPr.rFonts            r.set(qn("w:eastAsia"), "宋体")    document.save(path + "\\" + r"{}的成绩通知单.docx".format(stu['name']))