我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python操作PDF实现制作数据报告

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python操作PDF实现制作数据报告

大家好,我是朱小五。大家如果看过我的书《快学Python:自动化办公轻松实战》,会发现Python操作PDF文档内容,主要围绕PDF文档的内容提取、合并与拆分、加密与解密、添加水印以及不同文档格式相互转换来展开。

但大家会发现,其中并没有有太多直接操作PDF并向其写入的内容。这是因为我们更推荐大家Python自动操作word,然后加一步格式转换,而非直接想PDF写入内容。

不过,肯定还是有一部分人是有类似需求的,所以今天给大家分享一个案例:如何用Python操作PDF制作数据报告?

FPDF模块

Python操作PDF的库有很多,比如PyPDF2、pdfplumber、PyMuPDF等等。不过我们今天要用的是FPDF模块,它是用于在 Python 中生成 PDF 的最通用、最自由、最直观的库之一。为啥说它自由呢,看它的首字母F就知道了。Python中所用到的FPDF是基于PHP版本的FPDF。

FPDF 官方网址:http://www.fpdf.org/

pip install FPDF

FPDF模块使用逻辑非常简单,直接用几个小例子学习一下。

1、创建PDF,并添加单行文字

我们可以创建一个单元格cell(),然后将文本放入其中,这种方法更适合对齐或居中变量或动态文本。

from fpdf import FPDF

pdf = FPDF()
pdf.add_page()
pdf.set_font('Arial', 'B', 16)
pdf.cell(40, 10,'Hello, World!')
pdf.output('test_01.pdf', 'F')

输出结果:

2、其他操作

pdf.set_font('SIMYOU',size=10)  # 设置字体,字体,加粗,字号
pdf.set_text_color(120,120,120) # 设置颜色,采用RGB方式

pdf.text(x, y, txt) # 插入文本的另一种方式

pdf.add_page() # 增加一页

pdf.ln() # 插入新行

pdf.multi_cell(0,5,"插入多行") # 插入多行

pdf.image('01.jpg', 100, 50, 40) # 插入图片,100,50表示图片左上角的XY坐标,40表示图片的大小

3、实现字体的中文支持

FPDF库自带的字体非常少,想使用中文就需要导入支持中文的字体,可以使用add_font()方法。

pdf.add_font('幼圆字体','',r'C:\Windows\Fonts\SIMYOU.TTF',True)
pdf.set_font('幼圆字体', '', 14) # 设置字体为标准幼圆,size为14

注意,上面代码中的字体文件路径要根据自己的电脑实际存放位置更改。

此外,使用中文会有报错warnings.warn,直接无视就好。如果想解决,也可以参考下文补充内容

操作PDF制作数据报告

下面,直接展开案例:如何用Python操作PDF制作数据报告[2]?

由于我们这个小案例涉及绘制图形+写入图表,所以使用了seabornpandas模块。懒得自己打字,所以又使用了Faker模块,干脆模拟生成一些“假”的文字段落,方便直接插入到PDF文档中。

在交互式环境中输入如下命令(部分代码):

pdf.cell(w=30, h=ch, txt="Date: ", ln=0)
pdf.cell(w=30, h=ch, txt="01/10/2022", ln=1)
pdf.cell(w=30, h=ch, txt="Author: ", ln=0)
pdf.cell(w=30, h=ch, txt="公众号:快学Python", ln=1)

pdf.ln(ch)
pdf.cell(0, 5,'听我说谢谢你') # 单行文字
pdf.ln(ch)
# 随机生成文字段落
pdf.multi_cell(w=0, h=10, txt=fake.sentence(nb_words=50))
pdf.ln(ch)
pdf.image('./example_chart.png', x = 10, y = None, w = 100, h = 0, type = 'PNG', link = '')
pdf.ln(ch)
pdf.multi_cell(w=0, h=5, txt=fake.sentence(nb_words=50))
pdf.ln(ch)

# 表格 Header
pdf.cell(40, ch, 'Feature 1', 1, 0, 'C')
pdf.cell(40, ch, 'Feature 2', 1, 1, 'C')

# 表格内容
for i in range(0, len(df)):
    pdf.cell(40, ch, df['feature 1'].iloc[i], 1, 0, 'C')   
    pdf.cell(40, ch, df['feature 2'].iloc[i].astype(str), 1, 1, 'C')

打开导出的PDF文档,如下图所示。

这样我们就实现用Python操作PDF制作了一张“伪”数据报告,而我们在实际使用中则可以根据需求向其中插入文本、数字、图表等等内容。

补充

fpdf解决中文报错的方法

将字体从C:\Windows\Fonts目录下拷贝到了fpdf文件夹。如果打印的字是'你好世界'时不会报错。但是换为其他字时就报cmap value too big/small

import fpdf
pdf =fpdf.FPDF()
pdf.add_font('STSONG','',r'D:\test\venv\Lib\site-packages\fpdf\STSONG.TTF',True)
#此句话添加字体标准宋体
pdf.add_page()
pdf.set_font('STSONG', '', 35)#设置字体为标准宋体,size为35
pdf.cell(100, 100,'跟我说谢谢你')
pdf.output('helloword_01.pdf')

报错:

D:\test\venv\Scripts\python.exe D:/test/pdf操作/fpdftest.py 
D:\test\venv\lib\site-packages\fpdf\ttfonts.py:670: UserWarning: cmap value too big/small: -35825
  warnings.warn("cmap value too big/small: %s" % cm)
D:\test\venv\lib\site-packages\fpdf\ttfonts.py:670: UserWarning: cmap value too big/small: -35869
  warnings.warn("cmap value too big/small: %s" % cm)
D:\test\venv\lib\site-packages\fpdf\ttfonts.py:670: UserWarning: cmap value too big/small: -36318
  warnings.warn("cmap value too big/small: %s" % cm)
Traceback (most recent call last):
  File "D:\test\pdf操作\fpdftest.py", line 12, in <module>
    pdf.output('helloword_01.pdf')
  File "D:\test\venv\lib\site-packages\fpdf\fpdf.py", line 1079, in output
    f=open(name,'wb')
PermissionError: [Errno 13] Permission denied: 'helloword_01.pdf'
Process finished with exit code 1

点击报错中的ttfonts.py,将else及其后边几句注释掉后,竟然不报错了,并且能正常生成中文。

cmap.append(0)    # Mapping for last character
cmapstr = b('')
for cm in cmap:
    if cm >= 0:
        cmapstr += pack(">H", cm) 
    # else:
    #     try:
    #         cmapstr += pack(">h", cm)
    #     except:
    #         warnings.warn("cmap value too big/small: %s" % cm)
    #         cmapstr += pack(">H", -cm)

到此这篇关于Python操作PDF实现制作数据报告的文章就介绍到这了,更多相关Python PDF数据报告内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python操作PDF实现制作数据报告

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python操作PDF实现制作数据报告

Python操作PDF的库有很多,比如PyPDF2、pdfplumber、PyMuPDF等等。本文将利用FPDF模块操作PDF实现制作数据报告,感兴趣的小伙伴可以尝试一下
2022-12-16

Python利用reportlab实现制作pdf报告

这篇文章主要为大家详细介绍了reportlab生成流文件格式、reportlab分页和图片流文件写入reportlab等内容,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
2022-12-23

Python如何使用reportlab实现制作pdf报告

这篇文章主要讲解了“Python如何使用reportlab实现制作pdf报告”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python如何使用reportlab实现制作pdf报告”吧!rep
2023-07-04

用Python对PDF实现各种操作

本篇内容主要讲解“用Python对PDF实现各种操作”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“用Python对PDF实现各种操作”吧!Portable Document Format(可移
2023-06-16

Python操作Mysql数据库的实现

1、需要使用的模块MySQLdb,下载地址为:http://sourceforge.net/projects/mysql-python/2、实现代码如下:#!/usr/bin/env python# encoding: utf-8impor
2023-01-31

python操作excel实现数据清洗的示例

本文将为大家详细介绍“python操作excel实现数据清洗的示例”,内容步骤清晰详细,细节处理妥当,而小编每天都会更新不同的知识点,希望这篇“python操作excel实现数据清洗的示例”能够给你意想不到的收获,请大家跟着小编的思路慢慢深
2023-06-06

python调用pymssql包操作SqlServer数据库的实现

之前的文章介绍了python抓取网页数据并将数据保存到本地excel文件,后续可以将数据保存到数据库(SqlServer、mysql等)中,本文学习python中操作SqlServer数据库的基本用法,后续将从网页中抓取的数据保存到SqlS
2022-06-13

Mybatis操作多数据源的实现

本文主要介绍了Mybatis操作多数据源,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2023-05-20

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录