我的编程空间,编程开发者的网络收藏夹
学习永远不晚

如何利用python将pdf文档转为word?

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

如何利用python将pdf文档转为word?

1.前言

有些时候,我们需要将pdf文档转换为word文档进行处理,但市面上的一些pdf软件往往需要付费才能使用。那么作为一名技术人员,如何才能实现pdf转word自由?

2.准备工作

提前安装好python的环境,并且安装对应的第三方包:

pip install pdf2docx

3.实现方法

3.1 convert方法

from pdf2docx import Converter#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#进行转换new_converter=Converter(pdf_file_path)new_converter.convert(out_file_path)new_converter.close()

3.2 parse方法

from pdf2docx import parse#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#对所有页面进行转换,并输出parse(pdf_file_path, out_file_path)

3.3 仅转换其中几页

from pdf2docx import Converter#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#进行转换new_converter=Converter(pdf_file_path)#从第四页转换到最后一页,转换后输出new_converter.convert(out_file_path,start=3)#从第一页转换到第六页,转换后输出new_converter.convert(out_file_path,end=6)#从第四页转换到第六页,转换后输出new_converter.convert(out_file_path,start=3,end=6)new_converter.close()

转换其中的某些页面

#对pdf文档中的第1页、第四页和第九页就行转换,然后输出new_converter.convert(out_file_path,pages=[0,3,8])

3.4 调用多进程

from pdf2docx import Converter#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#进行转换new_converter=Converter(pdf_file_path)#进行多进程转换new_converter.convert(out_file_path, multi_processing=True)#指定数量new_converter.convert(out_file_path, multi_processing=True, cpu_count=4)new_converter.close()

3.5 处理有密码的pdf

from pdf2docx import Converter#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#加密的pdf文档密码pwd='pdf_2_word'#进行转换new_converter=Converter(pdf_file_path)new_converter.convert(out_file_path,pwd)new_converter.close()

3.6 将pdf转为表格

注意,本方法只能将以表格形式生成的pdf文档进行转换,不能处理含有表格的图片形式pdf文档。

from pdf2docx import Converterimport pandas as pdpdf_file_path=r'test.pdf'out_file_path=r'test.xlsx'cv = Converter(pdf_file_path)tables = cv.extract_tables()cv.close()# for table in tables:#     print(table)df=pd.DataFrame(tables[1:],columns=tables[0])df.to_excel(out_file_path,encoding='utf-8-sig')print(df)

4.后记

以上就是pdf转为word的方法,可以根据个人的情况进行调整。希望能够帮助到你~

来源地址:https://blog.csdn.net/qq_41780234/article/details/130508726

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

如何利用python将pdf文档转为word?

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

如何利用Python将html转为pdf、word文件

网络上存在很多将HTML转换为PDF的软件和工具,但是大家都知道收费,所以下面这篇文章主要给大家介绍了关于如何利用Python将html转为pdf、word文件的相关资料,文中通过示例代码介绍介绍的非常详细,需要的朋友可以参考下
2022-12-19

Java 将Word文档转换为PDF

前言本文将介绍如何使用免费Java Word组件Free Spire.Doc for Java在Java应用程序中将Word文档转换到PDF格式。Free Spire.Doc for Java在转换过程中能够识别中文字符并支持丰富的word
2023-06-02

如何在iPhone上将Word文档转换为PDF

无论是银行对账单还是求职简历,在某些场景下,您都需要在线提交 PDF 格式的文件。大多数文档仍然以Word格式在iPhone上存储的大部分时间。但是iPhone上没有专用的默认应用程序可以直接将Word文档转换为pdf格式,安装任何不安全的
2023-07-12

win8自带的Skydrive转换PDF文档将pdf转为word文档

知识点分析: 优点:不需要安装任何第三方转换软件,直接将pdf转为word文档,且十分稳定,不会像第三方工具转换后打开会产生一些不能识别的乱码 操作步骤: 1.打开 https://skydrive.live.com/ 2.上传你要转换成W
2022-06-04

php如何将word文档转成PDF文件

本文小编为大家详细介绍“php如何将word文档转成PDF文件”,内容详细,步骤清晰,细节处理妥当,希望这篇“php如何将word文档转成PDF文件”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。第一步:安装和配置
2023-07-05

如何利用Python代码批量将PDF文件转为Word格式

本篇文章给大家分享的是有关如何利用Python代码批量将PDF文件转为Word格式,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。在日常工作或学习中,经常会遇到这样的无奈:“小任
2023-06-17

如何将php文件转为word文档

本篇内容介绍了“如何将php文件转为word文档”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!准备工作在开始转换之前,您需要确保已经安装了
2023-07-05

利用C#/VB.NET实现将PDF转为Word

众所周知,PDF文档支持特长文件,集成度和安全可靠性都较高,可有效防止他人对PDF内容进行更改,所以在工作中深受大家喜爱。本文将分为两部分介绍如何以编程的方式将PDF转换为Word,需要的可以参考一下
2022-12-19

如何使用C#/VB.NET实现将PDF转为Word

本篇内容介绍了“如何使用C#/VB.NET实现将PDF转为Word”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!固定布局模式转换速度快,有利
2023-07-04

如何在java中使用openoffice将office文档转换为PDF

如何在java中使用openoffice将office文档转换为PDF?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Java的特点有哪些Java的特点有哪些1.
2023-05-30

Go语言中实现将PDF文件转换为Word文档的实用方法

Go语言实现PDF转Word文档的实用方法前言PDF和Word是两种常用的文档格式,在不同的场景下有不同的用途。PDF格式的文档具有跨平台兼容性好、安全性高、易于存储和传输等优点,而Word格式的文档则具有可编辑性强、易于修改和格式化等
Go语言中实现将PDF文件转换为Word文档的实用方法
2024-01-31

如何将HTML文件转换成Word文档

随着互联网和信息技术的不断进步,越来越多的人开始使用网页来展示和传递信息。然而,有些情况下我们需要将网页的内容转换成Word文档,例如需要打印文档、需要在Word中编辑等。本文将介绍如何将HTML文件转换成Word文档。一、使用在线转换工具目前市面上有很多免费的在线HTML转Word工具,如Zamzar、CloudConvert等,使用这些工具可以方便快捷地将HTML文件转换成
2023-05-14

Go语言中如何实现PDF转word文档

Go语言PDF转word文档步骤如下:1、设置许可证信息;2、打开PDF文件;3、创建一个新的Word文档;4、遍历PDF的每一页,将每一页转换为图像,并将图像插入到Word文档中;5、保存Word文档。本教程操作系统:windows10系
Go语言中如何实现PDF转word文档
2023-12-13

使用JAVA怎么将PDF转换为HTML文档

使用JAVA怎么将PDF转换为HTML文档?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。引入Maven依赖