我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python 如何提取PPT中所有文字的方法

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python 如何提取PPT中所有文字的方法

这篇文章主要介绍“python 如何提取PPT中所有文字的方法”,在日常操作中,相信很多人在python 如何提取PPT中所有文字的方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python 如何提取PPT中所有文字的方法”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

我就废话不多说了,大家还是直接看代码吧~

# 导入pptx包from pptx import Presentationprs = Presentation(path_to_presentation)text_runs = []for slide in prs.slides: for shape in slide.shapes:  if not shape.has_text_frame:   continue  for paragraph in shape.text_frame.paragraphs:   for run in paragraph.runs:    text_runs.append(run.text)

补充:使用 python-pptx-interface 将PPT转换成图片

▌00 简单方法

最简单的方法就是使用PPTX的File中的SaveAs命令,将PPTX文件另存为JPEG格式。

python 如何提取PPT中所有文字的方法

▲ 使用PPT的SaveAs将PPTX存储为JPEG

注意,在最后一步的时候需要选择“所有幻灯片(A)”。

python 如何提取PPT中所有文字的方法

▲ 选择所有幻灯片

最后,PPTX的每张幻灯片都以独立文件方式保存到文件中。X

这部分的内容可以参照: How to Export PowerPoint Slides as JPG or Other Image Formats 中的介绍。

▌01 使用Python-PPTX

1.简介

python-pptx是用于创建和更新PointPoint(PPTX)文件的Python库。

一种常用的场合就是从数据库内容生成一个客户定制的PointPoint文件,这个过程通过点击WEB应用上的连接完成。许多开发之 通过他们日常管理系统生成工程状态汇报PPT。它也可以用于批量生成PPT或者产品特性说明PPT。

python-ppt License:

The MIT License (MIT) Copyright © 2013 Steve Canny, https://github.com/scanny

Python-PPTX对应的官方网络网址: Python-PPTX https://python-pptx.readthedocs.io/en/latest/user/intro.html#

2.安装

使用pip进行安装:

pip install python-pptx

对于python要求: Python2.7,3.3,3.4,3.6

依赖库:

Python 2.6, 2.7, 3.3, 3.4, or 3.6lxmlPillowXlsxWriter (to use charting features)

▌02 测试

下面的例子来自于: Get Start 。

1. Hello Word

from pptx     import Presentationprs = Presentation()title_slide_layout = prs.slide_layouts[0]slide = prs.slides.add_slide(title_slide_layout)title = slide.shapes.titlesubtitle = slide.placeholders[1]title.text = 'Hello world!'subtitle.text = 'python-pptx was here.'prs.save(r'd:\temp\test.pptx')printf("\a")

python 如何提取PPT中所有文字的方法

2.Add_TextBox

from pptx import Presentationfrom pptx.util import Inches, Ptprs = Presentation()blank_slide_layout = prs.slide_layouts[6]slide = prs.slides.add_slide(blank_slide_layout)left = top = width = height = Inches(1)txBox = slide.shapes.add_textbox(left, top, width, height)tf = txBox.text_frametf.text = "This is text inside a textbox"p = tf.add_paragraph()p.text = "This is a second paragraph that's bold"p.font.bold = Truep = tf.add_paragraph()p.text = "This is a third paragraph that's big"p.font.size = Pt(40)prs.save(r'd:\temp\test1.pptx')

python 如何提取PPT中所有文字的方法

▌03 输出JPEG

1.安装 python-pptx-interface

pip install python-pptx-interface

2.转换PPTX

注意:转换生成的目录必须使用新的目录。否则就会出现:

Folder d:\temp\pptimage already exists. Set overwrite_folder=True, if you want to overwrite folder content.

from pptx_tools import utilspptfile = r'D:\Temp\如何搭建自己的电子实验室_20210102R10.pptx'png_folder = r'd:\temp\pptimage'utils.save_pptx_as_png(png_folder, pptfile, overwrite_folder=True)

生成后的PPT对应的PNGImage。

python 如何提取PPT中所有文字的方法

▲ 生成后的PPTX对应的PNG图片

※ 结论

将PPTX转换成图片,可以便于后期将文件上载到CSDN,或者用于DOP文件的制作。

到此,关于“python 如何提取PPT中所有文字的方法”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

python 如何提取PPT中所有文字的方法

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python 如何提取PPT中所有文字的方法

这篇文章主要介绍“python 如何提取PPT中所有文字的方法”,在日常操作中,相信很多人在python 如何提取PPT中所有文字的方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python 如何提取PP
2023-06-07

如何用php提取网页所有文字

要使用PHP提取网页上的所有文字,可以使用PHP的DOMDocument和XPath库来解析HTML页面并提取文本内容。以下是一个示例代码:```php// 网页地址$url = 'http://example.com';// 创建DOMD
2023-09-26

python提取图片文字的方法是什么

Python提取图片文字的方法主要有两种:OCR技术和深度学习技术。OCR(Optical Character Recognition)技术:OCR是一种通过计算机对图像进行分析、识别并获取图像中的文字信息的技术。在Python中,可以使
2023-10-25

Python 如何读取字典的所有键-值对

如果字典中存储了一些值,我想要取出来该怎么操作呢? 1、我要取出字典中所有的键-值对 取出字典中所有的键-值对时,可以使用items()返回一个键值对列表,并配合for循环进行遍历#创建一个存储一个学生的信息,通过遍历可以取出所有信息 st
2022-06-02

Node.js如何提取文件中的中文字符

这篇文章主要介绍了Node.js如何提取文件中的中文字符,本文介绍了在Node.js开发中如何使用代码提取文件中的中文字符,帮助开发者更好地处理中文文本数据,提高开发效率
2023-05-19

TS从目录中提取所有指定扩展名文件的方法

这篇文章主要介绍了TS从目录中提取所有指定扩展名文件的方法,具有一定借鉴价值,需要的朋友可以参考下。下面就和我一起来看看吧。“.ts”是一种高清视频封装格式文件,全称为MPEG2-TS,TS表示TransportStream;MPEG2-T
2023-07-06

php如何获取一个对象中所有的方法

今天小编给大家分享一下php如何获取一个对象中所有的方法的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。创建一个 Reflec
2023-07-05

python如何遍历字典中所有的键

这篇文章将为大家详细讲解有关python如何遍历字典中所有的键,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。遍历字典中所有的键使用for循环和key()方法遍历字典中的所有键,如下例所示:car = {c
2023-06-17

python如何遍历字典中所有的值

小编给大家分享一下python如何遍历字典中所有的值,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!遍历字典中所有的值使用for循环和values()方法遍历字典中
2023-06-17

TS如何从目录中提取所有指定扩展名的文件

.ts是一种高清视频封装格式文件,全称为MPEG2-TS,TS表示TransportStream,这篇文章主要介绍了TS如何从目录中提取所有指定扩展名的文件,需要的朋友可以参考下
2023-05-20

thinkphp如何获取模块下的所有方法

这篇文章主要介绍“thinkphp如何获取模块下的所有方法”,在日常操作中,相信很多人在thinkphp如何获取模块下的所有方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”thinkphp如何获取模块下的所
2023-07-06

php如何获取对象的所有方法名

这篇“php如何获取对象的所有方法名”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“php如何获取对象的所有方法名”文章吧。在
2023-06-29

Python遍历目录中的所有文件的方法

os.walk生成器 os.walk(PATH), PATH是个文件夹路径,当然可以用.或者../这样啦. 返回的是个三元元组为元素的列表, 每个元素代表了一个文件夹下的内容.第一个就是当前文件夹下内容. 返回的三元元组代表(该工作文件夹,
2022-06-04

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录