使用Python怎么统计文件夹内所有pdf文件的页数
短信预约 -IT技能 免费直播动态提醒
这期内容当中小编将会给大家带来有关使用Python怎么统计文件夹内所有pdf文件的页数,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
python可以做什么
Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂、容易入门、功能强大,在许多领域中都有广泛的应用,例如最热门的大数据分析,人工智能,Web开发等。
首先安装 PyPDF2 库:
pip install PyPDF2
然后保存下面文件(已带注释,具体实现请自己思考)
import osimport PyPDF2#获取文件夹内所有pdf文件,以及打印文件数量def GetFileInfo(path, fileType=()): fileList = [] # root 表示当前正在访问的文件夹路径 # dirs 是 list , 表示该文件夹中所有的目录的名字(不包括子目录) # files 是 list , 表示内容是该文件夹中所有的文件(不包括子目录) #(每遍历一次相当于进入下级子目录) for root, dirs, files in os.walk(path): for name in files : fname = os.path.join(root, name) if fname.endswith(fileType): fileList.append(fname) print("总共有%d个PDF文件"%fileList.__len__()) return fileListdef compute_pdfpage(path): TotalPageNum = 0 fileType = ("PDF","pdf") fileList = GetFileInfo(path=path, fileType=fileType) for pdf in fileList: try: reader = PyPDF2.PdfFileReader(pdf) #获取单个文件页数 pageNum = reader.getNumPages() TotalPageNum += pageNum except Exception as e: print("-"*70) print(pdf + "该文件出现异常,可能是权限问题") print(e) print("-"*70) return TotalPageNumif __name__ == '__main__': while True: path=input('请输入要检测的文件夹路径:\n') TotalPageNum = compute_pdfpage(path) print("总共%d页"%TotalPageNum)
安装打包工具pyinstaller(只有安装了这个,才能将py文件生成为可以通过双击直接在windows执行的exe文件)
pip install pyinstaller
然后在py文件目录下的地址栏输入cmd调出当前路径下的终端。
在终端中输入如下命令后回车,-F后面跟的是 你要生成exe可执行文件所对应的py文件。
pyinstaller -F 检测文件夹内所有pdf的小工具.py
最终生成3个文件夹,可执行文件在dist文件夹中。
运行效果:
上述就是小编为大家分享的使用Python怎么统计文件夹内所有pdf文件的页数了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注编程网行业资讯频道。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341