Python编程：pypdf2和pdfplumber获取pdf文件的页数-摩杜云开发者社区

Python编程：pypdf2和pdfplumber获取pdf文件的页数

TEZNKK3IfmPf 2023年11月15日 15 0

代码示例 github 代码实例

pypdf2

安装

pip install pypdf2

代码实例

from PyPDF2 import PdfFileReader

filename = "test.pdf"
reader = PdfFileReader(filename)

# 不解密可能会报错：PyPDF2.utils.PdfReadError: File has not been decrypted
if reader.isEncrypted:
    reader.decrypt('')

page = reader.getNumPages()
print(page)

"""
如果加密是高版本的（3, 4），可能会报错
NotImplementedError: only algorithm code 1 and 2 are supported

原因是：
代码中有版本判断
if not (encrypt['/V'] in (1, 2)):
    raise NotImplementedError("only algorithm code 1 and 2 are supported")
"""

pdfplumber

安装

pip install pdfplumber

代码示例

import pdfplumber

filename = "test.pdf"
f = pdfplumber.open(filename)
print(len(f.pages))

就是那么简单，没有过多的繁琐操作，暂时没有发现其他莫名问题

实际使用中发现前者速度要快很多

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：如何在电脑上安装Redis 下一篇： MySQL中如何正确使用反斜杠（mysql中加反斜杠）

分享：

最后一次编辑于 2023年11月15日 0

暂无评论

推荐阅读

Python：使用Flask-APScheduler管理定时任务

TEZNKK3IfmPf 2023年11月15日 16 0 0 github flask

Python: email-validator验证Email地址

TEZNKK3IfmPf 2023年11月15日 95 0 0 ide python github

error: failed to push some refs to ... 就这篇，一定帮你解决

TEZNKK3IfmPf 2024年03月30日 60 0 0 git github

如何拿到当前文件夹下的所有文件？1行Python代码搞定

TEZNKK3IfmPf 2024年03月29日 54 0 0 python github

Python编程：python-attrs模块的简单使用

TEZNKK3IfmPf 2023年11月15日 21 0 0 html 代码示例

一种基于s3 管理haproxy 配置的模式

TEZNKK3IfmPf 2024年03月22日 44 0 0 github

Git 多人协作以及版本冲突问题解决

TEZNKK3IfmPf 2024年03月29日 38 0 0 git vim github

Golang：go-version一个对语义化版本进行解析、比较的库

TEZNKK3IfmPf 2023年11月15日 19 0 0 ico github

【Git】常用命令详解（循序渐进，逐步分析）

TEZNKK3IfmPf 2024年03月30日 45 0 0 git github

Java：org.apache.commons.lang3.StringUtils判断字符串为空

TEZNKK3IfmPf 2023年11月15日 17 0 0 apache 代码示例

Python编程：pypdf2和pdfplumber获取pdf文件的页数

TEZNKK3IfmPf 2023年11月15日 16 0 0 代码示例 github 代码实例

fatal: Not a git repository (or any of the parent directories): .git

TEZNKK3IfmPf 28天前 22 0 0 git github

Python: flask-socketio使用Websocket协议进行通讯

TEZNKK3IfmPf 2023年11月15日 17 0 0 github 代码实例 flask

Java实现堆排序

TEZNKK3IfmPf 21天前 16 0 0 java github

cube.js bi connector 实现说明

TEZNKK3IfmPf 2024年03月22日 110 0 0 sql mysql github

Vue基于$attrs及$listeners实现隔代通信

TEZNKK3IfmPf 2023年11月15日 15 0 0 代码实例

Git本地仓库命令补充

TEZNKK3IfmPf 14天前 16 0 0 git github

20个Github 网页常用操作教程

TEZNKK3IfmPf 2024年03月29日 33 0 0 git github

Node.js：webpack前端开发npm资源整理

TEZNKK3IfmPf 2023年11月15日 19 0 0 css github javascript

TEZNKK3IfmPf

作者其他文章更多

【设计模式-4.3】行为型——责任链模式

2024-04-26

【设计模式-3.2】结构型——适配器模式

2024-04-26

使用fastjson错误

2024-04-26

es安装及使用

2024-04-26

怎么给数据库某个字段建立一个前缀索引

2024-04-26

SpringBoot自动装配原理简单分析

2024-04-26

修改/etc/profile来设置环境变量，和在/usr/bin下面设置超链接有什么区别

2024-04-26

【设计模式-2.1】创建型——单例模式

2024-04-26

如何开启MySQL的慢查询日志

2024-04-26

使用String.valueOf()的坑

2024-04-26

最新推荐更多

中国GDP空间分布数据集【转】

2024-05-08

Docker 必知必会1----初识

2024-05-08

利用神经网络对脑电图(EEG)降噪------开源的、低成本、低功耗微处理器神经网络模型解决方案

2024-05-08

macOS 打开 Acrobat 时出错

2024-05-08

四元数在旋转变换和插值中的有趣的可视化解释

2024-05-04

Prometheus监控的4个黄金指标及示例

2024-05-01

使用 Office Tool Plus 免费激活 Office

2024-05-01

浅析OpenCV分水岭变换watershed函数的markers参数[C++]

2024-04-30

加速博客体验：静态资源优化技巧大揭秘！

2024-04-28

java实现遍历树形菜单方法——struts.xml实现

2024-04-26

什么是libtorch:

2024-04-26

java实现遍历树形菜单方法——Dao层

2024-04-26

【设计模式-2.4】创建型——抽象工厂模式

2024-04-26

使用Hutool工具包解析、生成XML文件

2024-04-26

【教你通透ELK】Elasticsearch 集群管理

2024-04-26

死信交换机&延迟队列

2024-04-26

el-table 在第一行添加合计行和操作按钮

2024-04-26

Myeclipse SVN 修改用户名和密码详解

2024-04-26

【设计模式-4.3】行为型——责任链模式

2024-04-26

【设计模式-3.2】结构型——适配器模式

2024-04-26