python 处理pdf加密文件-摩杜云开发者社区

python 处理pdf加密文件

qKXwDtzZUJJJ 2024年01月11日 21 0

Python

近期有同事需要提取加密的pdf文件，截取其中的信息，并且重构pdf文件。网上没有搜到相关的pdf操作，于是咨询了chatgpt，给出了pypdf2的使用案例。但是时间比较久远了，很多库内的调用接口都已经更新了。

于是自行到官方的库内学习相关接口使用。整理的处理代码如下：

# -*- coding: utf-8 -*-
"""
Created on Thu Jan 11 10:36:17 2024

@author: xm AZHE
"""

import PyPDF2
file=r'C:\Users\xm\Downloads\xxx1.pdf'
# 打开PDF文件
pdf_file = open(file, 'rb')

# 创建一个PDF阅读器对象
pdf_reader = PyPDF2.PdfReader(pdf_file)

# 创建一个新的PDF写入器对象
pdf_writer = PyPDF2.PdfWriter()

# 截取第0，第101到108页
page = pdf_reader.pages[0]
pdf_writer.add_page(page)
for i in range(101,109):
    page = pdf_reader.pages[i]
    pdf_writer.add_page(page)
    # 顺便导出下每页的图片
    count = 0
    for image_file_object in page.images:
        with open(str(count) + image_file_object.name, "wb") as fp:
            fp.write(image_file_object.data)
            count += 1
    # 打印下下每页的文字
    page.extract_text(0)
    
# 处理的文件加个密
pdf_writer.encrypt("123456")

# 创建一个新的PDF文件并将页面写入其中
out_file=file.replace('.pdf','_remake.pdf')
output_file = open(out_file, 'wb')
pdf_writer.write(output_file)

# 关闭文件
output_file.close()
pdf_file.close()

PS: 解密用

if reader.is_encrypted:
    reader.decrypt("123456")

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：像素和DIP的区别和应用下一篇： Python多线程编程全解析：基础到高级用法

分享：

最后一次编辑于 2024年01月11日 0

暂无评论

推荐阅读

js逆向) 某音cookie中的__ac_signature

ILxlT0HtFgJu 2024年05月17日 72 0 0 Python

详解Python 中可视化数据分析工作流程

YqbaJkf98QJO 2024年05月17日 70 0 0 Python

快递查询 API 接口：让物流信息一目了然

Ugrw6b9GgRUv 2024年05月17日 83 0 0 Python

深入理解Django：中间件与信号处理的艺术

YpHJ7ITmccOD 2024年05月17日 56 0 0 Python

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

xCoOpmCw66sN 2024年05月17日 58 0 0 Python

Django性能之道：缓存应用与优化实战

YpHJ7ITmccOD 2024年05月17日 67 0 0 Python

Django 静态文件管理与部署指南

YpHJ7ITmccOD 2024年05月17日 63 0 0 Python

一篇文章掌握Python中多种表达式的使用：算术表达式、字符串表达式、列表推导式、字典推导式、_集合推导式、_生成器表达式、逻辑表达式、函数调用表达式

FDs7GVd6cZcT 2024年05月17日 74 0 0 Python

DrissionPage自动化框架学习

2Fnpj8K6xSCR 2024年05月17日 107 0 0 Python

Python字符串方法：字符串查找、替换、分割

FDs7GVd6cZcT 2024年05月17日 69 0 0 Python

高精度数学计算的瑞士军刀，mpmath库详解与应用示例

oaRbYQvpZaaT 2024年05月17日 56 0 0 Python

python中小数据池和编码

xKQN3Agd2ZMK 2024年05月17日 75 0 0 Python

python中7种方法实现字符串的拼接

49iChyeZd8DE 2024年05月17日 62 0 0 Python

Python中私有变量和私有方法

oELtfgAoDdFJ 2024年05月17日 55 0 0 Python

使用python中kivy库生成安卓APP

33Mqsls7cINW 2024年05月17日 65 0 0 Python

探索Django：从项目创建到图片上传的全方位指南

sSh3rBaiME5f 2024年05月17日 36 0 0 Python

运算符与表达式

fwjWaDlWXE4h 2024年05月17日 38 0 0 Python

Django国际化与本地化指南

YpHJ7ITmccOD 2024年05月17日 40 0 0 Python

Django测试与持续集成：从入门到精通

YpHJ7ITmccOD 2024年05月18日 75 0 0 Python

Python 潮流周刊#51：用 Python 绘制美观的图表

xCoOpmCw66sN 2024年05月18日 80 0 0 Python

qKXwDtzZUJJJ

作者其他文章更多

python 处理pdf加密文件

2024-01-11

最新推荐更多

Spring Boot —— 集成 MyBatis-Plus

2024-05-20

keycloak~作为第三方登录的对接标准

2024-05-20

【日记】母亲生日，我在跟数字人民币 Battle（612 字）

2024-05-18

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

2024-05-18

Qt学习第二篇（基本小组件的使用）

2024-05-18

全网首一份！你最需要的PPTP MS-CHAP V2 挑战响应编程模拟计算教程！代码基于RFC2759，附全部源码！

2024-05-18

Python 潮流周刊#51：用 Python 绘制美观的图表

2024-05-18

Django测试与持续集成：从入门到精通

2024-05-18

自研WPF插件系统(沙箱运行及热插拔)

2024-05-18

记一次asp.net 8 服务器爆满的解决过程

2024-05-18

非常全能WinForm 开发框架 - ReaLTaiizor

2024-05-18

C#反射

2024-05-18

net core jwt的基本原理和实现

2024-05-18

VUE3/JAVA 操作系统开发日志[day 1]

2024-05-18

Nginx R31 doc 官方文档-01-nginx 如何安装

2024-05-18

2024 年 5 月 8 日周三晴热（471 字）

2024-05-17

2024 年 5 月 9 日周四阴常（137 字）

2024-05-17

2024 年 5 月 10 日周五阴凉（1025 字）

2024-05-17

lua~基本语法

2024-05-17

2024 年 5 月 12 日母亲节周日晴常（197 字）

2024-05-17