零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式
  6ZTWmbGzfXvY 2023年11月02日 42 0

pdf2docx是Python的一个库,可以很方便的将PDF文档转换为word格式,首先安装这个库。

零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式_2d

然后在ChatGPT中输入提示词:

你是一个Python编程专家,要完成一个文档格式转换的任务,具体步骤如下:

打开F盘的Books文件夹;

读取里面的PDF文档,用pdf2docx库将其转换为word文档;

注意:每一步都要输出相关信息

使用多线程以加快转换速度;

零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式_线程池_02

源代码如下:

import os

from glob import glob

from pdf2docx import Converter

from concurrent.futures import ThreadPoolExecutor, as_completed

# 定义PDF转Word的函数

def pdf_to_word(pdf_file):

# 创建输出的Word文件名

docx_file = pdf_file.rsplit('.', 1)[0] + '.docx'

# 创建一个转换器对象

cv = Converter(pdf_file)

# 将PDF转换为Word

cv.convert(docx_file, start=0, end=None)

cv.close()

print(f'Successfully converted {pdf_file} to {docx_file}.')

# 获取F盘Books文件夹下的所有PDF文件

pdf_files = glob('F:/Books/*.pdf')

# 创建一个线程池

with ThreadPoolExecutor(max_workers=5) as executor:

# 使用线程池中的线程来执行转换任务

futures = {executor.submit(pdf_to_word, pdf_file): pdf_file for pdf_file in pdf_files}

# 打印转换进度

for future in as_completed(futures):

pdf_file = futures[future]

print(f'Finished processing file: {pdf_file}')

零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式_2d_03

运行成功:

零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式_2d_04

图片和表格都成功转换了:

零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式_2d_05

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  3XDZIv8qh70z   2023年12月23日   20   0   0 2d2d
6ZTWmbGzfXvY