pdf2docx是Python的一个库,可以很方便的将PDF文档转换为word格式,首先安装这个库。 然后在ChatGPT中输入提示词: 你是一个Python编程专家,要完成一个文档格式转换的任务,具体步骤如下: 打开F盘的Books文件夹; 读取里面的PDF文档,用pdf2docx库将其转换为word文档; 注意:每一步都要输出相关信息 使用多线程以加快转换速度; 源代码如下: import os from glob import glob from pdf2docx import Converter from concurrent.futures import ThreadPoolExecutor, as_completed # 定义PDF转Word的函数 def pdf_to_word(pdf_file): # 创建输出的Word文件名 docx_file = pdf_file.rsplit('.', 1)[0] + '.docx' # 创建一个转换器对象 cv = Converter(pdf_file) # 将PDF转换为Word cv.convert(docx_file, start=0, end=None) cv.close() print(f'Successfully converted {pdf_file} to {docx_file}.') # 获取F盘Books文件夹下的所有PDF文件 pdf_files = glob('F:/Books/*.pdf') # 创建一个线程池 with ThreadPoolExecutor(max_workers=5) as executor: # 使用线程池中的线程来执行转换任务 futures = {executor.submit(pdf_to_word, pdf_file): pdf_file for pdf_file in pdf_files} # 打印转换进度 for future in as_completed(futures): pdf_file = futures[future] print(f'Finished processing file: {pdf_file}') 运行成功: 图片和表格都成功转换了: |
|