PDF转图片
使用 PyMuPDF 和 PIL 将 PDF 转换为图片并合并
1. 简介
本教程将指导您如何使用 Python 和 PyMuPDF 库将 PDF 文档的每一页转换为图片,并使用 PIL(Pillow)库将这些图片垂直合并成一张长图片。这种方法对于创建长卷轴式的图像或文档非常有用。
2. 环境设置
在开始之前,请确保您的环境中已安装了 Python 和以下库:
- PyMuPDF:用于处理 PDF 文件。
- Pillow(PIL):用于图像处理。 您可以使用 pip 安装这些库(如果尚未安装):
pip install PyMuPDF Pillow
3. 脚本
import fitz # PyMuPDF
def convert_pdf_to_images(pdf_path, output_folder, resolution, color_mode='rgb'):
# 打开 PDF 文件
pdf_document = fitz.open(pdf_path)
# 遍历 PDF 中的每一页
for page_number in range(len(pdf_document)):
page = pdf_document[page_number]
# 获取页面的原始大小(以点为单位)
zoom_x = resolution / page.rect.width
zoom_y = resolution / page.rect.height
# 使用最小的缩放比例以确保整个页面都适应目标分辨率
zoom = min(zoom_x, zoom_y)
# 创建一个矩阵来应用缩放和抗锯齿
mat = fitz.Matrix(zoom, zoom)
# 将 PDF 页面转换为图片,指定分辨率、颜色模式和抗锯齿
pix = page.get_pixmap(matrix=mat, alpha=False, colorspace=color_mode)
# 定义输出图片的路径
output_path = f"{output_folder}/page_{page_number + 1}.png"
# 保存图片
pix.save(output_path)
# 关闭 PDF 文件
pdf_document.close()
# 使用函数
if __name__ == '__main__':
convert_pdf_to_images("E:/workCode/pythonScript/resources/test.pdf", './resources/output', resolution=2048,
color_mode='rgb')
import fitz # PyMuPDF
from PIL import Image
def convert_pdf_to_images(pdf_path, resolution):
# 打开 PDF 文件
pdf_document = fitz.open(pdf_path)
# 存储所有转换后的图片
images = []
# 遍历 PDF 中的每一页
for page_number in range(len(pdf_document)):
page = pdf_document[page_number]
# 获取页面的原始大小(以点为单位)
zoom_x = resolution / page.rect.width
zoom_y = resolution / page.rect.height
# 使用最小的缩放比例以确保整个页面都适应目标分辨率
zoom = min(zoom_x, zoom_y)
# 创建一个矩阵来应用缩放和抗锯齿
mat = fitz.Matrix(zoom, zoom)
# 将 PDF 页面转换为图片
pix = page.get_pixmap(matrix=mat)
# 使用 PIL 的 Image 对象打开图片
image = image = Image.frombytes("RGB", (pix.width, pix.height), pix.samples)
# 将图片添加到列表中
images.append(image)
# 合并所有图片
total_height = sum(image.size[1] for image in images)
combined_image = Image.new('RGB', (images[0].size[0], total_height))
current_height = 0
for image in images:
combined_image.paste(image, (0, current_height))
current_height += image.size[1]
# 关闭 PDF 文件
pdf_document.close()
return combined_image
# 使用函数
combined_image = convert_pdf_to_images("E:/workCode/pythonScript/resources/test.pdf", resolution=2048)
# 保存合并后的图片
combined_image.save("test.png")
我们将使用两个脚本。第一个脚本 convert_pdf_to_images.py
将 PDF 文件的每一页转换为图片。第二个脚本 merge_images.py
将这些图片合并成一张长图片。
脚本 1:将 PDF 文件的每一页转换为图片
此脚本执行以下操作:
- 打开指定的 PDF 文件。
- 遍历 PDF 的每一页。
- 计算合适的缩放比例,以确保每一页适应目标分辨率。
- 使用 PyMuPDF 的
get_pixmap()
方法将每一页转换为图片。 - 将转换后的图片保存到指定的文件夹。 重要函数和参数:
fitz.open()
: 打开 PDF 文件。get_pixmap()
: 获取页面的像素图。save()
: 保存图片到文件系统。
脚本 2:将 PDF 文件的每一页转换为图片并合并成一张图片
此脚本执行以下操作:
- 打开 PDF 文件并遍历每一页。
- 将每一页转换为图片,并保存到一个列表中。
- 计算合并后图片的总高度。
- 使用 PIL 的
Image.new()
创建一个新的空白图片。 - 将所有图片垂直拼接起来。
- 保存合并后的图片。 重要函数和参数:
Image.frombytes()
: 从二进制数据创建 PIL 的 Image 对象。Image.new()
: 创建一个新的图片。paste()
: 将图片粘贴到另一个图片上。
转载自:https://juejin.cn/post/7358622889681207308