PDF 到 Excel 转换将每个 pdf 页面放在不同的工作表中

1个回答

shecan1230

2025-09-07 08:05

excel
excel

PDF 到 excel 转换是一种常见的需求，特别是当我们需要对大量的 PDF 文档进行数据分析和处理时。然而，将每个 PDF 页面放在不同的工作表中可以提高数据的组织性和可读性，使之更易于后续操作和分析。本文将介绍如何，并附带案例代码，以实现将每个 PDF 页面放在不同的工作表中的功能。

首先，我们需要使用 Python 中的第三方库 tabula-py 来进行 PDF 到 excel 的转换。下面是一个简单的示例代码：

Python
import tabula
def convert_pdf_to_excel(pdf_path, excel_path):
    tabula.convert_into(pdf_path, excel_path, output_format="xlsx", pages="all")
pdf_path = "input.pdf"
excel_path = "output.xlsx"
convert_pdf_to_excel(pdf_path, excel_path)

在上述代码中，我们使用 tabula.convert_into 函数将指定的 PDF 文件转换为 excel 文件，并将所有页面放在一个工作表中。

如果我们希望将每个 PDF 页面放在不同的工作表中，我们需要稍作修改。下面是改进后的代码：

Python
import tabula
def convert_pdf_to_excel(pdf_path, excel_path):
    pdf_tables = tabula.read_pdf(pdf_path, pages="all")
    
    with pd.excelWriter(excel_path) as writer:
        for i, table in enumerate(pdf_tables):
            table.to_excel(writer, sheet_name=f"Page {i+1}", index=False)
pdf_path = "input.pdf"
excel_path = "output.xlsx"
convert_pdf_to_excel(pdf_path, excel_path)

在这个改进后的代码中，我们使用 tabula.read_pdf 函数读取每个 PDF 页面的表格数据，并将其存储在一个列表中。然后，我们使用 pd.excelWriter 来创建一个 excel 文件写入器，并使用 to_excel 方法将每个表格写入不同的工作表中，工作表的名称为 "Page 1"、"Page 2"、"Page 3" 等。

通过这种方式，我们可以将每个 PDF 页面放在不同的工作表中，以便于后续的数据处理和分析。这样做的好处是，每个工作表对应一个页面，数据的结构和关系更加清晰，便于查找和使用。

下面是代码的案例实现：

Python
import tabula
import Pandas as pd
def convert_pdf_to_excel(pdf_path, excel_path):
    pdf_tables = tabula.read_pdf(pdf_path, pages="all")
    
    with pd.excelWriter(excel_path) as writer:
        for i, table in enumerate(pdf_tables):
            table.to_excel(writer, sheet_name=f"Page {i+1}", index=False)
pdf_path = "input.pdf"
excel_path = "output.xlsx"
convert_pdf_to_excel(pdf_path, excel_path)

通过以上代码，我们可以将每个 PDF 页面放在不同的工作表中，以提高数据的组织性和可读性。

：

本文介绍了如何，以及如何将每个 PDF 页面放在不同的工作表中。通过将每个页面放在不同的工作表中，我们可以更好地组织和分析数据。希望本文对你有所帮助！

举报有用（4）分享收藏

PDF 到 Excel 转换将每个 pdf 页面放在不同的工作表中

1个回答

shecan1230

热门话题

相关问题