Rockyspade · August 18, 2024 07:16 · Rockyspade · Aug 21, 2024
diff --git a/pdf_page_counter_csv_script.py b/pdf_page_counter_csv_script.py
 import os
 import re
 import csv


 def count_pdf_pages(file_path):
    with open(file_path, "rb") as file:
        content = file.read()
        return len(re.findall(rb"/Type\s*/Page[^s]", content))


 def get_pdf_info(directory):
    pdf_info = []
    for root, _, files in os.walk(directory):
        for file in files:
            if file.endswith(".pdf"):
                pdf_path = os.path.join(root, file)
                print(f"Reading {pdf_path}")
                try:
                    num_pages = count_pdf_pages(pdf_path)
                    main_folder = os.path.relpath(root, directory)
                    pdf_info.append([main_folder, file[:-4], num_pages])
                except Exception as e:
                    print(f"Could not read {pdf_path}: {e}")
    return pdf_info


 def write_to_csv(pdf_info, output_file):
    with open(output_file, mode="w", newline="", encoding="utf-8") as file:
        writer = csv.writer(file)
        writer.writerow(["Main Folder", "PDF Name", "Number of Pages"])
        writer.writerows(pdf_info)


 if __name__ == "__main__":
    # Change the path to appropriate one
    directory = r"D:\\Path"  
    output_file = "pdf_info.csv"  

    pdf_info = get_pdf_info(directory)
    write_to_csv(pdf_info, output_file)

    print(f"PDF information has been written to {output_file}")
	import os
	import re
	import csv


	def count_pdf_pages(file_path):
	with open(file_path, "rb") as file:
	content = file.read()
	return len(re.findall(rb"/Type\s*/Page[^s]", content))


	def get_pdf_info(directory):
	pdf_info = []
	for root, _, files in os.walk(directory):
	for file in files:
	if file.endswith(".pdf"):
	pdf_path = os.path.join(root, file)
	print(f"Reading {pdf_path}")
	try:
	num_pages = count_pdf_pages(pdf_path)
	main_folder = os.path.relpath(root, directory)
	pdf_info.append([main_folder, file[:-4], num_pages])
	except Exception as e:
	print(f"Could not read {pdf_path}: {e}")
	return pdf_info


	def write_to_csv(pdf_info, output_file):
	with open(output_file, mode="w", newline="", encoding="utf-8") as file:
	writer = csv.writer(file)
	writer.writerow(["Main Folder", "PDF Name", "Number of Pages"])
	writer.writerows(pdf_info)


	if __name__ == "__main__":
	# Change the path to appropriate one
	directory = r"D:\\Path"
	output_file = "pdf_info.csv"

	pdf_info = get_pdf_info(directory)
	write_to_csv(pdf_info, output_file)

	print(f"PDF information has been written to {output_file}")