编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

统信系统下对PDF文件进行合并、旋转、添加页码

wxchong 2024-09-08 10:47:39 开源技术 14 ℃ 0 评论


用统信系统以来,想简单编辑一下PDF文件,比如合并、旋转、添加页码,总是遇到收费。

为避免收费,通过试验网络大神的代码,今天总算基本成功了


前段时间发了文字版,效果不太好,今天增加了图片,更直观


一、准备工作


1、全新安装统信1070,并更新系统


2、进入开发者模式


单击【控制中心】-【通用】-【开发者选项】-【进入开发者模式】-【在线激活】-【下一步】-勾选我已阅读并同意......;

微信扫描

在弹出窗口勾选“同意并进入开发者模式”、【确定】

输入密码、【确定】

【现在重启】



3、打开终端

(1)左面右击鼠标,选择【在终端中打开】



(2)取得权限

在终端输入:

sudo su

输入密码(密码不显示)、回车


4、改变python默认版本为3.7.3

在终端输入:

rm -f /usr/bin/python

ln /usr/bin/python3.7 /usr/bin/python

python -V


5、安装pip

在终端输入:

apt-get update

apt-get install wget

wget https://bootstrap.pypa.io/get-pip.py

python get-pip.py

pip -V


6、安装idle

在终端输入:

apt install idle



7、安装PyPDF2和reportlab两个Python库

在终端输入:

pip install PyPDF2 reportlab


8、新建文件夹

在桌面新建文件夹“PDF编辑”

在文件夹“PDF编辑”下建立“给pdf添加页码“、“合并PDF文件”、“旋转PDF指定页面”三个文件夹

*在“合并PDF文件”文件夹放入需要合并的PDF文件,文件名最好按合并顺序命名为“1.pdf、2.pdf、3.pdf、......”

*在“给pdf添加页码”文件夹放入需要添加页码的PDF文件,文件名序命名为“1源文件.pdf”


二、合并PDF

1、打开idle,单击“file”、“newfile”


2、粘贴以下代码,“另存为“(路径:file:///home/TRBS/Desktop/PDF编辑/合并PDF文件),按F5运行


# -*- coding:utf-8*-

# 利用PyPDF2模块合并同一文件夹下的所有PDF文件

# 只需修改存放PDF文件的文件夹变量:file_dir 和 输出文件名变量: outfile


import os

from PyPDF2 import PdfReader, PdfWriter

import time


# 使用os模块的walk函数,搜索出指定目录下的全部PDF文件

# 获取同一目录下的所有PDF文件的绝对路径

def getFileName(filedir):

file_list = [os.path.join(root, filespath) \

for root, dirs, files in os.walk(filedir) \

for filespath in files \

if str(filespath).endswith('pdf')

]

# print(file_list),此时排序为:2.pdf 3.pdf 1.pdf

file_list.sort() #文件列表排序

# print(file_list),此时排序为:1.pdf 2.pdf 3.pdf

return file_list if file_list else []

# 合并同一目录下的所有PDF文件

def MergePDF(filepath, outfile):

output = PdfWriter()

outputPages = 0

pdf_fileName = getFileName(filepath)

if pdf_fileName:

for pdf_file in pdf_fileName:

print("路径:%s" % pdf_file)

# 读取源PDF文件

input = PdfReader(open(pdf_file, "rb"))

# 获得源PDF文件中页面总数

# pageCount = input.getNumPages()

pageCount = len(input.pages)

outputPages += pageCount

# print("页数:%d"%pageCount)

print("页数:%d" % pageCount)

# 分别将page添加到输出output中

for iPage in range(pageCount):

output.add_page(input.pages[iPage])

print("合并后的总页数:%d." % outputPages)

# 写入到目标PDF文件

outputStream = open(os.path.join(filepath, outfile), "wb")

output.write(outputStream)

outputStream.close()

print("PDF文件合并完成!")

else:

print("没有可以合并的PDF文件!")

# 主函数

def main():

time1 = time.time()

file_dir = r'/home/TRBS/Desktop/PDF编辑/合并PDF文件' # 存放PDF的原文件夹:file:///home/TRBS/Desktop/PDF编辑/合并PDF文件

outfile = "/home/TRBS/Desktop/PDF编辑/合并PDF文件/合并后的PDF文件.pdf" # 输出的PDF文件的名称

MergePDF(file_dir, outfile)

time2 = time.time()

print('总共耗时:%s s.' %(time2 - time1))


main()



三、对PDF指定的页码进行旋转


1、打开idle,单击“file”、“newfile”


2、粘贴以下代码,“另存为“(路径:file:///home/TRBS/Desktop/PDF编辑/旋转PDF指定页面),按F5运行


#旋转PDF指定页面

from PyPDF2 import PdfWriter, PdfReader


ro_pagesa = [1,2,3] #需要右转的页码,需人工修改!

ro_pagesb = [] #需要掉头的页码,需人工修改!

ro_pagesc = [8,9,10] #需要左转的页码,需人工修改!


def page_rotation(old_file, new_file): #param old_file:需要旋转的PDF文件路径;param new_file:旋转后的PDF文件路径

pdf = PdfReader(old_file)

page_num = pdf.pages

pdf_writer = PdfWriter()

for i in range(0,len(page_num)):

if i+1 in ro_pagesa: #顺时针旋转90度 90的倍数

page = pdf.pages[i].rotate(90)

pdf_writer.add_page(page)

j = i+1

print("右转页面:%d" % j)

elif i+1 in ro_pagesb: #顺时针旋转180度 90的倍数

page = pdf.pages[i].rotate(180)

pdf_writer.add_page(page)

j = i+1

print("掉头页面:%d" % j)

elif i+1 in ro_pagesc: #顺时针旋转270度 90的倍数

page = pdf.pages[i].rotate(270)

pdf_writer.add_page(page)

j = i+1

print("左转页面:%d" % j)

else: #不旋转

page = pdf.pages[i].rotate(0)

pdf_writer.add_page(page)

with open(new_file, 'wb') as f:

pdf_writer.write(f)

page_rotation(r"/home/TRBS/Desktop/PDF编辑/旋转PDF指定页面/1需要旋转的PDF文件.pdf", r'/home/TRBS/Desktop/PDF编辑/旋转PDF指定页面/2旋转后的PDF文件.pdf')



四、给PDF文件添加“1/N”款式页码


1、打开idle,单击“file”、“newfile”


2、粘贴以下代码,“另存为“(路径:file:///home/TRBS/Desktop/PDF编辑/给pdf添加页码),按F5运行


from PyPDF2 import PdfWriter, PdfReader

from reportlab.pdfgen import canvas

from reportlab.lib.pagesizes import A4, letter

from reportlab.pdfbase import pdfmetrics

from reportlab.pdfbase.ttfonts import TTFont

import io


def AddNumber():

# input1 = input("输入原始文件路径:") #file:///home/TRBS/Desktop/PDF编辑/给pdf添加页码/1源文件.pdf

# pdf_file = PdfReader(open(input1, "rb"))

pdf_file = PdfReader(open('/home/TRBS/Desktop/PDF编辑/给pdf添加页码/1源文件.pdf', 'rb'))

# dir_path = input("输入输出文件路径(包含文件名):") #/home/TRBS/Desktop/给pdf添加页码/c

output = PdfWriter()

for i in range(len(pdf_file.pages)):

# new_pdf = CreatePageWithWords(i+1,300,20)

new_pdf = CreatePageWithWords(f" {i+1}/{len(pdf_file.pages)}",300,20)

page = pdf_file.pages[i]

page.merge_page(new_pdf.pages[0])

output.add_page(page)

# print(f" {i+1}/{len(pdf_file.pages)}",end="")

# with open(dir_path,'wb') as out:

with open('/home/TRBS/Desktop/PDF编辑/给pdf添加页码/添加页码后的PDF文件.pdf','wb') as out:

output.write(out)

print("页码添加成功!")


def CreatePageWithWords(words,x,y):

packet = io.BytesIO()

# 使用Reportlab创建一个新的PDF,原理是将两个页面叠加起来

can = canvas.Canvas(packet, pagesize=A4)

# pdfmetrics.registerFont(TTFont("chs", "/home/TRBS/.local/share/fonts/宋体/simsun.ttc"))

can.setFont("Helvetica", 28)

can.setFillColorRGB(255, 0, 0, 1)

can.drawString(x, y, str(words))

can.save()

packet.seek(0)

return PdfReader(packet)


AddNumber()





**********************再次感谢网络大神,祝你们五一快乐!**********************

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表