网站首页 > 开源技术 正文
支持谷歌、必应、有道的免费翻译接口,基于Django、PyMuPDF实现了pdf文档英译汉的功能,翻译后的pdf格式基本保持不变,可以下载docx和pdf格式的翻译文档,基本解决复制caj中文论文时的格式问题,简单的满足看论文以及写总结的需求。
目的
- 省去看英文论文去各个翻译网站对比翻译结果的时间消耗。
- 解决复制中文的caj或者pdf中的文字段落时会出现格式的问题。
- 下载翻译后的pdf以及word不用花钱,收费如翻译狗,有道等。
- 使用必应的英译汉翻译文档。
实现
- 基于django、PyMuPdf、谷歌、有道翻译实现了pdf英译汉的功能,翻译后的pdf格式基本保持不变,可以下载docx和pdf格式的翻译文档。
- 格式矫正方面基本解决了复制caj或者pdf中文论文时出现的格式问题。
问题
- word不能实现pdf一样的排版,翻译后的pdf还是存在样式问题(需要考虑的很多,慢慢做优化)。
- 表格无法写入,公示混乱。
- 搜狗,百度翻译接口未实现。
- 有道翻译长句子有问题,建议使用谷歌、必应。
环境
开发环境的系统平台为 Windows 10 (64 位),Python 版本为 3.6 (64 位),Django版本为 2.2
atomicwrites==1.3.0 attrs==19.1.0 certifi==2019.3.9 chardet==3.0.4 colorama==0.4.1 Django==2.2.1 docx==0.2.4 idna==2.8 Js2Py==0.63 lxml==4.3.3 more-itertools==7.0.0 pdfminer3k==1.3.1 Pillow==6.0.0 pluggy==0.11.0 ply==3.11 py==1.8.0 PyExecJS==1.5.1 pyjsparser==2.7.1 PyMuPDF==1.14.13 PyPDF2==1.26.0 pytest==4.5.0 python-docx==0.8.10 pytz==2019.1 requests==2.21.0 six==1.12.0 sqlparse==0.3.0 tzlocal==1.5.1 urllib3==1.24.3 wcwidth==0.1.7
展示
参考文档
PyMuPDF参考文档
只使用pdf翻译
如果只是想要拿来翻译论文的同学看这里
- 下载该项目后记得将文件夹名由Easy-Trans-master改为EasyTrans。
- 将要翻译的文件放到input_file这个目录中,将56行的代码最后的pdf名字修改为要翻译的pdf名字。
- 运行trans_file.py等代码执行结束,翻译后的文档就在output_file这个目录下面。
- 这里采用的是必应翻译,也可以自己修改为其它自己想用的翻译方式,也可以修改目录,方便自己运行翻译就可以了。如果有好的改进pdf翻译效果的建议或者问题联系qcs@stu.ouc.edu.cn。
在本地运行项目
1.克隆项目到本地(不使用git工具的话,直接下载就ok)
打开命令行,进入到保存项目的文件夹,输入如下命令:
https://github.com/QPromise/Easy-Trans.git
2.创建并激活虚拟环境(不使用可以跳过这里)
强烈推荐在 Virtualenv 下进行 Django 的开发。Virtualenv 是一个 Python 工具,使用它可以创建一个独立的 Python 环境。
在命令行进入到保存虚拟环境的文件夹,输入如下命令创建并激活虚拟环境:
C:\WINDOWS\system32>pip install virtualenv
C:\WINDOWS\system32>virtualenv C:\Users\Envs\EasyTrans_env
C:\WINDOWS\system32>C:\Users\Envs\EasyTrans_env\Scripts\activate
(EasyTrans_env) C:\WINDOWS\system32>
3.安装项目依赖
如果使用了虚拟环境,确保激活并进入了虚拟环境,在命令行进入项目所在的 Easy-Trans 文件夹,运行如下命令:
pip install -r requirements.txt
4.数据库迁移
命令行输入
python manage.py makemigrations
python manage.py migrate
5.创建后台管理员用户
命令行输入
python manage.py createsuperuser
6.运行开发服务器
命令行输入
python manage.py runserver
在浏览器输入:127.0.0.1:8000 就可以看到主页了。
注意
fitz这个包是PyMuPDF的,只要安装PyMuPDF就可以正常导入了。
猜你喜欢
- 2024-10-25 爬虫犯法吗?| python爬虫小demo(爬虫违法?)
- 2024-10-25 还在为实习工作发愁?保姆级爬虫教程,python爬取“实习网”信息
- 2024-10-25 利用python爬虫,3分钟帮朋友找到工作
- 2024-10-25 用python实现自己的小说阅读器(python编写pdf阅读器)
- 2024-10-25 安卓手机基于python3搜索引擎(python调用安卓so文件)
- 2024-10-25 Pip, Pipenv, Poetry or Conda——你会选择哪个?
- 2024-10-25 手把手搭建Web蜜罐Glastopf(如何搭建蜜罐)
- 2024-10-25 zabbix 钉钉报警带监控波动图(zabbix实现钉钉报警)
- 2024-10-25 Python 3.8 稳定版正式发布,新特性全面解读
- 2024-10-25 不用 pip install,你养我吗?(不用pip安装whl)
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)