PDFMathTranslate|一款开源免费的PDF数学公式翻译工具

简介

PDFMathTranslate是一款开源免费的PDF数学公式翻译工具,专注于提供高效、精准的 PDF 文档数学公式翻译功能。它能够将包含复杂数学公式的外文论文或教材,转换为中文版内容,并完整保留原始公式结构与排版格式,极大方便了中文用户阅读与学习。

功能特性

低门槛操作:无需编程基础,一键上传PDF,自动识别并翻译数学公式,快速上手。
高精度识别:基于深度学习算法,精准提取复杂公式,支持多语言翻译,提升效率。
高效适配:支持多种PDF格式,秒级响应,确保大规模文档处理无压力。

官网地址

官网:https://gitcode.com/Byaidu/PDFMathTranslate

 

 

安装和使用

1. UV 安装
  1. 安装 Python (3.10 <= 版本 <= 3.12)

  2. 安装我们的包:

    pip install uv
    uv tool install --python 3.12 pdf2zh
    
  3. 执行翻译,文件生成在 当前工作目录

    pdf2zh document.pdf
    
2. Windows exe
  1. 从 发布页面 下载 pdf2zh-version-win64.zip

  2. 解压缩并双击 pdf2zh.exe 运行。

3. 图形用户界面

1. 安装 Python (3.10 <= 版本 <= 3.12) 2. 安装我们的包:

pip install pdf2zh
  1. 在浏览器中开始使用:

    pdf2zh -i
    
  2. 如果您的浏览器没有自动启动,请访问

    http://localhost:7860/
    

4. 命令行
  1. 已安装 Python(3.10 <= 版本 <= 3.12)

  2. 安装我们的包:

    pip install pdf2zh
    
  3. 执行翻译,文件生成在 当前工作目录:

    pdf2zh document.pdf
    

Tip

docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate

无法安装?

当前程序在工作前需要一个 AI 模型 (wybxc/DocLayout-YOLO-DocStructBench-onnx),一些用户由于网络问题无法下载。如果你在下载此模型时遇到问题,我们提供以下环境变量的解决方法:

set HF_ENDPOINT=https://hf-mirror.com

对于 PowerShell 用户:

$env:HF_ENDPOINT = https://hf-mirror.com

如果此解决方案对您无效或您遇到其他问题,请参阅 常见问题解答

高级选项

在命令行中执行翻译命令,在当前工作目录下生成译文文档 example-mono.pdf 和双语对照文档 example-dual.pdf,默认使用 Google 翻译服务,更多支持的服务在这里)。

cmd

在下表中,我们列出了所有高级选项供参考:

选项 功能 示例
files 本地文件 pdf2zh ~/local.pdf
links 在线文件 pdf2zh http://arxiv.org/paper.pdf
-i 进入 GUI pdf2zh -i
-p 部分文档翻译 pdf2zh example.pdf -p 1
-li 源语言 pdf2zh example.pdf -li en
-lo 目标语言 pdf2zh example.pdf -lo zh
-s 翻译服务 pdf2zh example.pdf -s deepl
-t 多线程 pdf2zh example.pdf -t 1
-o 输出目录 pdf2zh example.pdf -o output
-f-c 异常 pdf2zh example.pdf -f "(MS.*)"
-cp 兼容模式 pdf2zh example.pdf --compatible
--share 公开链接 pdf2zh -i --share
--authorized 授权 pdf2zh -i --authorized users.txt [auth.html]
--prompt 自定义提示 pdf2zh --prompt [prompt.txt]
--onnx [使用自定义 DocLayout-YOLO ONNX 模型] pdf2zh --onnx [onnx/model/path]
--serverport [使用自定义 WebUI 端口] pdf2zh --serverport 7860
--dir [批量翻译] pdf2zh --dir /path/to/translate/
--config 配置文件 pdf2zh --config /path/to/config/config.json
--serverport [自定义 gradio 服务器端口] pdf2zh --serverport 7860
--babeldoc 使用实验性后端 BabelDOC 翻译 pdf2zh --babeldoc -s openai example.pdf

 

在下表中,我们列出了所有高级选项供参考:

选项 功能 示例
files 本地文件 pdf2zh ~/local.pdf
links 在线文件 pdf2zh http://arxiv.org/paper.pdf
-i 进入 GUI pdf2zh -i
-p 部分文档翻译 pdf2zh example.pdf -p 1
-li 源语言 pdf2zh example.pdf -li en
-lo 目标语言 pdf2zh example.pdf -lo zh
-s 翻译服务 pdf2zh example.pdf -s deepl
-t 多线程 pdf2zh example.pdf -t 1
-o 输出目录 pdf2zh example.pdf -o output
-f-c 异常 pdf2zh example.pdf -f "(MS.*)"
-cp 兼容模式 pdf2zh example.pdf --compatible
--share 公开链接 pdf2zh -i --share
--authorized 授权 pdf2zh -i --authorized users.txt [auth.html]
--prompt 自定义提示 pdf2zh --prompt [prompt.txt]
--onnx [使用自定义 DocLayout-YOLO ONNX 模型] pdf2zh --onnx [onnx/model/path]
--serverport [使用自定义 WebUI 端口] pdf2zh --serverport 7860
--dir [批量翻译] pdf2zh --dir /path/to/translate/
--config 配置文件 pdf2zh --config /path/to/config/config.json
--serverport [自定义 gradio 服务器端口] pdf2zh --serverport 7860
--babeldoc 使用实验性后端 BabelDOC 翻译 pdf2zh --babeldoc -s openai example.pdf