作为一名日常工作中需要频繁与 PDF 文件打交道的人,我深知处理 PDF 的各种“痛”。无论是合并几个文件、分割特定页面、压缩大文件方便发送,还是偶尔需要转换格式、加水印或保护文档,这些看似简单的操作,常常会把我逼疯。

市面上的 PDF 工具,要么是功能强大但价格不菲的商业软件,要么是免费但功能受限、弹窗广告满天飞的在线服务。特别是那些在线工具,虽然方便,但每次上传敏感或重要的文档时,我总会心里犯嘀咕:这些文件会被如何处理?有没有隐私泄露的风险?而且,很多在线工具对文件大小、操作次数都有这样那那样的限制,真正用起来效率大打折扣。

直到我遇到了 Stirling-PDF。这是一个在 GitHub 上发现的开源项目,一个可以完全在本地部署运行的 PDF 工具集。用了一段时间后,我必须说,它彻底改变了我处理 PDF 的方式。

Stirling-PDF 解决了我的哪些痛点?

  1. 隐私和安全: 这是我最看重的一点。Stirling-PDF 可以在我自己的电脑或服务器上运行,所有文件处理都在本地完成,无需上传到第三方服务器。这意味着我的文档内容绝对安全可控。

  2. 功能全面无限制: 告别了在线工具的功能和次数限制,Stirling-PDF 提供了超过 50 种 PDF 操作,而且想用多少次都行,完全取决于我本地设备的性能。

  3. 一次投入,长期受益: 作为一个开源项目,Stirling-PDF 本身是免费的。虽然搭建需要一些时间和技术,但这笔“投资”换来了长期的免费使用和数据安全。

  4. 告别广告和捆绑: 清爽简洁的界面,没有任何烦人的广告和捆绑软件。

常见使用场景

自从有了 Stirling-PDF,我的许多 PDF 处理任务都变得异常顺畅:

  • 文档整理: 轻松合并多个报告、合同或发票到一个文件,或者将一个大型 PDF 按章节或页面范围分割成多个小文件。

  • 文件优化: 快速压缩扫描生成的大尺寸 PDF,使其更容易通过邮件发送或在网页上分享;裁剪掉多余的白边或调整对比度,让文档更清晰。

  • 格式转换: 将 PDF 转换为图片(如 JPEG、PNG),或将图片以及其他常见文档(通过 LibreOffice)转换为 PDF。

  • 内容修改: 旋转方向错误的页面,删除不需要的页面,甚至进行一些基本的页面内容编辑、添加图片或页码。

  • 文档保护与安全: 给敏感文件添加密码,设置访问权限,或者添加水印来保护版权。

功能大揭秘:不止 50 种操作!

Stirling-PDF 的功能之多,几乎涵盖了你对 PDF 工具的所有想象:

页面操作类:

  • 合并 PDF

  • 分割 PDF(按页码、按范围、提取所有页面为独立文件)

  • 重新组织和排序页面(拖拽式 GUI 操作)

  • 旋转页面

  • 删除页面

  • 多页布局(将多页内容排布到一页上)

  • 缩放页面内容

  • 裁剪 PDF

  • 自动分割扫描文档

  • 提取特定页面

  • 将 PDF 转换为单页图片

  • 叠加/覆盖 PDF

  • 调整对比度

转换操作类:

  • PDF 与图片互转 (JPG, PNG, TIFF 等)

  • 将常见文件格式转为 PDF (Word, Excel, PowerPoint 等,需安装 LibreOffice)

  • HTML 转 PDF

  • Markdown 转 PDF

  • URL 转 PDF

安全与权限类:

  • 添加/移除密码

  • 修改 PDF 权限

  • 添加水印

  • 签名/认证 PDF

  • 清洗 PDF (Sanitize)

  • 自动文本涂黑/脱敏

其他实用功能:

  • 压缩 PDF (减小文件大小)

  • 提取图片

  • 从扫描件中提取图片

  • 移除图片

  • 移除注释

  • 添加页码

  • 修复损坏的 PDF 文件

  • 检测并移除空白页

  • 比较两个 PDF 的文本差异

  • 添加/生成签名

  • 创建自定义操作流程(Pipelines),自动化处理一系列任务

  • 支持 API 集成,方便开发者调用

可以看到,无论是日常的文档整理,还是更高级的安全处理和自动化需求,Stirling-PDF 都能满足。

本地搭建指南:拥有你自己的 PDF 服务

Stirling-PDF 最推荐的本地搭建方式是使用 Docker。这种方法最为便捷,可以在 Windows, macOS, Linux 等几乎所有支持 Docker 的系统上运行,并且能隔离环境,避免依赖冲突。

使用 Docker 搭建的基本步骤(以 Linux 为例,其他系统类似):

  1. 安装 Docker 和 Docker Compose: 如果你的系统还没有安装,请先按照 Docker 官方文档进行安装。

  2. 创建 Docker Compose 文件: 创建一个 docker-compose.yml 文件,内容类似如下:

    YAML

    version: '3.8'
    services:
      stirling-pdf:
        image: ghcr.io/stirling-tools/stirling-pdf:latest
        ports:
          - "8080:8080" # 将容器内部的 8080 端口映射到主机的 8080 端口
        volumes:
          - /path/to/your/data:/app/data # 持久化数据存储,按需设置
          - /path/to/your/extra_configs:/configs # 存储自定义配置文件,按需设置
        environment:
          # 可选的环境变量配置,例如:
          # - USER_NAME=admin
          # - PASSWORD=yourpassword
          # - DOCKER_ENABLE_SECURITY=true
          # - OCR_ENABLED=true # 如果需要 OCR 功能
          # - FILE_TO_PDF_ENABLED=true # 如果需要文件转 PDF 功能
        restart: unless-stopped
    

    /path/to/your/data/path/to/your/extra_configs 替换为你希望在主机上存储数据和配置的实际路径。

  3. 启动服务:docker-compose.yml 文件所在的目录打开终端,运行命令:

    Bash

    docker-compose up -d
    
  4. 访问应用: 等待 Docker 镜像下载和容器启动后,打开浏览器访问 http://localhost:8080,就可以开始使用 Stirling-PDF 了。

除了 Docker,Stirling-PDF 也提供了 Windows 和 macOS 的安装器,以及作为 Java Jar 包运行的方式,你可以根据自己的操作系统和技术偏好选择最适合的搭建方法。详细的安装指南可以在其 GitHub 仓库或官方文档中找到。根据需要开启 OCR 或文件转 PDF 功能时,可能需要额外安装一些依赖(如 Python, OpenCV, LibreOffice 等),官方文档中也提供了详细的说明。

对比常见解决方案

相比于大多数在线 PDF 工具,Stirling-PDF 在数据隐私、功能完整性、使用自由度上有着压倒性优势。你不再需要上传文件,担心隐私泄露,也不用忍受各种限制和广告。

与商业软件相比,Stirling-PDF 是免费且开源的,这意味着更高的透明度和社区驱动的快速发展。虽然商业软件可能有更漂亮的用户界面或某些独有的高级功能,但 Stirling-PDF 的功能集已经足够强大,满足绝大多数个人和小型团队的需求。而且其本地部署的特性,是很多商业软件订阅服务无法比拟的隐私保障。

结语

如果你也像我一样,常常与 PDF 打交道,并且注重数据安全和操作的自由度,那么我强烈推荐你尝试一下 Stirling-PDF。它不仅仅是一个 PDF 工具,更是一种安全、自主处理文档的解决方案。投入一点时间进行本地搭建,你将收获一个功能强大、无限使用且完全掌握在自己手中的 PDF 处理中心。