
poppler 是一套开源的 pdf 渲染库和实用工具集,广泛应用于 pdf 文档的解析、转换和处理。在许多开发场景中,特别是在 python 项目中,像 textract 这样的库常常依赖 poppler 来提取 pdf 内容。尽管在 linux 环境下,poppler 可以通过 apt-get 等包管理器轻松安装,但在 windows 开发环境中,当无法使用 conda、scoop 或 chocolatey 等包管理器时,手动安装就成为了必要的解决方案。
获取 Poppler 二进制文件为了在 Windows 上手动安装 Poppler,您需要获取其预编译的二进制文件。目前,GitHub 用户 oschwartz10612 维护并定期更新着包含所有依赖的 Poppler Windows 版本。
- 访问 GitHub 仓库: 打开您的浏览器,访问 oschwartz10612 的 GitHub 仓库:https://github.com/oschwartz10612/poppler-windows。
- 下载最新版本: 在仓库页面中,找到“Releases”(发布)区域或直接在主页上寻找最新版本的压缩包(通常命名为 poppler-xxx_x64.zip 或类似名称)。点击下载到您的本地系统。
- 解压文件: 将下载的压缩包解压到一个您偏好的目录,例如 C:\Program Files\Poppler 或 C:\tools\Poppler。解压后,您会看到一个包含 bin、include、lib 等子目录的文件夹。bin 文件夹中包含了所有可执行的 Poppler 命令行工具。
Poppler 的命令行工具(如 pdftoppm、pdftotext 等)位于解压目录下的 bin 文件夹中。为了让系统能够识别并执行这些工具,您需要将 bin 目录的路径添加到系统的 PATH 环境变量中。
- 打开系统属性: 右键点击“此电脑”(或“我的电脑”),选择“属性”。
- 进入高级系统设置: 在弹出的窗口中,点击左侧的“高级系统设置”。
- 打开环境变量: 在“系统属性”窗口中,点击“环境变量”按钮。
-
编辑 PATH 变量:
- 在“系统变量”部分,找到名为 Path 的变量,选中它,然后点击“编辑”。
- 在“编辑环境变量”窗口中,点击“新建”,然后输入您之前解压的 Poppler 目录下的 bin 文件夹的完整路径(例如 C:\tools\Poppler\bin)。
- 点击“确定”关闭所有窗口,保存更改。
重要提示: 修改 PATH 环境变量后,您可能需要重启所有已打开的命令行窗口(或 PowerShell),甚至重启计算机,以确保更改生效。
Teleporthq
一体化AI网站生成器,能够快速设计和部署静态网站
182
查看详情
验证安装
完成上述步骤后,您可以通过命令行验证 Poppler 是否已成功安装并配置。
- 打开新的命令行窗口: 打开一个新的命令提示符(CMD)或 PowerShell 窗口。
-
执行验证命令: 输入以下命令并按回车:
pdftoppm -h
如果 Poppler 已正确安装并且其 bin 目录已添加到 PATH 环境变量中,该命令将显示 pdftoppm 工具的帮助信息,表明 Poppler 实用工具已可供系统调用。如果出现“'pdftoppm' 不是内部或外部命令,也不是可运行的程序或批处理文件”的错误,请仔细检查 PATH 环境变量的配置是否正确,并确保命令行窗口已重启。
- 版本兼容性: 确保下载的 Poppler 版本与您的项目需求兼容。对于 Python 的 textract 等库,通常较新版本的 Poppler 都能良好工作。
- 更新与维护: 与包管理器不同,手动安装的 Poppler 不会自动更新。您需要定期检查 GitHub 仓库以获取最新版本,并重复上述步骤进行更新。
- 权限问题: 确保您有足够的权限将 Poppler 解压到目标目录,并修改系统环境变量。
- 替代方案: 如果您的开发环境允许,强烈建议使用包管理器(如 scoop install poppler 或 choco install poppler)来简化安装和管理过程,特别是在团队协作环境中。手动安装通常是作为一种备用或受限环境下的解决方案。
以上就是在 Windows 上不使用包管理器安装 Poppler 的详细教程的详细内容,更多请关注知识资源分享宝库其它相关文章!
相关标签: linux python git windows github 计算机 操作系统 浏览器 电脑 工具 pdf 环境变量 Python conda include github windows https linux PDF 文档 大家都在看: 解决Linux系统下用户安装程序(如Pipenv)不在PATH环境变量的问题 在 Linux 系统中如何解决 DataCap 验证码无法显示的问题? Linux 定时任务实战:Python 脚本自动化执行配置 机器学习模型部署:TensorFlow Serving 在 Linux 的配置 Linux 下 Python 调试技巧:pdb 与 VS Code 集成实战






发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。