2020年5月8日星期五

3 个快速提效的 PDF 制作工作流 | 实用技巧

PDF 读起来也许舒服,但是制作起来可能折磨过不少人。
由于排版稳定,PDF 对阅读的人比较友好,但固定尺寸对于制作来说较为麻烦,换台设备阅读可能就要切分重排……不幸的是,我们不一定总是能拿到符合要求的 PDF,常常免不了成为那个制作 PDF 的人。
之前我写过一篇《5 个不为人知的 PDF 技巧》,分享了 PDF 批注、转换方面的一系列技巧。这次我们聚焦几个 PDF 制作过程中的场景,通过 3 个 Automator 工作流,提高自制 PDF 的效率。
注:为求实现过程最简单易行,本次动作只提供 Automator 版成品,LaunchBar、Keyboard Maestro 等自动化动作也可以调用此动作来间接处理 PDF。

切分横版图片成 PDF

我们从由图片制作 PDF 的场景入手,一方面当然因为这类情况相对常见,另一方面,涉及的自动化动作可以部分用到后两节的场景中。
课业、工作和娱乐上,如果收到分散的图片素材,阅读、批注起来显然是不便的。图片本身质量好的话,尚且可以合并成 PDF 直接看;如果遇到横版扫描件甚至干脆是照片,导出来的 PDF 也不舒服。最常见的问题是,一屏放两页,上下夹着黑边指定不舒服;退一步讲,即便你在用的阅读器恰好可以自动分页,也不能照顾到批注——切开 PDF 会影响批注的连贯。作为通用方案,不如一开始就制作出排版合适的 PDF。

这些看起来别扭的图片素材,还真不是制作者存心为难读者,更多时候是制作时条件有限或无心之失:
  • 自行扫描的教材:直接用移动设备扫出来的课本、习题等文档,往往会两页平铺开来扫在一起,时候再切分比较麻烦。即便换作事先一页一页分开扫,也不过是朝三暮四,总工作量并没有丝毫减少。
  • 电子化的笔记:和教材的情况类似,拍摄方便考虑,扫描笔记也多为横版。涉及人情往来的还特别尴尬,比如拜托别人拍摄听课笔记或会议指示,即便收到的是横向图片,也不方便让对方重拍一遍。
  • 古董资源的扫描件:这些图书一般没有发行过电子版本,譬如旧杂志、初版漫画,制作者也不情愿把书切开扫,往往我们能拿到的只有横版图片或 PDF。有些电子书论坛中经常看到有人在寻求「分页重排工具」,横版图带来的麻烦可见一斑。
针对这些问题,第一个工作流就是:将横版图片素材自动切分、重组为竖版 PDF。

动作使用和素材准备

本动作需要 imagemagick 来处理图片素材,可在终端中通过 brew install imagemagick 命令安装(不熟悉 brew 命令和包管理器 HomeBrew 的读者,可通过 这篇文章 快速了解)。
安装动作后,试着选中一批图片,可以在右键菜单中看到「images to PDF」的动作。也可以在 Finder 画廊视图的快速操作(Quick Action)栏中看到这一动作。如果你已经装过其他动作,可能新动作会被挤到「More」选单中。

点击「images to PDF」,稍等一会儿,就可以看到切分重排好的 PDF。途中会在素材图所在处临时创建一个 temp 文件夹,用于存放切好后的图片,在 PDF 生成完毕后即自动删除。
如果制作前有机会自己扫描的话,还是尽量保证一下素材质量。首先是要把资料大致摆在镜头中间,切分的时候可以利落切成两份。其次是尽可能铺平,扫描软件也只能在一定程度上矫正弯曲。最后留意一下图片顺序,照着页码扫,因为稍后 Automator 需要按文件名顺序来创建 PDF。
导出图片这一步可以在手机上直接完成,从原生备忘录到 Scanner 等第三方工具,一般都有把扫描件保存成图片的选项。
对于已经生成完毕的横版 PDF,下一节还会有专门的转换方式。接着我们看一下 Automator 中的动作实现,其中不少模块会在后续动作中反复使用,了解一下可以做出更个性化的 PDF 动作。

原理简析

整个制作 PDF 的动作主要有切分、充组、删除临时素材几步,除了切图需要使用简单脚本,余下步骤都只用 Automator 自带模块。动作只接收图片,这样在处理其他文件时就不会占用操作菜单(尤其在右键菜单已经很挤的情况下)。
  1. 对半切分图片:这里调用了 imagemagick,切好后左侧序号在前,右侧序号在后。漫画素材顺序可能相反,稍后介绍调整方法。脚本末尾还输出了新图片素材所在路径,供下一步使用。
  2. 获取、排序素材并生成 PDF:切好的图通过这几个模块就可以制作 PDF,成品默认放在桌面。注意获取到的文件要按名称排序。
  3. 删除临时文件:找到切后的图片并删除,原素材不受影响。
切分图片这步会在素材图片所在位置创建临时文件夹,用来存放切分后的图片。如果怕临时文件夹撞名,可以把脚本中的 3 处 temp 全部换成比较特色的名字。
这个 PDF 制作工作流还可以继续拓展,比如接上 OCR 文字识别功能(上一篇 PDF 技巧文章中有介绍),做到切分、OCR 一次性完成。这种搭积木一样随意组合各项功能的用法,算是 Automator 的一个特长。即便对于代码不是特别熟悉,也可以把现成动作拼接起来。后面我们再看几例 Automator 模块的组合,处理 PDF 制作中的其他问题。

切分双页 PDF

除了横版图片素材,有时也会遇到横向排版的 PDF。整体的处理思路其实和对付图片是一样的,主要区别在于开头多了把 PDF 拆分成图片的操作。运行一下 Automator 动作,稍等便可以在桌面上得到切分好的 PDF。
有点可惜的是,这个动作没法进行批处理,因为它输出的 PDF 文件名是固定的,遇到多个文件时,后生成的文档会覆盖前一份。这也是 Automator 局限性的一个体现。
通过剖析下图的工作流也可以发现,原理部分基本相同,只是开头多了拆出图片的操作,临时素材文件夹的位置也移到了桌面(可以避免写脚本,上一节是免不了)。怕撞文件夹的话,同样可以在桌面创建一个名字独特的文件夹,再拖进开头「拷贝访达项目」和末尾「获取指定的访达项目」两步中(之后可以删除这个文件夹,不影响使用)。

其余部分不再赘述,我们加速进入一个动作。考虑到 Kindle 阅读器屏幕较小,高画质显示效果提升也不大,所以制作 PDF 时默认的页面画质只有中等,以便节约 Kindle 存储空间(毕竟图片制作的 PDF 体积还是有点大的)。

原理简析

Kindle 专用 PDF 的制作流程参考了横版 PDF 动作的一部分,大致也是提取页面、处理、合并、删除临时素材几大步,下面仅简单介绍旋转页面的命令。原本在切分 PDF 后,可以接上 Automator 自带的图像旋转模块,但是在 macOS 10.14 中这一模块经常失效(出现磁盘存取问题),所幸可以换用 macOS 自带的 sips 命令。这是一个命令行版本的图片处理工具,虽然不能和上两节的 imagemagick 相提并论,但转一下图片还是游刃有余。转动图片的命令是;
sips -r 90 图片路径
这表示将图片顺时针旋转 90 度,会直接覆盖掉原图,所以 Kindle 版动作里没有特意删除 Shell 脚本产生的临时素材。除了旋转图片,sips 还兼具翻转、调整尺寸、转换格式等功能。

生成自动排版的 Kindle 专用 PDF

前两个技巧制作的 PDF 在任何设备上都可以正常查看和批注,不过有些文档——比如漫画或杂志——可能看一遍就丢,如果阅读器自身支持分页(比如 iComic),确实没有必要切分 PDF。
不少读者在用的 Kindle 阅读器也可以自动分页,不过需要事先把 PDF 页面旋转 90 度才会启动分页功能。这节就为 Kindle 制作专用的 PDF。

动作使用

动作安装后也会出现在快速操作或画廊视图中,和上一个动作一样,只接收 PDF 文档,不影响其他文件的处理。运行后,即可得到一份页面被顺时针旋转过 90 度的新 PDF1

接着把这份 PDF 发送到 Kindle 绑定的邮箱,就能在阅读器上收到 Amazon 帮忙排好的 PDF。收到的 PDF 也是居中自动切分的,阅读起来比原先的横版好很多。如果需要在 Kindle 的小屏幕上阅读杂志、漫画等信息量较大的内容,先用 Automator 处理一下可以明显提升呈现效果。



没有评论:

发表评论