2020年4月27日 星期一

EPUB 固定版面特殊排版備忘

就我所知,EPUB 固定版面常會遇到 2 種結構:

1. 單純的每頁就是 1 張圖片,文字就在圖片裡面。
2. 每頁是 1 張圖片,但文字是另外用 HTML, CSS 語法內嵌進去。

第 1 種結構只要打開 EPUB 檔,很容易就可以取出圖片,做成 PDF 檔,方便筆記(請購買正版書籍且不要散佈)。

但當遇到第 2 種結構時,這個方法就行不通。即使使用 Calibra 的轉換功能,據我測試的結果都無法成功。

今天無意間看到做法,有些書是透過 pdf2htmlEX 這套軟體,以達到 PDF -> HTML 的效果。

我想如果認真研究一下,應該就能達到想要的結果。

記錄一下避免忘記。

Reference
http://coolwanglu.github.io/pdf2htmlEX/
https://github.com/RNCTX/PDF2HTMLEX-EPUB3FIXED

沒有留言:

張貼留言