就我所知,EPUB 固定版面常會遇到 2 種結構:
1. 單純的每頁就是 1 張圖片,文字就在圖片裡面。
2. 每頁是 1 張圖片,但文字是另外用 HTML, CSS 語法內嵌進去。
第 1 種結構只要打開 EPUB 檔,很容易就可以取出圖片,做成 PDF 檔,方便筆記(請購買正版書籍且不要散佈)。
但當遇到第 2 種結構時,這個方法就行不通。即使使用 Calibra 的轉換功能,據我測試的結果都無法成功。
今天無意間看到做法,有些書是透過 pdf2htmlEX 這套軟體,以達到 PDF -> HTML 的效果。
我想如果認真研究一下,應該就能達到想要的結果。
記錄一下避免忘記。
Reference
http://coolwanglu.github.io/pdf2htmlEX/
https://github.com/RNCTX/PDF2HTMLEX-EPUB3FIXED
沒有留言:
張貼留言