XHTMLからEPUBへの変換

仕事柄読むことが多い論文や仕様書,マニュアル類はPDFで提供されることが多いので,iPadにPDFファイルを転送してGoodReaderで読むことが多い.しかし,「Pythonによる日本語自然言語処理」のようなHTMLで提供されている文書もPDF化してみたのだが,印刷時の文字の大きさやマージンが調節できないなど,意外に融通が利かない.そこで,XHTMLからEPUBへの変換に挑戦してみた.以下はメモである.

  • 使用したソフトは「Sigil」.EPUBを直接読み書きできるし,「View」メニューから「Code View」を選べば,XHTMLを直接編集できる.なかなか優秀だ.
  • iBookの本棚でサムネールを表示したいのなら,「Insert」メニュの「Image...」で一番最初のページに画像を挿入しておけばよいようである.
  • 章ごとに改ページさせたい場合は,「Insert」メニューの「Chapter Break」で分けておけばよい.
  • ヘッダ用のタグを使えば,自動的に目次を作成してくれる.「Tools」メニューの「TOC Editor...」を使えば,それを編集することもできる.
  • iPadでは,作成したEPUBファイルをiBooksやStanzaで見ることができる.ただし,iBooksDropboxから直接転送できないので,基本的にはPCやMacと接続した状態で転送しなければいけないようだ.

試しに挑戦してみた竹鶴酒造の石川杜氏が書き,一酒庵でも公開している「間違いだらけの酒常識」は比較的うまく処理できた.

ただ,「Pythonによる日本語自然言語処理」の方は,スタイル指定が複雑だったり,和欧間の半角スペースがいろいろ悪さをしたりするなど,現在まだ修正中である.しかし,手持ちのデータが見やすくなるので,なかなか面白い.