ほんやくコンニャク

英辞郎第四版に同梱されたPDIC形式の辞書ファイルをStarDict形式の辞書ファイルに変換する方法について、いくつかの落とし穴に関するメモ。

  1. PDIC1行テキスト形式に変換する。
  2. UTF-16LEからUTF-8に変換する。
  3. stardict-editorで読めるようなタブ区切りテキストに変換する。
  4. stardict-editorでStarDict形式の辞書ファイルに変換する。

手間を考えるとWindowsで作業するのが面倒がない。

PDIC1行テキストに変換する。

UTF-16LEからUTF-8に変換する。

  • iconvでもなんでも。

stardict-editorで読めるようなタブ区切りテキストに変換する。

  • SP, SOLIDUS, SOLIDUS, SOLIDUS, SPをCHARACTER TABULATIONに変換する。
    • CHARACTER TABULATIONで終わっている行は、たぶんPDIC1行テキスト形式に変換した際に発音とかが落ちた行なので無視する。
  • SP, REVERSE SOLIDUS, SPをREVERSE SOLIDUS, LATIN SMALL LETTER Nに変換する。
    • それ以外のREVERSE SOLIDUSはYEN SIGNに変換する。
  • UNIX改行にする。

stardict-editorでStarDict形式の辞書ファイルに変換する。

  • GDKまわりが面倒なのでWindowsで適当になんとかする。
  • stardictをインストールするとProgram Files/Common Files/GDKもインストールされる。
  • stardict-editorを適当なディレクトリに入れる。
  • 変換する。

OmegaTで使ったり、DictUnifierで使ったりして幸福になれる。