LDOCE5 DVDをEPWING化する
最終更新日 2010-01-11
LDOCE5に付属のDVDを、FreepWingでEPWING化するためのスクリプトです。
ダウンロード
ldoce5-fpw-20100111.tar.gz
対応状況
- LDOCE5の辞書本体を変換。
- 外字はできるだけ変換。見落としや変換ミスがあるかもしれません。
- 参照は不完全ながら対応。
- 画像と音声は未サポート。抽出は出来ているのでそのうちに対応するかもしれません。
構成
- readme.txt
- 説明書
- ldoce5-fpw.conf
- 設定ファイル
- ldoce5-fpw.pl
- 変換スクリプト本体
- gaiji.pl
- 外字作成スクリプト
- parse.pl
- 展開後のデータを中間形式に変換するサブルーチン群
- gaijitbl.pl
- gaiji.plとparse.plの両方で使うテーブル
- Makefile
- Makefile
- catalogs.txt
- 辞書名などを定義するファイル
以下は同梱のおまけ
- ebwin.pl
- EBWin用の外字変換テーブルを作成するスクリプト
- idm2txt.pl
- picture.pl
- 開発中の画像抽出スクリプト
使い方など
FreePWINGが使える環境が必要なので、Windowsの人はcygwinを入れるのがよいと思います。
外字作成にImage::Magickを使っているので、インストールしてください。cygwinは標準でインストールされるのではダメっぽいので手動で入れ直す必要があります。ソースを取ってきて展開、./configure --without-x --enable-shared --disable-openmpの後、makeしてmake installでいけると思います。
XML::DOMモジュールを使っています。CPANからインストール可能です。
以下の手順で実行してください。
設定ファイルの確認
以下の2つのパスを設定します。詳細は設定ファイルの中を見てください。
- LDOCE5のインストール先へのパス
- 外字作成用TrueTypeFontへのパス
その他細かい設定。1は有効、0は無効。
- $collobox
- COLLOCATIONSの項
- $thesbox
- THESAURUSの項
- $grambox
- Grammarの項
- $f2nbox
- Registerの項
- $indent
- 字下げ
- $italic
- 斜体指定
- $bold
- 太字指定
- $emphasize
- 強調指定
- $link
- 参照
- $gramshortform
- [uncountable]->[U]などの変換
- $geoshortform
- (American|Australian|British) Engrish->(Am|Aus|Br)E変換
パッケージを作成
$ fpwmake package
LDOCE5 というディレクトリに辞書データ一式(honmonなど)が作成されます。また。zipコマンドがインストールされていれば。そのディレクトリを圧縮してパッケージを作成します。
package-tar-(gz|bz2)を指定するとzipの代わりにtar.(gz|bz2)形式で固めます。詳しくは、FreePWINGのドキュメントを参照してください。
更新履歴
サポートっぽいもの
変換結果がおかしい等があったら、とりあえずゲストブック
にお願いします。
謝辞
スクリプトはZelgadissさん作成のldoce4v2-fpwをベースにしました。先駆者に敬意を表します。
リンク