英辞郎(第五版)をstardictに変換する方法:iPad/iPhoneで英辞郎を使おう

iPadiPhoneiPod touchを使って洋書を多読する最大のメリットは、やはり辞書です。例えば、以前ご紹介したBookZi2Readerという電子書籍リーダーを使うと、画面に表示される単語をスワイプしたりタップしたりするだけでその意味を調べることができます。

BookZ
i2Reader

どちらのアプリstardict形式の辞書を内蔵できます。stardict形式の辞書は公式サイトから無料でダウンロードできます。でも、洋書を読むときに圧倒的に便利なのが、やはり172万項目を誇る英辞郎です。そこで、今回は先日発売された書籍版『英辞郎第五版』をstardict形式に変換する方法をご紹介します。




では、この『英辞郎 第五版』をstardict化する手順を説明します。ちょっと大変ですが、ステップ・バイ・ステップでやっていきましょう。

まずはWindows上での作業になります。

1)まず、『英辞郎 第五版』を書籍の指示に従ってインストールする。

2)次に、インストールした「PDIC Unicode for EIJIRO V」を起動。

3)「File」>「辞書設定<詳細>」を選択し、「辞書設定」ダイアログを表示させます。
eijiro01.jpg











4)そうすると、以下の4個のファイルがリスト表示されます。
・EIJI-118.dic
・WAEI-118.dic
・RYAKU118.dic
・REIJI118.dic

それぞれのファイルについて、リスト上で右クリックして、「辞書の変換」を選択し、「辞書変換の設定」ダイアログを表示させます。
eijiro02.jpg




















5)「変換先ファイル形式」に「PDIC1行テキスト形式」選択します。4個のファイルを、すべてこの方法で変換してください。
eijiro03.jpg













6)次に、5)で変換した4つのファイルの文字コードを、「Unicode」から「UTF-8」に変換します。

文字コード変換には、「文字コード変換ツール for .NET 2.0」というフリー・ソフトを利用します。ベクターでダウンロードできます。

文字コード変換ツール for .NET
http://www.vector.co.jp/soft/winnt/util/se372195.html

ダウンロードしたらソフトを起動します。4つのファイルを「変換元ファイル」のウィンドウ上(下図では空欄になっています)にドラッグ&ドロップします。変換元コードを「Unicode」、変換先コードを「UTF-8」として、変換をクリック。
eijiro04.jpg
















7)次に、6)で変換した全てのファイルについて、以下の2種類の文字置換を行います。
・「///」をタブコード「¥t」(半角¥とt)に変換
・「¥」(半角¥)を「¥n」(半角¥とn)に変換

※必ず半角にすること。コピペではなくタイプで入力してください!

この作業には、「Speeeeed」というツールを使います。ベクターでダウンロードしてください。

Speeeeed
http://www.vector.co.jp/soft/win95/util/se142895.html

・検索文字列に「///」を、置換文字列にタブコード「¥t」(半角¥とt)を入力し、ファイルを追加、「置換開始」をクリックです。

eijiro05.jpg






















・検索文字列に「¥」(半角¥)、置換文字列に「¥n」(半角¥とn)を入力、ファイルを追加して「置換開始」をクリックです。下図クリック拡大。
eijiro06.jpg






















以上でWindows上での作業は完了です。microSDに「stardict」という名前のファイルを作成し、その中に上の4つのファイルをコピーしておきましょう。



さて、ここからは、Linuxディストリビューション、Ubuntu上での作業となります。ぼくはUbuntuを日常的には使用しないので、「Wubi」(UbuntuをWindows上からインストールする仕組み)を利用しました。Ubuntuを使ったことのない方は、書店に行けばLinuxの入門書がたくさん売られているので、そちらを参考されるといいと思います。実はぼくもそうでした。

8)まず、「Synaptic パッケージ・マネージャ」を起動、「stardict」、「stardict-tools」の2項目にチェックして、インストールしてください。この際、他の必要なパッケージも自動でインストールされます。

うまくいかない場合は、こちらからダウンロードしてみてください。


9)いよいよ7)で文字変換した英辞郎の辞書ファイルを、StarDict形式に変換します。7)で用意した辞書ファイルがmicroSDの「eijiro」フォルダにあるとします。

@上部パネルの「アプリケーション」>「アクセサリ」>「端末」を起動します。

Aコマンドラインから、以下のコマンドを実行します。それぞれの処理に少し時間がかかりますので、ひとつずつ丁寧に行ってください(ファイル名を変えた方は適宜修正してください)。

$ cd /media/disk/eijiro
$ /usr/lib/stardict-tools/tabfile EIJI-118.txt
$ /usr/lib/stardict-tools/tabfile WAEI-118.txt
$ /usr/lib/stardict-tools/tabfile RYAKU118.txt
$ /usr/lib/stardict-tools/tabfile REIJI118.txt
$ rm *.txt

変換作業自体はここで終了です。Ubuntu上でstardictを使用する場合は、以下のコマンドも追加で実行してください。Ubuntuで使用しない場合は不要です。

$ cd ..
$ sudo mv eijiro /usr/share/stardict/dic/
$ sudo chmod -R 777 /usr/share/stardict/dic/eijiro

これで作業は完了です!お疲れ様でした。

あとは、できあがったstardict形式の辞書ファイルをBookZi2Readerに入れれば、スワイプ/タップだけで英辞郎の検索が可能になります。
この記事へのコメント
こんにちは はじめまして。

前verまではこちらに掲載されている順序で
dict info idxの三種類のファイルを用意すれば
webuploadページを経由して 本体に組み込めたので
すが つい先日のアップデートで FTPupload方式のみに変更されファイル形式がtar.bz2のみになり従来のやりかたでは通用しなくなりました。
圧縮されたtar.bz2を用意すればいいということですが。。 せっかくファイルを用意したのに使えないのはなんとも残念です。良い方法がありましたらご教授ください。
Posted by tak at 2010年03月31日 23:56
始めまして。
この解説のおかげで英辞郎を入れることが出来ました。ありがとうございます!
一つ問題がありまして、解説の通りにファイルを
作成すると、単語の意味を区切る改行
(最初にファイルを作成したときには\となっている部分)
に改行コード(\n)を入れるとbookzでタップした時にその部分で意味が切れてしまいます。
仕方なく\の記号のまま使っているのですが、
かなり見づらいです。
bookzに単語が違う改行ではなく、意味の区切りとしての改行という意味で使う方法があるのでしょうか?
Posted by yksk at 2010年04月02日 09:52
こんにちは。初めまして。
こちらのサイトを見ましてBookZと英辞郎を購入しましたが、書かれている手順通りにやっても上手くいかずに、もう10時間も悶々としています。
Ubuntuに「stardict」、「stardict-tools」をインストール後、
Ubuntuの「アプリケーション」>「アクセサリ」>「端末」を起動で書かれている通りに下記のコマンドをその通りに入れるといつも

$ cd /media/disk/eijiro
$ /usr/lib/stardict-tools/tabfile EIJI-118.txt (ここでEnterをすると)
次に
Error,no new line at the end
↑このようなクレジットが毎回出て、いつもこれ以上次に進めません。

英辞郎のファイルの変換からやり直しても必ず同じ現象になります。
一体、何がいけないのか全く分からず、途方に暮れております。

変換した4つのtxtファイルはメモリーステックの中に「eijiro」と名前をつけたフォルダを作り、その中に入れました。

解決の糸口をご教示を賜りたく、コメントさせて頂きました。
誠に申し訳ありませんが、上記のメールアドレスまでご返信頂ければ有難く思います。
Posted by ニキ at 2010年04月19日 01:29
初心者レベルの者です。
wubiを使ってubuntuをインストールするところまでで、次の「Synapticパッケージ・マネージャーを起動する」ができません。いろいろ検索しましたがこのページにたどり着きます。
申し訳ありませんが、やり方をご紹介願えないでしょうか。
(パソコンでの書き込みは初めてです、無知なお願いであるならばお許しください。)
Posted by 渡邊 at 2010年04月28日 11:41
みなさま、コメントありがとうございます。コメントに気づかず、お返事が遅くなってたいへん申し訳ありませんm(__)m

みなさまの御苦労お察しします。ぼくも上記の方法を見つけて成功するまでに何度も失敗しました。本当にubuntuには苦労させられました。という次第でubuntuに関しては素人に等しく、また日常的に使ってはいないので、残念ながらみなさまのご質問にお答えするノウハウを持ち合わせていませんが、以下のサイトが何かの参考になるかもしれません。

ぼくが参考にしたのはこちらのサイトです。
http://www.center-left.com/blog/archives/2009/09/netwalkerstardict.html

というわけで、ubuntuに関してはご容赦願うしかないのですが、うまくいかない原因として文字変換が正しくできていないことが考えられます。「Speeeeed」で文字変換する場合、タブコードの入力に注意してください。タブコードは半角¥とtを入力しますが、上の記事ではブラウザか何かの関係で(?)半角の¥が正確に表示されないようなので(したがって上の記事では全角の¥で代替してます)、画像をクリックしてタブコードをよく確認したうえで、タイプ入力してください。また、圧縮に関しては、Lhaplusなどのフリーソフトで解決できるかと思います。

stardictのサイトもリニューアルされて、以前落とせた辞書ファイルが落とせなくなったようですが、英語版グーグルで検索してみると、ネット上に無料の辞書ファイルがころがっています。ただ、中には権利の怪しいものもあるようなので(Geniusとか)ご注意ください。
Posted by HKZ at 2010年06月13日 01:44
 はじめまして。
 私もdict info idxの3つのファイルを作り、http経由でアップロードするところから先に進みません。
 パソコン上のリストに表示されないので、上手くいってないのでしょう。ipad側から見ても0filesです。
 サポートにメールしてみましたが、返事はありません。
Posted by YASU at 2010年07月29日 18:34
>YASUさん

英辞郎第五版は辞書ファイルがかなり重いので、環境によっては転送途中で失敗するのだろうと思います。ぼくの環境(インストールした時点:iPhone3G、OS3系、ウィンドウズVista、hts)ではうまくいったのですが、なぜかi2Readerの方には第五版を転送できませんでした(第四版は成功)。

USB経由ならうまくいきそうな気がしますが、BookZは未対応なのですよね?すると、第四版で試してみるしかないかもしれません。

今回ご紹介しているi2Readerの記事も参照してみてください。
Posted by HKZ at 2010年07月30日 02:59
お陰さまでどうにかインストールできました。
httpはどうしてもだめで、ftpでアップしました。
ソフト内のstep-by-stepを参考にftpソフトをインストールし、dict info idxの3つのファイルを適当な名称のフォルダにいれ、フォルダごとtar.bz2形式で圧縮しアップしました。tar.bz2形式は手持ちのLhacaのデラックス版だと思いますが、この圧縮ソフトでTBZ形式で圧縮し、拡張子名称を変更しました。デフォルトの英英辞書2つは削除しました。

ついでで申し訳ないですが、英辞郎で1点教えてください。
簡単な単語、例えば、backやpageなどを検索すると先頭が大文字でなくても【人名】のみ表示されますが、これはどうしょうもない現象と考えるべきでしょうか(まさか端から直していくわけにもいかないので)。
Posted by YASU at 2010年08月01日 18:51
>YASUさん

またまたお返事が遅くなってすみませんm(_ _)m
ftpで導入できたとのこと、安心しました。
さて、お尋ねの件ですが、BookZの辞書検索エンジンの仕様でどうしてもそうなってしまうようですね。こちらではどうしようもないので、開発者さんに改善をお願いするしかないかもしれません。
Posted by HKZ at 2010年08月22日 02:54
こんにちは、とっても有意義な情報ありがとうございます。

こちらの内容を参考にして、BOOKZへの英辞郎の登録うまくいきました。

英辞郎は最新のダウンロード版(V.125)を使用しました。
Ubuntuは、Wubi版を使用し、Windows7の環境ですが、問題なくインストールできました。

Bookzへの登録までうまくいったのですが、いざ使用すると、以前コメントされた方のように改行コード(\n)以降が表示されません。
変換時に「エスケープシーケンスを使用しない」にチェックするとうまくいきました。

ちなみにUbuntu環境では、変換コマンドが標準で提供されており、PDIC1行テキスト形式に変換した後は、Ubuntuのコマンドラインで実行できます。
コマンドに慣れた方はこちらの方が簡単だと思うので参考に記載します。

1.文字コード変換

iconv -f UNICODE -t UTF-8 EIJI-125.txt > EIJI-125_UTF8.txt

2.文字置換え

sed 's/\/\/\//\t/g' EIJI-125_UTF8.txt > EIJI-125_UTF8_t.txt

sed 's/\\/\\n/g' EIJI-125_UTF8_t.txt > EIJI-125_UTF8_tn.txt

3.圧縮

tar -cjvf EIJI-125.tar.bz2 EIJI-125 (EIJI-125は変換後の辞書を入れたディレクトリー名)

4.ファイル転送(ブラウザーからだとうまくいかずコマンドで実施しました。)

ftp xxx.xxx.xxx.xxx 1984
userid/passwordは適当
cd Dictionries
bin
put EIJI-125.tar.bz2
quit

BOOKZは本当に便利ですね。
ただ辞書検索から戻った時にどこまで読んでたか分からなくなってしまいますね。
辞書検索から戻っても検索した文字が輝度されたままなら言うことないのですが。

Posted by TOYS307 at 2010年11月04日 22:46
ubuntu使わずに成功しました。

こちら
http://d.hatena.ne.jp/feedface/?of=7

http://d.hatena.ne.jp/nnn-isnt-name/20080413/1208088281
を参考にしたのですが、

ここのページの7)まで終わった時点でWindows版Stardictをインストールし、
StarDict-Editor
http://code.google.com/p/stardictproject/downloads/detail?name=stardict-editor-3.0.1.rar&can=2&q=
のexeを
C:\Program Files\StarDict\Gtk\bin
に入れてダブルクリックで実行します。

後は左下のコンポボックスが「tab file」となっていることを確認し、Browseからテキストファイルを選択・Buildボタンを押すだけです。3つのファイルが出力されます。

それからBookzですと、
YASUさんがおっしゃるように3つのファイルをフォルダにまとめて圧縮し、ftpアップロードで使えます。

また、ykskの「意味が1つめしか表示されない」トラブルには私もぶつかったのですが
http://twitter.com/x_JAI_x/statuses/11806571548
を参考に、変換前「\\」 変換後「\\n」としましたところ、複数の意味が表示されました。
Posted by クレードル at 2011年01月15日 10:03
yksk「さん」でした。
失礼しました;
Posted by クレードル at 2011年01月15日 10:04
みなさま

私事で忙しくブログを放置しておりまして、コメントにお返事が出来ずに申し訳ありません。

クレードルさん、ものすごく有益な情報ありがとうございました。記事に追記して読者の注意を促しておきます。

ありがとうございましたm(__)m
Posted by HKZ at 2011年05月16日 20:38
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。