ただの駄文です。

jus第79回東京勉強会(2000年11月10日)
「電子辞書基礎編」笠原基之
「Windows辞書製品をUNIXで使うために」太田純
http://www.jus.or.jp/benkyokai/00-11tokyo.html

のときの私の発表資料を藤井さんが確保・公開してくだ
さっていたことに最近ようやく気付きました。

http://hp.vector.co.jp/authors/VA023689/misc/ohta1.txt
http://hp.vector.co.jp/authors/VA023689/misc/ohta2.txt

# 藤井さん、ありがとうございます。(_ _)

このときすでに世界大百科事典が解析できたらいいなあ
ということ、圧縮アルゴリズムに詳しい人間が開発に参
加してほしいということをしゃべっていたのでした。

世界大百科事典が解析されるまでにあれから3年を要し
たわけです。まさか自分でやるハメになるとは思ってい
ませんでしたが...。(^^;

藤井さんのdessedが出たのがこの勉強会のわりとすぐあ
とだったので、藤井さんはこのころすでにシステムソフ
ト電子辞典シリーズを(間違って:-)購入して解析を始め
られていたのでしょうね。

で、それで解析テクやらスキルやらを身につけることが
できて、その藤井さんとの共同作業で今回ようやく世界
大百科事典が解析できたわけです。何というか、運命の
巡り合わせのようなものを感じます。

ちなみに、あの発表のとき解析されていなかったシステ
ムソフト電子辞典シリーズとDTONICシリーズはすでに解
析されていますし、日本大百科全書は発表直後に出た廉
価版のほうが無事に解析されました。

残る大物の現況を書いておきます。

●エンカルタ百科事典/ブックシェルフ

最近のバージョンはWindows HTML Help 2.0のフォーマ
ットで格納されているらしい。パーシャルな情報はある。
  Microsoft's ITOL/ITLS format
  http://www.speakeasy.org/~russotto/chm/itolitlsformat.html
圧縮形式も既知。頑張れば解析可能か? エンカルタ2002
と2003、ブックシェルフ3.0はこのフォーマット。

古いバージョンは詳細不明。プログレッシブ英和はこの
フォーマットしかない(電子ブックプレーヤ付属の電子
ブックにこれを含むものがあるらしい)ので、古いバー
ジョンも解析できればうれしい。

●日本大百科全書1998年総合版

上記のjus勉強会で言及した初版。あのとき不明だった
日本大百科全書のインデックス、国語大辞典のインデッ
クスおよび本文はAccess97のDBファイルであることが判
明している。パスワードも構造も既知なので手をかけれ
ばいつでもEPWING化は可能だが、その後DBMSがホロンの
HiBaseになっていて、そちらはすでにEPWING化が可能に
なっているため要望がどれだけあるか不明。EB Studio
のhishidaさんはいずれ対応してくださるはず。

●学研Super日本語大辞典

LDOCE4変換スクリプトやスーパーアンカー変換スクリプ
トを書かれたNOMADさんが部分的に解読。あとは手間を
かけるだけという状況。

●学研の楽しむ辞典シリーズ

スーパーアンカー英和・和英および学研マルチメディア
辞典はNOMADさんの変換スクリプトでEPWINGに変換可能。
ほかの製品についても手間をかけるだけという状況。

●株式会社電子辞典のHD電子辞典シリーズ

fj.comp.applications.dictionaryで既報のとおり藤井
さんが本文データの伸張に成功。あとはどれだけ需要が
あるか次第?

●ロボワード

詳細不明。Jammingでは対応している。わりといろいろ
な辞書があるので対応できればうれしいかも。

●Babylon

詳細不明だが解析は困難と思われる。最近になって大修
館ジーニアス英和・和英辞典を収録したバージョンが出
たので需要はあるかも。

●Encyclopaedia Britannica

詳細不明。

●Oxford English Dictionary, 2nd Ed.

詳細不明。私のもっているのは古いバージョン(価格改
定直後のWindows 3.1版)で、新しいバージョンはデータ
形式が変更されているらしいので、古いバージョンを解
析してもあまり意味がないかも、と思っている。
-- 
太田純(Junn Ohta) (株)リコー/新横浜事業所
ohta@sdg.mdd.ricoh.co.jp