Re: 世界大百科事典
ただの駄文です。
jus第79回東京勉強会(2000年11月10日)
「電子辞書基礎編」笠原基之
「Windows辞書製品をUNIXで使うために」太田純
http://www.jus.or.jp/benkyokai/00-11tokyo.html
のときの私の発表資料を藤井さんが確保・公開してくだ
さっていたことに最近ようやく気付きました。
http://hp.vector.co.jp/authors/VA023689/misc/ohta1.txt
http://hp.vector.co.jp/authors/VA023689/misc/ohta2.txt
# 藤井さん、ありがとうございます。(_ _)
このときすでに世界大百科事典が解析できたらいいなあ
ということ、圧縮アルゴリズムに詳しい人間が開発に参
加してほしいということをしゃべっていたのでした。
世界大百科事典が解析されるまでにあれから3年を要し
たわけです。まさか自分でやるハメになるとは思ってい
ませんでしたが...。(^^;
藤井さんのdessedが出たのがこの勉強会のわりとすぐあ
とだったので、藤井さんはこのころすでにシステムソフ
ト電子辞典シリーズを(間違って:-)購入して解析を始め
られていたのでしょうね。
で、それで解析テクやらスキルやらを身につけることが
できて、その藤井さんとの共同作業で今回ようやく世界
大百科事典が解析できたわけです。何というか、運命の
巡り合わせのようなものを感じます。
ちなみに、あの発表のとき解析されていなかったシステ
ムソフト電子辞典シリーズとDTONICシリーズはすでに解
析されていますし、日本大百科全書は発表直後に出た廉
価版のほうが無事に解析されました。
残る大物の現況を書いておきます。
●エンカルタ百科事典/ブックシェルフ
最近のバージョンはWindows HTML Help 2.0のフォーマ
ットで格納されているらしい。パーシャルな情報はある。
Microsoft's ITOL/ITLS format
http://www.speakeasy.org/~russotto/chm/itolitlsformat.html
圧縮形式も既知。頑張れば解析可能か? エンカルタ2002
と2003、ブックシェルフ3.0はこのフォーマット。
古いバージョンは詳細不明。プログレッシブ英和はこの
フォーマットしかない(電子ブックプレーヤ付属の電子
ブックにこれを含むものがあるらしい)ので、古いバー
ジョンも解析できればうれしい。
●日本大百科全書1998年総合版
上記のjus勉強会で言及した初版。あのとき不明だった
日本大百科全書のインデックス、国語大辞典のインデッ
クスおよび本文はAccess97のDBファイルであることが判
明している。パスワードも構造も既知なので手をかけれ
ばいつでもEPWING化は可能だが、その後DBMSがホロンの
HiBaseになっていて、そちらはすでにEPWING化が可能に
なっているため要望がどれだけあるか不明。EB Studio
のhishidaさんはいずれ対応してくださるはず。
●学研Super日本語大辞典
LDOCE4変換スクリプトやスーパーアンカー変換スクリプ
トを書かれたNOMADさんが部分的に解読。あとは手間を
かけるだけという状況。
●学研の楽しむ辞典シリーズ
スーパーアンカー英和・和英および学研マルチメディア
辞典はNOMADさんの変換スクリプトでEPWINGに変換可能。
ほかの製品についても手間をかけるだけという状況。
●株式会社電子辞典のHD電子辞典シリーズ
fj.comp.applications.dictionaryで既報のとおり藤井
さんが本文データの伸張に成功。あとはどれだけ需要が
あるか次第?
●ロボワード
詳細不明。Jammingでは対応している。わりといろいろ
な辞書があるので対応できればうれしいかも。
●Babylon
詳細不明だが解析は困難と思われる。最近になって大修
館ジーニアス英和・和英辞典を収録したバージョンが出
たので需要はあるかも。
●Encyclopaedia Britannica
詳細不明。
●Oxford English Dictionary, 2nd Ed.
詳細不明。私のもっているのは古いバージョン(価格改
定直後のWindows 3.1版)で、新しいバージョンはデータ
形式が変更されているらしいので、古いバージョンを解
析してもあまり意味がないかも、と思っている。
--
太田純(Junn Ohta) (株)リコー/新横浜事業所
ohta@sdg.mdd.ricoh.co.jp
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735