Re: 株式会社電子辞典の HD 辞典シリーズ
fj.comp.applications.dictionaryの記事<878yn5c0pz.wl%fujii@chi.its.hiroshima-cu.ac.jp>で
fujii@chi.its.hiroshima-cu.ac.jpさんは書きました。
> LZSS でも S-EBXA なんかは 8つのフラグをまとめて
> 1バイトにしているようです[1]。
> ビット単位をバイト単位で扱う LZSS の常套手段ですね。
うむむ、圧縮に手を出すにはもう少し経験値上げておか
ないとだめかも。(^^;
> おおっ、となるとエンカルタか世界大百科事典あたりでしょうか?
やりたいのは世界大百科なんですよね。
> ただ、どちらもコンテンツ完全収録な体験版をやっちゃってるなー。
そうなんです。Jammingで世界大百科が読めるのですが、
それは第二版だけで、アスキーが体験版をつけた初版に
は対応してません。ファイル構成を眺めるたかぎりでは
どちらも同じように見えるんですけどね。そのあたりは
微妙かもしれない...。
> 他に使われそうなアルゴリズムは動的ハフマンとか
> LZ78 や LZW の動的辞書法でしょうか。
LZ78とLZWは特許がらみの問題があるので、賢いところ
は手を出さないのではないかと思っているのです。
> ただ、圧縮されたデータを XOR などで暗号化されると
> もはや歯が立たないと思います。
そうなんですよね。でも世界大百科はJammingでも何と
かなっているわけですから、暗号化まではされていない
のではないかと期待しているのでした。
--
太田純(Junn Ohta) (株)リコー/新横浜事業所
ohta@sdg.mdd.ricoh.co.jp
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735