At 28 Oct 2003 03:08:13 GMT,
Junn Ohta wrote:
> 
> なるほど、ビット単位で眺めればそれなりに構造が見え
> てくるわけですね。そのためのツールも作りようはあると。

LZSS でも S-EBXA なんかは 8つのフラグをまとめて
1バイトにしているようです[1]。
ビット単位をバイト単位で扱う LZSS の常套手段ですね。

> ちょっと勉強してどれか製品を選んでトライしてみ
> ようかなと思います。

おおっ、となるとエンカルタか世界大百科事典あたりでしょうか?
期待しちゃいます。
ただ、どちらもコンテンツ完全収録な体験版をやっちゃってるなー。

> EPWINGはハフマンでシステムソフトがLZ77、株式会社電
> 子辞典がLZSSということになるわけですが、選択肢とし
> てはそれぐらいなのかな。

nomad さんが解析された DTONIC はハフマン法。
これまた nomadさんが取り組まれている LDOCE4 は gzip。

他に使われそうなアルゴリズムは動的ハフマンとか
LZ78 や LZW の動的辞書法でしょうか。

ただ、圧縮されたデータを XOR などで暗号化されると
もはや歯が立たないと思います。


[1] S-EBXA の圧縮形式について
    http://www.sra.co.jp/people/m-kasahr/dict-compress/sebxa-compress.html

---
藤井宏憲