Re: 株式会社電子辞典の HD 辞典シリーズ
At 28 Oct 2003 03:08:13 GMT,
Junn Ohta wrote:
>
> なるほど、ビット単位で眺めればそれなりに構造が見え
> てくるわけですね。そのためのツールも作りようはあると。
LZSS でも S-EBXA なんかは 8つのフラグをまとめて
1バイトにしているようです[1]。
ビット単位をバイト単位で扱う LZSS の常套手段ですね。
> ちょっと勉強してどれか製品を選んでトライしてみ
> ようかなと思います。
おおっ、となるとエンカルタか世界大百科事典あたりでしょうか?
期待しちゃいます。
ただ、どちらもコンテンツ完全収録な体験版をやっちゃってるなー。
> EPWINGはハフマンでシステムソフトがLZ77、株式会社電
> 子辞典がLZSSということになるわけですが、選択肢とし
> てはそれぐらいなのかな。
nomad さんが解析された DTONIC はハフマン法。
これまた nomadさんが取り組まれている LDOCE4 は gzip。
他に使われそうなアルゴリズムは動的ハフマンとか
LZ78 や LZW の動的辞書法でしょうか。
ただ、圧縮されたデータを XOR などで暗号化されると
もはや歯が立たないと思います。
[1] S-EBXA の圧縮形式について
http://www.sra.co.jp/people/m-kasahr/dict-compress/sebxa-compress.html
---
藤井宏憲
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735