Re: dessed
At 17 Oct 2003 03:53:35 GMT,
Junn Ohta wrote:
>
> fj.comp.applications.dictionaryの記事<871xtcwu54.wl%fujii@chi.its.hiroshima-cu.ac.jp>で
> fujii@chi.its.hiroshima-cu.ac.jpさんは書きました。
> > 2048 バイトの倍数は、
> > 2048 4096 6144 8192 10240 12288 14336 16384 18432 20480 22528 24576
> > 26624 28672 30720 32768 でした。
> > それよりも、1,2,3バイト大きいか小さいか、そんなファイルはありますか?
>
> 21バイト大きい(32768に対して32791)ファイルもありま
> した。
>
> 以下はls -lの出力からサイズだけを残して
> sort -n | uniq -c
> した結果です。
>
> 研究社新英和・和英中辞典V3.0 → OK
> 1 26624
> 2730 32768
>
> 広辞苑第四版V2.0 → NG
> 9 32768
(...)
たくさん実行結果をいただき、どうもありがとうございます。
私の予想とは大きく違いました。
どうやら、V2.0はアルゴリズムが微妙に違うようです。
dessed では V2.0 は不可能だと思います。
スライド窓のサイズとかなにかが違うのでしょう。
私はお手上げです。
もしも、がんばる方がいらっしゃいましたら、
笠原さんの ebdump.pl とかを使えば、
http://hp.vector.co.jp/authors/VA023689/misc/ebdump.pl
$ ll
total 128
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 13:10 honmon.0000
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 13:10 honmon.0001
-rw-r--r-- 1 fujii fujii 32768 2003-10-17 13:10 honmon.0002
-rw-r--r-- 1 fujii fujii 30720 2003-10-17 13:10 honmon.0003
$ ebdump.pl honmon.0000 1:0 | head
0001:000 1f021f0900011f4100011f611f0a1f02 1f021f0900011f4100011f611f0a1f02
0001:010 1f0900012223376b3a2748644f2a3163 1f090001[■][結][婚][披][露][宴]
0001:020 1f0a1f0a1f0900012178332b3163244e 1f0a1f0a1f090001[§][開][宴][の]
0001:030 3c2d1f0a1f0a1f0900012227332b3163 [辞]1f0a1f0a1f090001[▼][開][宴]
0001:040 244e3c2d214a3b4a32713c54214b1f0a [の][辞][(][司][会][者][)]1f0a
0001:050 1f0900021f4d00000000000000000000 1f0900021f4d00000000000000000000
0001:060 00000000006900301f6d1f0a1f090002 00000000006900301f6d1f0a1f090002
0001:070 212144392469242f242a4254243f243b [ ][長][ら][く][お][待][た][せ]
0001:080 2424243f2437245e2437243f2123243d [い][た][し][ま][し][た][。][そ]
0001:090 246c2447244f243f24403a232468246a [れ][で][は][た][だ][今][よ][り]
$
こんな感じでダンプできるので、
それを見ながら、いじればどうにかなるのではないかと思います。
---
藤井宏憲
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735