新城@筑波大学情報です。こんにちは。
単語単位の diff で、HTML 出力するものの件です。
In article <1194002819.318287.28780@e34g2000pro.googlegroups.com>
        pegacorn <subscriber.jp@gmail.com> writes:
> どこかにあったような気がすると思って探したら、こんなのありました。
> DocDiff:
> >http://www.kt.rim.or.jp/~hisashim/docdiff/>

これは、なかなかいいですね。情報、ありがとうございます。中身
は、Ruby で書かれていました。

1つ問題としては、行末の単語が、削除されてまた挿入されたと認
識されるものです。

http://www.kt.rim.or.jp/~hisashim/docdiff/readme.ja.html#tips

これは、時々起きるのかと思っていたら、元の文書から改行が抜か
れたものが返って来て、全ての行で発生します。wdiff にはそうい
う問題は出てこないので、差分を比較するエンジンの問題なのかと
思います。

diff のアルゴリズムは、けっこう難しいですよね。

\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 電子・情報       \\