In article <070802094552.M0124196@takesima.lbm.go.jp> I write:
>http://www.lbm.go.jp/toda/comp/spam.html#russia
>にも書き足しましたが、ここ2ヶ月ほどkoi8-rが増えています。
>こちらではWindows-1251と拮抗しているんですが、嘘つきが多いんですよね。
>koi8-rで書いてあるよと宣言しながら実際はWindows-1251で書いていたりします。
>その逆も多いですし、意外と多いのが
>ヘッダと本文が異なるコード(一方がkoi8-rで他方がWindows-1251)で書いてあって、
>宣言はどちらか一方に統一されてしまっているというパターンです。
に関する続報です。

ヘッダと本文の不一致ならまだ良いのですが、
ヘッダ同志の不一致も多いんですよね。
多いのが、本文がkoi8-rで、Subject:もkoi8-rであることを宣言した
MIMEのヘッダ用文字列で実際にkoi8-rで記述されているのに、
From:にはWindows-1251が生で書いてあるというパターン。

もっと訳の解らないのが、
本文の途中でkoi8-rとWindows-1251が切り替わってしまうという例。
text/plainですよ。一体どういう編集工程でこういうものが出てくるんだろう?

冒頭の標題っぽいところとか、末尾の注意書きっぽいところとかだけ
違うコードになっている例が多いようなので、
別の文書から持ってきて貼りつける時に混ざるんでしょうかね。
でも、貼りつけの際に両方とも正常に読めてるの?

先日、ヒントになりそうな事例に行き当たりました。
text/htmlパートが、koi8-rの完結したHTMLソースの後に、
Windows-1251のプレーンテキストが続いた形になっていました。
ここから推測されるのは、編集者のデフォルトの編集コードはWindows-1251で、
HTMLソース部分には「koi8-rである」という情報が付いているために
正しくWindows-1251に変換した状態で見えているという可能性です。

こういう環境で編集したtext/htmlを
「text/plainじゃないとSpam対策に阻止され易い」と考えて
変換して出したのだと仮定すると、
その変換ソフトの出来が悪ければ起り得る話ですね。
コード指定を無視して、単純にHTMLタグを外してしまったと……

                                戸田 孝@滋賀県立琵琶湖博物館
                                 toda@lbm.go.jp