In article <4253108B.74A6A304@ht.sakura.ne.jp> delmonta@ht.sakura.ne.jp writes:
>> あとは戸田さんもwebページで書いている通り、スラブ語系のspamが増えていま
>> すねぇ。ロシア語なんかで送られても私は読めません。
>スラブ系は私は見たことがないです。
>単に見落としているだけなのかも知れませんが。
>#Spam の誤判定チェックの際、日本語として無意味な8ビット文字列はすべて
>#韓国語と推定しているので、その中にロシア語が混じっているのかも。
その可能性が高いと思います。
数字・句読点や時々入っているローマ文字を除いて全部8ビット文字なので、
通常の日本語環境では、無意味な日本語文字列になるハズです。

ほとんどの場合、「Content-Type:」ヘッダに
「charset=Windows-1251」があれば、ロシア語だと判断できます。
たまに例外もありますが。
 
                                戸田 孝@滋賀県立琵琶湖博物館
                                 toda@lbm.go.jp