Re: Spam in EUC-KR
In article <4253108B.74A6A304@ht.sakura.ne.jp> delmonta@ht.sakura.ne.jp writes:
>> あとは戸田さんもwebページで書いている通り、スラブ語系のspamが増えていま
>> すねぇ。ロシア語なんかで送られても私は読めません。
>スラブ系は私は見たことがないです。
>単に見落としているだけなのかも知れませんが。
>#Spam の誤判定チェックの際、日本語として無意味な8ビット文字列はすべて
>#韓国語と推定しているので、その中にロシア語が混じっているのかも。
その可能性が高いと思います。
数字・句読点や時々入っているローマ文字を除いて全部8ビット文字なので、
通常の日本語環境では、無意味な日本語文字列になるハズです。
ほとんどの場合、「Content-Type:」ヘッダに
「charset=Windows-1251」があれば、ロシア語だと判断できます。
たまに例外もありますが。
戸田 孝@滋賀県立琵琶湖博物館
toda@lbm.go.jp
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735