Re: SpamCheck, ネットニュースから spam 記事を取り除く
いいじまです。
> |>小金丸さんのフィルタ、厳しすぎるような…spam がなくなるなら false alarm
> |>もおかまいなし、記事の欠落も気にしない、という態度がありありと見えます。
>
> false alarm とは何でしょうか。
今回は、spam でないものを spam と誤判定してしまうことを指してこの言葉を
使いました。
False alarm というのはもとは統計の用語で、実際には意味のあるデータは取れ
ていないにも関わらず「意味があるデータだ」という結論を導いてしまうことを
指します。日本語の定訳はありませんが「誤報」が順当でしょうか。統計的検定
では、取ってきたデータから、この false alarm が起こる確率を計算して、これ
が一定の数字(測定誤差を考慮して、10%、5%、1%、0.1% などと使い分けます)
を下回ったときに、「意味のあるデータだ」という結論を導きます。
Spam に対する姿勢については以前に小金丸さんとは FreeBSD-users-jp メーリン
グリストでさんざん議論してますので、蒸し返さないことにします。
> |>これは、私は回りくどい書き方をしてますけど、
> |>^Content-Type: audio/.*filename=.*(com|exe|pif|scr|bat)"
> |>の一発で大半が落とせるかも知れません。
>
> 参考になりました。ありがとうございます。
他にも対象の拡張子を増やしたほうがいいですね。最低でも js、vbs あたりは。
audio のところを (audio|image) にするのも悪くないかも。
========================================================================
飯嶋 浩光 / でるもんた・いいじま http://www.ht.sakura.ne.jp/~delmonta/
IIJIMA Hiromitsu, aka Delmonta mailto:delmonta@ht.sakura.ne.jp
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735