Re: honeypotを利用したspam対策実験

From(投稿者):	yas@is.tsukuba.ac.jp (Yasushi Shinjo)
Newsgroups(投稿グループ):	fj.mail
Subject(見出し):	Re: honeypotを利用したspam対策実験
Date(投稿日時):	19 Jul 2004 08:50:50 GMT
Organization(所属):	Institute of Information Sciences and Electronics, University of Tsukuba
References(祖先記事, 一番最後が直親):	(G) <cd54h4$lcm$1@caraway.media.kyoto-u.ac.jp>
Message-ID(記事識別符号):	(G) <YAS.04Jul19175050@kirk.is.tsukuba.ac.jp>
Followuped-by(子記事):	(G) <040720153224.M0700468@XP.doga.jp>
(G) <40FE13F2.F1ECBCA6@ht.sakura.ne.jp>

From(投稿者):

yas@is.tsukuba.ac.jp (Yasushi Shinjo)

Newsgroups(投稿グループ):

fj.mail

Subject(見出し):

Re: honeypotを利用したspam対策実験

Date(投稿日時):

19 Jul 2004 08:50:50 GMT

Organization(所属):

Institute of Information Sciences and Electronics, University of Tsukuba

References(祖先記事, 一番最後が直親):

(G) <cd54h4$lcm$1@caraway.media.kyoto-u.ac.jp>

Message-ID(記事識別符号):

(G) <YAS.04Jul19175050@kirk.is.tsukuba.ac.jp>

Followuped-by(子記事):

(G) <040720153224.M0700468@XP.doga.jp>

(G) <40FE13F2.F1ECBCA6@ht.sakura.ne.jp>

記事全体へのコマンド

新城＠筑波大学情報です。こんにちは。

In article <cd54h4$lcm$1@caraway.media.kyoto-u.ac.jp>
        Yoshitaka Ikeda <honeypot@4bn.ne.jp> writes:
> honeypotを利用したspam対策実験を行うことにしました。
> これは、
> 特定のメールアドレスあてのメールを蓄積し
> cronを使って、bsfilterのspamデータベースを更新するものです。

面白そうですね。

> honeypot: /home/user_a/newspams
> 0 * * * * /home/user_a/bsfilter -s --mbox /home/user_a/newspams;rm 
> /home/user_a/newspams;/home/user_a/bsfilter -u

ベイズの定理を使うものだと、spam だけ学習させても、うまくな
いんじゃないかなあ。私はそこそこ学習させたもので、判定率も満
足いくレベルになっていてるので、普段は学習をやめています。

時々、週に１回より少ないくらい、「このやろう！」と思った 
spam だけ学習させて、あと、同時に正当なメールが spam と判定
されないことを確かめています。この時正当なメールが spam と判
定されたら、逆方向に学習させています。

bsfilter って、単語の数が増えてくると、遅くなるのだとは思い
ますが、どのくらい数が適当なんでしょうか。

あと、spam というと、いくつか持っているアドレスで .forward 
で転送していると、別々のアドレスに同じ内容のものが次々と来る
んですよね。こんな感じ。
------------------------------------------------------------
1024  07/19 d_gregory_cq@citd  $39757<<Hi, We sent you an email a while ago, be
1025  07/19 rae.kflemingif@st  $85145<<Hi, We sent you an email a while ago, be
1026  07/19 jboone_ed@diagram  $85145<<Hi, We sent you an email a while ago, be
------------------------------------------------------------

To: は全部違います。内容は、同じ。$85145 とか工夫しているけ
ど、bsfilter で検出できています。だから、別に bsfilter で問
題ないといえばそうなんだけど、同じ物が複数届くと怪しいという
情報も使えばまた面白い対策が取れるのではないかと思ったのでし
た。

さっき、溜めている spam のフォルダを MH-e で表示しようとした
ら、３ヶ月で 10000 万通越えていて、表示できませんでした。と
いうことは、1日100通くらい。

＼＼　新城　靖　（しんじょう　やすし）　＼＼
＼＼　筑波大学　電子・情報　　　　　　　＼＼

Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735