Re: MH pick with Bayes' Theorem

From(投稿者):	yas@is.tsukuba.ac.jp (Yasushi Shinjo)
Newsgroups(投稿グループ):	fj.mail.system
Subject(見出し):	Re: MH pick with Bayes' Theorem
Date(投稿日時):	14 Jun 2003 19:44:06 GMT
Organization(所属):	Institute of Information Sciences and Electronics, University of Tsukuba
References(祖先記事, 一番最後が直親):	(G) <YAS.03May13162339@kirk.is.tsukuba.ac.jp>
(G) <YAS.03Jun6231148@kirk.is.tsukuba.ac.jp>
Message-ID(記事識別符号):	(G) <YAS.03Jun15044406@kirk.is.tsukuba.ac.jp>
Followuped-by(子記事):	(G) <YAS.03Jun20125259@kirk.is.tsukuba.ac.jp>

From(投稿者):

yas@is.tsukuba.ac.jp (Yasushi Shinjo)

Newsgroups(投稿グループ):

fj.mail.system

Subject(見出し):

Re: MH pick with Bayes' Theorem

Date(投稿日時):

14 Jun 2003 19:44:06 GMT

Organization(所属):

Institute of Information Sciences and Electronics, University of Tsukuba

References(祖先記事, 一番最後が直親):

(G) <YAS.03May13162339@kirk.is.tsukuba.ac.jp>

(G) <YAS.03Jun6231148@kirk.is.tsukuba.ac.jp>

Message-ID(記事識別符号):

(G) <YAS.03Jun15044406@kirk.is.tsukuba.ac.jp>

Followuped-by(子記事):

(G) <YAS.03Jun20125259@kirk.is.tsukuba.ac.jp>

記事全体へのコマンド

新城＠筑波大学情報です。こんにちは。

In article <YAS.03Jun6231148@kirk.is.tsukuba.ac.jp>
        yas@is.tsukuba.ac.jp (Yasushi Shinjo) writes:
> 新城＠筑波大学情報です。こんにちは。
> http://www.h2.dion.ne.jp/~nabeken/bsfilter/
> bsfilterとは
>  * spamと、そうではない正当なメイル(このページではcleanと呼
>    ぶ)を自動判別するフィルタ
>  * 日本語に対応している
>  * rubyで書かれている

その続報です。

> pick に似せるには、こんな感じです。

この pick (p-pickという名前とします)といっしょに、次のような 
csh の alias を定義しました。

alias p-set             'set p=`p-pick \!*`'
alias p-scan            'p-set \!*; if( "$p" != "" ) scan $p'
alias p-refile          'if( "$p" != "" ) refile $p +junk; unset p;'
alias spam              'bsfilter -s `mhpath \!*`; bsfilter -u'
alias nospam            'bsfilter -c `mhpath \!*`; bsfilter -u'

p-set は、シェル変数 p に spam メッセージのリストをセットし
ます。p-scan で、spam らしい記事を表示します。中では p-set 
を呼んでいます。p-set や p-scan は、inbox 全体をやると重
たいので、
    % p-scan last:20
のように、最新の 20 個だけ調べるといったこともできます。

それであっていれば p-refile で、それを +junk に送っています。
時々、間違うので、その時には、そのメッセージを spam, nospam 
で学習させます。

こんな使い方をしていると、主に spam の方だけ学習させることに
なります。こういう使い方で、大丈夫なんですかね。１週間くらい
使った感じでは、わりと平気なんですけれど。

ちょっと怖かったのは、最初、+junk の spam と日本語のまともな
メッセージだけ学習させたら、英語のメッセージがバンバン spam 
と判定されて。慌てて過去のまともな英語のメッセージを学習させ
ました。

あと、何回かしつこく学習させても、spam と判定してくれないも
のもありますね。

＼＼　新城　靖　（しんじょう　やすし）　＼＼
＼＼　筑波大学　電子・情報　　　　　　　＼＼

Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735