Re: MH pick with Bayes' Theorem
新城@筑波大学情報です。こんにちは。
In article <YAS.03Jun6231148@kirk.is.tsukuba.ac.jp>
yas@is.tsukuba.ac.jp (Yasushi Shinjo) writes:
> 新城@筑波大学情報です。こんにちは。
> http://www.h2.dion.ne.jp/~nabeken/bsfilter/
> bsfilterとは
> * spamと、そうではない正当なメイル(このページではcleanと呼
> ぶ)を自動判別するフィルタ
> * 日本語に対応している
> * rubyで書かれている
その続報です。
> pick に似せるには、こんな感じです。
この pick (p-pickという名前とします)といっしょに、次のような
csh の alias を定義しました。
alias p-set 'set p=`p-pick \!*`'
alias p-scan 'p-set \!*; if( "$p" != "" ) scan $p'
alias p-refile 'if( "$p" != "" ) refile $p +junk; unset p;'
alias spam 'bsfilter -s `mhpath \!*`; bsfilter -u'
alias nospam 'bsfilter -c `mhpath \!*`; bsfilter -u'
p-set は、シェル変数 p に spam メッセージのリストをセットし
ます。p-scan で、spam らしい記事を表示します。中では p-set
を呼んでいます。p-set や p-scan は、inbox 全体をやると重
たいので、
% p-scan last:20
のように、最新の 20 個だけ調べるといったこともできます。
それであっていれば p-refile で、それを +junk に送っています。
時々、間違うので、その時には、そのメッセージを spam, nospam
で学習させます。
こんな使い方をしていると、主に spam の方だけ学習させることに
なります。こういう使い方で、大丈夫なんですかね。1週間くらい
使った感じでは、わりと平気なんですけれど。
ちょっと怖かったのは、最初、+junk の spam と日本語のまともな
メッセージだけ学習させたら、英語のメッセージがバンバン spam
と判定されて。慌てて過去のまともな英語のメッセージを学習させ
ました。
あと、何回かしつこく学習させても、spam と判定してくれないも
のもありますね。
\\ 新城 靖 (しんじょう やすし) \\
\\ 筑波大学 電子・情報 \\
Fnews-brouse 1.9(20180406) -- by Mizuno, MWE <mwe@ccsf.jp>
GnuPG Key ID = ECC8A735
GnuPG Key fingerprint = 9BE6 B9E9 55A5 A499 CD51 946E 9BDC 7870 ECC8 A735