重大欠陥かと気を揉んでいたら、そんなことでしたか。

"Eiji KATSURA" <blackhole(I_dont_read_mails)@hamaint.co.jp> wrote in message
news:030822230252.M0104736@psv.hamaint.co.jp...
> <bi44ht$ap7$1@pita.efnet.com>の記事において
> tt@efnet.comさんは書きました。
>
> > "Eiji KATSURA" <blackhole(I_dont_read_mails)@hamaint.co.jp> wrote in
message
> > news:030822110449.M0203038@psv.hamaint.co.jp...
> > > 半年位前から 行われている NoCeN Report ですが、
> > > 精度が悪すぎて、役に立っていないと思う。
> >
> > 確認したところ、反応された
> >     <ncmreport4.x-velveeta-fj.20030822-003237.1.1@news.efnet.com>
> > に問題は見当たりませんが…
>
> そう思うのは、たぶん、「精度」とか「役に立つ」という言葉の
> 解釈が 違うのでしょう。

失礼ながら言葉の解釈以前に目的そのものを誤解しています。

Message-ID: <b35420$elk$1@pita.efnet.com> をご覧になれば
一目瞭然なのですが、タイプ x-velveeta-fj のリポートは、
単純に Newsgroups ヘッダに記載されたグループのうち、
fj.* にマッチするものの数を数え、
その数が 3 以上となるものを排除すべき記事と判定し、
リストしているだけです。

> a. 排除するべき記事を 排除するべきでないと判定する
> b. 排除するべきでない記事を 排除するべきと判定する
>
> この二つの割合が多いとき、「精度が悪い」と称しています。

何も難しく考える必要は有りません。数え間違えさえ無ければ、
false negatives は常にゼロであり、 false positives も常にゼロです。
数え間違いがゼロであれば、精度は常に 100% です。

逆に、精度が 100% でないということは、数え間違いが発生して
いることになります。にわかには信じられませんが、有り得ないとも
言い切れません。早速、検証してみましょう。

問題の記事
    <ncmreport4.x-velveeta-fj.20030822-003237.1.1@news.efnet.com>
には、
    <Ead1b.755$U8.143@news1.dion.ne.jp> fj.soc.politics
     japan.jiji
     fj.sci.math
     fj.sci.physics
とあります。 fj.* にマッチするものは、
    fj.soc.politics
    fj.sci.math
    fj.sci.physics
の三つ。確かに三つですね。あ、ひょっとして正解は四つなのに、
バグか何かで三つと報告しているのかもしれません。元の記事
    <Ead1b.755$U8.143@news1.dion.ne.jp>
にもあたりましょう。ヘッドには、
    Newsgroups: fj.soc.politics,japan.jiji,fj.sci.math,fj.sci.physics
    Message-ID: <Ead1b.755$U8.143@news1.dion.ne.jp>
とあります。 fj.* にマッチするものは、えーと、
    fj.soc.politics
    fj.sci.math
    fj.sci.physics
の三つ。やはり三つです。ディスクかメモリに問題? 有り得ます。
他所のサーバで調べましょう。

(順不同)
ベルガコム・スカイネット
    Newsgroups: fj.soc.politics,japan.jiji,fj.sci.math,fj.sci.physics
    Message-ID: <Ead1b.755$U8.143@news1.dion.ne.jp>
アドバンスド・テレコム
    Newsgroups: fj.soc.politics,japan.jiji,fj.sci.math,fj.sci.physics
    Message-ID: <Ead1b.755$U8.143@news1.dion.ne.jp>
リムネット
    Newsgroups: fj.soc.politics,japan.jiji,fj.sci.math,fj.sci.physics
    Message-ID: <Ead1b.755$U8.143@news1.dion.ne.jp>
ベクター・インターネット・サービセズ
    Newsgroups: fj.soc.politics,japan.jiji,fj.sci.math,fj.sci.physics
    Message-ID: <Ead1b.755$U8.143@news1.dion.ne.jp>
シラキュース大学
    Newsgroups: fj.soc.politics,japan.jiji,fj.sci.math,fj.sci.physics
    Message-ID: <Ead1b.755$U8.143@news1.dion.ne.jp>
自由ベルリン大学
    Newsgroups: fj.soc.politics,japan.jiji,fj.sci.math,fj.sci.physics
    Message-ID: <Ead1b.755$U8.143@news1.dion.ne.jp>
京都大学
    Newsgroups: fj.soc.politics,japan.jiji,fj.sci.math,fj.sci.physics
    Message-ID: <Ead1b.755$U8.143@news1.dion.ne.jp>

もう勘弁。全て三つです。ここまで来れば、間違い有りません。

数え直してみてください。

> Follow-up されている記事があるとか無いとか、そういった情報まで
> 取り込まないと、まともな判定はできないのでは?

ただ数えれば済む話です。話を複雑にする必要は全く有りません。

-tt