01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
ベイズ理論とは
でググると、手ごろな解説サイトが幾つも見つかる。(←[2006-07-22-1])
大体のサイトには以下のような説明が付いている。
「過去の事象から将来の事象の発生確率を予測する」これだけだと、「で、結局どういうことするの?」と言いたくなるのでは?
「未来を予測するには過去を振り返らなければならない」
人がメールの本文の内容を元に、迷惑メール
かどうかとの関連性を判断するには、過去蓄積され経験としてあらかじめ
蓄えられた情報から算出し、その算出した情報を総計して出した結果が、
迷惑メールであると判断に足りる数値となった場合、迷惑メールだろう、
と判断します。
もちろん、中には非常に紛らわしい内容のメールもありこの方法は完璧
な正確さを得ることはできないのですが、メールを受け取れば受け取るほど
情報は蓄積されていくわけで、自動化していくことができます。
この作業をコンピュータで行おうとするのならば、メール内の文章を
単語ごとに切り分け、それぞれの単語が含まれる率を計算し、「これだけ
含まれていれば迷惑メールと判定する」と設定しておけば、合致したもの
を振り分けの対象とすることができます。
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12
2002 : 01 02 03 04 05 06 07 08 09 10 11 12
最終更新時間: 2009-11-03 02:08