IDG コラム
2005/02/07 20:17 更新


スパム対策に欠かせないベイズ理論とは? (2/2)


前のページ | 1 2 |      

 ベイジアンフィルターの支持者らによれば、ベイジアンフィルターによってスパムと判断されるメッセージのうち、偽陽性のものは1%以下だという。

 しかし、ベイジアンスパムフィルターの本領は、その学習能力にある。ユーザーが新しいメッセージに印を付けると、フィルターはデータベースを更新し、新しいスパムのパターンとして認識するようになる。

補足――トーマス・ベイズとベイズの定理について

 英国の牧師、トーマス・ベイズ(1702〜1761)は、「An Essay Towards Solving a Problem in the Doctrine of Chances」の著者として知られている。1763年、ベイズの死後に発表されたこの論文は、今日「ベイズの定理」として知られる、ある事が起きる確率を、関係はあるが別の事象に基づいて予測する方程式を示している。ここで私は「事象」という言葉を使ったが、これは、あるメッセージがスパムかどうかの判断のような、1つの言明もしくは命題の「真」を示すことと理解することもできる。

 方程式を紹介する前に、多少、統計学の表記法を確認しておこう。p(A)という式は、Aという事象が起きる可能性を示す。p(A|B)は、「事象Bがすでに起きている場合に、事象Aが起きる可能性」を示す。この表記法の下、ベイズの定理を示すと次のようになる。

p(A|B) = [ p(B|A) p(A) ] / p(B)

 ほとんどの読者にとって、この方程式が特に参考になるとは思わないし、数学の由来にこだわるつもりもない。統計学者はすでにこれを知っている。だがこの方程式は、ベイズ分析が事前情報を活用した計算に基づいていることをよく示している。

 ベイズ理論についてさらに知りたければ、エリエゼル・ユドコウスキー氏による、明確で詳しく、段階を追ったオンラインチュートリアル「An Intuitive Explanation of Bayesian Reasoning: Bayes' Theorem for the curious and bewildered; an excruciatingly gentle introduction」をお勧めする。読むには少なくとも30分はかかるが、読めばベイズ関連について、よく理解できるだろう。

(By Russell Kay, Computerworld US)

前のページ | 1 2 |      

[IDG Japan]

Copyright(C) IDG Japan, Inc. All Rights Reserved.




キャリアアップ



エンタープライズ・ピックアップ

news004.jpg 世界で勝つ 強い日本企業のつくり方:利用契約の検討――グローバルクラウドで失敗しないために(前編)
2010年以降、クラウドサービスの利用がさらに加速する。サービスを利用する企業はプロバイダーのデータセンターに預けた自社情報を保護するために、法的な要素を理解しておかなければならない。企業が注意を払うべき法的な検討事項を整理する。

news001.jpg IT投資の新方程式:「Twitter使ってます」――現役MS社員が“社員力”を語る(前編)
マイクロソフトが掲げるプロモーションメッセージ「社員にチカラを。ITで企業力を。(以下、BIEB)」からは、ITで社員の生産性を向上することが業績の拡大につながる、といったニュアンスを感じる。そこで気になるのが「じゃあ、マイクロソフトの社員自身はどうなのよ?」ということ。3人の現役MS社員により実態が明らかになる……?

news010.jpg 産業構造を変えるか:「住宅クラウド」の衝撃
住宅都市工学研究所が進める「住宅クラウド」は、クラウドが企業のIT領域にとどまらず、ビジネスのやり方自体を変える可能性を示している。

news010.jpg オルタナティブな生き方 栗原進さん:ネットでリアルを楽しくしたい
SE出身の企業広報マンでありながら、趣味は落語で憧れの人はインディ・ジョーンズとアナログ全開の栗原さんに、ブログを書く理由やネットからはじまるコミュニケーションについて伺った。

news001.jpg 最強最速アルゴリズマー養成講座:トップクラスだけが知る「このアルゴリズムがすごい」――「探索」基礎最速マスター
プログラミングにおける重要な概念である「探索」を最速でマスターするために、今回は少し応用となる探索手法などを紹介しながら、その実践力を育成します。問題をグラフとして表現し、効率よく探索する方法をぜひ日常に生かしてみましょう。