每次進我的信箱 都發現有的郵件被歸為垃圾郵件
其運作方式是靠機率統計的貝式統計(Bayes stastic ;使用條件機率重算機率,提高預測準確度)
教科書上 常舉的例子就是有A與B兩個箱子 裡面各自有紅球籃球   A裡面有較多的紅球  B裡面有較多籃球
P(A/B)=[P(A發生垃圾郵件使用語彙1,B發生垃圾郵件使用語彙1)+...+P(A發生垃圾郵件使用語彙n,B發生垃圾郵件使用語彙n)]/[P(B發生垃圾郵件使用語彙1)+....+P(B發生垃圾郵件使用語彙n]
A為垃圾郵件寄件人使用之語彙箱
B為一般郵件寄件人(包括垃圾郵件寄件人)使用之語彙箱
電腦收到郵件時就會檢索信件內使用語彙
並從過去郵件資料中整理各語彙使用程度 計算出各語彙的危險率(拿到紅球機率;P(B發生垃圾郵件使用語彙i))  判斷是否為垃圾郵件經常使用語彙
傳送過來郵件中 使用危險率高的語彙愈多,該郵件從A寄來的可能性愈高
把各個語彙(i:降價 郵購  匯款 免費.... 等等)都這樣計算後再加總就可以得到該郵件是垃圾郵件的機率(A箱寄來機率)
經過計算所得的垃圾郵件機率超過基準值,該郵件就會被判定為垃圾郵件


以上是牛頓雜誌介紹的內容
文章標籤
全站熱搜
創作者介紹
創作者 小比爾 的頭像
小比爾

小比爾的部落格

小比爾 發表在 痞客邦 留言(6) 人氣(16)