POPFile

電信八号でいろいろルール設定するのも面倒なのでProxyとして動作する統計型のメールフィルタ入れてみました。
SourceForgeにはPerlまで一緒に入れてくれるWindowsインストーラ版がありますがせっかくだからFreeBSDのEdenへインストール。
POPFile自体は最新版がすでにportsに登録されていたのでラクでしたがperl5がえらく古かったりモジュールが入ってなかったりとそっちで一苦労。
ただでさえperlはろくに使ったことないのに断片的な情報だけだと余計に解りません。
とりあえずperlのバージョンに関してはエラーメッセージに出てたのでportsからperl5.8。5をインストール。モジュールはぐぐってみたらCPANとかいうものでportsのごとくオンラインで取得&インストールができるのでそれでインストール。
SQLiteが入ってないよと言うことでこれもportsからインストール。
無事起動したのでとりあえずspamと非spamのバケツを作成。
電八のサーバ設定も修正してとりあえず今日一日分のメール40余通をダウンロード。でも八割方ははspamです。
履歴ページを開いて今の40余通を分類して学習。
その後早速数通英語のspamが来ましたがどれもきちんとspamとして認識している模様。
まだまだ数が少ない分精度は低いので、当面はspamが非spamに紛れること以上に非spamspamと誤検知されていないか気をつけて調べる必要があります。
やたらと馴れ馴れしい文体で書いてある日本語spamなんて難しそうだなぁ…。
英語圏spamは例のV1AGRAとかの偽装が凝ってても内容自体はストレートな宣伝広告なので統計手法では比較的簡単そうです。

しかし、今のところrootでコマンド打って起動しなければならないとで少々厄介。
デーモンとして起動するか、inetd経由で使えればベストなのですが。