SpamAssassin

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 13:55:32

apache.orgの傘下になって、ますます勢いづくスパムメールの暗殺者
SpamAssassin
これでSPAM業者を失業に追い込もう.......
とまでには、まだまだ遠い道のりだよ(w
学習しろ!!学習しろ!!学習しろ!!
sa-learn --spam --mbox /home/hiroyuki/mail/spam

ハムをスパムと間違えないで、一生のお願いだから。

スパム業者の荒らしはスルーってことで。
おまいら、まったりとお願いします。

本家 ttp://spamassassin.apache.org/
2005-06-06: SpamAssassin 3.0.4 released!

キーワード
local.cf
user_prefs
spamassassin
ベイズ推定
ベイジアンフィルタ
ホワイトリスト
AWL
bayes_journal
auto-whitelist

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 13:56:11

ググル SpamAssassin
http://www.google.com/search?as_q=SpamAssassin&num=100&hl=ja&ie=Shift_JIS&btnG=Google+%8C%9F%8D%F5&as_epq=&as_oq=&as_eq=&lr=lang_ja&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=

関連スレ
http://www.google.com/search?as_q=spamassassin&num=100&hl=ja&ie=Shift_JIS&c2coff=1&btnG=Google+%8C%9F%8D%F5&as_epq=&as_oq=&as_eq=&lr=lang_ja&as_ft=i&as_filetype=&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=2ch.net

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 14:17:10

なんでunix板なんだろうという素朴な疑問は却下ですか

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 14:23:50

↓こっちで十分だろうという素朴な疑問は却下ですか

メールサーバ迷惑メール対策スレ
http://pc8.2ch.net/test/read.cgi/unix/1124090297/

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 14:26:08

Internet Mail System スレって落ちたんだっけ

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 14:31:04

みたいだね。立てちゃっていいんじゃないかな。

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 14:51:41

http://pc8.2ch.net/test/read.cgi/pc/1097383368/l50

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 15:59:57

SpamAssassinは「メールテキスト(ヘッダと本文)分析、
ベイジアンフィルタ、DNS blocklists、
および共同型フィルタリングネットワーク」
を使用する事でスパムを特定するメールフィルタです。

DNS blocklistsは、spamを発信もしくは
中継するサーバのIPアドレスのブラックリスト、
及び、spamの本文中にある、spammerが誘い込もうとする
web サービスのURI 文字列から、
ドメイン名を抽出したブラックリストを利用します。
共同型フィルタリングネットワーク
(collaborative spam filtering network) は、
メールの本文から「署名」を検出し、これをサーバに登録されている
spamの「署名」と照合し、合致していればspamと判定する、というものです。

(参考)
ttp://tlec.linux.or.jp/docs/spamassassin.html

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 16:01:46

>>1をフィルタしたいです。

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 17:51:29

sperm ass ass in

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 17:54:26

スパム朝死んだ

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 17:55:52

Mail-SpamAssassin は razor-agents と組み合わせて
使うとかなり強力だよね。

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 18:18:11

SpamAssassinの設定ファイルは、3種類あります。
以下のディレクトリのパスの記述は、正確には
OSもしくはディストリビューションのmanを参考にして下さい。

- /usr/share/spamassassin/*.cf:
デフォルト設定が記述されています。
バージョンアップにより、書き換えられるので、
変更しない方が良いでしょう。

- /etc/mail/spamassassin/*.cf:
サイト全体の設定を記述します。

$USER_HOME/.spamassassin/user_prefs:
各ユーザー自身の細かい設定が出来ます。
例えばサイト設定でスパム指定されているドメインからのメールでも、
ユーザが希望すれば、受信する事が出来ます。
ただし、サイト設定でuser_prefsの使用が
有効になっている必要があります。

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 18:46:41

D_BOUNCEとD_REJECTの違いがわかりません
おしえてくださいませ

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 19:11:58

要は >>1 == >>14 の単発質問スレだったのか。

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 19:36:38

OSもしくはディストリビューションのman

**名無しさん＠お腹いっぱい。** · 2005/08/23(火) 22:43:22

bsfilterのほうが好きです

**名無しさん＠お腹いっぱい。** · 2005/08/24(水) 00:42:51

導入してすぐに、部署が違う顔なじみのお姉様達に、
迷惑メール減らしてくれてありがと～と誉められました。
なんかうれしかった。

**名無しさん＠お腹いっぱい。** · 2005/08/24(水) 01:02:26

>>14

# Notes:
# D_REJECT and D_BOUNCE are similar, the difference is in who is responsible
# for informing the sender about non-delivery, and how informative
# the notification can be (amavisd-new knows more than MTA);
# With D_REJECT, MTA may reject original SMTP, or send DSN (delivery status
# notification, colloquially called 'bounce') - depending on MTA;
# Best suited for sendmail milter, especially for spam.
# With D_BOUNCE, amavisd-new (not MTA) sends DSN (can better explain the
# reason for mail non-delivery, but unable to reject the original
# SMTP session). Best suited to reporting viruses, and for Postfix
# and other dual-MTA setups, which can't reject original client SMTP
# session, as the mail has already been enqueued.

**名無しさん＠お腹いっぱい。** · 2005/08/24(水) 11:22:12

>>18
雑誌の裏表紙広告のようでﾜﾛｽ

**名無しさん＠お腹いっぱい。** · 2005/08/24(水) 16:03:20

>>19　すみません。違いが良く解りません。エロイ人、解説して。

**名無しさん＠お腹いっぱい。** · 2005/08/25(木) 21:25:38

>>8　ここの設定ファイル、まめにアップしてくれるので
非常に参考になります。
日本語のスパム排除に効果アリアリです。

**名無しさん＠お腹いっぱい。** · 2005/08/26(金) 14:49:37

>>14 >>19

D_REJECT 発信元のsmtpにrejectする。もしくはDSNを送る。
(MTAによってことなる。)

D_BOUNCE DSNを送る。

**名無しさん＠お腹いっぱい。** · 2005/08/29(月) 19:32:07

入れると動作おもくね?

**名無しさん＠お腹いっぱい。** · 2005/08/30(火) 15:51:44

>>24
アルバイトでもしなさい。

**名無しさん＠お腹いっぱい。** · 2005/08/31(水) 17:58:36

>>24 ハム3000通読ませたら、落ちたyo。ちょっとずつ読み込ませろ。

**名無しさん＠お腹いっぱい。** · 2005/09/08(木) 14:33:13

デーモンとしての動作なら大丈夫らしい。
ハムスパムの読み込ませは、パワーいると思う。

**名無しさん＠お腹いっぱい。** · 2005/09/09(金) 05:55:47

>>26
頼まれて作ったサイトの最初の学習用に、取れ立てspamを一気に
一万ファイル読ませたけど、大じょぶだーたよ。

途中で裏にまわしちゃったので、正確にはわからないけれど
一時間以上はかかったと思う。Debian Sarge/i386でRAM512MB、
SAは3.0.3。Maildir形式。

若干オフトピになるかもしれないけれど、参加者が
いるかもしれないので聞いてみる。
RBL.JPのメーリングリストって活発ですか?。流量は?。
一時停止のお知らなどの運用状況『も』流れたりします?。

仕事でも個人でもspammerには頭来てるんで、暇な時は
(RBL.JPとは他所のところに)spam報告してるんだけれど、
RBL.JPにも入ってみようかと思っているんだが、どんな様子なのだか、
聞いてみるテスツ。

**名無しさん＠お腹いっぱい。** · 2005/09/13(火) 00:27:25

qmail/qregexにspamassassin使ってます。
7月終わりからのこの一月半くらいで（51日）、

ブロックしたspamメールは　2238通。

うち、rblでブロックしたもの　　664通 (30%)
helo 時点でブロック 162通 ( 7%)
badmailfrom でブロック 1123通 (50%)
SpamAssassinブロック 289通（13%)

ですた。

一部あんまり煩い .tw/.kr/.cnは丸ごとパケット
捨ててる場合もあり。

**名無しさん＠お腹いっぱい。** · 2005/09/13(火) 12:57:50

>>29
> ブロックしたspamメールは　2238通。

ブロックしたのにどうやって spam だと判定するのですか？

**名無しさん＠お腹いっぱい。** · 2005/09/13(火) 13:21:15

わかんなければ口をつぐんでろヨ馬鹿

**名無しさん＠お腹いっぱい。** · 2005/09/13(火) 14:14:47

>>31
自分がわかってないのを認めるのが嫌だからって、人がわかっていないという
レッテルを張るのはいかがなものか。

**名無しさん＠お腹いっぱい。** · 2005/09/13(火) 18:44:49

キチガイに馬鹿というレッテルを貼ったのは俺の間違いだったヨ。謝るよキチガイ。

**名無しさん＠お腹いっぱい。** · 2005/09/13(火) 18:51:22

>>33
わたしをキチガイ認定するとは浅はかな人ですね.

**名無しさん＠お腹いっぱい。** · 2005/09/13(火) 19:17:12

キチガイキター

**名無しさん＠お腹いっぱい。** · 2005/09/13(火) 19:45:41

>>35
浅はかだですね.

29 · 2005/09/13(火) 20:36:48

みなさん喧嘩しないでくらさい。

**名無しさん＠お腹いっぱい。** · 2005/09/18(日) 09:59:27

藻前らSpamAssassin 3.1でつよ。

**名無しさん＠お腹いっぱい。** · 2005/09/20(火) 02:55:15

>>28　凸レポート頼むw

**名無しさん＠お腹いっぱい。** · 2005/09/22(木) 11:57:56

>>38
アップデート対象
ClamAV 0.86.2 to 0.87　・・・OK
Razor2 2.67 to 2.72　・・・OK
SpamAssassin 3.0.1 to 3.1　・・・NG

プラグインエラーが出た
use_razor2 1
ok_languages ja en

プラグイン有効設定（v310.pre　ファイル）
Razor2
TextCat

spamd 再起動　・・・OK
spamメールテスト　・・・OK

**名無しさん＠お腹いっぱい。** · 2005/09/22(木) 12:57:41

SpamAssassin 3.1.0で、spamdではなくspamassassinをprocmailから呼んでます。
RelayCountryを生かしたいのですが、
init.preの
loadplugin Mail::SpamAssassin::Plugin::RelayCountry
を有効にしてもメールに X-Relay-Countries ヘッダがついてくれません。

何かほかに必要なことがあるのでしょうか?
IP::Countryは入っています。

**名無しさん＠お腹いっぱい。** · 2005/09/23(金) 18:53:51

>>41
ttp://www.gossamer-threads.com/lists/spamassassin/users/16555?search_string=relaycountry;#16555

**名無しさん＠お腹いっぱい。** · 2005/09/23(金) 19:55:26

ありがとうございます。

> I don't believe the RelayCountry plugin adds anything visible to the
> message.

Ok, I didn't get that from the docs (such as they are). I expected the
"X-Relay-Countries" header to be added to the message.

そのURLの通りspamassassin -tD で実験したらちゃんとチェックしてくれていました。

trusted_networks にプロバイダの(secondaryを含む)メールサーバをちゃんと
書かないとあらゆるメールでJPが入ってしまうので書くべきだけど、
名前じゃなくアドレスで書かないとだめだしプロバイダのネットワーク全体を
許可するのも範囲が広すぎるし、というところがちょっと悩みどころですね。
私の使ってるプロバイダはspammerへの対応をちゃんとしてくれる方らしいので
メールサーバなどのアドレスを含むネットワーク全体をtrustしてしまいましたが。

42 · 2005/09/23(金) 20:08:30

>>43 SAてのは、Emailのメッセージコンテンツで
スパムかどうかを判断する、てのがやっぱ恐らく
本筋の使い方、ということなんじゃないすか。
オリジンやリレーで判断するならRBLｓあたりで、

**名無しさん＠お腹いっぱい。** · 2005/09/23(金) 22:09:35

ベイジアンフィルタでは結局出現確率しか捉えられないんで、
人間が書いた規則を中心に色んな規則を含めて総合評価できるのがsaじゃないかと。

あとはルールのスコアも自動的に最適値を学習してくれるなら嬉しいんだけど。
マイニングしてルールを自動生成しろとまでは言わないから。

**名無しさん＠お腹いっぱい。** · 2005/09/27(火) 15:25:28

>>45 sa-learn --ham
これで学習できるでしょ?
cronで自動化はだめなの?

**名無しさん＠お腹いっぱい。** · 2005/09/27(火) 19:34:29

>>46
全然わかってないな

**名無しさん＠お腹いっぱい。** · 2005/10/01(土) 11:43:43

各ルールでのスコアを単純に加算するのではなく、それぞれがマッチした
場合の spam 確率を出し、それをまたベイズの定理で組み合わせるとか。

ベイジアンフィルタからの spam 度: 0.8
URIBL: 0.9
SPF SUCCESS: 0.3

となるメールからは

sub mul { $r = 1.0; foreach (@_) { $r *= $_; } $r; }
my @probs = (0.8, 0.9, 0.3);
my $prod = mul(@probs);
$prod / ($prod + mul(map { 1 - $_ } @probs));

=> 0.939...

と計算する。
んで、スコアが閾値以上・以下なら、それぞれのルールにフィードバック。

**名無しさん＠お腹いっぱい。** · 2005/10/04(火) 09:24:19

環境
redhat9
sendmail8.12.8-4
milter0.3.0-1.0
spamassassin3.10

質問させてください。
spamassassinでベイジアンフィルタを利用しています。
このベイジアンフィルタなのですが、サーバ単位でspam、hamメールを学習させていますが、
各ユーザ毎にham、spamの基準が違い(mailinglist等)、サーバ単位でなく、
各ユーザ単位でベイジアンフィルタの学習を行わせたいと考えています。
ユーザ毎にベイジアンフィルタのデータベースをbayes_seen、bayes_toksをもって、
自分の趣向に合わせてベイジアンフィルタに学習させるイメージです。

user_prefsがユーザ毎に設定できますが、これはヘッダや本文の条件、
ルールを設定できるだけででした。

ご存知の方がいらっしゃいましたら教えて下さい。
よろしく御願いします。

**名無しさん＠お腹いっぱい。** · 2005/10/04(火) 17:22:15

各ユーザが.forwardからspamassassinを呼び出せば済む。
RedHatだとsendmailのMDAがprocmailだったりしそうだから、
.procmailrcに
:0fw: spamassassin.lock
* < 256000
|/usr/bin/spamc
と書くとか。

しっかし、procmailrcはわけわかんね～。はよmaildropに移行したい…

**名無しさん＠お腹いっぱい。** · 2005/10/05(水) 13:36:05

>>50
49です。ありがとうございます。
設定してみます。

**名無しさん＠お腹いっぱい。** · 2005/10/26(水) 08:49:34

procmailでspamassassinの設定する方法はあちらこちらにかいてあるけど
qmailでの設定ってほとんど見当たらない。
ユーザごとにいちいち.qmailを編集するのもスマートじゃないし
qmail-scannerあたりを書き直せばいいんだろうけど・・・

と思ってたら、vpopmailでの運用をしてたので、案外簡単にできた。

**名無しさん＠お腹いっぱい。** · 2005/10/26(水) 20:11:30

>>52 書き直すまでもなく、使えると思うが。
ttp://qmail-scanner.sourceforge.net/

**名無しさん＠お腹いっぱい。** · 2005/10/28(金) 07:41:11

なるほど！情報ありがとう。
先にSpamAssassinいれといてQmail-Scannerをインストールすれば
良いってことですね。

ところで、Ｑｍａｉｌ－Ｓｃａｎｎｅｒにバグがあるみたいです。
添付ファイルを処理する際にカッコがあると、途中でエラーをおこし、
メールが返送されてしまうのです。
一応、修正を行ってみたのですが、旨くいくかどうかは未確認なので
確認してから報告したいのですが、なんかＭＬ加入しないとダメみたいですね。
チョットメンドクサイ・・・

**名無しさん＠お腹いっぱい。** · 2005/10/28(金) 08:02:46

procmailで$HOME/.procmailrcを読みに行かなくすることってできるんでしょうか?
/etc/procmailrcだけで制御したいのですが、ググって調べてると、
「$HOME/.procmailrcが無いときは/etc/procmailrcが読まれる」
ってなことが書かれてて…。

**名無しさん＠お腹いっぱい。** · 2005/10/29(土) 07:14:48

>添付ファイルを処理する際にカッコがあると
はて、どゆこと？>>54

**名無しさん＠お腹いっぱい。** · 2005/10/29(土) 13:55:36

>>55
ユーザプロセスでは ~/.procmailrc を真っ先に読みに行くってのは
ソースレベルでの仕様だから、それが嫌ならソースを書き換えてビルドするか、
さもなくば全ユーザのホームディレクトリ上で
ln -s /etc/procmailrc ~/.procmailrc するしかないんじゃない？

**名無しさん＠お腹いっぱい。** · 2005/10/30(日) 11:42:12

>>56
わかりにくい表現ですいません。
ログにこんなエラーがありました。

Unmatched ( in regex; marked by <-- HERE in m/^ESC$bfc dj8&5f7w2hESC( <-- HERE b.doc$/ at /var/qmail/bin/qmail-scanner-queue.pl line 22 12, <STDIN> line 3221.

ESCの部分は端末上反転していたので、実際は\\と思います。
添付されていたのは日本語の入ったＰＤＦとワード書類です。
で、qmail-scanner-queue.plの該当行のソースがこれ。

push(@uufile_list, $uufile) if(!grep(/^$uufile$/,@uufile_list));

多分$uufileが正しくクオートされておらず、添付ファイル内の「（」が、
正規表現の一部とみなされているようです。
この推測が当たっていれば$uufile --> \Q$uufile\E とすればＯＫなはずです。（未確認）
で、一応は自己解決をみたわけですが、SpamAssassinのコミュニティに報告するのが
メンドクサイ仕組みなので、なんかどうでもいいやっていう気になってます。

**名無しさん＠お腹いっぱい。** · 2005/10/30(日) 12:15:53

>>58 添付ファイル名やその中身に括弧文字が
入っていて起こる鰓てのは初耳す。
qmail-scannerの versionと、そのメールを作った
ソフトは何ですか（Winのoutlookとか　thuderbirdとか、
**xのmewとか。。。？）
お話の感じだと、これ、SAの問題ではないと思う。

**名無しさん＠お腹いっぱい。** · 2005/10/30(日) 12:59:39

>>59
qmail-scanner-queue.pl 1.25です。
メールを作ったソフトの方は折り返し戻っていってしまったので、
すぐには確認できませんが、送信者からの以前の話からすると
Ｍａｃのソフトらしいです。たぶんＥｕｄｏｒａ？

それはともかく、該当行の変数名からしてuuencodeされたファイルと思うのですが、
それが正しければＳＡの問題じゃないでしょうか・・・

59 · 2005/10/30(日) 14:07:55

>>60
エラーが起きてるのは、qmail-scanner-queue.pl
の、sub check_and_grab_attachments の中ですよね。
uuencode/binhexしたファイル名をいろいろいじったやつ
を添付して試してみてるんだけど、症状再現しないす。
うちも qmail-scanner 1.2.5、んで、SA 3.1。