SpamAssassin
0001名無しさん@お腹いっぱい。
垢版 |
2005/08/23(火) 13:55:32
apache.orgの傘下になって、ますます勢いづくスパムメールの暗殺者
SpamAssassin
これでSPAM業者を失業に追い込もう.......
とまでには、まだまだ遠い道のりだよ(w
学習しろ!!学習しろ!!学習しろ!!
sa-learn --spam --mbox /home/hiroyuki/mail/spam

ハムをスパムと間違えないで、一生のお願いだから。

スパム業者の荒らしはスルーってことで。
おまいら、まったりとお願いします。

本家 ttp://spamassassin.apache.org/
2005-06-06: SpamAssassin 3.0.4 released!

キーワード
local.cf
user_prefs
spamassassin
ベイズ推定
ベイジアンフィルタ
ホワイトリスト
AWL
bayes_journal
auto-whitelist
0300名無しさん@お腹いっぱい。
垢版 |
2008/12/18(木) 18:30:52
今日の昼ぐらいから急にSpamAssassinがSIGPIPEで死ぬようになって難儀している。
procmailで食わせているんだけど、毎回死ぬわけでもなく、時々。
インストールしてあるものを何か入れ替えたわけでもないし、ディスクが足りてない
わけでもない。何故だろう……。
0306名無しさん@お腹いっぱい。
垢版 |
2009/01/18(日) 10:18:27
>>305
するどい。調べてみたところ、razor-users MLでの報告を発見。
それによるとどうやら c303.cloudmark.com というサーバだけが、なぜかときどき
空のgreetingを返してくれて解析に失敗して死ぬらしい。
servers.catalogue.lst からc303を外して様子をみてみる。どうもありがとう。
0307名無しさん@お腹いっぱい。
垢版 |
2009/02/18(水) 19:51:23
お世話になってます。ところでちゃんとしたルールを自作して役に立ちたいのですが、
ルール作成のマニュアルはどこを参照したらよろしいでしょうか?

本家のDOCを斜め読みしたのですが、いまいち解りにくく。
ttp://wiki.apache.org/spamassassin/RuleDescriptionTemplate

ttp://spamassassin.apache.org/tests_3_2_x.html
ttp://svn.apache.org/repos/asf/spamassassin/tags/spamassassin_release_3_2_5/rules/

0309名無しさん@お腹いっぱい。
垢版 |
2009/02/19(木) 14:53:29
豚切りスマソ
uriとかrawbodyって何。

fullはメイル全体を正規表現によるマッチングの対象とします。
したがって、"^"はメイル全体の先頭、"$"はメイル全体の末尾を意味します。
添付ファイルのヘッダを引っ掛けたいなら、 mimeheader の使用をお勧めします。

0310名無しさん@お腹いっぱい。
垢版 |
2009/02/20(金) 11:34:08
>>307 >>309 精進頼む

対象説明
header ヘッダ
(MIME復号化済み)
body ボディのテキストパートのみ
(MIME復号化済み、HTMLタグ等の除去あり)
nbody ボディのテキストパートのみ(MIME復号化済み、
HTMLタグ等の除去あり、UTF-8に変換済み)
uri ボディに記述されたURI
rawbody ボディのテキストパートのみ(MIME復号化済み)
full 生メッセージ全体(MIME復号化なし)

ttp://www.emaillab.org/spamassassin/docs/plugin-OSC20061028.pdf
0312名無しさん@お腹いっぱい。
垢版 |
2009/02/25(水) 22:31:57
誰かSpamAssassinのマニュアルとかドキュメントのあるURLを教えてくれないか?!
0313名無しさん@お腹いっぱい。
垢版 |
2009/02/26(木) 12:22:03
>>312 ttp://spamassassin.apache.org/
0317名無しさん@お腹いっぱい。
垢版 |
2009/03/02(月) 20:00:36
>>315
そこにあるドキュメントだと、どーも理解が難しくてつらかったんだよ!
>>316
単純にspamassassinで、どういう設定したらこーなるよ〜ってのを調べたかったんだ

docsのMail::SpamAssassin::Conf を見ればある程度わかってきたから
あとはぐぐってがんばってみるよ
0319名無しさん@お腹いっぱい。
垢版 |
2009/03/03(火) 14:03:40
ttp://tlec.linux.or.jp/docs/user_prefs

こういう、実践的なコードを読みながらマニュアルとつけあわせした方が
近道じゃないか?
0320名無しさん@お腹いっぱい。
垢版 |
2009/03/03(火) 15:21:42
>>319 そのマニュアルが解りにくいって何度言ったら(ry

user_prefsは、>>310のリンク先の文章程度のが無いと理解できないのでは?
鯖管はともかく、事務系の一般ユーザーが正規表現なんかは無理。

spamassassinでググると、日本SpamAssassinユーザ会がトップw
壁が高すぐwwwwwww

0321名無しさん@お腹いっぱい。
垢版 |
2009/03/03(火) 16:20:02
そもそも一般ユーザも使えるというだけで
一般ユーザの積極的な利用に配慮しているとは言い難いから
多少やさしく書いたところで>>320の言うような対象者は読まんだろ

素人フレンドリーにしたいなら
設定を作成する前処理系でも作ればいいと思うぞ
0322名無しさん@お腹いっぱい。
垢版 |
2009/03/03(火) 16:27:43
そこまで大袈裟な話では無いのでは。
user_prefsを子ユーザーが書き込むGUIはいくつか有るし。

俺様ルールが書けるだけでとりあえずは十分でしょ。
今はこのマニュアルすら、まともなのは無い訳で。

0324pupupuPu
垢版 |
2009/03/03(火) 18:53:09
>>323 おまえはどれくらい偉いんだ?w
0327名無しさん@お腹いっぱい。
垢版 |
2009/03/03(火) 23:56:03
情報が少ないのは求められてない証拠
それではいかんと思うなら自分で行動を起こせ

オレは困ってないから興味ないわ
0329名無しさん@お腹いっぱい。
垢版 |
2009/03/04(水) 16:01:21
一般ユーザはすり抜け分をMUAの学習型フィルタで簡単に対処できるよな
なのにややこしいルールを書きたい一般ユーザがどれだけいるんだ?
0330名無しさん@お腹いっぱい。
垢版 |
2009/03/04(水) 17:54:55
>>329 イタイヤツ?

>簡単に対処できるよな 簡単に対処できるよな 簡単に対処できるよな
できない場合がある。

>なのにややこしいルールを書きたい一般ユーザがどれだけいるんだ?

ややこしいルールは書きたくないだろ普通。
簡単なルールを書きたいユーザーは多い。

ただユーザーそのものが少ないがw
ユーザーが増えない理由位は想像できるよな?
0331名無しさん@お腹いっぱい。
垢版 |
2009/03/04(水) 18:58:16
Outlook/Thunderbird/Shurikenなどにはビルトインのフィルタがあるし
Outlook Express、Beckey!、秀丸などでもフィルタを追加できる
ユーザはルールを記述するよりもGUIの方が喜ぶと思うぞ

で、そういった手元のフィルタを有効に出来ない場合がどれだけある?
簡単なルールを書きたいユーザが多いのはお前の周囲だけだったりしないのか

ユーザ数に執着するところも理解できない
うまく使えるやつは使うしお前みたいなのは使わなきゃいいだけなのにな
0332名無しさん@お腹いっぱい。
垢版 |
2009/03/04(水) 20:57:39
>Outlook Express、Beckey!、秀丸などでもフィルタを追加できる
これは大変だろ?
そもそも、他人と情報を共有するのが難しい。


>お前の周囲だけだったりしないのか
お前、人と直接話す機会少ないだろ?友達も少ないとか......
rf[:@ZwE|6b@Zw7\4t>wwww


>ユーザ数に執着するところも理解できない
執着しているのは、むしろお前なのでは?


ところでお前は何がしたいんだ?お前が作ったDOCでも有るまいて?
ただのかまってちゃんなら消えろ。
0334名無しさん@お腹いっぱい。
垢版 |
2009/03/05(木) 09:23:59
俺は前衛だって上から目線だからひとりぼっちなんだよ。
まあシコシコと一人上手やってろ。
このままじゃ、いずれ消滅するソフトだし。

0337名無しさん@お腹いっぱい。
垢版 |
2009/03/06(金) 21:06:31
>>327-328
どちらも違う。
本家MLを見るとわかるが、ユーザ数は少なくはない。
結構活発に投稿されている。
そして、同じような内容の質問が度々見受けられる。
なのに、文書は更新されない。
これは開発メンバーにやる気がないと考えるのが妥当じゃないか。
0338名無しさん@お腹いっぱい。
垢版 |
2009/03/06(金) 23:10:02
>>326
是非とも訳して欲しいものがある。
http://www.nabble.com/Understanding-Trusted-and-Internal-td22282224.html
trusted_networks と internal_networks の違いの質疑応答なんだが、
正直何が書いてあるんだかさっぱりわからない。

他のユーザも文書が欠けてるって認識を持ってる模様。
http://archives.free.net.ph/message/20081124.164139.3346f2fa.ja.html

0340名無しさん@お腹いっぱい。
垢版 |
2009/03/07(土) 03:12:13
訳すもなにも見たまんまじゃないの?

trusted_networks: スパム送信したり3rd party relayするような悪い子じゃないと仮定する。
善意の第三者なので悪い子から送りつけられちゃったスパムをリレーしてくるかも知れないけど
自分でスパムの送出源になったりヘッダを改竄したりはしない。

internal_networks: そのアドレス内にあるサーバは自組織内のメールサーバ(つまり
そこが送り出すメールは全て自組織発)か自組織のMX。
メールサーバ自身もそれを使ってメールを送る人も、誰も悪いことしないいい子ちゃん。

自分が使ってるISPのメールサーバは、その子自身に悪意がないことはまあ仮定できる。
でも自分と同様にそれを使ってメールを出すISPのユーザの中にスパマーもいるかも知れない。
だからtrusted_networksには指定してもいいけどinternal_networksに指定するのは甘過ぎる。

これでわかるように、internal_networksはtrusted_networksより厳しいので、
常にtrusted_networksの部分集合になるはず。
んで、trusted_networksが指定されてinternal_networksが指定されない場合、
internal_networksはtrusted_networksの値を使う。
……と書いてあるがほんとかね。その仕様はマズいんじゃないの。
より甘いもののデフォルト値としてより厳しいものを使うというなら安全だけど
より厳しいもののデフォルト値としてより甘いものを使うのって安全じゃないよねえ。
0341名無しさん@お腹いっぱい。
垢版 |
2009/03/07(土) 06:39:00
>>340
ありがとう、助かったよ
いきなり PBL/DUL check とか FP とかいう意味不明な略語が出てきて全くわからなかった
よければこれらの略語の意味を教えてくれないか

安全か否かの話なんだが
trusted_networks と internal_networks は仮想ヘッダの作成に使われる
trusted_networks は X-Spam-Relays-Untrusted / X-Spam-Relays-Trusted の判断に
internal_networks は X-Spam-Relays-External / X-Spam-Relays-Internal の判断に
仮想ヘッダはデバッグ出力で見ることができる
これらは全く別の判断で、相互に影響し合うものじゃないから
片方の設定値がない場合はもう片方の設定を引っ張ってくる、という仕様じゃないかな

0342名無しさん@お腹いっぱい。
垢版 |
2009/03/07(土) 13:26:27
そのあたりは本題と関係ないと思ってすっとばしたんで知らん。というのもなんなので……
PBLはopen relayとかの悪い子メールサーバのリストじゃなかったっけ?
うっすらとした記憶によればDULはたぶんDial Up List。FPは知らない。

> これらは全く別の判断で、相互に影響し合うものじゃないから
あなたのいう「判断」は仮想ヘッダを生成するかどうかの判断だよね?
それらの仮想ヘッダの役割はいってみればtrusted_networks/internal_networks
(によるそのメールの仕分け)を後段に渡すだけなので、生成が独立なのは当たり前じゃないかな。
0343名無しさん@お腹いっぱい。
垢版 |
2009/03/07(土) 16:46:44
ありがとう

> あなたのいう「判断」は仮想ヘッダを生成するかどうかの判断だよね?

ビミョーに違う
仮想ヘッダってのは Received: 行を正規化したもので
生成の際、何処までが trusted で何処から untrusted なのかを決める指標が
trusted_networks で
何処までが internal で何処から external なのかを決める指標が internal_networks
これらは設定しないと、 SA は設定がないなりに何とか切り分けようと努力する
つまり、設定されていなくてもそれなりに動作し、仮想ヘッダは必ず生成される
今手元で確認したんで断言できる

> 生成が独立なのは当たり前じゃないか

それが正直今までわからなかった
もしかすると internal にあって trusted にない IP が何か関係するのかと思ってた

0344名無しさん@お腹いっぱい。
垢版 |
2009/03/07(土) 22:19:54
> > 生成が独立なのは当たり前じゃないか
>
> それが正直今までわからなかった
> もしかすると internal にあって trusted にない IP が何か関係するのかと思ってた

そのあたりは後段のルールの役割でしょうね。
あなたの着目した部分の役割というのは
要するにメールが経由したパスの信頼性を分類して、後段が扱いやすくすることだと思います。
0346名無しさん@お腹いっぱい。
垢版 |
2009/03/15(日) 21:39:27
>>344-345
ありがとう
プロバ規制でずっと書き込めなくて
今はダイヤルアップで書いてる

>>339
言われてみればそれもあるかも
少なくとも開発のペースはすっかり落ちてるし
sa-update しても更新されない

ところで、ふと思ったんだけど、
spam自体が下火になりつつある、ってことはないかな?
なんか、あんまり増えたって気がしないのは自分だけかな?
0347名無しさん@お腹いっぱい。
垢版 |
2009/03/17(火) 11:59:59
>spam自体が下火になりつつある、ってことはないかな?

ない

>なんか、あんまり増えたって気がしないのは自分だけかな?

うん
0348名無しさん@お腹いっぱい。
垢版 |
2009/08/17(月) 12:51:56
ヘッダに
 autolearn=no
が付加されたものは、
 『スパムじゃないと判断したし、何も学習してないよ』
ということなんでしょうか。

また、ヘッダに付加された
 autolearn=ham
は一体何なのでしょうか。
0350名無しさん@お腹いっぱい。
垢版 |
2009/08/17(月) 18:56:50
そのヘッダの意味はわからないけど、ham はスパムフィルターの用語では
スパムでないメッセージのこと。
0352名無しさん@お腹いっぱい。
垢版 |
2009/09/04(金) 11:42:38
これ精度めちゃくちゃ低いなぁ…調教次第なのかな?

POPFILEだとほぼ完璧に振り分けてるのに迷惑メールを
ザクザク受信トレイに放り込むし、閾値上げるとちょっとした
重要メールまで迷惑メールにするし、いやはや。
0356名無しさん@お腹いっぱい。
垢版 |
2009/09/04(金) 19:02:07
月に1万通くらいスパム認定しているが、スパムじゃないのをスパム認定したのは
3、4通くらい。それもメールアドレスが ***.@*** みたいなイレギュラーアドレス。
すり抜けたスパムが5、6通くらいかな。結構快適。
0358名無しさん@お腹いっぱい。
垢版 |
2009/09/11(金) 09:39:47
関係ないけどpostgrey入れてみたら超快適
3日間様子を見たけど、1日平均100通のspamが0だった

postfixもほとんど弄らないでいいし、ホント入れるだけに近い
まぁ原理的にトラフィックが増えてしまうんだけど、中小なら
この程度の対策で良いのかもなーと
0369名無しさん@お腹いっぱい。
垢版 |
2010/04/20(火) 07:12:08
spamassasin使ってる人に質問

/usr/local/bin/spam-filter の
下記送信先に、spamメールが配送されますが、
それをどこにも送らないようにするにはどうすればいいでしょうか。
cat | $SPAMASSASSIN -x > in.$$
grep -e "^X-Spam-Status:.Yes" in.$$ \
&& $SENDMAIL "送信先" < in.$$ \
|| $SENDMAIL "$@" < in.$$
0370名無しさん@お腹いっぱい。
垢版 |
2010/04/20(火) 09:47:56
>>369
ttp://pc11.2ch.net/test/read.cgi/mysv/1083212079/207
ttp://pc11.2ch.net/test/read.cgi/mysv/1119304945/737-738

いろんなところにマルチ乙。

そもそも/usr/local/bin/spam-filterって自分で作るファイルだから、
ぐぐって解説サイトのスクリプトを丸々コピペしてる人しか同じような環境の人はおらんよ。
全部他人任せのやつには自宅鯖をする資格無し。
0376名無しさん@お腹いっぱい。
垢版 |
2010/05/05(水) 15:30:14
3.3系って日本語対応パッチは不要(パッチがなくとも同等の機能が最初からある)
になっているのでしょうか?
0377名無しさん@お腹いっぱい。
垢版 |
2010/05/30(日) 18:54:07
RTFのみ添付のスパムに加算するためのルールはどう書けばよいのでしょうか?
どなたかご教示お願い致します。
0381名無しさん@お腹いっぱい。
垢版 |
2010/06/24(木) 15:36:42
連投失礼。
tlecのuser_prefsが更新されないと、途端に日本語スパムが溢れてきて
松田さんの偉大さを知りました。
SpamAssassinには日本語対応パッチ当ててるんですが、やはり手動避け設定は
強力ですね。
0383名無しさん@お腹いっぱい。
垢版 |
2010/06/24(木) 18:59:16
>>382
日本語対応パッチしてても、ベイジアンフィルタを抜けてくるのは圧倒的に
日本語のスパムが多くて、いちおうパッチの効果はあるようには思うんですが
やはり日本語スパムは手動避けがまだ必要なんだなと。
0385名無しさん@お腹いっぱい。
垢版 |
2010/07/15(木) 15:57:15
/home/$user/Maildir/cur
には正常メールとスパムメールが混在した状態です。

間違えて
sa-learn --ham /home/$user/Maildir/cur
をやってしまったのですが、
学習を初期化(なかったことに)する方法はあるのでしょうか?
0390名無しさん@お腹いっぱい。
垢版 |
2010/08/17(火) 23:52:08
移動先: http://www.flcl.org/~yoh/user_prefs

> cron.daily に設定されている方が結構多いようで、朝の4時〜5時にアクセスが集中しています。
> それ以外では、一時間毎に設定されている方が数人程度。
> 面白いのは、午前11時になると一時間の間、1分毎にダウンロードする人。 crontab の設定ミスですね。(笑)
> さ*らのweb鯖を使ってる方、貴方ですよ。^^;

自分は、半年に一回くらい。
0392名無しさん@お腹いっぱい。
垢版 |
2010/08/18(水) 07:04:16
>>390
よく自動でアップデートできるな・・・
俺は、アップデート用のスクリプト使っても怖くてcronで更新する
気にはなれん
0394名無しさん@お腹いっぱい。
垢版 |
2010/09/12(日) 17:02:16
TLECのuser_prefs使ってたら国内のホストでもRCVD_IN_CHINAや
RCVD_IN_CHINA_KR、RCVD_IN_TAIWANと誤判定される物が増えたので。
blackholes.us絡みの記述を削除。

blackholes.usの代わりにcc.wariate.jpでテスト中。
0397名無しさん@お腹いっぱい。
垢版 |
2010/10/28(木) 12:05:13
SpamAssassin 3.3.1に上げたんだけど、この警告が非常に気になる。

warn: netset: cannot include 0:0:0:0:0:0:0:1/128 as it has already been included

あとTLECのuser_prefsの箇所でもこんな感じで出てるんだけど、これって何だろ?

warn: netset: cannot include 124.83.168.15/32 as it has already been included
warn: netset: cannot include 124.83.168.16/29 as it has already been included
warn: netset: cannot include 124.83.168.24/30 as it has already been included
warn: netset: cannot include 124.83.168.28/31 as it has already been included

もちろん、二重に読み込んだりはしてない。
0398名無しさん@お腹いっぱい。
垢版 |
2010/10/29(金) 00:00:44
0:0:0:0:0:0:0:1/128 ってのはv6じゃないかな
カーネルのv6サポート外せば治まるんでは

host 124.83.168.15 ってやってみ
user_prefs の trusted_networks に記述がある筈
trusted_networks で重複しているならそいつは古いから
>>390 から落とすべし
0399名無しさん@お腹いっぱい。
垢版 |
2010/10/30(土) 18:25:51
>>398
どうもです。user_prefsを最新のものにしても変わらず…。
警告をよく見たら、自分で設定した trusted_networks も同じ表示があった。

warn: netset: cannot include 192.168.0.0/24 as it has already been included

動作的には問題ないようにも見えるけど、よく分からん。
レスを投稿する


ニューススポーツなんでも実況