SpamAssassin
■ このスレッドは過去ログ倉庫に格納されています
apache.orgの傘下になって、ますます勢いづくスパムメールの暗殺者 SpamAssassin これでSPAM業者を失業に追い込もう....... とまでには、まだまだ遠い道のりだよ(w 学習しろ!!学習しろ!!学習しろ!! sa-learn --spam --mbox /home/hiroyuki/mail/spam ハムをスパムと間違えないで、一生のお願いだから。 スパム業者の荒らしはスルーってことで。 おまいら、まったりとお願いします。 本家 ttp://spamassassin.apache.org/ 2005-06-06: SpamAssassin 3.0.4 released! キーワード local.cf user_prefs spamassassin ベイズ推定 ベイジアンフィルタ ホワイトリスト AWL bayes_journal auto-whitelist >>180 それスパムじゃないメールなの? 相手はどんな環境からメール出してるんだ?? >>183 そ。普通の文章を普通のMUAからNATルータ越しに送ってきたもの。なので、最初のHELOは ローカルIPが生で入っている模様。 会社のサーバでqmail-scannerでウイルスチェックかけて、ヲレのサーバでもclamdで ウイルスチェックかけているんで、実際のreceived:はもうちょっと煩雑なものになるんだけど。 >>184 つまりMTA->MTAじゃなくMUA->MTAってことなんだろ? ということは自分とこのユーザってことだから、それは当然だわな。 その場合も、MTAからのものと同じようにSpamAssassinのチェックが掛かるということが 177が言ってる問題の本質とみた。 あ、clamdじゃなくてclamsmtpで、ですな。ウイルスチェック自体はclamdがやっているけど。 >>185 そそ。動的IPアドレスブロックつかって自前のMTAをあげている場合なら まだしも、MUAからのメールではまることがあったので驚いたのですだ。 あと、別のサーバから転送されてくるspamの判別を効かせるためにinternal networks を設定するとはまることがあるんだなぁというお話。 >>177 自分のIPアドレスを 名乗る「MTA」だったりすると、もうspamと判定されちゃう。 これで>>180 「MUA」を例示するからややこしい。 そもそも、RBL系を利用しているのだから、判定されやすいのは当然なのに。 それに、MUAが吐き出すHELOはほぼ不正なんだけど。 まあ、spamassassinのデフォルト設定のスコアリングの危険性が知られるのはいいことだと思う。 俺の環境では、LANのIPアドレスがRCVD_NUMERIC_HELOでスコアされる事はないぞ。 MTA上でspamdとして動いています。 user_prefsはtlec謹呈。 3.1.5 & 3.1.7 その辺、internal_networksやtrusted_networksの書き方次第じゃないの? >>190 tlecのuser_prefsがイイってこと? >>181 >他にいくつかのキーワードを混ぜてはじいてる。 >>190 tlecのuser_prefsには、internal_networksの記述は無い。 trusted_networksはコメントアウトされている。 >>193 trusted_networks は利用者が個別に書くことを推奨している。 それが private_prefs と作者が勝手に名付けている奴。 これは、private_prefsファィルを設置しないと、働かないんでしょ? spamass-milterでsubjectだけ加工するってのは無いのかょ spamassassinにスパム学習させる為だけに怪しい出会い系に 入会した私は変態でしょうか? 出会い系の登録してそこからのメールを自動的にスパム学習させると スパムのトレンドに自動的に追随してくれるかなと思って 出来心でやってしまいました。 でも、今一番難しいのは株を買え!系なんですが。 >>202 折角なんで有効活用したら?w 株系の画像添付はなかなか難しいよなぁ・・・ うちではほとんどカットしてくれてるけどなあ >画像添付 何かコピペか自動生成かって感じの文章が書いてあるだけのが時々抜けてくる。 SpamAssassinを使っているのですが OBSCURED_EMAIL BODY: Message seems to contain rot13ed address でSPAM扱いされるメールがあるのですよ。 ROT13(アルファベットを十三文字ずらすあれ)でエンコードされたアドレスがある というのは判るんだが 何を基準にrot13edかそうでないかを判断してるのかが判らんとです。 教えてエロイ人。 >>208 ^ と ( を見てるくさい。 @ と . がこれに変換されるのかな。 ってことは /usr/share/spamassassin/20_body_tests.cf の body EMAIL_ROT13 /\b[a-z(\]-]+\^[a-z-]+\([a-z]{2,3}\b/ ですか。 a-z,(,],- の繰り返しで始まり、 ^ a-z,- の繰り返し、 ( a-z (2 or 3) で終わるってことニカ? なんか違うような・・・正規表現ですよねこれ 最近、株式SPAMのキーワードがコロコロ変わって大変です。 こんなのや S.umbol: UTEV Current price: $0.012 Recommendation: very aggresive buy!!! こんなの Search for: UTEV Current price: $0.012 Market: bullish. 全部の文字間にHTMLタグとか テーブルのセル1個に1文字とか そんなん? いえ、textっす(´・ω・`) 今、また13発着弾してしまいました。 /etc/mail/spamassassin/local.cfを、 ttp://tlec.linux.or.jp/docs/の user_prefsと入れ換えてもOKですか? ユーザーは50人位です。 >>214 個人向け、つまりfalse_positiveも自己責任で処理することを 前提に作られているから、正直お勧めしない。 多少取りこぼしてもよいのなら、 required_score 30 以上に すれば、少しは安全になるかも。 report_safe 0の 設定を/etc/mail/SA/local.cfに書いているのですが、 なぜか、スパムの判定結果がattachedされてしまいます。 3.17のときは全く問題なかったのですが、3.18にあげてから、 このようになりました。 どなたか教えていただけないでしょうか。 >>216 SAを実行するユーザにて su して、 spamassassin -d spamfile|spamassassin -t -D 2>&1|lv する。 spamd を使っている場合は、spamd を止めてから spamd -D 2>&1 とする。 デバッグメッセージに以下のようなメッセージが出てくる筈。 > [3772] dbg: config: read file /etc/spamassassin/local.cf >>217 レスありがとうございます。 仰せの通りやってみました。 [4218] dbg: config: using "/etc/mail/spamassassin" for site rules dir [4218] dbg: config: read file /etc/mail/spamassassin/local.cf という感じで、ただしく設定したものを読んでいるようです。 >>218 なら、その後に何か error 或は warning が出てきてないか? 因みに俺の手元では spamc で問題なく実行できた。 local.cf の中身を report_safe 0 だけにしてみる。 それでダメなら、ファイルの改行コードを疑う。 >>220 通らないね。なのでRazor2とDCCだけ。 >>219 いろいろありがとうございます。 ふと思いついてHTML::Parserのモジュールを アップグレードしてみたら、今のところ、うまく 動いているようです。 お騒がせしました。 普段はCPANでアップグレードしていたのですが、 気づかないうちに整合性がとれていなかったのかもしれません。 前から気になってたんですが、 spamassassinが、SURBL等に参照するときに、 bodyを全部送っているのでしょうか? http:// と続く部分だけ送っているのでしょうか? httpプロトコルのように、 RBLサーバとのやりとりが説明されたサイトはありませんか? みんなが使うから、たぶん効率の良い方法を取っていると思うのですが、 どういう方法にて、やりとりしているのでしょうか? SURLBLの問い合わせもDNSBLと同じ、つまりDNS引いてるだけだから 送られるのはドメイン名のみのはず。 * bug 4636: Add support for charset normalization, so rules can be written in UTF-8 to match text in other charsets. UTF-8対応したんだね。 分かち書きは対応してないのかな? postfixでバーチャルドメインな環境ですが、 特定のドメインのユーザ(複数ドメイン指定)だけ、spamassassin先生を呼ぶことはできますか? hogehoge@aaa.com → spamassassin → メールボックス sagesage@aaa.com → spamassassin → メールボックス fugaduga@bbb.com → そのままメールボックスへ hagehage@ccc.com → spamassassin → メールボックス それとも、postfixは、すべてのメールをspamassassinに渡してしまうのでしょうか? spamc の -u オプションを使えないようにしたい (spamdの起動ユーザを spamcの起動ユーザのみにしたい) のですが、ソースをどう修正すればよいでしょうか。 spamc -u hoge としてspamdを起動すれば、 /home/hoge/.spamassassin/user_pref を意図的に作り出せることが出来てしまいます。 これを避けたいためです。 spamd は perl ですが、 spamc は C言語なんですね、、、 spamd だけの修正(パッチ当て)で何とか対応できないでしょうか。 >>232 spamcはspamdを呼び出すためのインターフェイスなだけだから 実際にuser_prefを作ってるのはspamdのはずだよ。 でspamdはrootとか特権ユーザで動いてるから、そうやってファイル作ることも出来てるわけ。 spamcとspamdは通信でユーザを渡してると思うので、根本的に対応するには、そのプロトコルから 変更しないと無理だと思われ。 小手先だけの対応なら、spamcのソースから-uオプションの指定をはずしてやればいいんでない? >>231 spamassassinはどうやって呼び出してる? 単に.forwardから呼んでるなら、フィルタしたくないユーザの.forwardからはずしてやればいいだけ。 FreeBSD6.2 + p5-Mail-SpamAssassin-3.2.1で構築中なのですが、 デフォルトでユーザ毎にできる学習ファイル $HOME/.spamassassin/bayes_seen などを全ユーザで1つにして共有したいのですが、 どこかにそれ用の設定ありますでしょうか? >>235 amavis とか使ってMTA側でやれば? >>236 その場合sa-leranもamavisユーザでやるってことでしょうか? なんかここ1-2週間、spamasassinをすりぬけてくる 日本語のspamが急激に増えたんだけど、なんでだろう? >>239 うちは SpamAssassin の前段階の maildropfilter で結構弾いてるっぽい。 よぉく見ると特徴的なヘッダしてるからそれで弾いてる。 以下のヘッダ(xxx は IP アドレス)が付いている spam が多くて、対策を検討中です。 Received: from unknown (HELO ?xxx.xxx.xxx.xxx?) (xxx.xxx.xxx.xxx) 「RCVD_NUMERIC_HELO」ってルールが標準であるようですが、 上記メールは RCVD_NUMERIC_HELO に引っ掛かっていませんでした。 「RCVD_NUMERIC_HELO」というルールを使うためには、何か特別な設定が必要なのでしょうか? /etc/mail/spamassassin/local.cf は松田さんのところの user_prefs を private_prefs 未使用にして置き換えています。 >>242 spamassassin.jpに相談したほうがいい 3.1.8だと問題なくmake test通るけど、3.1.9と3.2.2でmake testでエラー出るんだけど何か変わった? 最近来るスパムメールって、特定のパターンにひっかからない 奴が多い。サブジェクト普通だし差出人もいろんな国から 色んなアドレス使って来る。(パターン化しないようにしてる?) メール本文は○○.pdfが添付されてるだけだったり、 ○○.html とかが多い。 みんなどうやってはじいてるの? たとえば差出人や見出しはこんな感じ Subject: oh man your nutz From: <rkirchho@first-lan.de> Sender: User kwaneix <kwaneix@tkhfvj> こんなのは動的アドレスから来てるから Postfix の方で弾いちゃってるよ >>246 まだpdf spam来てる? オレんとこは8/21を最後に来てないんだが。 >>247 その情報だけじゃわかんない。 少なくとも送信元のReceived:が欲しい。 >>248 動的アドレスって、どうやって判断するんだ? 逆引きのないIPや、一見動的っぽく見えるFQDNとか、 バリエーションは世界中に無数に存在するのに? IPとFQDNだけでspamって判断できるのか? ISPのメアドじゃ出来ない方法か。 なるほど、確かにspammerはそんな極少数派の対策などする訳がないな。 PostfixにSpamAssassinとClamAVを導入しようと思っているのですが、 amavisd-newを使うやり方と、SpamPDとClamSMTPを使うやり方とがあるっぽいんですが、 どっちがオススメでしょうか? >>254 俺はSpamPDとClamSMTPでやってます。 qmail-scanner+SpamAssassin の組み合わせを使っているんですが 最近、英文Spamが大量にスルーされるのは、俺だけのところですかね? >>254 SpamPD+ClamSMTPで使ってるけど、安定して運用できてるよ。 >>255 ,257 レスありがとう、SpamPDとClamSMTPで挑戦中です。 ですが、よく考えたら自鯖にSMTPで来るメールよりも、ISPからfetchmailで持ってくる メールのほうが多数だったみたいで(あまり意識してなかった。。。) こんな場合はやっぱ普通にfetchmail->procmail->spamc/clamdscan ですかね。 この場合はSMTP->procmailのルートの時に二重にスパムチェックしそうなので、 procmailrc分けてみようか、、、とか考えてます。 >>258 postfix の filter 使ったら? ClamSMTP を使いたい無いサイトは filter前に登録してチェックさせないようにしているよ。 とりあえずspamPDとClamSMTPで出来たっぽいですヽ(゚∀゚)ノ >>259 spamPDを使った場合、fetchmailで持ってくる分については別口でやらないと いけないなぁ、という感じなんですが、postfixのfilterでやれます? そうか、fetchmailで smtphost localhost ってやればいいんですね。。(゚Д゚;) スレ汚し失礼しました spamPDで質問なんですが、sa-learnするときはやはりspampdを動かしてるユーザで やるのが正解でしょうか? debian etchのaptでspamPDを入れたら、spampdユーザが作られて実行されるんですが、 spampdユーザにはhomeが無い、、、 で、なんとなくrootでsa-learnしてたんですが、なんか違うかな〜と思いまして。。。 >>262 です >>238 ってことですかね、、、スイマセン spamdをroot権限以外で起動したいのですが、どうすればよいのでしょうか? >>264 -u オプションと -g オプションでユーザとグループを指定できる。 とりあえず、spamd -h、perldoc spamd 見るべし。 >>262 sudo -H -u spampd sa-learn ... とかでよくね? ($HOMEを変更しないと ~root/.spamassassin/ を見に行くので -H 必須) 日本語パッチあてたら日本語スパムでもBAYES_99出るようになったー! けどやっぱまだBAYES_50止まりが大半、、、 tlecのuser_prefsのおかげでBAYES_99いかなくてもけっこう弾けてるけど、 スパム判定されて本文が添付になってしまったメールをlearnさせても正常に (添付のオリジナルメッセージだけを対象に)学習してくれるモノでしょうか? 探したんだけどピッタリなスレが見あたらなかったんでここで質問させてちょ bsfilter と spamcopを組み合わせて使う方法ってどこかに書かれてないかな? MTA直でspamcop呼び出すと必要なメールまで根こそぎ蹴られてしまいそうなので なんとかフィルタとして微調整しながら使いたいんだけど ベイジアンフィルタだけではもう限界だわorz 苦労して組み合わせて使う仕組み構築するくらいなら、素直にSpamAssassin使えよ。 bsfilter関連でいろいろと組み上げた細工もあるしさ、それも含めてルーチン ワークができあがってるし、できるもんならそのまま引き継いで使いたいさね ちょいと程度の苦労で済むなら・・w どうにもアレなようならSpamAssasinに切り替えようかとは思ってるんだが SpamAssassin 3.2.4使ってるんですが、この手のフィルタ避けのせいか、 SPAMがすり抜けてしまいます。 >封.筒発.送して毎.月39.万.円.稼ぐ > >ビジ.ネスマニュ.アルに沿って初.心者でも活.動が可.能となりました。 > >活.動時.間は自分で選択! sa-learnしたんですが、キーワードが間の「.」で分割されているせいか、 学習出来ていないようです。 うまく排除する方法は無いもんでしょうか? >>271 へー、日本語スパムでもベイジアン対策してるの出てきたんだな。 そんなのきてるんだ。 中国・韓国・フィリピンなどの発信元を拒否してるためか、 手元にはまだ届いてない。 気長に学習させるか、他のヒューリスティックなスコアリングに 頼るかのどちらかしかないものなぁ >271 そんだけ個性があれば個別のルールでスコア付けとけば良くね? 溜まったspam判定されたメールのチェック、どうしてる? MH形式で保存してあるんでフィルタ書いてサマリの形にしてlessでざーーーーーっと眺めるような 形にしてる(1日200〜400通くらい来るから、ちんたらやっとられん)んだけど、困るのが日本語のメール。 base64とか出てくるし、もう、このクソがと。 今は読めないメールは個別にMUAで開いたりnkf通して中身確認してるんだけど、なんかスマートな 方法ないかな? 未チェックのまま捨てる事ができればいいんだけどorz >>277 俺はMUAでFromだけザーと流し見して捨ててるなぁ BAYES_99をけっこう高めに設定してるんでいちおう見てるけど、 日に200件を超えるんで、ほんとは見ずに捨てたいところ。 spam判定された物は別アドレスに転送、 条件付きフィルタでヘッダ部分を判別して自動削除してる。 >>278-279 やっぱ別アドレス用意しといて転送、後は/var/mail/hogehoge を直接いぢるくなり MTA使うなり・・ってのが一番融通も効いてよさそだねえ 出先で処理しなくちゃならんケースもあって、そういうのって常にMTAが使える訳でもなくてさ telnetしか使えないとかPDAしか使えないとか ああ、頭いてえ ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる