SpamAssassin
■ このスレッドは過去ログ倉庫に格納されています
apache.orgの傘下になって、ますます勢いづくスパムメールの暗殺者 SpamAssassin これでSPAM業者を失業に追い込もう....... とまでには、まだまだ遠い道のりだよ(w 学習しろ!!学習しろ!!学習しろ!! sa-learn --spam --mbox /home/hiroyuki/mail/spam ハムをスパムと間違えないで、一生のお願いだから。 スパム業者の荒らしはスルーってことで。 おまいら、まったりとお願いします。 本家 ttp://spamassassin.apache.org/ 2005-06-06: SpamAssassin 3.0.4 released! キーワード local.cf user_prefs spamassassin ベイズ推定 ベイジアンフィルタ ホワイトリスト AWL bayes_journal auto-whitelist >>220 通らないね。なのでRazor2とDCCだけ。 >>219 いろいろありがとうございます。 ふと思いついてHTML::Parserのモジュールを アップグレードしてみたら、今のところ、うまく 動いているようです。 お騒がせしました。 普段はCPANでアップグレードしていたのですが、 気づかないうちに整合性がとれていなかったのかもしれません。 前から気になってたんですが、 spamassassinが、SURBL等に参照するときに、 bodyを全部送っているのでしょうか? http:// と続く部分だけ送っているのでしょうか? httpプロトコルのように、 RBLサーバとのやりとりが説明されたサイトはありませんか? みんなが使うから、たぶん効率の良い方法を取っていると思うのですが、 どういう方法にて、やりとりしているのでしょうか? SURLBLの問い合わせもDNSBLと同じ、つまりDNS引いてるだけだから 送られるのはドメイン名のみのはず。 * bug 4636: Add support for charset normalization, so rules can be written in UTF-8 to match text in other charsets. UTF-8対応したんだね。 分かち書きは対応してないのかな? postfixでバーチャルドメインな環境ですが、 特定のドメインのユーザ(複数ドメイン指定)だけ、spamassassin先生を呼ぶことはできますか? hogehoge@aaa.com → spamassassin → メールボックス sagesage@aaa.com → spamassassin → メールボックス fugaduga@bbb.com → そのままメールボックスへ hagehage@ccc.com → spamassassin → メールボックス それとも、postfixは、すべてのメールをspamassassinに渡してしまうのでしょうか? spamc の -u オプションを使えないようにしたい (spamdの起動ユーザを spamcの起動ユーザのみにしたい) のですが、ソースをどう修正すればよいでしょうか。 spamc -u hoge としてspamdを起動すれば、 /home/hoge/.spamassassin/user_pref を意図的に作り出せることが出来てしまいます。 これを避けたいためです。 spamd は perl ですが、 spamc は C言語なんですね、、、 spamd だけの修正(パッチ当て)で何とか対応できないでしょうか。 >>232 spamcはspamdを呼び出すためのインターフェイスなだけだから 実際にuser_prefを作ってるのはspamdのはずだよ。 でspamdはrootとか特権ユーザで動いてるから、そうやってファイル作ることも出来てるわけ。 spamcとspamdは通信でユーザを渡してると思うので、根本的に対応するには、そのプロトコルから 変更しないと無理だと思われ。 小手先だけの対応なら、spamcのソースから-uオプションの指定をはずしてやればいいんでない? >>231 spamassassinはどうやって呼び出してる? 単に.forwardから呼んでるなら、フィルタしたくないユーザの.forwardからはずしてやればいいだけ。 FreeBSD6.2 + p5-Mail-SpamAssassin-3.2.1で構築中なのですが、 デフォルトでユーザ毎にできる学習ファイル $HOME/.spamassassin/bayes_seen などを全ユーザで1つにして共有したいのですが、 どこかにそれ用の設定ありますでしょうか? >>235 amavis とか使ってMTA側でやれば? >>236 その場合sa-leranもamavisユーザでやるってことでしょうか? なんかここ1-2週間、spamasassinをすりぬけてくる 日本語のspamが急激に増えたんだけど、なんでだろう? >>239 うちは SpamAssassin の前段階の maildropfilter で結構弾いてるっぽい。 よぉく見ると特徴的なヘッダしてるからそれで弾いてる。 以下のヘッダ(xxx は IP アドレス)が付いている spam が多くて、対策を検討中です。 Received: from unknown (HELO ?xxx.xxx.xxx.xxx?) (xxx.xxx.xxx.xxx) 「RCVD_NUMERIC_HELO」ってルールが標準であるようですが、 上記メールは RCVD_NUMERIC_HELO に引っ掛かっていませんでした。 「RCVD_NUMERIC_HELO」というルールを使うためには、何か特別な設定が必要なのでしょうか? /etc/mail/spamassassin/local.cf は松田さんのところの user_prefs を private_prefs 未使用にして置き換えています。 >>242 spamassassin.jpに相談したほうがいい 3.1.8だと問題なくmake test通るけど、3.1.9と3.2.2でmake testでエラー出るんだけど何か変わった? 最近来るスパムメールって、特定のパターンにひっかからない 奴が多い。サブジェクト普通だし差出人もいろんな国から 色んなアドレス使って来る。(パターン化しないようにしてる?) メール本文は○○.pdfが添付されてるだけだったり、 ○○.html とかが多い。 みんなどうやってはじいてるの? たとえば差出人や見出しはこんな感じ Subject: oh man your nutz From: <rkirchho@first-lan.de> Sender: User kwaneix <kwaneix@tkhfvj> こんなのは動的アドレスから来てるから Postfix の方で弾いちゃってるよ >>246 まだpdf spam来てる? オレんとこは8/21を最後に来てないんだが。 >>247 その情報だけじゃわかんない。 少なくとも送信元のReceived:が欲しい。 >>248 動的アドレスって、どうやって判断するんだ? 逆引きのないIPや、一見動的っぽく見えるFQDNとか、 バリエーションは世界中に無数に存在するのに? IPとFQDNだけでspamって判断できるのか? ISPのメアドじゃ出来ない方法か。 なるほど、確かにspammerはそんな極少数派の対策などする訳がないな。 PostfixにSpamAssassinとClamAVを導入しようと思っているのですが、 amavisd-newを使うやり方と、SpamPDとClamSMTPを使うやり方とがあるっぽいんですが、 どっちがオススメでしょうか? >>254 俺はSpamPDとClamSMTPでやってます。 qmail-scanner+SpamAssassin の組み合わせを使っているんですが 最近、英文Spamが大量にスルーされるのは、俺だけのところですかね? >>254 SpamPD+ClamSMTPで使ってるけど、安定して運用できてるよ。 >>255 ,257 レスありがとう、SpamPDとClamSMTPで挑戦中です。 ですが、よく考えたら自鯖にSMTPで来るメールよりも、ISPからfetchmailで持ってくる メールのほうが多数だったみたいで(あまり意識してなかった。。。) こんな場合はやっぱ普通にfetchmail->procmail->spamc/clamdscan ですかね。 この場合はSMTP->procmailのルートの時に二重にスパムチェックしそうなので、 procmailrc分けてみようか、、、とか考えてます。 >>258 postfix の filter 使ったら? ClamSMTP を使いたい無いサイトは filter前に登録してチェックさせないようにしているよ。 とりあえずspamPDとClamSMTPで出来たっぽいですヽ(゚∀゚)ノ >>259 spamPDを使った場合、fetchmailで持ってくる分については別口でやらないと いけないなぁ、という感じなんですが、postfixのfilterでやれます? そうか、fetchmailで smtphost localhost ってやればいいんですね。。(゚Д゚;) スレ汚し失礼しました spamPDで質問なんですが、sa-learnするときはやはりspampdを動かしてるユーザで やるのが正解でしょうか? debian etchのaptでspamPDを入れたら、spampdユーザが作られて実行されるんですが、 spampdユーザにはhomeが無い、、、 で、なんとなくrootでsa-learnしてたんですが、なんか違うかな〜と思いまして。。。 >>262 です >>238 ってことですかね、、、スイマセン spamdをroot権限以外で起動したいのですが、どうすればよいのでしょうか? >>264 -u オプションと -g オプションでユーザとグループを指定できる。 とりあえず、spamd -h、perldoc spamd 見るべし。 >>262 sudo -H -u spampd sa-learn ... とかでよくね? ($HOMEを変更しないと ~root/.spamassassin/ を見に行くので -H 必須) 日本語パッチあてたら日本語スパムでもBAYES_99出るようになったー! けどやっぱまだBAYES_50止まりが大半、、、 tlecのuser_prefsのおかげでBAYES_99いかなくてもけっこう弾けてるけど、 スパム判定されて本文が添付になってしまったメールをlearnさせても正常に (添付のオリジナルメッセージだけを対象に)学習してくれるモノでしょうか? 探したんだけどピッタリなスレが見あたらなかったんでここで質問させてちょ bsfilter と spamcopを組み合わせて使う方法ってどこかに書かれてないかな? MTA直でspamcop呼び出すと必要なメールまで根こそぎ蹴られてしまいそうなので なんとかフィルタとして微調整しながら使いたいんだけど ベイジアンフィルタだけではもう限界だわorz 苦労して組み合わせて使う仕組み構築するくらいなら、素直にSpamAssassin使えよ。 bsfilter関連でいろいろと組み上げた細工もあるしさ、それも含めてルーチン ワークができあがってるし、できるもんならそのまま引き継いで使いたいさね ちょいと程度の苦労で済むなら・・w どうにもアレなようならSpamAssasinに切り替えようかとは思ってるんだが SpamAssassin 3.2.4使ってるんですが、この手のフィルタ避けのせいか、 SPAMがすり抜けてしまいます。 >封.筒発.送して毎.月39.万.円.稼ぐ > >ビジ.ネスマニュ.アルに沿って初.心者でも活.動が可.能となりました。 > >活.動時.間は自分で選択! sa-learnしたんですが、キーワードが間の「.」で分割されているせいか、 学習出来ていないようです。 うまく排除する方法は無いもんでしょうか? >>271 へー、日本語スパムでもベイジアン対策してるの出てきたんだな。 そんなのきてるんだ。 中国・韓国・フィリピンなどの発信元を拒否してるためか、 手元にはまだ届いてない。 気長に学習させるか、他のヒューリスティックなスコアリングに 頼るかのどちらかしかないものなぁ >271 そんだけ個性があれば個別のルールでスコア付けとけば良くね? 溜まったspam判定されたメールのチェック、どうしてる? MH形式で保存してあるんでフィルタ書いてサマリの形にしてlessでざーーーーーっと眺めるような 形にしてる(1日200〜400通くらい来るから、ちんたらやっとられん)んだけど、困るのが日本語のメール。 base64とか出てくるし、もう、このクソがと。 今は読めないメールは個別にMUAで開いたりnkf通して中身確認してるんだけど、なんかスマートな 方法ないかな? 未チェックのまま捨てる事ができればいいんだけどorz >>277 俺はMUAでFromだけザーと流し見して捨ててるなぁ BAYES_99をけっこう高めに設定してるんでいちおう見てるけど、 日に200件を超えるんで、ほんとは見ずに捨てたいところ。 spam判定された物は別アドレスに転送、 条件付きフィルタでヘッダ部分を判別して自動削除してる。 >>278-279 やっぱ別アドレス用意しといて転送、後は/var/mail/hogehoge を直接いぢるくなり MTA使うなり・・ってのが一番融通も効いてよさそだねえ 出先で処理しなくちゃならんケースもあって、そういうのって常にMTAが使える訳でもなくてさ telnetしか使えないとかPDAしか使えないとか ああ、頭いてえ >>277 サーバ側にSquirrelMail立ってて受信フォルダとは別のフォルダに 移動させておいて、暇なときにFrom/Subjectをざーっと見て全チェック→削除。 spamとして弾かれるときにテンプレにされてオリジナルメールは添付ファイルになっちゃうけど これやめさせられない?オリジナルのままヘッダに情報追加する形、もしくは追加情報いらんから オリジナルのままにさせときたいんだけど でないと学習させんのがメガマンドクセー>< >>283 > これやめさせられない? できるけど。 ,..-─‐-..、 /.: : : : : : : .ヽ R: : : :. : pq: :i} この知りたがり屋! |:.i} : : : :_{: :.レ′ ノr┴-<」: :j| /:r仁ニ= ノ:.ノ|! _ /:/ = /: :/ }! |〕) ペシ ペシ {;ハ__,イ: :f | /´ ☆ / }rヘ ├--r─y/ / r'‐-| ├-┴〆 _, 、_ '⌒ ☆ 仁二ニ_‐-イ | | ∩`Д´) | l i 厂  ̄ニニ¬ ノ ⊂ノ ,ゝ、 \ \ __厂`ヽ (__ ̄) ) / /\_i⌒ト、_ ノrr- } し'し′ └-' ̄. | |_二二._」」__ノ local.cf を更新した時って、spamassassinのプロセス再起動が必要でしょうか? >>288 勿論。 >>267 perldoc sa-learn の OPTIONS の --ham 又は --spam を見ろ。 htmlメール中に張られている、画像リンクを対処する場合、 user_prefs にどういう風に記述すればいいのでしょう??? >>290 > 画像リンクを対処する ってどういうことか説明しないと。 tlec.linux.or.jpから落としてリネームしてそれだけって人 大丈夫なのかな・・・・ 一度、デバッグしたほうがいいと思うんですが 大量のエラーがでますから tlec.linux.or.jp いつも更新乙です Content-Type: を宣言していないheaderを持つメールにスコア与えるには どんなレシピ設定をしてやれば良いのでしょうか? >>294 warn: config: failed to parse, now a plugin, skipping, in "/usr/local/etc/tlec_linux_or_jp/user_prefs": ok_languages ja en 今日の昼ぐらいから急にSpamAssassinがSIGPIPEで死ぬようになって難儀している。 procmailで食わせているんだけど、毎回死ぬわけでもなく、時々。 インストールしてあるものを何か入れ替えたわけでもないし、ディスクが足りてない わけでもない。何故だろう……。 俺のセブンセンシズによればハードディスクが壊れかかっている。 そうか、ディスクか。 ……でもログとSMARTの情報を見たけど別段おかしくはなさそうだ。 メモリーが壊れかかっているのを感じるぞ。 うおー、燃え上がれ俺のコスモ!memtest86拳 >>305 するどい。調べてみたところ、razor-users MLでの報告を発見。 それによるとどうやら c303.cloudmark.com というサーバだけが、なぜかときどき 空のgreetingを返してくれて解析に失敗して死ぬらしい。 servers.catalogue.lst からc303を外して様子をみてみる。どうもありがとう。 お世話になってます。ところでちゃんとしたルールを自作して役に立ちたいのですが、 ルール作成のマニュアルはどこを参照したらよろしいでしょうか? 本家のDOCを斜め読みしたのですが、いまいち解りにくく。 ttp://wiki.apache.org/spamassassin/RuleDescriptionTemplate ttp://spamassassin.apache.org/tests_3_2_x.html ttp://svn.apache.org/repos/asf/spamassassin/tags/spamassassin_release_3_2_5/rules/ s-jis → jis → 正規表現 このツールなら見かけたけど。 豚切りスマソ uriとかrawbodyって何。 fullはメイル全体を正規表現によるマッチングの対象とします。 したがって、"^"はメイル全体の先頭、"$"はメイル全体の末尾を意味します。 添付ファイルのヘッダを引っ掛けたいなら、 mimeheader の使用をお勧めします。 >>307 >>309 精進頼む 対象説明 header ヘッダ (MIME復号化済み) body ボディのテキストパートのみ (MIME復号化済み、HTMLタグ等の除去あり) nbody ボディのテキストパートのみ(MIME復号化済み、 HTMLタグ等の除去あり、UTF-8に変換済み) uri ボディに記述されたURI rawbody ボディのテキストパートのみ(MIME復号化済み) full 生メッセージ全体(MIME復号化なし) ttp://www.emaillab.org/spamassassin/docs/plugin-OSC20061028.pdf ttp://stock.sharpdecimal com このスペースが無いuriに困りましたw 誰かSpamAssassinのマニュアルとかドキュメントのあるURLを教えてくれないか?! >>312 ttp://spamassassin.apache.org/ >>313 dクス でもできれば、もう少しこう・・・温かみのある場所を頼む! Docs ってあるだろ そこ見ろよ 温かみって具体的になんなんだよ >>315 まあそう責めるなよ docsが不親切なのは事実だし、普及の妨げ要因なわけだし。 >>312 何が解らないんだよ? >>315 そこにあるドキュメントだと、どーも理解が難しくてつらかったんだよ! >>316 単純にspamassassinで、どういう設定したらこーなるよ〜ってのを調べたかったんだ docsのMail::SpamAssassin::Conf を見ればある程度わかってきたから あとはぐぐってがんばってみるよ >>317 結局クグルしかw ググっても解らん事はここで質問すると、 後続ユーザーの為にもなるから良いんじゃね? ttp://tlec.linux.or.jp/docs/user_prefs こういう、実践的なコードを読みながらマニュアルとつけあわせした方が 近道じゃないか? >>319 そのマニュアルが解りにくいって何度言ったら(ry user_prefsは、>>310 のリンク先の文章程度のが無いと理解できないのでは? 鯖管はともかく、事務系の一般ユーザーが正規表現なんかは無理。 spamassassinでググると、日本SpamAssassinユーザ会がトップw 壁が高すぐwwwwwww ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる