2ちゃんねるに貼ってある画像リンクを追い、
jpgをかき集めるスクリプトを作ってみました。
http://www.ninnin.net/
※perlとwgetが必要です。
※Windows,Macでは動きません。
探検
2ちゃん画像落としまくりスクリプト
11
NGNGNGNG
windows で perl も wget も動くはずだが。
31
NGNG fork 使ってるからActive perlでは動かないのですよ。
cygwin上なら動くかも(ためしてないけど)
cygwin上なら動くかも(ためしてないけど)
41
NGNG 追記:
MacOS Xなら動きますよ
(10.1ならwgetを入れなきゃだめだけど)
MacOS Xなら動きますよ
(10.1ならwgetを入れなきゃだめだけど)
5名無しさん@お腹いっぱい。
NGNG グロ画像コワイヨ(;´д`)
61
NGNG 例えばモー娘板で
一回スクリプトを実行すると
約800枚の画像が収集できます。
一回スクリプトを実行すると
約800枚の画像が収集できます。
NGNG
UNIX板的にはどうかと思うがサンクス1
NGNG
Σ(゚д゚lll)ガーン
アイドル画像板でやったら最初の画像が葉っぱ隊だった
しかも何かループしてて同じ画像だけ取ってるっぽい。
42枚しか収集できなかった。
アイドル画像板でやったら最初の画像が葉っぱ隊だった
しかも何かループしてて同じ画像だけ取ってるっぽい。
42枚しか収集できなかった。
9UNIX すごい。
NGNG MacOS X ですがやってみました。
こんなこともできるんですね。目からウロコです。
中にはとても重たいサーバーがあるので、可能であれば
タイムアウトのパラメータも追加されるとうれしいです。
(30秒以上反応が無かったらスキップして次、など)
perl スクリプトとか詳しくないのに勝手言っちゃってすいません。
こんなこともできるんですね。目からウロコです。
中にはとても重たいサーバーがあるので、可能であれば
タイムアウトのパラメータも追加されるとうれしいです。
(30秒以上反応が無かったらスキップして次、など)
perl スクリプトとか詳しくないのに勝手言っちゃってすいません。
NGNG
cygwinのperlでも動いた。
ただ $down デフォルトは、せめて2くらいに
しておいた方が良くないかい? もしくは固定とか。
サーバに申し訳なくて5は指定出来ん。
ただ $down デフォルトは、せめて2くらいに
しておいた方が良くないかい? もしくは固定とか。
サーバに申し訳なくて5は指定出来ん。
NGNG
mpegも落としたいが....
醤油みたけど直すのメンドイな
醤油みたけど直すのメンドイな
NGNG
こういうのは自分で書いた方が良さげ。
131
NGNG14名無しさん@お腹いっぱい。
NGNG ガ━━(゚Д゚;)━━ソ!
よろこびいさんで半角板いったらなんもなかった
よろこびいさんで半角板いったらなんもなかった
NGNG
おおお、すごいね。ガンガン落とせるよ。でも鯖の負荷がすごそう
なのでsage進行の方が良いかな…。
ところで、これで落とした画像を閲覧するスクリプトとか、
どうやって作るんだろう? 手動でeeで見てるんだけど、再帰的に
.jpgファイルを見るスプリプト?とかありそうなんですが。
なのでsage進行の方が良いかな…。
ところで、これで落とした画像を閲覧するスクリプトとか、
どうやって作るんだろう? 手動でeeで見てるんだけど、再帰的に
.jpgファイルを見るスプリプト?とかありそうなんですが。
16名無しさん@XEmacs
NGNG やっぱ wget を fork して…ってのはみんな書くのね(笑)
ウチの環境だと wget は 2 個くらい fork するのが一番
効率が良かったかなぁ。
# fork しすぎると timeout して、
# まともに取れなかったりして…
>15
find ./ -name '*.jpg' -exec display \{\} \;
とか?
XEmacs の dired も、よく使いますけど。。。
ウチの環境だと wget は 2 個くらい fork するのが一番
効率が良かったかなぁ。
# fork しすぎると timeout して、
# まともに取れなかったりして…
>15
find ./ -name '*.jpg' -exec display \{\} \;
とか?
XEmacs の dired も、よく使いますけど。。。
NGNG
迷惑画像URLリストとか、どこかにないでしょうか。
フィルタリングしたいですよね。
フィルタリングしたいですよね。
NGNG
find ./ -name '*.jpg' |xargs ElectoricEyes
NGNG
半角板のDATってどこにあるす? つーか何もないのはおかしいよね。
NGNG
>>15
スクリプトじゃないけどgqviewとかpicviewとかじゃだめなん?
スクリプトじゃないけどgqviewとかpicviewとかじゃだめなん?
21124
NGNG こんなことができるのは常時接続の人たちですか?
23名無しさん@お腹いっぱい。
NGNG24名無しさん@お腹いっぱい。
NGNGhttp://とか
ttp://
みたいにあえてコピペ用になってる物も
落とせる?
25名無しさん@お腹いっぱい。
NGNG261
NGNG271
NGNG28名無しさん@XEmacs
NGNG 半角っていえば、天使とか鳥とかの半角用語?を含むURLをサポートしたスクリ
プト書いた人居る?漏れは諦めた(w
これ、できたら結構凄いよな…
プト書いた人居る?漏れは諦めた(w
これ、できたら結構凄いよな…
NGNG
>>28
同意。ぜひ1にはがんばってもらいたい。
同意。ぜひ1にはがんばってもらいたい。
30名無しさん@Vi
NGNG たしかに画像フィルタは便利かもしれませんが、
個人的にはこのスクリプトは画像をダイジェストできることに
特化して欲しいです。
できれば追加して欲しい機能
1.URL は違うけどファイル名が同じ場合のファイル処理
2. キーワードを追加( tp:// とか http:// など)
3.スレッドのスキップ(先頭から50個目のスレッドから開始など)
4. いっそのこと MPEG ファイルも対象に。
スレッドのスキップはスクリプトに追加して作ってみました。
もし希望があれば送ります。>1
個人的にはこのスクリプトは画像をダイジェストできることに
特化して欲しいです。
できれば追加して欲しい機能
1.URL は違うけどファイル名が同じ場合のファイル処理
2. キーワードを追加( tp:// とか http:// など)
3.スレッドのスキップ(先頭から50個目のスレッドから開始など)
4. いっそのこと MPEG ファイルも対象に。
スレッドのスキップはスクリプトに追加して作ってみました。
もし希望があれば送ります。>1
NGNG
スレをどこまで読んだか記憶して、次回はそれ以降だけを読むとか、
落としたファイルのアドレスを記録しておいてそのファイルは二度と落とさないとか
そういう機能がないと、毎日同じファイルをダウンしてきてしまうと思うのですが
どうよ?
落としたファイルのアドレスを記録しておいてそのファイルは二度と落とさないとか
そういう機能がないと、毎日同じファイルをダウンしてきてしまうと思うのですが
どうよ?
321
NGNG33名無しさん@お腹いっぱい。
NGNG コレ使うとスレの荒れ度がわかるね
荒れてるスレは死体画像多い。
あとなぜかペットの画像も多いNE!
荒れてるスレは死体画像多い。
あとなぜかペットの画像も多いNE!
34名無しさん@お腹いっぱい。
NGNG wgetでいいじゃん。
35名無しさん@お腹いっぱい。
NGNGNGNG
OSXにwget入れるのに小1時間かかりました。
でも成功、すごいぞUNIX、ありがとう>1
でも成功、すごいぞUNIX、ありがとう>1
NGNG
>32
そっか、俺は落としてきたファイルを
別ディレクトリに移動して整理していたんだが、
そうすると、また同じやつを落としてきてしまうんだな。
死体画像とかも残しておかないと、
また同じ死体画像を落としてきてしまうのだな。
そっか、俺は落としてきたファイルを
別ディレクトリに移動して整理していたんだが、
そうすると、また同じやつを落としてきてしまうんだな。
死体画像とかも残しておかないと、
また同じ死体画像を落としてきてしまうのだな。
38名無しさん@お腹いっぱい。
NGNG >>28 その辺の隠語は限られているから、単純置換じゃダメかな…
391
NGNG40名無しさん@XEmacs
NGNG >38
単純置換は無理っぽいですね。隠語はちょこちょこ増えてるみたいですし、
URLは省略されたりクイズで記述されたりもするので(w
単純置換は無理っぽいですね。隠語はちょこちょこ増えてるみたいですし、
URLは省略されたりクイズで記述されたりもするので(w
NGNG
おいおいおいおいおい、2ch内とはいえ下手なスパイダー
動かすのはやめてくれ。転送量も鯖の負荷も増える。
やりたいやつは公開なんかしないで、自分で作ってひっそりと
やってくれ。
動かすのはやめてくれ。転送量も鯖の負荷も増える。
やりたいやつは公開なんかしないで、自分で作ってひっそりと
やってくれ。
42名無しさん@お腹いっぱい。
NGNG >>41
すいてる時間帯でもダメ?
すいてる時間帯でもダメ?
NGNG
>>42
まず、datファイルをgetして、それを元にすればよいかと思われ。
まず、datファイルをgetして、それを元にすればよいかと思われ。
44名無しさん@お腹いっぱい。
NGNG MacOSXの人って結構いるんだなぁ。
そういう漏れも。
そういう漏れも。
45名無しさん@お腹いっぱい。
NGNGNGNG
>>44-46
スレ違い。
スレ違い。
48名無しさん@お腹いっぱい。
NGNG 同名のファイルがあった場合、ファイルサイズを調べて一致しなかったら
後ろに_01とか付けて保存するのは出来ませんか?
後ろに_01とか付けて保存するのは出来ませんか?
491
NGNG >>48
できます。
その方法も考えたのですが、結局やりませんでした。
いらないかな?と思って。
同じような要望が多ければ導入を検討します。
wgetのオプションの中にそんな機能があった気がしますので、
ご自分で改造してみてはいかがでしょう。
$optionsにオプションを突っ込んでwget実行サブルーチンを
呼んでるだけですので。
できます。
その方法も考えたのですが、結局やりませんでした。
いらないかな?と思って。
同じような要望が多ければ導入を検討します。
wgetのオプションの中にそんな機能があった気がしますので、
ご自分で改造してみてはいかがでしょう。
$optionsにオプションを突っ込んでwget実行サブルーチンを
呼んでるだけですので。
50名無しさん@お腹いっぱい。
NGNG 試しにやってみたけどいい感じだぁよ、ありがとう。>1
要望とか考えると結局Iria先生みたくなるんだろうけど期待しちゃうよ。
なにってcronで動かしておけるから昼間だけの時限モノとか拾える可能性
あるってだけでピンコたんピキーンなれるし。
ただこの板でやるなら負荷、転送量減らしは最初に考慮する必要あるかと。
引っ越し間際のスレなんて生データで300kb以上になるのを毎回引っ張る
のはやはり問題だと思うので、ツモって来たdat fileはローカルに保存して
再利用する方向で進めてはどうか。
同名異URI処理は取り敢えず後にしないと、考え無し厨房が全開で走らせる
と思われ。
要望とか考えると結局Iria先生みたくなるんだろうけど期待しちゃうよ。
なにってcronで動かしておけるから昼間だけの時限モノとか拾える可能性
あるってだけでピンコたんピキーンなれるし。
ただこの板でやるなら負荷、転送量減らしは最初に考慮する必要あるかと。
引っ越し間際のスレなんて生データで300kb以上になるのを毎回引っ張る
のはやはり問題だと思うので、ツモって来たdat fileはローカルに保存して
再利用する方向で進めてはどうか。
同名異URI処理は取り敢えず後にしないと、考え無し厨房が全開で走らせる
と思われ。
NGNG
ねぇねぇ、これからもいじる気ある?>1
マジでcronで走らせてグロ画像getterになろうと思うだけどいぢっていい?
perl なんてしばらくいじってないから思い出すとこからはじめるけど。
マジでcronで走らせてグロ画像getterになろうと思うだけどいぢっていい?
perl なんてしばらくいじってないから思い出すとこからはじめるけど。
NGNG
途中で切れちゃう画像とかあるんですが、どこをいじればいいですか?
$limit = 3
$down = 2
で使ってますが。
$limit = 3
$down = 2
で使ってますが。
531
NGNG >>50
datのタイムスタンプをチェックして再利用するようにしようかなぁ
ご意見ありがとう。転送量軽減を目指します。
>>51
ぜひいぢってください
>>52
117行目のwgetのオプション設定で調整できると思います。
-t や -w の値を調整すると良いかも。参考ページはこちらあたりをどうぞ
http://seagull.cs.uec.ac.jp/~horiuc-m/wget.html
datのタイムスタンプをチェックして再利用するようにしようかなぁ
ご意見ありがとう。転送量軽減を目指します。
>>51
ぜひいぢってください
>>52
117行目のwgetのオプション設定で調整できると思います。
-t や -w の値を調整すると良いかも。参考ページはこちらあたりをどうぞ
http://seagull.cs.uec.ac.jp/~horiuc-m/wget.html
NGNG
自分でSocket開いてRange: bytesヘッダとか使ってくれ。
つーかこういうもんはまともになってから公開してくれ
つーかこういうもんはまともになってから公開してくれ
55名無しさん@お腹いっぱい。
NGNG FreeBSDでこのソフト使いました。
jpg/以下にたくさんのファイルがきましたが、
この中から、最適なファイルを絞り込むのはむづかしいですね。
タグ情報等から、分類できないのかなあ?
もしくわ、winみたいに、一つ一つのファイルを簡単に表示
できたらまだいいかも。(サムネーム表示?)
今gimp使って、いっこいっこ開いてるけど、
もっと楽にファイル情報しらべれないかな?
jpg/以下にたくさんのファイルがきましたが、
この中から、最適なファイルを絞り込むのはむづかしいですね。
タグ情報等から、分類できないのかなあ?
もしくわ、winみたいに、一つ一つのファイルを簡単に表示
できたらまだいいかも。(サムネーム表示?)
今gimp使って、いっこいっこ開いてるけど、
もっと楽にファイル情報しらべれないかな?
56名無しさん@お腹いっぱい。
NGNG 今のままじゃ、ファイル名による絞り込み
しかできないよ。
しかできないよ。
NGNG
・・・ここは本当にUNIX板なのか・・・鬱
レスを投稿する
ニュース
- ■緊急地震速報 熊本など [人気者★]
- 性売買「買う側」処罰化と同時に「売る側は処罰せず、支援の対象に」Colabo主催の集会にて [パンナ・コッタ★]
- 相次ぐ中国公演中止に、シンガーソングライターらが続々高市首相に怒り表明「隣国の仲間たちに対して申し訳ない」 [muffin★]
- 【足立区ひき逃げ事故】意識不明の20代女性が死亡 死者2人に [Ailuropoda melanoleuca★]
- NHKの災害情報、閲覧に「ユーザー登録必要」で批判の声多数 [少考さん★]
- とろサーモン・久保田「後輩や演者からも評判が悪すぎる」大物MCに意見 「世間が思ってる人間とは真逆」と思い爆発 [muffin★]
- ほんこん さん「安全保障やセキュリティクリアランスに疎い方には国家は任せれません。やはり選挙がいかに大事か!」久々に自分で語る [201193242]
- しじみ [546716239]
- 【悲報】NHK党が消滅!立花孝志が齊藤健一郎議員の離党を承認 [977790669]
- 大地震 [904880432]
- 大震災
- 【安倍晋三】山上徹也は暴力を使った。お前らはそれを認め許すの? [201193242]
