連番のH画像/動画を一気にダウンロードする7.5 [無断転載禁止]©2ch.net

1名無しさん@お腹いっぱい。
垢版 |
2016/03/30(水) 03:44:30.41
■前スレ
連番のH画像/動画を一気にダウンロードする6
http://peace.2ch.net/test/read.cgi/unix/1349257148/

連番のH画像/動画を一気にダウンロードする7(途中落ち)
http://peace.2ch.net/test/read.cgi/unix/1443867437/
102名無しさん@お腹いっぱい。
垢版 |
2021/05/07(金) 19:43:03.42
GWもロスタイム。自分の能力ではデコードの糸口も見出せそうにないのでPASHは断念した。

今回Web漫画サイトを回って知ったのは、この手の行為に対して意外と大手漫画出版社のガードが
チープな事。ほぼノーガードですって場合も多い。「ウチの本業じゃない所にコストを掛けるより
この程度の解像度でよきゃ欲しい奴は持ってけ」方式なのか。

手間と言えるものを掛けたのはチマチマとブラウザのデバッグツールでJavascriptを追ったbinb系と
力技でスクランブルパターンの計算方を探した(簡単な方の)publus系。
後は思い出した時にでも海外掲示板でそのスジのツワモノ達の解析談義を検索するよ。

久々の連番スレはもう廃墟かと思いきや生存者が居てなにより。それでは良い終末を!
103名無しさん@お腹いっぱい。
垢版 |
2021/06/17(木) 14:23:47.54
csvファイルにURLが記録されている画像をダウンロードするには、何か良い方法はありますか?
1行の構成は次のような感じです

url1, url2, url3 ... 最大でurl10まで

これが複数行あります
2021/06/17(木) 14:27:34.70
あっと、wgetのhelpの中にありました(見落としてた)

wget --input-file=hoge.csv

ですね
105名無しさん@お腹いっぱい。
垢版 |
2021/06/17(木) 15:02:56.55
いや、wgetだと1ファイル/1行しかダメですね
カンマあるいはスペース区切りで複数URLが1行にあると、ダウンロードできない
csvファイルを列ごとに別ファイルにするのは最終手段にしたいので、
何か良い方法は無いでしょうか?
106名無しさん@お腹いっぱい。
垢版 |
2021/06/17(木) 15:16:39.25
csvファイルのカンマ区切りを、スペースに置換して保存しても、

wget -i hoge.csv

を実行するとスペースが%20でwgetに渡され、1つの繋がったURLと見なされてForbiddenになってしまう
2021/06/17(木) 15:24:02.47
そこはスペースではなく改行。

tr ',' '\012' | wget -i -

みたいな感じか。
2021/06/17(木) 16:40:36.87
おお、trなんてコマンドがあるのですね

cat hoge.csv | tr ',' '\012' | wget --input-file=-

で出来ました
ありがとうございます
2021/06/26(土) 08:27:42.18
穢れたcanvasを浄化する魔法はありますか?
2021/06/27(日) 02:40:24.51
ありますよ
2021/06/27(日) 08:57:31.08
呪文を教えて下さい
2021/06/27(日) 11:50:50.29
テクマクマヤコン、テクマクマヤコンと唱えて服を脱ぎます
2021/10/27(水) 07:10:55.28
ラミパスラミパスルルルルル
114名無しさん@お腹いっぱい。
垢版 |
NGNG?2BP(1000)

https://youtu.be/nxJLFh3Bbcs
115名無しさん@お腹いっぱい。
垢版 |
2021/10/30(土) 09:58:00.42
久しぶりの書き込みが、と思ったらなんのこっちゃ。

canvasは本体ドキュメントの場所と異なるドメインから持ってきたコンテンツを描画すると「穢れ」る訳で、
そうやって汚染されたcanvasからはデータを抜けなくなるよね。
まぁユーザーの手操作で「名前を付けてファイルに保存」する事は出来るんだけど

解決策の一つは代理Webサーバをローカルに立てて異なるドメインとのやり取りを仲介させ、
その際に自前のスクリプトを注入してドキュメント内のリンクを書き換えてしまうことで
ブラウザには同じドメインのコンテンツの様に見せかけて穢れは無いと誤解させること。
この仕組みを作っておけば、この板の趣旨的には結構便利。

もう一つ、二次元画像ならクロスドメインに厳しいブラウザなど使わずに自前で直に編集出力すること。
各種web漫画サイトなら自分はnode+sharpでふじこlp
2022/07/31(日) 17:30:10.67
テスト
2022/09/19(月) 12:31:27.63
ex-も変わってないな。
楽勝で落としまくれる。
118名無しさん@お腹いっぱい。
垢版 |
2022/09/20(火) 19:28:33.54
  (゚Д゚;)えっ
2022/09/28(水) 15:43:58.92
ヾ( ゚д゚)ノ゛
120名無しさん@お腹いっぱい。
垢版 |
2022/10/02(日) 14:29:47.09
( ゚ д ゚ ) ポカーン
121名無しさん@お腹いっぱい。
垢版 |
2022/10/07(金) 17:09:53.10
(`・ω・´)つ
122名無しさん@お腹いっぱい。
垢版 |
2022/10/08(土) 18:50:00.51
(´ω`)
2022/10/16(日) 17:36:11.45
(・∀・)
124名無しさん@お腹いっぱい。
垢版 |
2022/10/23(日) 11:28:16.19
(つω;`)
2022/10/27(木) 20:06:24.81
H画像じゃないけど誰かComicWalkerのAPI知らね?
ニコ静のofficials系とcontents/<ID>/episodes系
2022/10/28(金) 15:45:11.14
知ってる
2022/10/28(金) 16:50:56.00
サーバ共用してるComicWalkerとニコ静は画像取得表示部分は共通化できるんだけど
全部APIからJSON読んで完結できるニコ静に対して
HTML本文GETしてString.match()して〜の工程が頭悪そうで何とかしたいの
だって見るモノ無いとは言え同じ元ネタならスマートに共通化したいじゃん!

把握して使ってるのは今これだけ
/comicwalker-api.nicomanga.jp/api/v1/comicwalker/contents/<contentID>
/comicwalker-api.nicomanga.jp/api/v1/comicwalker/episodes/<episodeID>
/comicwalker-api.nicomanga.jp/api/v1/comicwalker/episodes/<episodeID>/frames
/comic-walker.com/v1/endbook?episode_id=<episodeID>

で、ニコ静の次の機能に相当するAPIを知りたいの
/api.nicomanga.jp/api/v1/app/manga/officials[/<deptID|directory>]
/api.nicomanga.jp/api/v1/app/manga/officials/<deptID>/contents[?offset=<from>&limit=<count>]
/api.nicomanga.jp/api/v1/app/manga/contents/<contentID>/episodes

知ってたら教えて♪ 知らなかったらおとといレスくれるとチョー嬉しいんだけど♡
2022/10/29(土) 17:21:28.41
教える
2022/10/29(土) 21:16:38.72
Node.js とwork_crawlerで落とせたけど

cd /work_crawler-master/comic.ja-JP/ && node ComicWalker "とある科学の心理掌握"

nico_seiga.js
ComicWalker.js

この人みたいに素直に2つ作れよw
2022/10/29(土) 21:44:26.66
いや自分のもnodejsで画像処理部以外は別々のプラグインで作ってそれはそれで機能してるのよ
でもコードが美しくないし、それにCWって再配信モノとかでごちゃごちゃして見にくいじゃん
それもあってニコ静しか見てなかったんだけど最近CWの方が更新日の早いヤツがあるって
気付いて、この際自分のコードを素敵にメンテしたいなって思ったのよ
2022/10/29(土) 22:01:02.90
あ、書いてて気が付いたけど閲覧したり落としたりする処理は綺麗なもんで不満はなく
そこに至るまでの更新作品とか公開話一覧とかをブラウズする用途のAPIの話ね
2022/10/29(土) 23:19:14.43
work_crawlerはelectronのguiでjson検索を作ってるみたい

とある科学の心理掌握 ComicWalker last_update 2022/10/05 第12話後編
2022/10/29(土) 23:47:28.19
建設的レス感謝

Gitでソースを見たけど残念ながら指定されたepisodeIDでframesを取るAPIしか使ってなかった
むしろCW的にAPIサーバのssl.seiga.nicovideo.jpは旧仕様なのでその内無くなっちゃうかも

自分のはEx含めて画像を連番で落とすだけのダウンローダーじゃなくて
ブラウザ経由で選択や閲覧できるようにするCORS回避プロキシっぽい機能を持ってるんですよ
そこに清濁混合で各サイト用に作ったプラグイン群が動的に刺さる感じ
サイトを直接表示しないんであの手この手のエロ動画とかポップアップは出ないし
公式サイトでも無用な広告画像や埋め込みツイートとか読まないので通信もエコ(自分回線細いんで)
特にアカウント持ってないニコ静は公式ページからじゃ閲覧できないのでこれ頼み
2022/10/30(日) 12:56:31.75
俺は自作でもdownload.txtを作って差分を取るぐらいしかやらないから
話が噛み合わないな

DATA : exhentai.org/g/2328720/23baa0b43e/
DATA : [虫無心] 奴隶-ボア・ハンコック (ワンピース) 20
DATA : END
DATA : exhentai.org/g/2328691/61dd1d0061/
DATA : ちえりさんは負けられない!3 -夫公認で誰の精子でも受精する変態便器 69
DATA : END
2022/10/30(日) 15:03:23.44
公式系漫画板の連中は「アレおもしれえコレ嫌い」しか頭にないし
不法系漫画板は「死んだ生き返った更新マダー」しか関心なさげなんで
久しぶりにここを思い出しスレチ承知で聞いてみた
連番スレとスレの皆々様には益々の御健勝と御多幸御活躍をお祈り申し上げる
136名無しさん@お腹いっぱい。
垢版 |
2022/11/16(水) 15:46:13.81
伴宙太
137名無しさん@お腹いっぱい。
垢版 |
2022/11/21(月) 12:17:05.69
(`・ω・´)つ
138名無しさん@お腹いっぱい。
垢版 |
2022/11/30(水) 15:59:25.30
(*´д`*)
139名無しさん@お腹いっぱい。
垢版 |
2022/12/11(日) 14:56:10.44
ヽ(´ー`)ノ
2022/12/11(日) 16:34:35.24
今日はシュワルツ変換を覚えました^^

my @tmp; for(@fields){push @tmp, [$_, $_->[9]];}
@tmp = sort {$a->[1] <=> $b->[1]} @tmp;
my @fields2; for(@tmp){push @fields2, $_->[0];}
2022/12/11(日) 16:41:30.99
# シュワルツ変換
my @fields3 =
map $_->[0],
sort { $a->[1] <=> $b->[1] }
map [ $_, $_->[9] ],
@fields;
142名無しさん@お腹いっぱい。
垢版 |
2022/12/18(日) 15:58:36.81
ヾ( ゚д゚)ノ゛
143名無しさん@お腹いっぱい。
垢版 |
2022/12/22(木) 16:01:52.05
( ´д)ヒソ(´д`)ヒソ(д` )
2022/12/22(木) 16:25:57.57
今日はYAML::Dumperを覚えました^^
use v5.34;
use utf8;

use Encode qw/encode decode/;
sub de { decode("shiftjis", shift) } sub en { encode("shiftjis", shift) }
sub de8 { decode("utf8", shift) } sub en8 { encode("utf8", shift) }
use open IO => qw/:utf8 :std/;
use JSON;
use YAML::Dumper;
my $yaml = YAML::Dumper->new(); $yaml->indent_width(4);
use WWW::Mechanize;
my $mech = WWW::Mechanize->new();
$mech->agent_alias('Windows Mozilla');
$mech->get(${url});
my $content = de8($mech->content);

my $json1 = from_json($content);
my $json_text = to_json( $json1 );
my @arr = split(/,/, $json_text, -1);

print $yaml->dump( \$json1 );
145名無しさん@お腹いっぱい。
垢版 |
2022/12/24(土) 20:29:48.40
(´-`)(´_`)
146名無しさん@お腹いっぱい。
垢版 |
2022/12/28(水) 11:25:14.08
༼´・д・`༽
2023/01/01(日) 13:14:44.32
    ∩
    _( ⌒)     ∩__
  //,. ノ ̄\   / .)E)
 /i"/ /|_|i_トil_| / /      / ̄ ̄ ̄ ̄ ̄
 |ii.l/ /┃ ┃{. / /     < あけおめ
 |i|i_/''' ヮ''丿i_/       \_____
 i|/ ,ク ム"/ /
 |(  ヽ _,.-===、j、
 ゞヽ‐イ/´   ヽ ヽ、
   \!   ::c:: !  :p
     }ヽ __ ノ、_ノ
   /    ノ ノ´
148名無しさん@お腹いっぱい。
垢版 |
2023/01/04(水) 14:14:25.46
(*´д`*)
2023/01/04(水) 15:39:05.82
今日はif文のかわりにハッシュを使うを覚えました^^

sub image_format_check {
use Image::ExifTool qw(:Public);

my $checkfile = shift;
my $info = ImageInfo($checkfile);

my $FileName = $info->{'FileName'};
my $FileType = $info->{'FileType'};
#my $MIME = $info->{'MIMEType'};
my $Date = $info->{'DateTimeOriginal'};
my $error = $info->{'Error'};

my %handler1 = (
"JPEG" => "jpg",
"WEBP" => "webp",
"PNG" => "png",
"BMP" => "bmp",
"GIF" => "gif",
"ZIP" => "zip",
);
#----- 画像の種類の判定 ここから
my $checkdata = $handler1{"$FileType"} // "bin";
$checkdata eq "bin" and $error = ":error bin";
$FileType =~ /TXT/ and $error = ":error txt";

return ($checkdata, $error, $FileName);
}
2023/01/07(土) 18:15:07.19
ヽ(´ー`)ノ
151名無しさん@お腹いっぱい。
垢版 |
2023/01/14(土) 18:22:30.18
(つω;`)
152名無しさん@お腹いっぱい。
垢版 |
2023/01/18(水) 12:04:29.40
(*`ω´)y━
153名無しさん@お腹いっぱい。
垢版 |
2023/01/21(土) 20:29:35.54
(^ ω ^)
2023/01/25(水) 17:34:25.03
(´ー`)y─┛~~
155名無しさん@お腹いっぱい。
垢版 |
2023/01/28(土) 20:31:33.10
(^ ω ^)
156名無しさん@お腹いっぱい。
垢版 |
2023/01/29(日) 15:46:39.54
(」・ω・)」うー!(/・ω・)/にゃー!
157名無しさん@お腹いっぱい。
垢版 |
2023/01/30(月) 15:13:31.77
( ´д)ヒソ(´д`)ヒソ(д` )
158名無しさん@お腹いっぱい。
垢版 |
2023/02/01(水) 14:00:17.12
(*^_^*)
159名無しさん@お腹いっぱい。
垢版 |
2023/02/04(土) 20:01:04.08
(・∀・)ゞ 
160名無しさん@お腹いっぱい。
垢版 |
2023/02/05(日) 15:11:18.55
༼´・д・`༽
161名無しさん@お腹いっぱい。
垢版 |
2023/02/08(水) 11:56:57.02
(´-`)(´_`)
162名無しさん@お腹いっぱい。
垢版 |
2023/02/11(土) 17:27:56.02
(;´Д`)ハァハァ
163名無しさん@お腹いっぱい。
垢版 |
2023/02/12(日) 12:27:19.54
( ´д)ヒソ(´д`)ヒソ(д` )
2023/02/15(水) 12:38:29.11
J( 'ー`)し
165名無しさん@お腹いっぱい。
垢版 |
2023/02/18(土) 20:02:32.29
(^Д^)
166名無しさん@お腹いっぱい。
垢版 |
2023/02/19(日) 12:26:51.90
\(^o^)/
2023/02/20(月) 10:42:48.52
(=゚ω゚)y━・~~~
168名無しさん@お腹いっぱい。
垢版 |
2023/02/23(木) 12:19:56.89
(´ω`)
169名無しさん@お腹いっぱい。
垢版 |
2023/02/25(土) 17:12:46.77
( ´O)η ファ~
170名無しさん@お腹いっぱい。
垢版 |
2023/02/26(日) 11:10:48.24
ヽ(´ー`)ノ
171名無しさん@お腹いっぱい。
垢版 |
2023/03/02(木) 11:19:21.72
(´-`)(´_`)
172名無しさん@お腹いっぱい。
垢版 |
2023/03/04(土) 19:11:10.44
(・∀・)ゞ 
173名無しさん@お腹いっぱい。
垢版 |
2023/03/05(日) 12:03:27.89
('A`)
174名無しさん@お腹いっぱい。
垢版 |
2023/03/08(水) 11:08:20.90
(*^_^*)
175名無しさん@お腹いっぱい。
垢版 |
2023/03/11(土) 17:28:23.89
。゜(゚´Д`゚)゜。
176名無しさん@お腹いっぱい。
垢版 |
2023/03/12(日) 12:06:55.17
  (゚Д゚;)えっ
177名無しさん@お腹いっぱい。
垢版 |
2023/03/13(月) 11:29:12.84
(`・ω・´)つ
178名無しさん@お腹いっぱい。
垢版 |
2023/03/16(木) 11:45:46.77
(=゚ω゚)y━・~~~
179名無しさん@お腹いっぱい。
垢版 |
2023/03/18(土) 17:14:59.87
(´・_・`)
180名無しさん@お腹いっぱい。
垢版 |
2023/03/19(日) 10:57:05.45
_(:3 」∠ )_
181名無しさん@お腹いっぱい。
垢版 |
2023/03/20(月) 11:26:20.70
( ゚ д ゚ ) ポカーン
182名無しさん@お腹いっぱい。
垢版 |
2023/03/21(火) 15:42:15.75
ヽ(`Д´)ノ ウワァン
183名無しさん@お腹いっぱい。
垢版 |
2023/03/23(木) 10:58:26.27
༼´・д・`༽
184名無しさん@お腹いっぱい。
垢版 |
2023/03/25(土) 16:54:43.21
(´-`)(´_`)
185名無しさん@お腹いっぱい。
垢版 |
2023/03/26(日) 13:03:57.93
ヽ(´▽`)/
2023/03/27(月) 11:25:50.56
ヽ(´ー`)ノ
187名無しさん@お腹いっぱい。
垢版 |
2023/04/01(土) 16:32:14.40
<(_ _)>
188名無しさん@お腹いっぱい。
垢版 |
2023/04/02(日) 11:01:30.81
( ´д)ヒソ(´д`)ヒソ(д` )
189名無しさん@お腹いっぱい。
垢版 |
2023/04/06(木) 12:07:05.20
(>_<)
190名無しさん@お腹いっぱい。
垢版 |
2023/04/07(金) 10:56:14.49
(^Д^)
191名無しさん@お腹いっぱい。
垢版 |
2023/04/09(日) 12:19:21.11
(・o・)
192名無しさん@お腹いっぱい。
垢版 |
2023/04/12(水) 10:36:07.80
(´ー`)y─┛~~
193名無しさん@お腹いっぱい。
垢版 |
2023/04/13(木) 11:22:40.84
(・∀・)ゞ 
194名無しさん@お腹いっぱい。
垢版 |
2023/04/15(土) 16:20:39.20
(;´Д`)ハァハァ
195名無しさん@お腹いっぱい。
垢版 |
2023/04/16(日) 10:53:34.20
(;^ω^)
196名無しさん@お腹いっぱい。
垢版 |
2023/04/17(月) 11:00:49.94
|д゚)
197名無しさん@お腹いっぱい。
垢版 |
2023/04/19(水) 09:47:04.24
( ´ー`)y-ด็็็็็้้้้้็็็็้้้้้็็็็็้้้้้็็็็็้้้้้็็็็
198名無しさん@お腹いっぱい。
垢版 |
2023/04/22(土) 16:23:52.75
(((((((((((っ・ω・)っ ブーン
199名無しさん@お腹いっぱい。
垢版 |
2023/04/23(日) 11:36:02.09
(*´・ω・)(・ω・`*)ネー
200名無しさん@お腹いっぱい。
垢版 |
2023/04/24(月) 11:09:10.16
(* ´3`)
201名無しさん@お腹いっぱい。
垢版 |
2023/04/26(水) 10:13:01.81
(´゚'ω゚`)ショボーン
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況