Internet Archive総合 (web.archive.org) #2 ©2ch.net

 
 前スレッド

Internet Archive総合 (web.archive.org) #1
http://echo.2ch.net/test/read.cgi/esite/1189771222/
 

195名無しさん@お腹いっぱい。2017/10/21(土) 14:00:43.25
/脱落に因む404大杉

196名無しさん@お腹いっぱい。2017/10/23(月) 14:40:32.65
去年冬ごろ取得したのは"/"が勝手に加えられての404が多かった

197名無しさん@お腹いっぱい。2017/10/24(火) 01:09:43.67
なんやそれ

198名無しさん@お腹いっぱい。2017/10/26(木) 00:50:42.39
悪いひとたちがやって来て
みんなを殺した

理由なんて簡単さ
そこに弱いひとたちがいたから

女達は犯され
老人と子供は燃やされた

悪いひとたちはその土地に
家を建てて子供を生んだ

そして街ができ
悪いひとたちの子孫は増え続けた


朝鮮進駐軍 関東大震災 日本人大虐殺
https://goo.gl/FTqHJ1
https://goo.gl/1ntWvZ
https://youtu.be/D0vgxFC04JQ
https://goo.gl/h1o4eV
https://www.youtube.com/watch?v=sYsrzIjKJBc

199名無しさん@お腹いっぱい。2017/10/30(月) 09:15:18.95
ページ自体が表示されないが、今はどういう状況? メンテ中?

200名無しさん@お腹いっぱい。2017/11/01(水) 22:03:58.93
Wayback Exception
An unknown exception has occurred. Unexpected Error

こればっか

201名無しさん@お腹いっぱい。2017/11/24(金) 13:46:14.14
アーカイヴされたことないページへのリンク踏んだら
久々に404にならず"Save this url in the Wayback Machine"が現れてクリック取得ができた
これ常時できてたのって夏休み前だったから感動すら覚える

202名無しさん@お腹いっぱい。2017/11/24(金) 22:36:52.60
うむ、

203名無しさん@お腹いっぱい。2017/11/24(金) 22:51:45.43
>>201
夏休みかぁ。若いって良いなぁ。

204名無しさん@お腹いっぱい。2017/12/12(火) 17:05:40.69
サイトで友達が稼げるようになった情報とか
⇒ http://rprpe093w.sblo.jp/article/181823411.html

興味がある人だけ見てください。

SOF53Y4MWW

205名無しさん@お腹いっぱい。2017/12/15(金) 14:46:48.96
さて

206名無しさん@お腹いっぱい。2017/12/17(日) 18:45:14.54
ちくしょ完全にダウンしやがった、、

207名無しさん@お腹いっぱい。2017/12/17(日) 18:55:40.85
2h前にあった現地の停電の影響
さすがに回避不能だしイラついてもしょうがない
大人しく復旧を待とう

208名無しさん@お腹いっぱい。2017/12/19(火) 19:03:04.11
今日も調子悪いね

209名無しさん@お腹いっぱい。2017/12/19(火) 19:31:07.30
日常な気がしてきた

210名無しさん@お腹いっぱい。2017/12/19(火) 20:14:35.23
あーーーー何か来たぞーーーー

211名無しさん@お腹いっぱい。2018/01/01(月) 15:04:20.22
新年早々だめだこりゃ

212名無しさん@お腹いっぱい。2018/01/04(木) 15:44:23.36
>>211
取得しようとしたら、一旦反応はあるものの、
なぜか取得する前段階の画面に戻ってしまっていたな。

結局、1月1日は終始そんな状態だったが、
1日中使えなかったのはあまりに痛すぎる。

213名無しさん@お腹いっぱい。2018/01/04(木) 20:29:56.52
去年10月の第一週に取得しといたのが半分ぐらい駄目になってる
重要だと思うページは取れてるか確認してみたほうがいい

214名無しさん@お腹いっぱい。2018/01/04(木) 21:15:03.46
>>213
2015 年よりスクリプトで毎日一回ずつ保存させているものがあるんだけど、
昨年 10 月は第一週に限らずポツポツと抜けている。
URL は公開したくないのでスクショでご勘弁。
ttp://i.imgur.com/4qDvnsI.png
ttp://i.imgur.com/l0lfBpa.png
ttp://i.imgur.com/ZKixGUA.png

215名無しさん@お腹いっぱい。2018/01/04(木) 21:24:36.49
4月29日何があった

216名無しさん@お腹いっぱい。2018/01/04(木) 21:58:08.32
>>214
スクリプトってどんな感じの?参考にしたいからやり方教えて下さいm(__)m

2172142018/01/04(木) 22:01:04.72
>>215
403 ページが繰り返し記録されているので Internet Archive の問題ではない。

ちなみにスクリプトは /save/ にリクエストを投げてから、リダイレクトを処理して
最終的に 200 番か 504 番の応答が返ってくれば保存できたと判断、
それ以外なら計 10 回まで試行するように組んである。
ログは取っていないので、保存できなかった日にどういう応答が
返ってきていたのかは判らない。

218名無しさん@お腹いっぱい。2018/01/04(木) 22:59:58.51
10月散々だな・・・ここのログ読んでも9月末から10月までは大分やばそうな感じだし、見直してみるか

219名無しさん@お腹いっぱい。2018/01/04(木) 23:15:25.28
>>214
スクリプトを作成する技術があるのなら、アーカイブするよりも
そのページを直接ハードディスクにhtml(またはmhtml)で保存
するほうが確実ではないのか?

2202142018/01/05(金) 03:49:29.13
以下長文失礼。

>>219
いわゆる「証拠保全」の目的で、ブログなどを保存させることもあるでしょう・・・。

>>216
こちらでは Windows Scripting Host 用のスクリプトを JScript で書き、
それを Windows のタスクスケジューラで実行させている。
以下、Internet Archive へ仕掛けるアクセスの内容と、HTTP の応答コードの扱いについて簡単に。

1) 保存させたい URL の前に https://web.archive.org/save/ を付けて、
その URL 向けに HEAD リクエストを投げさせる。
2) 300 番台の応答 (リダイレクト) が返って来た場合、順次追跡して HEAD リクエストを投げさせる。
これは、使用する API によっては特に記述せずとも勝手にやってくれる。
3) 最終的に 200 番の応答が返ってくれば、たぶん保存できている。

保存成否は HTTP の応答コードだけでほぼ判定できる。
コンテントボディは不要なので HEAD メソッドを使っているが、
HEAD を扱えない環境なら GET メソッドでも問題無い。

数百メガバイトの巨大ファイルを保存させようとした場合など、
オリジンサーバから Internet Archive への転送に時間が掛かってしまうと
途中でタイムアウトとなり、504 番の応答が返ってきてしまう。
スクリプトを汎用とする (URL を別途パラメータとして与える) のであれば、
これも一応「保存できた」として扱った方が無難。
504 でも保存がキャンセルされる訳では無いようで、
これをエラーとして扱い再試行させてしまったがために
巨大ファイルを短い間隔で重複して保存させてしまったことがある。

2212162018/01/05(金) 20:15:59.49
>>220
ご丁寧にご解説ありがとうございましたm(__)m

定期保存の方法は大体理解できたのですが
当方JScriptに詳しくないのでスクリプトの具体的な書き方がわかりません(ノД`)・゜・。

ご無理は承知しておりますが
Pastebin.comなどにスクリプトのサンプルを貼って頂けると有り難いのですが・・・
ぜひとも後学の為によろしくお願い致します。(o_ _)o))

222名無しさん@お腹いっぱい。2018/01/05(金) 21:16:22.82
スレ違い
しかも今どきm(__)m (ノД`)・゜・。 (o_ _)o))の顔文字
キモいキモすぎる

223名無しさん@お腹いっぱい。2018/01/06(土) 15:47:30.36
専門板って時間の流れが違う人多いよね

224名無しさん@お腹いっぱい。2018/01/06(土) 17:38:17.30
時間の流れ方は人それぞれだし、顔文字とか個性があるのは別にいいんじゃない
Internet Archiveに関するスクリプトなら満更スレ違いとも言えないだろうし
Pastebin指定している所見ると、極力スレに迷惑かからないように考慮しているみたいだし
大体このスレ、1年過ぎても1スレの1/5くらいも消費してないくらい話題ないんだから
多少のスレ違いは問題ないっしょ

225名無しさん@お腹いっぱい。2018/01/06(土) 19:40:14.08
>スクリプトの具体的な書き方がわかりません(ノД`)・゜・。

から判るのは"参考"までに問うてみるなんてレベルには
背伸びしても達しない現状を隠しつつ>>216を書き
レスが来たと見るやベース丸コピの勢いで乞食メンタリティを現す
呆れた自己中クレクレ厨という事実

2262162018/01/06(土) 22:55:52.85
私のせいでスレが荒れてしまってすみません(>_<)
すべて無知で乞食で心が貧しかった私のせいです。。。
気分を害された方々、本当に申し訳ありませんでしたm(__)m

227名無しさん@お腹いっぱい。2018/01/09(火) 16:59:38.81
>>223

ひとくちに専門板といっても
この板とシャワートイレ板や文房具板では雰囲気がまったく違う。

228名無しさん@お腹いっぱい。2018/01/12(金) 11:17:09.62
懐かしいこの使い心地

229名無しさん@お腹いっぱい。2018/01/12(金) 22:39:58.08
今さっきからメンテナンスに入った
今日は夕方あたりから「503」乱発だったから仕方ないか…

というか昨日・一昨日あたり消えてるっぽいものもあるのだが

230名無しさん@お腹いっぱい。2018/01/13(土) 08:11:09.82
てか1月10日及び11日の分
やっぱり消えてるわ

231名無しさん@お腹いっぱい。2018/01/13(土) 08:32:56.05
ありゃりゃ

232名無しさん@お腹いっぱい。2018/02/27(火) 05:25:01.33
過去に取得されてるURLを現在の表示内容に更新する為に再度保存するにはどこのボタンを押せばいいんですか?

233名無しさん@お腹いっぱい。2018/02/27(火) 05:28:59.49
>>232
そんなボタンはありません。

234名無しさん@お腹いっぱい。2018/02/27(火) 08:43:21.75
☆ 日本の、改憲を行いましょう。現在、衆議員と参議院の
両院で、改憲議員が3分の2を超えております。
『憲法改正国民投票法』、でググってみてください。国会の発議は
すでに可能です。平和は勝ち取るものです。お願い致します。☆☆

235名無しさん@お腹いっぱい。2018/02/27(火) 20:45:30.03
>>232
https://web.archive.org/ の【 Save Page Now 】セクションに
URL入力欄とボタンがあるじゃろ

Capture a web page as it appears now for use as a trusted citation in the future.

236名無しさん@お腹いっぱい。2018/03/02(金) 07:42:32.15
>>235
御礼が遅れましたがありがとうございました
貴方良い人だ

237名無しさん@お腹いっぱい。2018/03/03(土) 14:40:00.74
取得歴0のページを新たにセーブしても"2 captures"になるのって何なんだろ

238名無しさん@お腹いっぱい。2018/03/05(月) 18:14:49.67
去年保存されてしばらくは完全に保存されてたページが
いつの間にかそのページの画像の大半が失われてた

239名無しさん@お腹いっぱい。2018/03/07(水) 22:29:59.08
This URL has been excluded from the Wayback Machine.
なサイトが復活した事例ってある?
BIGLOBEの例とか見るに必ずしも運営者が手を回したわけじゃないようだし、問い合わせたら復活したりするんじゃないかと思ったんだが

240名無しさん@お腹いっぱい。2018/03/12(月) 00:57:39.67
Archive.is で Facebook のアーカイブが取れなくなっている。

Archive.is のクローラは Facebook 上では登録ユーザとして振舞っていて、
パブリックでは無いコンテンツのアーカイブも取れるようになっているのだが
そこで使われていたアカウントがブロックされたっぽい。
ttp://Archive.is/TT0nA
Masha とか Nathan とか、過去にアカウント名が変わったことが何回かあるので
今回が初めてでは無いのかも。

>>239
聞いたことが無いですね・・・。

241名無しさん@お腹いっぱい。2018/04/17(火) 11:35:00.65
今日深夜ずっと繋がらないんだけど何かあった?

242名無しさん@お腹いっぱい。2018/04/20(金) 09:29:40.69
Archive.isはweb.archive.orgと違ってソース見るとリンクが別の文字列に置き換わるんだな
だから記録したリンクのアドレスをソースで調べようとしてもわからない
リンクアドレスが直接サイト上にすべて表示してあるなら大丈夫だけど
web.archive.orgtが禁止してるサイトを記録できるのはありがたいが中途半端

243名無しさん@お腹いっぱい。2018/04/23(月) 22:52:27.15
悪いひとたちがやって来て
みんなを殺した

理由なんて簡単さ
そこに弱いひとたちがいたから

女達は犯され
老人と子供は燃やされた

悪いひとたちはその土地に
家を建てて子供を生んだ

そして街ができ
悪いひとたちの子孫は増え続けた


朝鮮進駐軍 関東大震災 日本人10万人大虐殺

https://youtu.be/iBIA45CrE30
https://youtu.be/D0vgxFC04JQ
https://www.youtube.com/watch?v=sYsrzIjKJBc
https://www.youtube.com/watch?v=SiHp41uWo1I
https://www.youtube.com/watch?v=zYBCTRryFP8
https://youtu.be/-wF31xbwqPM

244名無しさん@お腹いっぱい。2018/05/22(火) 18:37:32.43
あー重い重い

245名無しさん@お腹いっぱい。2018/05/24(木) 23:16:48.78
最近は激烈重いな

新着レスの表示
レスを投稿する