Internet Archive総合 (web.archive.org) #2　©2ch.net

2016/09/30(金) 23:45:13.25

　
　前スレッド

Internet Archive総合 (web.archive.org) #1
http://echo.2ch.net/test/read.cgi/esite/1189771222/
　

**名無しさん＠お腹いっぱい。** · 2017/06/10(土) 16:48:28.74

何を残そうが人の勝手
IAの趣旨には沿ってるし

**名無しさん＠お腹いっぱい。** · 2017/06/10(土) 18:59:22.23

うん、何を残してもいいと思うけど
突っ込むならば
大事な物をいつまでも残しておく手段にIAを使う
という所では^_^;

**名無しさん＠お腹いっぱい。** · 2017/06/11(日) 01:17:03.81

自殺配信して死んだだるまが生きた証と言って残したブログも速攻で消されたけど誰かがIAに保存してたおかげで読めたな

**名無しさん＠お腹いっぱい。** · 2017/06/11(日) 01:58:42.80

いい話だなあ

**名無しさん＠お腹いっぱい。** · 2017/06/11(日) 06:23:44.63

amebloをIAで開くと、トップページはアーカイブされているけど、
月別や個々のURLを入れるとアーカイブされていないことが多い。
まあ、amebloに限った話じゃないが。

**名無しさん＠お腹いっぱい。** · 2017/06/26(月) 01:23:07.16

HTMLだけで画像が全滅してるやつってどういうアーカイブのされかたなんだろ

**名無しさん＠お腹いっぱい。** · 2017/07/07(金) 22:15:10.17

>>125
普通に有り得る例としては、そのサイトに直リン除けが掛けられていて
画像向けのリファラーのチェックが行われていたとか。

**名無しさん＠お腹いっぱい。** · 2017/07/08(土) 00:56:44.12

Alexaのは画像なかったりするみたいね

**名無しさん＠お腹いっぱい。** · 2017/07/12(水) 16:31:21.72

伺かの小鳩とクロver1.0の2003年のファイル落としたら
中に2007年と2008年と2015年の日付のファイルが入ってた謎

**名無しさん＠お腹いっぱい。** · 2017/07/12(水) 17:12:45.51

日本語で

**名無しさん＠お腹いっぱい。** · 2017/07/12(水) 17:57:20.43

これの事
ttps://web.archive.org/web/*/http://kumamoto.cool.ne.jp:80/sorakarakobato/kobato_ver.1.0.nar

**名無しさん＠お腹いっぱい。** · 2017/07/12(水) 22:43:57.30

何か意味あるのかな。
ブログでトップに表示させるために2050年とかの記事があるようなものだったりするの？

**名無しさん＠お腹いっぱい。** · 2017/07/14(金) 13:10:28.89

何かまた見れなくなったサイトがあるんだが
余計な改悪してそう

**名無しさん＠お腹いっぱい。** · 2017/07/15(土) 15:00:32.61

何年か前からURLに「:80」が入るバグで見れないパターン出てくるな

**名無しさん＠お腹いっぱい。** · 2017/07/18(火) 05:49:05.50

これ、もうすぐ完全にダメになりそうだ

**名無しさん＠お腹いっぱい。** · 2017/07/27(木) 21:02:13.39

復活マダ～?!ﾁﾝﾁﾝ!!

**名無しさん＠お腹いっぱい。** · 2017/07/28(金) 01:59:47.19

どうにかなってたの？

**名無しさん＠お腹いっぱい。** · 2017/07/28(金) 11:48:29.31

過去の保存アーカイブの大半が死んでる。検索機能も駄目だし…

ミラー鯖は若干は検索機能でヒットするがやはりあるはずアーカイブにはエラーなのかたどりつけない。

**名無しさん＠お腹いっぱい。** · 2017/07/28(金) 17:22:45.77

アーカイブ済ページから未アーカイブページへのリンク踏むと
前はsave this url画面になったのに
こないだから404になっていちいちボックスにurl入れなきゃなので面倒

**名無しさん＠お腹いっぱい。** · 2017/07/28(金) 19:23:03.47

とうとうミラーのtopまで落ちた…

**名無しさん＠お腹いっぱい。** · 2017/07/29(土) 21:20:01.40

そんな調子悪いのか

**名無しさん＠お腹いっぱい。** · 2017/07/31(月) 02:10:36.37

末期感みなぎって来たねー

**名無しさん＠お腹いっぱい。** · 2017/07/31(月) 03:28:01.11

情報求めて初めて来たが、こんな板あったのか……
繋がらないのは俺だけじゃなかったんだな……
ここ使えないとマジで困りますよ……

**名無しさん＠お腹いっぱい。** · 2017/08/01(火) 08:56:54.10

トップ（ホーム）ページが糞化しすぎ。

**名無しさん＠お腹いっぱい。** · 2017/08/04(金) 18:31:32.95

503と504で全然つながらない
あと1年で終わるんだろうな

**名無しさん＠お腹いっぱい。** · 2017/08/04(金) 20:16:57.48

昨日から久しぶりに使ってたんだが、全然つながらなくなったので調べてたが
ずっと調子悪かったのか
便利なんだけどな

**名無しさん＠お腹いっぱい。** · 2017/08/05(土) 11:39:53.24

日刊ス○ーツ公式
記事に関して新しいものが取得できなくなってる！？

2～3日前までに取った記事は表示できるんだが

魚拓で取得不可能になったから（トップページは除く）
ここが使えないと何気に困る

**名無しさん＠お腹いっぱい。** · 2017/08/06(日) 17:17:00.96

ページによって時系列表示が出るのと出ないのがあるけど、何が違うんだろう？

**名無しさん＠お腹いっぱい。** · 2017/08/07(月) 04:38:18.77

>>146
/save/ で行けてるみたいだけどなぁ。

**名無しさん＠お腹いっぱい。** · 2017/08/16(水) 00:08:42.74

日付が変わって昨日になるが、18時ごろから1時間くらい、
タイムアウトとか言って、使い物にならなかった。

この時間帯で1時間も使えなかったのって、ほんと酷だわ…。

**名無しさん＠お腹いっぱい。** · 2017/08/16(水) 09:19:32.75

何か特別な時間帯なの？

**名無しさん＠お腹いっぱい。** · 2017/08/20(日) 21:48:59.46

ちょっと古いブラウザで動かないページってどんな作り方なの？

**名無しさん＠お腹いっぱい。** · 2017/08/20(日) 23:28:20.85

何が？

**名無しさん＠お腹いっぱい。** · 2017/08/31(木) 14:11:58.84

IA内に履歴ないURL踏んだときの
セーヴしないという選択なくしたんだな
ちょっと楽ちんになった

**名無しさん＠お腹いっぱい。** · 2017/08/31(木) 17:01:17.43

そうなの？

**名無しさん＠お腹いっぱい。** · 2017/09/01(金) 10:16:43.71

>>153だけど、きのう書いたように仕様変更と思いきや
以前と同じく404吐くのに戻っていた

ちなみに昨日取得したページは、某著名人のブログ2017.8.29夕方アップ記事
きょう取得したのは、昨日と同アカのブログ内の昨晩アップ記事

**名無しさん＠お腹いっぱい。** · 2017/09/01(金) 12:34:48.84

挙動がころころ変わるときはある気がするね。

**名無しさん＠お腹いっぱい。** · 2017/09/01(金) 21:02:34.83

> IA内に履歴ないURL踏ん
でみたけど
クリックと同時に"Saving page now..."になるページと404のワンクッションおくページとが混在。
中の人らがどこをどういじってるのか知らんが当分は不安定な状態が続きそう。
まーどうにかこうにか取得できてるんでありがたくフリー利用させてもらいまふ

**名無しさん＠お腹いっぱい。** · 2017/09/02(土) 01:51:59.68

一昨日（８月３１日）、「Wayback Exception」という表示が何度も出て、
サイトの取得を妨げていたんだけど、見られた方はいますか？

「Exception」は“例外”という意味らしいけど、毎日のように取ってるサイトで
このような現象が起きたので驚いてる。

因みに昨日（９月１日）は逆に、その表示を一切見ていない。

**名無しさん＠お腹いっぱい。** · 2017/09/02(土) 06:08:02.02

>>158
いわゆるプログラミング用語の「例外」でしょ?
どうして例外が発生したのか見てないの?

**名無しさん＠お腹いっぱい。** · 2017/09/03(日) 10:40:23.83

>>159
そう、確かにその表示なのだが、

＞どうして例外が発生したのか見てないの?

そこまでは見ていない、というよりも分からない。

何しろ、普段から取得している複数の新聞社のニュースサイトを
取る作業をしていた際に、この現象が起きたから。
どうにも原因が思いつかない。

**名無しさん＠お腹いっぱい。** · 2017/09/04(月) 21:57:17.78

Shift_JIS が宣言されていても Windows-31J として処理しくれるような
融通は利かせてくれないものだろうか。
http://web.archive.org/web/1/mevius.2ch.net/test/read.cgi/esite/1475246713/161

①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ㍉㌔
㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻㎜㎝㎞㎎㎏㏄㎡㍻〝〟№㏍℡㊤㊥㊦㊧㊨
㈱㈲㈹㍾㍽㍼∮這�
ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ￤＇＂纊褜鍈銈蓜俉炻昱棈鋹曻彅丨仡仼伀伃伹佖
侒侊侚侔俍偀倢俿倞偆偰偂傔僴僘兊兤冝冾凬刕劜劦勀勛匀匇匤卲厓厲叝
﨎咜咊咩哿喆坙坥垬埈埇﨏塚增墲夋奓奛奝奣妤妺孖寀甯寘寬尞岦岺峵崧
嵓﨑嵂嵭嶸嶹巐弡弴彧德忞恝悅悊惞惕愠惲愑愷愰憘戓抦揵摠撝擎敎昀昕
昻昉昮昞昤晥晗晙晴晳暙暠暲暿曺朎朗杦枻桒柀栁桄棏﨓楨﨔榘槢樰橫橆
橳橾櫢櫤毖氿汜沆汯泚洄涇浯
涖涬淏淸淲淼渹湜渧渼溿澈澵濵瀅瀇瀨炅炫焏焄煜煆煇凞燁燾犱犾猤猪獷
玽珉珖珣珒琇珵琦琪琩琮瑢璉璟甁畯皂皜皞皛皦益睆劯砡硎硤硺礰礼神祥
禔福禛竑竧靖竫箞精絈絜綷綠緖繒罇羡羽茁荢荿菇菶葈蒴蕓蕙蕫﨟薰蘒﨡
蠇裵訒訷詹誧誾諟諸諶譓譿賰賴贒赶﨣軏﨤逸遧郞都鄕鄧釚釗釞釭釮釤釥
鈆鈐鈊鈺鉀鈼鉎鉙鉑鈹鉧銧鉷鉸鋧鋗鋙鋐﨧鋕鋠鋓錥錡鋻﨨錞鋿錝錂鍰鍗
鎤鏆鏞鏸鐱鑅鑈閒隆﨩隝隯霳霻靃靍靏靑靕顗顥飯飼餧館馞驎髙
髜魵魲鮏鮱鮻鰀鵰鵫鶴鸙黑

**名無しさん＠お腹いっぱい。** · 2017/09/06(水) 02:25:34.26

(´‥∀‥`)ほう

**名無しさん＠お腹いっぱい。** · 2017/09/07(木) 00:12:02.88

>>161 は (0x8794) が這 (0x9487) に化けてるけど、これは 2ch 側の問題だな。
具体的には、の文字の 1 個以上の連続のうち、先頭バイトだけが
なぜか HTML 上では脱落する。
専ブラで dat を直接読んでいれば脱落は起こらない。

バイト列で表現するとこんな感じ。
41 41 87 94 87 94 87 94 87 94 41 41 (AA這這這尿A)
↓
41 41 -- 94 87 94 87 94 87 94 41 41 (AA這這這尿A)
http://web.archive.org/web/1/mevius.2ch.net/test/read.cgi/esite/1475246713/163

算術記号のではなくて、ギリシャ文字の Σ (0x83B0) だと起こらない。

**名無しさん＠お腹いっぱい。** · 2017/09/07(木) 15:43:52.89

ほんとだ直アクセスでもそんな感じだな

**名無しさん＠お腹いっぱい。** · 2017/09/09(土) 15:12:07.27

取得したページ上部のデザインがまた変わったなあ
小さくなったり大きくなったり極端だ

**名無しさん＠お腹いっぱい。** · 2017/09/14(木) 10:27:22.74

（過去にもあったけど）
一部のサイトで、以前取ったアドレスが、取れなくなってるな。
取っても、現時点で最新のものしか出てこない。

https://web.archive.org/web/20170913155359/https://www.daily.co.jp/gossip/
https://web.archive.org/web/20170913094650/https://www.nikkansports.com/battle/

**名無しさん＠お腹いっぱい。** · 2017/09/16(土) 18:16:34.78

悪いひとたちがやって来て
みんなを殺した

理由なんて簡単さ
そこに弱いひとたちがいたから

女達は犯され
老人と子供は燃やされた

悪いひとたちはその土地に
家を建てて子供を生んだ

そして街ができ
悪いひとたちの子孫は増え続けた

朝鮮進駐軍関東大震災日本人大虐殺
https://goo.gl/1ntWvZ
https://youtu.be/D0vgxFC04JQ
https://goo.gl/h1o4eV
https://www.youtube.com/watch?v=sYsrzIjKJBc
https://goo.gl/FTqHJ1

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 14:00:49.17

こういうのもちゃんと読んで反応してるんだろうか
問答無用で弾いてるような印象があるが
http://yahoo-mbga.jp/robots.txt

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 14:03:00.66

User-Agent: *
Disallow: /

もうこれだけ読んでやめてる気がしてならない

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:07:51.75

10分くらい前から使えなくなってる
何が起きた

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:08:23.33

繋がらんな

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:12:57.86

一応戻ったが、何でまた急に…

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:13:02.20

なおったか

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:23:19.47

今落ちてないかい？
ついに…

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:26:13.63

うむ、まただ

メンテの予告はないよね？

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:26:58.18

落ちてるね
このところ順調だったけど

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:30:42.72

ネットワーク診断結果

デバイスまたはリソース（web.archive.org）が応答していません。

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:31:33.35

もう、急に何ヒス起こしてるんだよ…

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:38:10.25

>>168
問答無用も何も、その robots.txt を規則通りに解釈したら
Internet Archive (ia_archiver) の場合は全拒否になるのだが。

| User-Agent: ia_archiver
| Disallow: /

この少し後ろに "User-Agent: *" で始まるグループがあるが、
上の "User-Agent: ia_archiver" を優先するため無視される。

| User-Agent: *
| Disallow: /
| Allow: /sitemap
| Allow: /$
| ...

仮に上の "User-Agent: ia_archiver" とその次の行が無かったとしても、
Internet Archive は Allow 命令には対応していない。
つまり、"User-Agent: *" とその次の Disallow 命令だけが解釈されて、
どっちみち全拒否となる。

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 20:39:47.04

何度かYahooスポーツの世話になっていたが、久しぶりに古いページを
見ようとしたらデータが取れなくなってるな。

**名無しさん＠お腹いっぱい。** · 2017/09/26(火) 21:11:20.42

取得時モッサリと重たいんだけど時間帯のせいかな

**名無しさん＠お腹いっぱい。** · 2017/09/27(水) 06:43:46.15

Saving page now...が消えたと思いきやまた表示され
Saving page now...が今度こそ消えたと思いきやまた表示され
Saving page now...が（ｒｙ
この自動ループに陥って結局手動で停止させるんだが
後から確認してみると取れてるのと取れてないのが2:1ぐらい
めんどくせ

**名無しさん＠お腹いっぱい。** · 2017/09/30(土) 09:53:51.13

ﾓｻｰﾘ爆進中

**名無しさん＠お腹いっぱい。** · 2017/10/01(日) 01:02:16.28

根気テストされてるに違いない

**名無しさん＠お腹いっぱい。** · 2017/10/02(月) 11:53:53.32

画像が全然保存できてないな

下手するとさっき保存したものよりも同じページの2009年くらいのスナップショットのほうがたくさん画像が見れたりする

**名無しさん＠お腹いっぱい。** · 2017/10/02(月) 19:51:18.22

>>184
Bummerが3～4回繰り返されるので
既に根気もくそも無くなってるわ

特に19時台が酷い気がするけど
単に気のせいかな

**名無しさん＠お腹いっぱい。** · 2017/10/02(月) 21:30:39.54

気のせいだお
全時間帯まんべんなく酷い

**名無しさん＠お腹いっぱい。** · 2017/10/02(月) 23:44:48.37

ウェブ魚拓も「スカ」が多くなったな
魚拓の類がこんな調子だと本当に困る

**名無しさん＠お腹いっぱい。** · 2017/10/03(火) 18:10:31.64

もうBummer出るのがデフォになってるな
改善される時は来るのだろうか

**名無しさん＠お腹いっぱい。** · 2017/10/04(水) 20:16:52.84

URL検索機能が相変わらず死んだまんまや…

**名無しさん＠お腹いっぱい。** · 2017/10/04(水) 21:57:06.86

検索機能って/*/～*みたいなやつ？

**名無しさん＠お腹いっぱい。** · 2017/10/15(日) 18:42:33.29

wikiにつながらない

**名無しさん＠お腹いっぱい。** · 2017/10/15(日) 20:29:29.29

はぁ？

**名無しさん＠お腹いっぱい。** · 2017/10/16(月) 16:17:25.01

上旬は先月よりだいぶ調子よかったが昨日からまたダメダメ

**名無しさん＠お腹いっぱい。** · 2017/10/21(土) 14:00:43.25

/脱落に因む404大杉

**名無しさん＠お腹いっぱい。** · 2017/10/23(月) 14:40:32.65

去年冬ごろ取得したのは"/"が勝手に加えられての404が多かった

**名無しさん＠お腹いっぱい。** · 2017/10/24(火) 01:09:43.67

なんやそれ

**名無しさん＠お腹いっぱい。** · 2017/10/26(木) 00:50:42.39

悪いひとたちがやって来て
みんなを殺した

理由なんて簡単さ
そこに弱いひとたちがいたから

女達は犯され
老人と子供は燃やされた

悪いひとたちはその土地に
家を建てて子供を生んだ

そして街ができ
悪いひとたちの子孫は増え続けた

朝鮮進駐軍関東大震災日本人大虐殺
https://goo.gl/FTqHJ1
https://goo.gl/1ntWvZ
https://youtu.be/D0vgxFC04JQ
https://goo.gl/h1o4eV
https://www.youtube.com/watch?v=sYsrzIjKJBc

**名無しさん＠お腹いっぱい。** · 2017/10/30(月) 09:15:18.95

ページ自体が表示されないが、今はどういう状況？　メンテ中？

**名無しさん＠お腹いっぱい。** · 2017/11/01(水) 22:03:58.93

Wayback Exception
An unknown exception has occurred. Unexpected Error

こればっか

**名無しさん＠お腹いっぱい。** · 2017/11/24(金) 13:46:14.14

アーカイヴされたことないページへのリンク踏んだら
久々に404にならず"Save this url in the Wayback Machine"が現れてクリック取得ができた
これ常時できてたのって夏休み前だったから感動すら覚える

**名無しさん＠お腹いっぱい。** · 2017/11/24(金) 22:36:52.60

うむ、

**名無しさん＠お腹いっぱい。** · 2017/11/24(金) 22:51:45.43

>>201
夏休みかぁ。若いって良いなぁ。

**名無しさん＠お腹いっぱい。** · 2017/12/12(火) 17:05:40.69

サイトで友達が稼げるようになった情報とか
⇒　http://rprpe093w.sblo.jp/article/181823411.html

興味がある人だけ見てください。

SOF53Y4MWW

**名無しさん＠お腹いっぱい。** · 2017/12/15(金) 14:46:48.96

さて

**名無しさん＠お腹いっぱい。** · 2017/12/17(日) 18:45:14.54

ちくしょ完全にダウンしやがった、、

**名無しさん＠お腹いっぱい。** · 2017/12/17(日) 18:55:40.85

2h前にあった現地の停電の影響
さすがに回避不能だしイラついてもしょうがない
大人しく復旧を待とう

**名無しさん＠お腹いっぱい。** · 2017/12/19(火) 19:03:04.11

今日も調子悪いね

**名無しさん＠お腹いっぱい。** · 2017/12/19(火) 19:31:07.30

日常な気がしてきた

**名無しさん＠お腹いっぱい。** · 2017/12/19(火) 20:14:35.23

あーーーー何か来たぞーーーー

**名無しさん＠お腹いっぱい。** · 2018/01/01(月) 15:04:20.22

新年早々だめだこりゃ

**名無しさん＠お腹いっぱい。** · 2018/01/04(木) 15:44:23.36

>>211
取得しようとしたら、一旦反応はあるものの、
なぜか取得する前段階の画面に戻ってしまっていたな。

結局、1月1日は終始そんな状態だったが、
1日中使えなかったのはあまりに痛すぎる。

**名無しさん＠お腹いっぱい。** · 2018/01/04(木) 20:29:56.52

去年10月の第一週に取得しといたのが半分ぐらい駄目になってる
重要だと思うページは取れてるか確認してみたほうがいい

**名無しさん＠お腹いっぱい。** · 2018/01/04(木) 21:15:03.46

>>213
2015 年よりスクリプトで毎日一回ずつ保存させているものがあるんだけど、
昨年 10 月は第一週に限らずポツポツと抜けている。
URL は公開したくないのでスクショでご勘弁。
ttp://i.imgur.com/4qDvnsI.png
ttp://i.imgur.com/l0lfBpa.png
ttp://i.imgur.com/ZKixGUA.png

**名無しさん＠お腹いっぱい。** · 2018/01/04(木) 21:24:36.49

4月29日何があった

**名無しさん＠お腹いっぱい。** · 2018/01/04(木) 21:58:08.32

>>214
スクリプトってどんな感じの？参考にしたいからやり方教えて下さいm(__)m

**214** · 2018/01/04(木) 22:01:04.72

>>215
403 ページが繰り返し記録されているので Internet Archive の問題ではない。

ちなみにスクリプトは /save/ にリクエストを投げてから、リダイレクトを処理して
最終的に 200 番か 504 番の応答が返ってくれば保存できたと判断、
それ以外なら計 10 回まで試行するように組んである。
ログは取っていないので、保存できなかった日にどういう応答が
返ってきていたのかは判らない。

**名無しさん＠お腹いっぱい。** · 2018/01/04(木) 22:59:58.51

10月散々だな・・・ここのログ読んでも9月末から10月までは大分やばそうな感じだし、見直してみるか

**名無しさん＠お腹いっぱい。** · 2018/01/04(木) 23:15:25.28

>>214
スクリプトを作成する技術があるのなら、アーカイブするよりも
そのページを直接ハードディスクにhtml（またはmhtml）で保存
するほうが確実ではないのか？

**214** · 2018/01/05(金) 03:49:29.13

以下長文失礼。

>>219
いわゆる「証拠保全」の目的で、ブログなどを保存させることもあるでしょう・・・。

>>216
こちらでは Windows Scripting Host 用のスクリプトを JScript で書き、
それを Windows のタスクスケジューラで実行させている。
以下、Internet Archive へ仕掛けるアクセスの内容と、HTTP の応答コードの扱いについて簡単に。

1) 保存させたい URL の前に https://web.archive.org/save/ を付けて、
その URL 向けに HEAD リクエストを投げさせる。
2) 300 番台の応答 (リダイレクト) が返って来た場合、順次追跡して HEAD リクエストを投げさせる。
これは、使用する API によっては特に記述せずとも勝手にやってくれる。
3) 最終的に 200 番の応答が返ってくれば、たぶん保存できている。

保存成否は HTTP の応答コードだけでほぼ判定できる。
コンテントボディは不要なので HEAD メソッドを使っているが、
HEAD を扱えない環境なら GET メソッドでも問題無い。

数百メガバイトの巨大ファイルを保存させようとした場合など、
オリジンサーバから Internet Archive への転送に時間が掛かってしまうと
途中でタイムアウトとなり、504 番の応答が返ってきてしまう。
スクリプトを汎用とする (URL を別途パラメータとして与える) のであれば、
これも一応「保存できた」として扱った方が無難。
504 でも保存がキャンセルされる訳では無いようで、
これをエラーとして扱い再試行させてしまったがために
巨大ファイルを短い間隔で重複して保存させてしまったことがある。