Internet Archive総合 (web.archive.org) #2　©2ch.net

**名無しさん＠お腹いっぱい。** · 2018/12/11(火) 09:56:55.30

Mozilla/5.0 (Windows NT 6.1; rv:52.0) Gecko/20100101 Firefox/52.0
これでやってみたら弾かれたw
http://web.archive.org/web/20181211005436/www26.atwiki.jp/gcmatome/pages/1017.html

**名無しさん＠お腹いっぱい。** · 2018/12/11(火) 13:50:43.49

atwikiはFirefox 52にトラウマでもあるのか

**名無しさん＠お腹いっぱい。** · 2018/12/11(火) 19:58:30.15

ふむふむ
http://web.archive.org/web/20181211102115/www26.atwiki.jp/gcmatome/pages/1017.html
Mozilla/6.0 (Macintosh; Intel Mac OS X 10.13; rv:60.0) Gecko/20100101 Firefox/60.0

>>320
/save/ を叩いた時なんだけど、もし点数方式で判定するなら
◎ IP は archive.org の取得用サーバ群の中の何れか一つが使われる。
米国の IP であること、また名前に www が入っていることは加点対象になる可能性あり。
同じ IP からの繰り返しアクセスも加点対象になる可能性あり。
◎ User-Agent を含め、リクエストヘッダはクライアントのものがそのまま転送される。
古いブラウザを使っていると加点対象になる可能性あり。
◎ さらに Via: HTTP/1.0 web.archive.org (Wayback Save Page) が追加される。
これは間違いなく加点対象。

この辺が総合的に判断されて弾かれているのだろう。
保存に成功することもあるので、Wayback Machine だからと言って一律に判断しているのでは無いと思う。

**名無しさん＠お腹いっぱい。** · 2018/12/11(火) 20:49:04.21

そもそも閲覧回数が多いのってスパムっていうのだろうか
いや本筋と関係ないな

**名無しさん＠お腹いっぱい。** · 2018/12/12(水) 12:01:20.16

biglobe復活したっぽい？

**名無しさん＠お腹いっぱい。** · 2018/12/12(水) 13:36:14.82

なにそれ？まじ？

**名無しさん＠お腹いっぱい。** · 2018/12/13(木) 12:44:14.27

先週くらいから、上のほうに寄付金募集のバナーが出るようになったな。

しかもIEだと、右上の「×」をクリックしても、どうしたわけかバナーが消えない。

この募集は本気だな。

**名無しさん＠お腹いっぱい。** · 2018/12/13(木) 14:08:10.35

将来見たくなった時のためにそれの魚拓も撮っといてくれ

**名無しさん＠お腹いっぱい。** · 2018/12/13(木) 16:19:22.29

>>326
http://web.archive.org/web/*/archive.org/
これじゃ足りんのか?

**名無しさん＠お腹いっぱい。** · 2018/12/13(木) 16:32:01.50

本気やな

**名無しさん＠お腹いっぱい。** · 2018/12/13(木) 16:38:05.04

フィルタにぶっこんで終了
改悪し杉だ

**名無しさん＠お腹いっぱい。** · 2018/12/13(木) 18:31:05.91

ウィキのコーヒー1杯みたいな洒落たジョークじゃないと金が集まらんぜ

**名無しさん＠お腹いっぱい。** · 2018/12/13(木) 19:00:40.93

アーカイブ内は飲食禁止ですので…

**名無しさん＠お腹いっぱい。** · 2018/12/24(月) 07:37:21.51

http://web.archive.org/web/20181223223511/https://www26.atwiki.jp/gcmatome/pages/2928.html
http://web.archive.org/web/20181223223509/https://www26.atwiki.jp/gcmatome/pages/686.html

またスパム扱いされてる

**名無しさん＠お腹いっぱい。** · 2018/12/24(月) 11:12:18.71

ハム食べたくなってきた

**名無しさん＠お腹いっぱい。** · 2018/12/24(月) 16:33:59.12

221 名前：名無しさん＠お腹いっぱい。[] 投稿日：2018/12/22(土) 16:36:12.78

こういう海外サービスを発見した。
まだちょこっとしか試していないが。

Archive.st
https://archive.st

Time Travel
（ブラウザから「このサイトはやばいかもしれない」
という警告が出たが、おそるおそる行ってみると
特にまずいことはなかった）
http://timetravel.mementoweb.org

**名無しさん＠お腹いっぱい。** · 2018/12/25(火) 15:42:40.96

>>326
本日12月25日現在（これでよろしい？）
http://i.imgur.com/UCGhQjr.jpg

**名無しさん＠お腹いっぱい。** · 2019/01/01(火) 02:07:14.14

5ドルは高いなあ

**名無しさん＠お腹いっぱい。** · 2019/01/01(火) 06:17:17.53

12月30日に取った分が消えてる！？

**名無しさん＠お腹いっぱい。** · 2019/01/02(水) 14:42:28.29

“WE’VE REACHED OUR GOAL!”

https://i.imgur.com/vH6AgSg.jpg

**名無しさん＠お腹いっぱい。** · 2019/01/02(水) 16:26:04.27

保守

**名無しさん＠お腹いっぱい。** · 2019/01/02(水) 17:30:15.52

何だ俺のサポートはいらなかったんだ

**名無しさん＠お腹いっぱい。** · 2019/01/02(水) 21:03:41.50

Wayback Everywhereってアドオン使ってるけど他に便利なのないかな

**名無しさん＠お腹いっぱい。** · 2019/01/03(木) 10:14:56.81

以前のいつかと同じく、18年12月29日深夜から現在に至るまで取得したアーカイブの消失が起きている
注意されたし

◆P0jSlC5fJs · 2019/01/09(水) 13:23:55.37

名前上がらないけどWebrecorderとかInterPlanetary Waybackとか知ってる？
いいぞ～これ

**名無しさん＠お腹いっぱい。** · 2019/01/09(水) 17:39:45.59

>>343

クラウド保存でなくローカル保存？

**名無しさん＠お腹いっぱい。** · 2019/01/09(水) 21:27:16.68

どういうこっちゃ

**名無しさん＠お腹いっぱい。** · 2019/01/10(木) 15:23:06.86

>>343
使い方がよくわからん。

◆P0jSlC5fJs · 2019/01/11(金) 00:33:29.73

Webrecorderは、Webページからwarcファイルを生成するWebアプリケーション
生成したwarcはコレクションに保存され、そのまま表示したり、
会員なら公開コレクションにすることでURLを貼って公開できる
+ New Sessionの隣の「…」から「Download Collection」でコレクション内のwarcファイルをダウンロードできる

warcファイルは魚拓の規格化された形式で、HTTPのステータスコードから画像や動画までそのページを表示するのに必要な情報を格納している
とりあえずwarcファイルさえあれば後からどうにでもなるから残したいサイトは今すぐcaptureしてこい

warcファイルを表示するには、「Webrecorder-player」というアプリが使える
またWebrecorderのコレクションにwarcファイルをアップロードして追加することも可能なので、そうやって表示や公開をしてもいい

InterPlanetary Waybackはもうちょっと高度な話で、IPFSと連携するためのものなんだけどこれは後でいい

**名無しさん＠お腹いっぱい。** · 2019/01/11(金) 01:54:02.35

I see.

**名無しさん＠お腹いっぱい。** · 2019/01/11(金) 16:54:33.71

アプリとかﾏﾝﾄﾞｸｾ

**名無しさん＠お腹いっぱい。** · 2019/01/14(月) 23:42:12.54

19/01/13の分から取得したアーカイブが確認不可能になっている

**名無しさん＠お腹いっぱい。** · 2019/01/14(月) 23:59:40.50

いろいろあるな

**名無しさん＠お腹いっぱい。** · 2019/01/15(火) 11:10:48.03

保守

**名無しさん＠お腹いっぱい。** · 2019/01/23(水) 19:17:49.86

最近無茶苦茶重い時あるな
時間帯にもよるけど

**名無しさん＠お腹いっぱい。** · 2019/01/23(水) 23:58:37.78

いうほど最近か？

**214** · 2019/01/24(木) 03:33:30.27

>>214 と同じ URL の 2018 年カレンダーを貼ってみます。
10 月に連続して欠けているのは、Internet Archive の仕様変更に対し
こちらの対応が遅れた (>>291) ことが原因です。
ttp://i.imgur.com/aYSmomB.png
ttp://i.imgur.com/35RP1No.png
ttp://i.imgur.com/fRsG33D.png

こちらは URL を公開しちゃってもいいや。
この人の騒動について個人的に興味が無くなってきていること、
また別途取得させている個別エントリのアーカイブで十分なことから、いずれ止めるかもしれません。
ttp://web.archive.org/web/*/blog.goo.ne.jp/chimaki-1014
昨年 3 月以降、一日 2 回の取得に対し計 4 回のスナップショットが記録されているのは、
HTTP から HTTPS へのリダイレクトと HTTPS で取得したブログコンテンツが
それぞれ計上されているためかと思われます。

**名無しさん＠お腹いっぱい。** · 2019/01/27(日) 16:51:33.96

先週辺りから
「502 Bad Gateway」が
表示されることが多くなった

**名無しさん＠お腹いっぱい。** · 2019/01/28(月) 07:20:53.88

NHKニュース公式のスクショが
ちゃんと保存されないポンコツびりには
あきれた

**名無しさん＠お腹いっぱい。** · 2019/01/28(月) 07:22:08.67

×ポンコツびり
〇ポンコツぶり

あー本当に腹が立つ

**名無しさん＠お腹いっぱい。** · 2019/01/29(火) 10:32:25.48

近々でNHK NE○S W○Bのトップページを
InternetArchive経由で魚拓を取った人は
一度確かめてほしい

なぜか画面が「本日現在」の状態になっているから

ウェブ魚拓ではMETAタグが引っかかって駄目
ArchiveTodayも変な画像（白地に黒文字の注意書き？のみ）
を結果として返してくるので駄目

まさか頼みの綱のInternetArchiveで大失敗するとは思わなんだ

どうしてもN○K NEWS ○EBのトップページを残したければ
画面を直に撮影するしか方法は無いようだ

**名無しさん＠お腹いっぱい。** · 2019/01/29(火) 13:31:19.65

htmlに本文が入ってなくて、ajax的に別のファイルから読み込むやつはいかんな。
wixも同じ理由で保存されてない。
本文ファイルのキャッシュが残ってたとしても、それを読み込みに行ってくれないのよね

◆P0jSlC5fJs · 2019/01/30(水) 15:31:24.94

で、それはwebrecorderでも保存できないのかい？

**名無しさん＠お腹いっぱい。** · 2019/02/01(金) 19:43:12.41

>>361
使い方が分かりにくいな
記録（魚拓）は取れても
その取り出し方がいまいち分かり辛い

後日に取り出してその当時の状態を
再現できなければ意味がないし

**名無しさん＠お腹いっぱい。** · 2019/02/02(土) 19:49:25.42

>>360-361
何で「NHK NE○S W○B」のトップページの話を出したかといえば
先週日曜（1月27日）にあった某「国民的」グループの活動休止発表からだった

この時「N○K NEWS ○EB」のトップページでは
最上部の「速報」・そのすぐ下の「JUST IN」・本記事と
同時に3つの見出しで「○活動休止」の文字が並ぶという
何とも稀な状態になっていた

そこでInternetArchiveでページの魚拓を取り
同時にIｒfanview経由でスクリーンショットを取った“はず”だったのだが
その画像を何らかの形で保存することをうっかり忘れてしまっていた

そして翌朝になってInternetArchiveを確認したら…
下のような状況になっていた
https://i.imgur.com/IBOpfrs.jpg

すなわち明けて1月28日になったが
前日27日に取ったものが表示されないという状態

一応は類似の画像を検索してみたがこんなのしか出なかった
https://pbs.twimg.com/media/Dx56MVSV4AEsqgB.jpg

**363続き** · 2019/02/02(土) 19:50:59.02

そんなわけで試しに1月27日以前に取られたものも表示してみたが
結局どの日でも表示されるのは“作業当日”の画面だった

つまりは二重三重で痛恨のミスをやらかしたことになり
本当に今週はそれを引きずった…

このままでは何か癪に障るので
おまけを罪滅ぼしに置いておく

（1月31日）
https://i.imgur.com/E96yEeA.jpg
https://i.imgur.com/bCjdPXO.jpg
https://i.imgur.com/EAUNldo.jpg

（昨2月1日）
https://i.imgur.com/hpvfmr9.jpg

**名無しさん＠お腹いっぱい。** · 2019/02/06(水) 12:38:23.06

つまりこういうことですわ…某所の３本見出し
（IA経由だと４本見出しになったが多分すぐに消える）

https://i.imgur.com/xBWgiNU.jpg
https://i.imgur.com/hie187Y.jpg
https://i.imgur.com/3Xzxad7.jpg

**名無しさん＠お腹いっぱい。** · 2019/02/09(土) 01:56:12.20

時々出てくるこれ、具体的に何かやっているというより、
503 応答のエラーページがこのように書かれているだけとしか思えないんだけどなぁ。

**名無しさん＠お腹いっぱい。** · 2019/02/09(土) 17:40:02.31

>>366
文字通りメンテナンス中と思わせるくらいに
数時間表示される場合もあれば…

この画面が出た後で再読み込みをしたら
すぐにトップ画面に戻る場合もある

**名無しさん＠お腹いっぱい。** · 2019/02/11(月) 03:28:55.18

リンク先がなにもない真っさらなページだった時ってもう諦めたほうがいいですか？

**名無しさん＠お腹いっぱい。** · 2019/02/11(月) 11:07:09.41

一概にはいえないがはい

**名無しさん＠お腹いっぱい。** · 2019/02/20(水) 13:36:23.52

昨日2月19日に取ったものって消えてる！？

**名無しさん＠お腹いっぱい。** · 2019/02/21(木) 00:37:48.78

たしかに2/19にとったやつが消えてますね
前もこんなこと1週間くらい続いたけど戻ったときがあったので様子見ですかね

**名無しさん＠お腹いっぱい。** · 2019/02/21(木) 02:05:25.15

おやまあ難儀だねえ

**名無しさん＠お腹いっぱい。** · 2019/02/25(月) 18:11:13.56

アーカイブのサイトが何だかおかしいね

当サイトは昨日「Sorry,we are busy」なんていう
初めて見た表示が出た

ウェブ魚拓は今日の午前中重かった

Archive isは断続的にキレる

一体全体どうなってるのか

**名無しさん＠お腹いっぱい。** · 2019/02/26(火) 18:41:52.94

当社？

**名無しさん＠お腹いっぱい。** · 2019/02/28(木) 18:45:57.30

最近取得してもすぐ消えるな

**名無しさん＠お腹いっぱい。** · 2019/02/28(木) 20:42:43.21

yahoo!ブログまでサービス終了だ
どんどん老舗が消えていくなあネットのデータは儚い

**名無しさん＠お腹いっぱい。** · 2019/02/28(木) 21:02:55.33

えっまじかよ

**名無しさん＠お腹いっぱい。** · 2019/03/01(金) 00:34:09.55

ここ3日間くらいは全部アーカイブ消えてるな

**名無しさん＠お腹いっぱい。** · 2019/03/04(月) 13:45:25.05

Yahoo!ブログ消えるのにYahoo!系はなぜかInternet Archiveで保存しても全部トップページに転送されちゃうから保存できないんだよな…

**名無しさん＠お腹いっぱい。** · 2019/03/10(日) 19:02:20.66

消えるのか…？

**名無しさん＠お腹いっぱい。** · 2019/03/16(土) 12:44:48.31

何だか重くなってるぞ
20分くらい前にはアクセス不能になっていたし

**名無しさん＠お腹いっぱい。** · 2019/03/22(金) 05:46:37.80

2日前くらいからarchive.orgの再生時画面が小さくなってしまって辛い
全画面だと作業が出来ないしなあ

**名無しさん＠お腹いっぱい。** · 2019/04/05(金) 17:49:39.15

>>379
このトップページ転送本当どうにかならんのかな。

**名無しさん＠お腹いっぱい。** · 2019/04/05(金) 21:22:53.08

ほんらいのペエジは保存されてるの

**名無しさん＠お腹いっぱい。** · 2019/04/06(土) 00:51:58.43

>>383
何なんだろうなこれ
自前でHeritrix回すとどんな感じになるんだろう

Yahooブログアーカイブ活動の本スレ
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

**名無しさん＠お腹いっぱい。** · 2019/04/06(土) 21:50:02.80

【保存・記録】ウェブアーカイブ総合 Page.01
http://mevius.5ch.net/test/read.cgi/internet/1554553882/

**名無しさん＠お腹いっぱい。** · 2019/04/06(土) 22:44:56.49

魚拓もInternet Archiveも引っ掛からないスレタイって

**名無しさん＠お腹いっぱい。** · 2019/04/07(日) 02:07:26.56

>>383
3 年前に前スレで挙がったスクリプトがそのまま使われてるんだけどな。
http://echo.5ch.net/test/read.cgi/esite/1189771222/839-854

**名無しさん＠お腹いっぱい。** · 2019/04/09(火) 19:23:32.75

>>388
サンクス。
adblockの詳細設定のマイフィルターリストに「*/yjsecure.js」を登録してadblock有効で転送されなくなった。

**名無しさん＠お腹いっぱい。** · 2019/04/10(水) 16:44:20.47

ボス猫

**名無しさん＠お腹いっぱい。** · 2019/04/10(水) 16:44:54.15

失礼誤爆

**名無しさん＠お腹いっぱい。** · 2019/04/10(水) 17:54:51.45

http://mevius.5ch.net/test/read.cgi/internet/1554553882/78-79

/save/ を知ってて /web/2/ を知らないとは。
あと保存の際に http:// や https:// を無条件に外すのも考え物。
HTTP から HTTPS へリダイレクトするサイトだと、そのリダイレクトも
保存回数に計上されてしまう。

**名無しさん＠お腹いっぱい。** · 2019/04/10(水) 18:40:23.58

>>392
そのブックマークレットを作った人間ではないけど、Wayback Machine初心者の自分に/web/2/が何なのか教えて下さい
あと保存回数の計上が増えると何か問題があるの？

**名無しさん＠お腹いっぱい。** · 2019/04/10(水) 18:40:36.94

/save/知ってるのはgeocitiesのスレの方で多用されてたからじゃないかな

**名無しさん＠お腹いっぱい。** · 2019/04/10(水) 18:44:09.20

/save/と/*/はわりかし有名だと思う

**名無しさん＠お腹いっぱい。** · 2019/04/10(水) 21:30:16.96

>>395
これ
/web/2/は初めて聞いたけどその二つは言うほど特別な知識ではないと思うよ

**名無しさん＠お腹いっぱい。** · 2019/04/11(木) 00:15:00.50

/0/と/1/は知ってるけど/2/は初めて見た。

**名無しさん＠お腹いっぱい。** · 2019/04/12(金) 14:03:48.45

今年の2月分
ゴッソリ消えてる！？

**214** · 2019/04/12(金) 15:44:18.86

>>398
っぽいですね。
https://i.imgur.com/gZyzB5u.png

ただ、アーカイビングとインデクシングはそれぞれ独立しているみたいなので、
後者だけでデータの欠落が発生しているという可能性もあると思います。

**名無しさん＠お腹いっぱい。** · 2019/04/12(金) 16:25:15.40

はえー

**214** · 2019/04/14(日) 17:12:22.85

ふっかつっ!
https://i.imgur.com/HQYxL1R.png

**名無しさん＠お腹いっぱい。** · 2019/04/14(日) 17:15:33.25

えがった

**名無しさん＠お腹いっぱい。** · 2019/04/19(金) 08:25:11.36

全ページ内全文検索はまだ？

なんか問題でもあるのか？

**名無しさん＠お腹いっぱい。** · 2019/04/19(金) 16:18:48.21

昔やってたけどすぐ立ち消えたからきつかったんじゃね

**名無しさん＠お腹いっぱい。** · 2019/04/23(火) 16:43:50.23

Scheduled Maintenance

先ほどからこの表示
長くなりそうか？

**名無しさん＠お腹いっぱい。** · 2019/04/25(木) 00:54:18.11

IAってrobots.txtを読み込んでるんだな
https://www.digitaltrends.com/computing/internet-archive-robots-txt/
https://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/
こういう記事が出てたから完全に読み込まないようになったと思ってたんだが、robots.txtでIAを排除してるサイトを保存してくれなかった

**名無しさん＠お腹いっぱい。** · 2019/04/25(木) 07:38:49.03

>>406
機械翻訳使ったのかどうか知らんが、文章の意味を読み取れて無いだけやんか。

**名無しさん＠お腹いっぱい。** · 2019/04/25(木) 15:36:04.78

>>406
米国政府のサイトと米軍のサイト限定って書いてあるな
そこまで強調して書いてある訳ではないとは言えもうちょっと慎重に読もう
しかし、robots.txtが邪魔なら全サイトで無視しちゃば良いのにな
どうせ法的拘束力はないんだし

**名無しさん＠お腹いっぱい。** · 2019/04/25(木) 18:16:09.24

過去分リストが今日から（？）マイナーチェンジしている件

**名無しさん＠お腹いっぱい。** · 2019/04/25(木) 18:52:48.09

自動的に最新ログの年に飛ばない気がする。2019年。

**名無しさん＠お腹いっぱい。** · 2019/05/01(水) 01:04:13.28

改元でなんかいいの録れたら教えてください

**名無しさん＠お腹いっぱい。** · 2019/05/03(金) 15:57:31.30

数分前から「HTTP ERROR 400」と出て使えない

**名無しさん＠お腹いっぱい。** · 2019/05/14(火) 05:19:52.89

手動で1ページ1カテゴリーづつ保存するの面倒くさいんですけど、
自動巡回で指定のサイトやブログをhttps://web.archive.org/に保存出来る方法なんて無いですよね？
毎日毎日徹夜で保存して疲れた…保存しても保存してもキリがない…

**名無しさん＠お腹いっぱい。** · 2019/05/14(火) 12:56:17.84

>>413
＞毎日毎日徹夜で保存して疲れた…
＞保存しても保存してもキリがない…

アーカイブサイト全般のユーザーの
最大の悩みでもあるな

一度やり始めたら強迫観念が出てきて
毎日やらねばならなくなる

しかも誰もがやっているわけじゃなさそうだから
自分が休んでも他の人が補完してくれる保証はないしね

**名無しさん＠お腹いっぱい。** · 2019/05/15(水) 02:06:18.98

やろうと思えばプログラム組んで出来るよ、ネット探せば色々見つかる
さっきWebアーカイブ総合スレに投稿されたやつを転載

0175 py ◆o3kzHb/in8w0 2019/05/14 19:06:58
https://u1.getuploader.com/irvn/download/1657
web2IAWBM.dms ver0.000.007　WayBackMachineに保存　(web.archive.org) 2019/05/14

web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■

動作試験環境：windows10pro　Irvine1.3.1

**名無しさん＠お腹いっぱい。** · 2019/05/15(水) 02:09:48.66

IAヘビーユーザーが多いであろうここの住人なら、
自動化手段を発見済みかスクリプト自作してる人がいるだろうと思ってたが、案外そういう訳でもないのかな

**名無しさん＠お腹いっぱい。** · 2019/05/15(水) 05:10:13.79

>>414-416
ありがとうございます。
勇気出して聞いてよかった…頑張る

**名無しさん＠お腹いっぱい。** · 2019/05/15(水) 07:42:21.01

やっぱり Irvine を土台にするよなぁ。みんな考えることは同じだね。

>>416
どうですかねぇ。
http://web.archive.org/web/*/blog.livedoor.jp/shimon761182/*
http://web.archive.org/web/*/livedoor.blogimg.jp/shimon761182/*

**名無しさん＠お腹いっぱい。** · 2019/05/23(木) 16:45:13.77

archive.orgにファイルアップロードしてる人っている?

**名無しさん＠お腹いっぱい。** · 2019/05/23(木) 21:45:14.89

どんなときもー

**名無しさん＠お腹いっぱい。** · 2019/05/26(日) 03:07:17.45

重宝していた攻略サイトが消えてしまった・・
アーカイブされていたのに何故？何が原因でまるごと
消えてしまったんだ？

**名無しさん＠お腹いっぱい。** · 2019/05/26(日) 13:33:28.50

どこ？

**名無しさん＠お腹いっぱい。** · 2019/05/26(日) 15:46:05.58

archive.orgにファイルアップロードしてる人っている?

**名無しさん＠お腹いっぱい。** · 2019/05/31(金) 17:26:07.60

ベータ版の新しいSave Page Nowを使ってみたかったからユーザー登録してみた
思いのほかあっさり登録できて少し驚いた

**名無しさん＠お腹いっぱい。** · 2019/06/07(金) 03:04:34.14

今、サーバーエラー出てる
503 Service Unavailable
No server is available to handle this request.

**名無しさん＠お腹いっぱい。** · 2019/06/07(金) 04:14:39.73

復活してた

**名無しさん＠お腹いっぱい。** · 2019/06/08(土) 04:29:23.99

スマホからSave Page Nowを使ってTwitterをアーカイブしようとすると必ずエラーを吐いてくる
PCではそんなことになった経験がないんだけど何がおかしいんだろう

あと、これはスマホもPCも関係ないんだが、
Internet Archiveの場合ツイートがjsonと解釈さ
れてしまう場合が多い
Archive.todayやmegalodonは普通のHTMLコンテンツと解釈してくれるんだが、IAだと何でjsonになってしまうんだろう

**名無しさん＠お腹いっぱい。** · 2019/06/25(火) 13:34:53.69

エラー入りました（この表示は初めてだ）

500 Internal Server Error
nginx/1.10.3 (Ubuntu)

**214** · 2019/06/25(火) 14:24:49.75

落ちてる落ちてる
https://twitter.com/internetarchive/status/1143378990826004480
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2019/06/25(火) 17:10:05.80

まだ落ちてんのかよ

**名無しさん＠お腹いっぱい。** · 2019/06/25(火) 18:07:29.24

まだ駄目だね

**名無しさん＠お腹いっぱい。** · 2019/06/25(火) 18:25:49.56

にしてもこうまで長時間の「メンテナンス」はいつ以来か

**名無しさん＠お腹いっぱい。** · 2019/06/25(火) 22:13:06.38

最近400errorみたいな表示が多かったのは前兆だったのか・・・？

**名無しさん＠お腹いっぱい。** · 2019/06/26(水) 01:48:15.81

hmmm

**名無しさん＠お腹いっぱい。** · 2019/06/26(水) 04:56:31.21

おっメンテナンス終わったかな？

**214** · 2019/06/26(水) 05:24:58.72

https://twitter.com/internetarchive/status/1143604539695616000
詳しくは述べられていないが何処かで断線していたらしい。
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2019/06/26(水) 11:17:32.59

掃除機か？

**名無しさん＠お腹いっぱい。** · 2019/06/26(水) 13:28:47.85

しかし長かったねえ

**名無しさん＠お腹いっぱい。** · 2019/06/26(水) 18:58:15.72

鼠じゃないの?

**名無しさん＠お腹いっぱい。** · 2019/06/26(水) 20:29:57.40

ミッキーマウスの複数形ってミッキーマイス？

**名無しさん＠お腹いっぱい。** · 2019/06/26(水) 20:30:13.51

ごめんスレ見誤った

**名無しさん＠お腹いっぱい。** · 2019/06/28(金) 20:13:41.33

>>424

> ベータ版の新しいSave Page Now

初耳

**名無しさん＠お腹いっぱい。** · 2019/06/28(金) 20:25:37.04

あー、すまん。勘違いしていた。

**名無しさん＠お腹いっぱい。** · 2019/06/28(金) 22:52:24.09

どっちや

**名無しさん＠お腹いっぱい。** · 2019/07/07(日) 14:56:34.46

どっちらけ

**名無しさん＠お腹いっぱい。** · 2019/07/13(土) 13:26:19.30

なんか保存済みページをIA開いて記事とかの2ページ目から3ページ目に移動しようとすると2ページ目に移動する(移動できてない)。
なんかちょっとおかしい。

**名無しさん＠お腹いっぱい。** · 2019/07/14(日) 02:21:08.08

そのサイト
スクリプトでページ切り替えてるんでねーの?

**名無しさん＠お腹いっぱい。** · 2019/07/14(日) 13:56:13.87

訛っちゅうげ

**名無しさん＠お腹いっぱい。** · 2019/07/19(金) 06:31:44.32

imgur直リンがSavePageNow出来なくなった。

**名無しさん＠お腹いっぱい。** · 2019/07/19(金) 21:22:55.64

Twitterをアーカイブすると必ず表示が崩れる人がいるんだが
あれって何なんだろうか

**名無しさん＠お腹いっぱい。** · 2019/07/19(金) 23:06:25.81

最近保存してないけどツイッターいつもUIが謎の外国語になってたわ

**名無しさん＠お腹いっぱい。** · 2019/07/20(土) 00:37:36.80

>>451
それ多分IAが経由してるサーバーの国の言語で表示されてるんだと思う

**名無しさん＠お腹いっぱい。** · 2019/07/20(土) 10:05:42.37

>>449の症状が治ったっぽい

**鈴木喜三郎** ◆PEYInCbx5g · 2019/07/23(火) 05:49:06.07

これarchive.vnだと保存できない奴も保存出来るから便利

**名無しさん＠お腹いっぱい。** · 2019/07/23(火) 16:22:05.75

>>454

> これ

どれ？

**名無しさん＠お腹いっぱい。** · 2019/07/23(火) 18:20:17.89

これが示すのはInternet Archive Wayback Machineのことだろ。

**名無しさん＠お腹いっぱい。** · 2019/07/23(火) 18:28:08.66

そうか

**名無しさん＠お腹いっぱい。** · 2019/07/27(土) 14:21:28.66

>>446の症状は直らない

**名無しさん＠お腹いっぱい。** · 2019/07/27(土) 15:47:23.29

具体的にどこよ?

**名無しさん＠お腹いっぱい。** · 2019/07/27(土) 17:52:51.11

https://web.archive.org/web/20190727084527/https://toyokeizai.net/articles/-/293979?page=2
東洋経済の記事で未保存記事を1ページ目を保存して、1ページ目のアーカイブから2ページ目のリンクを開くと
保存されていないから当然保存用のリンクが表示されるけど、2ページ目のアーカイブから3ページ目のリンクを
クリックすると2ページ目のアーカイブが再度表示される。
以前だったら連続で保存できたのにできなくなって直接SavePageNowに打ち込むしかなくなったっぽい。

**名無しさん＠お腹いっぱい。** · 2019/07/27(土) 17:53:37.41

>>459
具体的にこれ>>460

**459** · 2019/07/27(土) 18:55:41.10

https://toyokeizai.net/articles/-/293789
https://toyokeizai.net/articles/-/294305
この 2 つを Internet Archive の入力欄に突っ込んでやってみたけど、
どちらも先頭から最後のページまで、"This page is available on the web!" を経て保存できたけどなぁ。
https://web.archive.org/web/20190727093955/https://toyokeizai.net/articles/-/293789
https://web.archive.org/web/20190727094921/https://toyokeizai.net/articles/-/294305
どうもこちらでは現象が再現できない。

**名無しさん＠お腹いっぱい。** · 2019/07/31(水) 16:56:51.69

>>462
もう一回試してみたけど、また同じ症状になった。page=2が再表示。駄目やん
Firefoxアプデ放置してたのが原因かと思って、他のタブ閉じたりしてしばらくたったところで
アプデ前にもう一回挑戦したら、何故かpage=3も保存できた。あれ？できた。どうなってるんだ？

**名無しさん＠お腹いっぱい。** · 2019/07/31(水) 21:58:16.17

archive.todayまったく繋がらないけど同じ状況の人いませんか？

**名無しさん＠お腹いっぱい。** · 2019/07/31(水) 22:03:00.21

問題なし

**名無しさん＠お腹いっぱい。** · 2019/08/04(日) 23:29:04.15

>>427
Heritrixの仕様か何かなのかな？
自前でHeritrix動かしたことないから断言は出来ないけど

**名無しさん＠お腹いっぱい。** · 2019/08/07(水) 05:57:03.34

/save/の調子がおかしい

**名無しさん＠お腹いっぱい。** · 2019/08/07(水) 10:04:06.93

Chromeにしたらできた。ブラウザの問題か？

**名無しさん＠お腹いっぱい。** · 2019/08/09(金) 14:25:43.54

5ch全体がまた長い時間落ちてたな…
http://i.imgur.com/ngUfu0Q.jpg
http://i.imgur.com/ZvEQ11t.jpg

で当サイトも13時前後にこうなってた
（幸い今は元に戻ってるが）
http://i.imgur.com/DgoOPBq.jpg
http://i.imgur.com/0C7H9LH.jpg

**名無しさん＠お腹いっぱい。** · 2019/08/10(土) 13:00:17.06

ひょっとしたら改悪が行われたか？

以前ならば、（うまく説明できないが）例えばニュースサイトならば、
本記事以外の近隣記事なり参照記事のURLをクリックすると、
取得前のものについては、新規の取得を促す画面が出ていた。

これが大量に記事を取りたい場合には、非常に助かっていたのだが…

ところが昨日からは、上記と同じ動作を行うと、そういう画面が出なくなった。
代わりに出てきたのがこれ↓
https://i.imgur.com/2mOTHmt.jpg

そのため、いちいち一つずつ「Save Page Now」の部分に
URLを打ち込んで、対処している状態だが…。
やっぱりどうにも面倒くさい。

「This page is not available on the web」「because of server error」
ということは、一部のサーバーが動いていないのが原因で、
それさえ治れば、先に触れた機能も復活するのか？

このままでは仕事量が多くなる一方だから、何とかしてほしいんだが。

**名無しさん＠お腹いっぱい。** · 2019/08/10(土) 17:11:05.47

>>470の別パターン

https://i.imgur.com/4oyCI9z.jpg

**471** · 2019/08/10(土) 17:16:33.62

因みに>>470とはメッセージが異なる。

「The Wayback Machine has not archived that URL.」

「This page is not available on the web」
「because request is invalid」

**214** · 2019/08/10(土) 20:23:49.05

>>470
それ、起こるサイトでは以前から発生しているけどなぁ。

> そのため、いちいち一つずつ「Save Page Now」の部分に
> URLを打ち込んで、対処している状態だが…。

アドレスバーの /web/日付時刻数字/ を /save/ に変えるだけでは駄目なのか?
面倒なことには変わりは無いが。

せっかくブラウザにブックマークツールバーを出してるんだったら
強制保存させるブックマークレットを登録してしまえ。
ttps://pastebin.com/NA4c5krN

**名無しさん＠お腹いっぱい。** · 2019/08/10(土) 20:57:03.82

ほーんそんなことできるやね

**名無しさん＠お腹いっぱい。** · 2019/08/11(日) 16:13:46.46

>>473
＞それ、起こるサイトでは以前から発生しているけどなぁ。

東京スポーツの公式サイトのうち「バックナンバー（本日の紙面）」に関しては、
こうした現象を確認していたんだが、本当にあるとすればそのくらいで、
いきなり対象となる範囲が広がってしまった印象。

＞アドレスバーの /web/日付時刻数字/ を /save/ に変えるだけでは駄目なのか?
＞面倒なことには変わりは無いが。

これを試してみたけど、幾分作業が楽になった。これ、しばらく続けてみます。
本当にありがとうございます。

**名無しさん＠お腹いっぱい。** · 2019/08/11(日) 18:37:46.76

Twitterも最近その現象になってしまったな
アーカイブ先への負荷対策とかなんかね

**名無しさん＠お腹いっぱい。** · 2019/08/17(土) 00:10:57.04

>>460の症状は今は直っているぽい

**名無しさん＠お腹いっぱい。** · 2019/08/17(土) 13:08:01.08

>>470に関しても、元に戻ったみたいだ（新規取得を促す画面が復活）。

とはいえ>>473最下段のブックマークレットは、使ってみたら
結構便利なので、しばらく併用ということで。

ところでchromeはともかくとして、先日からＩＥではかなり使い辛くなった。

保存の後、以前なら左上隅のロゴマークをクリックするとトップページに戻っていたのが、
なぜか違うページに飛ばされるようになった。
上方に四角形がいくつか並んでいるのと、小さな英文が表示されたページだが、
その四角形は関連サイトへのリンクらしく、左端の四角形をクリックすると、
やっとこさ当サイトのトップページに戻ることができた。

さらに言えば、「BROWSE　HISTORY」（過去の保存リストが表示される画面行き）が
ＩＥでは使えなくなってしまってる。

**名無しさん＠お腹いっぱい。** · 2019/08/19(月) 18:42:22.44

IEだと使いづらいね。過去のキャプチャ一覧も見られなくなったし。
Microsoft Edgeなら問題なく見られるから今後はEdgeで見ようかな

**名無しさん＠お腹いっぱい。** · 2019/08/19(月) 21:28:32.19

直リン禁止サイトの画像がキャプチャできないっぽい

**214** · 2019/08/20(火) 00:08:02.41

>>480
元々そういう仕様。

/save/ を使って保存させたとき、ブラウザから Internet Archive へ送られた
リクエストヘッダ類 (俗に環境変数と呼ばれているやつ) は
一部の改変・追加のみで元サーバへ送られるので、
これを偽装することによって直リン回避は可能。
リファラーのみチェックしているサイトについては、やったことがある。

ただ、同一の URL について複数の日付のアーカイブが存在しているときに、
自分が /save/ したものだけ画像あり、他人が /save/ したものは画像無し、
ということになるのであまり実用性は無いと思う。

**名無しさん＠お腹いっぱい。** · 2019/08/20(火) 04:06:07.29

>>478-479
何が悲しくって未だにIE使ってるの？
MSももはやサポート放棄しようとしてるのに

**名無しさん＠お腹いっぱい。** · 2019/08/20(火) 04:09:28.55

Internet Archiveがどうかは分からないけど、最近のサイトは面倒なIE対応を放棄してるところも多いし、
悪いこと言わないからEdgeとかChromeとかFirefoxとかに乗り換えた方が良い
というかIAも長くてあと2,3年でIEじゃちゃんと見れなくなると思うぞ

**名無しさん＠お腹いっぱい。** · 2019/08/20(火) 11:55:38.40

IEだとまったく使い物にならなくなっていたのか。
検索かけて原因見てもだれも指摘してないので調べたら、5ｃｈのこのスレでようやく原因判明

クローム使えってか。たしかにweb.archive.org/web/*/　の保存一覧がちゃんと出るようになった

見られないからwebarchiveに無駄に垢とっちゃったよ消したい・・・・

**名無しさん＠お腹いっぱい。** · 2019/08/20(火) 17:01:34.51

>>482
図書館などの公共施設のパソコンだと、
いまだにブラウザといえばIEしか用意されてない。

**名無しさん＠お腹いっぱい。** · 2019/08/21(水) 01:38:06.53

IEは業務決め打ちシステム用が多くて下手に改変もできないが無視して捨てるわけにもいかないがんじがらめ状態なんだろうな

**名無しさん＠お腹いっぱい。** · 2019/08/21(水) 19:32:31.80

>>481
ありがとう。Referer ControlをInactiveにしたら画像もキャプチャできた。

**名無しさん＠お腹いっぱい。** · 2019/08/31(土) 13:21:10.56

こんな表示初めてだ
https://i.imgur.com/qHAOEdh.jpg

**名無しさん＠お腹いっぱい。** · 2019/08/31(土) 13:23:41.39

429 Too Many Requests
You have sent too many requests in a given amount of time.

…ありゃスレもあがってないや

**名無しさん＠お腹いっぱい。** · 2019/09/03(火) 11:14:03.82

>>488
これ俺だけじゃなかったのか
てっきりアーカイブし過ぎたせいかと

**名無しさん＠お腹いっぱい。** · 2019/09/03(火) 17:20:01.26

ここ数日
すぐに結果が表示されずに
画面が真っ白になる現象が起きている

今のところ少し時間を置けば普通の状態になるので
使えはするが何だか謎

**名無しさん＠お腹いっぱい。** · 2019/09/03(火) 23:12:39.81

>>490
同じく。
>>491
トップにしかアクセスできない。
ブラウザによってはトップすらアクセスできず。

**名無しさん＠お腹いっぱい。** · 2019/09/03(火) 23:53:16.60

>>488
スクショをJPEGで上げてる時点で程度が知れてる

**名無しさん＠お腹いっぱい。** · 2019/09/04(水) 00:05:55.93

激重だな

**名無しさん＠お腹いっぱい。** · 2019/09/05(木) 02:32:15.75

ようやくトップ以外にもアクセスできるようになった。

**名無しさん＠お腹いっぱい。** · 2019/09/06(金) 17:35:27.43

>>479
URL検索がずっと死んだままで特定サイトの年代別アーカイブが探りにくい

検索エンジンも昔はサクサクで一覧出てきたのが、何年か前にUIがリニュされてから、ずっと激重で不便極まりなかったけど…

**名無しさん＠お腹いっぱい。** · 2019/09/06(金) 18:04:08.37

>>484
Chromeも古い端末だと最終verでも駄目だね。

Edgeが使えるぐらい新しい機種でないと…

**名無しさん＠お腹いっぱい。** · 2019/09/07(土) 17:00:08.96

ピザ

**名無しさん＠お腹いっぱい。** · 2019/09/07(土) 23:07:16.12

ピザピザ

**名無しさん＠お腹いっぱい。** · 2019/09/09(月) 21:12:02.33

30分ほど前からサイトにつながらない

**名無しさん＠お腹いっぱい。** · 2019/09/09(月) 21:26:42.32

こっちは普通に問題なく繋がってる
今もSave Page Nowでいくつか保存してきた
ベータ版SPNのSave outlinksってオプションを初めて使ってみたがめちゃくちゃ便利だな

**名無しさん＠お腹いっぱい。** · 2019/09/09(月) 22:06:55.46

なにそれ
もしゃあして全部保存してくれるの

**名無しさん＠お腹いっぱい。** · 2019/09/10(火) 06:26:29.17

>>501

> ベータ版SPNのSave outlinksってオプション

知らない

**名無しさん＠お腹いっぱい。** · 2019/09/10(火) 06:31:20.60

ベータ版SPNのSave outlinks　

いま試してみたが、ヤフーニュースはやっぱり魚拓とれなかった。

**名無しさん＠お腹いっぱい。** · 2019/09/10(火) 14:26:32.65

海外のブックマークサービスと魚拓サービスのリスト
https://github.com/pirate/ArchiveBox/wiki/Web-Archiving-Community

**名無しさん＠お腹いっぱい。** · 2019/09/10(火) 14:53:20.34

>>504
アーカイブが取れて無いのと、例のページ遷移スクリプトが発動してるだけなのと
どっちなんだ

**501** · 2019/09/10(火) 16:04:06.39

Save outlinksってのは、SPNに投げたURLのページに貼られてるリンク先も全て読み込んで保存してくれるオプション
さすがに無制限にリンクを辿る訳ではなくて1段階しか辿ってくれないけど、それでもかなり手間が省ける
遷移スクリプトの発火をキャンセルしてくれるような機能はおそらくないと思う

**501** · 2019/09/10(火) 16:23:18.90

ここから使える
https://web.archive.org/save

**名無しさん＠お腹いっぱい。** · 2019/09/10(火) 17:21:54.72

>>506
>>504

今までインターネットアーカイブでヤフー関連のページの魚拓を
取ってもヤフートップに飛ばされた魚拓しか表示されなかったので
ここでは魚拓は取れないものと思っていたが、実は取れていたと知
恵袋に書いてあった。
http://superbabooooo.blog.jp/archives/27043737.html

**名無しさん＠お腹いっぱい。** · 2019/09/10(火) 17:43:04.48

またクソ重になってら
他だと取りにくいページもあるのに

**名無しさん＠お腹いっぱい。** · 2019/09/10(火) 17:50:40.56

確か/web/1/が最古、/web/2が最新のアーカイブなんだよね
これ以外に隠しコマンドというか隠しエンドポイント的なURLはあるの？

**名無しさん＠お腹いっぱい。** · 2019/09/10(火) 18:26:40.26

/0/は？

**名無しさん＠お腹いっぱい。** · 2019/09/10(火) 19:08:38.46

>>512
初耳だったのでexample.comで試してみたが最古のものが表示された
/1/と同じなのでは

**名無しさん＠お腹いっぱい。** · 2019/09/11(水) 01:13:51.29

/1996/は？

**214** · 2019/09/11(水) 13:00:53.66

>>514
/web/年/ とか /web/年月/ とかは、現在の UI が Beta から本導入となった時に廃止された。
今でもエラーとはならないものの、数字の意味する通りには動かなくなっている。

>>511
数字の後ろに付ける、コマンドみたいなものは前スレでほぼ挙がっているから、
いわゆる文字化け騒動以降のレスに一通り目を通しておくと良いと思う。

**名無しさん＠お腹いっぱい。** · 2019/09/12(木) 02:32:02.83

ふむ

**名無しさん＠お腹いっぱい。** · 2019/09/12(木) 03:00:49.41

>>515
情報ありがとう
主なものをまとめるとこんな感じだろうか、間違いや抜けがあったら教えてくれ
(全てhttps://example.comで利用可能なのは検証済み)
/save/：保存
/web/*/：アーカイブ一覧表示
/web/1/：最古のアーカイブ
/web/2/：最新のアーカイブ
/web/日付時刻数字fw_/：時系列・クローラー情報の非表示（文字コード変換あり）
/web/日付時刻数字id_/：アーカイブ時の生ファイル（文字コード変換なし、HTMLコード内のURLの置換も行われない）

こちらも参照のこと：https://en.wikipedia.org/wiki/Help:Using_the_Wayback_Machine#Specific_archive_copy
まだ情報を精査出来てないけどここも参考になりうるかも：https://github.com/iipc/openwayback/wiki

**名無しさん＠お腹いっぱい。** · 2019/09/12(木) 03:03:53.26

新しいSPNのSave outlinksなどのオプションのオンオフ情報はやはりHTTPリクエストの中に含まれてるのかな
このオプションを使った/save/を自動化できたらいいんだが