Internet Archive総合 (web.archive.org) #2　©2ch.net

2016/09/30(金) 23:45:13.25

　
　前スレッド

Internet Archive総合 (web.archive.org) #1
http://echo.2ch.net/test/read.cgi/esite/1189771222/
　

**名無しさん＠お腹いっぱい。** · 2016/09/30(金) 23:54:00.45

　
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
　　------------------

Ｑ.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ＆文字化けが起きる＆極端に重いなどの症状が出てしまう

Ａ.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック

Ｑ.Web Archiveでダウンロードしたzipなどが開けない＆CRCが違うと表示される

Ａ.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。
　

**名無しさん＠お腹いっぱい。** · 2016/10/01(土) 00:04:40.17

３！

**名無しさん＠お腹いっぱい。** · 2016/10/01(土) 00:06:07.00

　
　関連スレッド

ウェブ魚拓 Part2
http://echo.2ch.net/test/read.cgi/esite/1340450717/

「ウェブ魚拓」と類似サービス
http://echo.2ch.net/test/read.cgi/esite/1440044212/
　

**名無しさん＠お腹いっぱい。** · 2016/10/01(土) 04:24:53.46

テンプレのＱ＆Ａ二件、まだそんなやり方が通用すると思ってる奴いるの？

**名無しさん＠お腹いっぱい。** · 2016/10/01(土) 15:05:09.01

乙

**名無しさん＠お腹いっぱい。** · 2016/10/04(火) 06:16:20.88

浮上

**名無しさん＠お腹いっぱい。** · 2016/10/04(火) 15:20:50.65

スレ保全

**名無しさん＠お腹いっぱい。** · 2016/10/08(土) 19:41:25.44

これでインフォシークの消えたページ見る方法ないの？

**名無しさん＠お腹いっぱい。** · 2016/10/09(日) 06:07:06.45

Internet archiveでYoutubeの動画をダウンロードするのに簡単な方法は何かありますか？

**名無しさん＠お腹いっぱい。** · 2016/10/09(日) 06:45:07.16

>>9
インフォシーク自身はロボット除けの robots.txt を置いたり
コンテンツを Internet Archive からごっそり削除させたりということは
やっていないので、アーカイブさえ残っていれば問題なく見られます。

**名無しさん＠お腹いっぱい。** · 2016/10/09(日) 15:28:04.62

>>11
＞コンテンツを Internet Archive からごっそり削除させたり

これどういうこと？　削除なんてできるの？

**名無しさん＠お腹いっぱい。** · 2016/10/11(火) 00:08:37.65

ｙ

**名無しさん＠お腹いっぱい。** · 2016/10/17(月) 12:49:50.07

Youtubeとかrobots.txtで保存できないサイトは、
Archive.is→ウェブ魚拓と経由させると保存できるよ
これ結構やってる豆知識

**名無しさん＠お腹いっぱい。** · 2016/11/30(水) 18:35:43.93

robots.txtで

Disallow: /
Allow: /nullpo/

とかアロウ指定されてても効いてなくて一括ではじかれるやつが痛い

**名無しさん＠お腹いっぱい。** · 2016/12/01(木) 10:11:29.72

>>15
一部のクローラが Allow 文の実装を始める前の、
初期の robots.txt の仕様で動作してるってことだね。

**名無しさん＠お腹いっぱい。** · 2016/12/01(木) 19:00:58.64

サービス終了したniftyの保存し忘れてたサイトをInternet archiveで
サルベージしようと思ったのに出来るサイトとできないサイトがあるんだな
homepage2.nifty.comはThis URL has been excluded from the Wayback Machine.が出て全くダメで
homepage3.nifty.comはいけたこれ2の方はアーカイブされてないってことか
データベース系サイトの消失が勿体無い

**名無しさん＠お腹いっぱい。** · 2016/12/01(木) 20:20:48.09

あれどういうことなんだろうね

**名無しさん＠お腹いっぱい。** · 2016/12/09(金) 09:54:15.47

$50の募金？が必要？
1000円ぐらいなら払ってもいいんだけど。

**名無しさん＠お腹いっぱい。** · 2016/12/12(月) 11:28:39.62

てす

**名無しさん＠お腹いっぱい。** · 2016/12/13(火) 17:26:17.11

前は500billionページ超えてた気がするけど保存ページへってない？
自分が以前保存させたのも今見てみたら保存できてないし

**名無しさん＠お腹いっぱい。** · 2016/12/16(金) 20:35:22.16

保守

**名無しさん＠お腹いっぱい。** · 2016/12/17(土) 04:17:40.90

>>21
ttp://web.archive.org/web/20161015012725/archive.org/web/web.php
510 billion web pages saved over time.

これが最高値かな。10 日後には半減してる。

**名無しさん＠お腹いっぱい。** · 2016/12/17(土) 12:35:53.98

誰も寄付しないの？

**名無しさん＠お腹いっぱい。** · 2016/12/17(土) 18:40:34.49

>>24
Hrm.....

**名無しさん＠お腹いっぱい。** · 2016/12/22(木) 11:15:51.54

保守

**名無しさん＠お腹いっぱい。** · 2016/12/23(金) 11:21:56.50

paypalで寄付しようとしたらJPからじゃダメ言われた

**名無しさん＠お腹いっぱい。** · 2016/12/26(月) 09:15:36.52

>>23
だよねえ。運営苦しいのかな

**名無しさん＠お腹いっぱい。** · 2016/12/26(月) 23:21:17.03

今Chromeでアクセスして過去ページ見るとどこを見てもファビコンが「あたまにきた」になるんだけど俺だけ？

**名無しさん＠お腹いっぱい。** · 2016/12/27(火) 04:31:04.60

あたまに？

**名無しさん＠お腹いっぱい。** · 2017/01/01(日) 00:56:18.70

あけおめ

**名無しさん＠お腹いっぱい。** · 2017/01/06(金) 12:22:28.80

保守

**名無しさん＠お腹いっぱい。** · 2017/01/08(日) 13:54:30.34

―――――――――――――――――――――――

**名無しさん＠お腹いっぱい。** · 2017/01/12(木) 13:54:30.66

―――――――――――――――――――――――

**名無しさん＠お腹いっぱい。** · 2017/01/12(木) 22:29:14.71

単語で検索できたら最高なのにな
URLが分からなきゃせっかく保存されてる過去の遺産も永遠に見れないままとか糞

**名無しさん＠お腹いっぱい。** · 2017/01/12(木) 23:37:22.32

昔あったけどやっぱり重すぎたのかな

**名無しさん＠お腹いっぱい。** · 2017/01/23(月) 03:19:50.01

ここ数日めっちゃ不安定

**名無しさん＠お腹いっぱい。** · 2017/01/25(水) 14:37:17.64

>>23
まあ「more than」ってことで…

**名無しさん＠お腹いっぱい。** · 2017/01/25(水) 15:27:01.25

>>37
わかる

**名無しさん＠お腹いっぱい。** · 2017/02/06(月) 14:09:30.68

過去にあったＵＲＬをキッチリ入れてても観れないサイトってあるんだね。

**名無しさん＠お腹いっぱい。** · 2017/02/11(土) 23:37:08.87

あちらの時間で9日に取得してアーカイブ成功したときの表示になった62ページのうち
20ちょっとが失敗してることを今確認してて気付いた
使ってた端末とかの環境も取得対象にしたドメインも分散してるからあちらの問題ぽい
そのあたりに取った人は成功してるかチェックしたほうがいいかも

**名無しさん＠お腹いっぱい。** · 2017/02/12(日) 02:25:00.27

困ったことによくあるんだよなそういうの

**名無しさん＠お腹いっぱい。** · 2017/02/12(日) 22:39:45.19

http://page.freett.com/brave_heart/atm_inspire/
こっちのサイトのFlashを見ようと思って、最近の日時のやつだと表示されないから古い日時のやつ見ようと思ったら勝手にinfoseekのトップに飛ばされてしまう…
飛ばされないようにすることとか出来ぬのか
(ブラウザはedge、chrome、Firefox)

**名無しさん＠お腹いっぱい。** · 2017/02/12(日) 23:27:33.37

見てみたけどInfoseekトップじゃなくてhttp://binyudaisuki.hp.infoseek.co.jp/に飛ばそうとしてる(そしてinfoseek側がトップにリダイレクトしてる)。
Flashのことは知らないけど、他サイト(この場合web.archive.org)からの再生を検出してそこに飛ばす、みたいなのが組み込まれてるんじゃないの？

**名無しさん＠お腹いっぱい。** · 2017/02/17(金) 00:42:15.71

バイナリエディッタって復元したい画像があるんですが、やってくれる神様いますか？
潰れた撮影会系サイトのアーカイブデータなんですが、一連の画像のうち、ほぼ半分が割れて開けません
（わいせつ性もジポ性も皆無のピチピチという言葉にハマらないクソつまらない画像だというのは一連の画像なのでわかります。）

**名無しさん＠お腹いっぱい。** · 2017/03/25(土) 10:39:36.93

？

**名無しさん＠お腹いっぱい。** · 2017/04/02(日) 01:20:23.71

最近robot.txtで弾かれるの増えたな
ついったの動画とかみんなどうやって補完するんだろう

>>29
ここのファビコンはしょっちゅう化ける　原因は不明だが
最近自分が見たサイトのものと入れ替わることが多い
archive自体のファビコンはちゃんとあるのにな

**名無しさん＠お腹いっぱい。** · 2017/04/15(土) 23:26:54.07

改悪されてそうな悪寒

**名無しさん＠お腹いっぱい。** · 2017/04/16(日) 00:15:13.22

なんかうまく見れないな

**名無しさん＠お腹いっぱい。** · 2017/04/16(日) 16:16:35.44

なんかおかしくなってる？

**名無しさん＠お腹いっぱい。** · 2017/04/16(日) 16:25:47.28

昨日から調子悪くて遺跡発掘が捗らないな
メンテでもやってんのかね

**名無しさん＠お腹いっぱい。** · 2017/04/16(日) 17:06:19.48

自分だけじゃなくて良かった。
しばらく様子見てみるか。

**名無しさん＠お腹いっぱい。** · 2017/04/17(月) 02:47:42.58

横にツイッターボタンとかいらんのよ
ちゃんと見れるようにしてくれ

**名無しさん＠お腹いっぱい。** · 2017/04/17(月) 09:43:38.46

ブクマしてたIAの中の某サイトがきれいさっぱり消滅してた

**名無しさん＠お腹いっぱい。** · 2017/04/17(月) 11:48:06.13

ｴｴｰ･･･

**名無しさん＠お腹いっぱい。** · 2017/04/17(月) 14:46:28.12

自分のサイトが中途半端にアーカイブされていて恥ずかしかったから
なんちゃらtxt入れたら過去の分もアクセスできなくなったがそれじゃないのか

**名無しさん＠お腹いっぱい。** · 2017/04/17(月) 20:41:16.03

niftyも恥ずかしかったのかな

**名無しさん＠お腹いっぱい。** · 2017/04/18(火) 22:12:00.90

なんか数日前から突然ツイッターとか他のサイトも色々robot.txtが云々で保存できなくなってて絶望してたんだけど、みんなもそうだったのか
色々なサイトが仕様変更したんじゃなくてInternetArchiveの方が何か改悪したのか？

**名無しさん＠お腹いっぱい。** · 2017/04/18(火) 22:15:16.02

>>54
自分のブクマしてた過去にアーカイブしといたはずのページも見れなくなってた…このままだったら最悪だ

**名無しさん＠お腹いっぱい。** · 2017/04/19(水) 00:49:22.33

何で余計な改悪するんだろうな

**名無しさん＠お腹いっぱい。** · 2017/04/19(水) 00:57:45.48

顔本ボット仕込んで取得NGにしやがった

**名無しさん＠お腹いっぱい。** · 2017/04/19(水) 01:56:45.11

フレームを使用してたページが全て見れないんだけど

**名無しさん＠お腹いっぱい。** · 2017/04/19(水) 03:14:21.99

確かに

**名無しさん＠お腹いっぱい。** · 2017/04/19(水) 11:06:54.58

firefox10で表示できなくなった。
それとは別に、robots.txtのせいで表示できないサイトがあるのって全体的にそうなの？

**名無しさん＠お腹いっぱい。** · 2017/04/19(水) 19:42:21.77

Firefox10って？

**名無しさん＠お腹いっぱい。** · 2017/04/21(金) 00:53:19.35

フレームの件はサイト名がタブに出るから直る可能性があるけど
biglobe系のサイトが全滅?してしまったのが痛すぎる

**名無しさん＠お腹いっぱい。** · 2017/04/21(金) 04:01:21.62

なんとかアーカイブできるサイトでも表示がすごく変になってる

**名無しさん＠お腹いっぱい。** · 2017/04/24(月) 03:43:58.99

co.jp/　の表示が　co.jp:80/　になってない？
時系列を遡るとURLがおかしくなるな

**名無しさん＠お腹いっぱい。** · 2017/04/24(月) 07:03:58.24

それは大昔からの仕様
近頃の不具合と一切関係ない

**名無しさん＠お腹いっぱい。** · 2017/04/25(火) 09:07:28.13

やはり不具合があるんですね。
保存しようとしたブログが文字化けしてしまう。

**名無しさん＠お腹いっぱい。** · 2017/04/25(火) 09:40:01.45

いわゆる機種依存文字だけが化けるという問題なら
2014 年 7 月にすでに始まっているはず。

自称 Shift_JIS の Windows-31J な文書も、あくまで厳密に Shift_JIS として
UTF-8 への変換を掛けてしまってるんだよね。

**名無しさん＠お腹いっぱい。** · 2017/04/25(火) 10:43:08.51

そんな前から…

**名無しさん＠お腹いっぱい。** · 2017/04/25(火) 13:23:20.20

biglobe系が失われたのは地味にダメージでかいな

**名無しさん＠お腹いっぱい。** · 2017/04/25(火) 14:01:22.68

どうやって失われたの？

**名無しさん＠お腹いっぱい。** · 2017/04/25(火) 21:37:43.40

フレームのページは見れるようになったが、通常は上に表示される棒グラフが出ないな。
フレームじゃないページでも棒グラフのところが真っ白になるのもある。

**名無しさん＠お腹いっぱい。** · 2017/04/25(火) 23:20:30.77

棒グラフって一覧表？

**名無しさん＠お腹いっぱい。** · 2017/04/26(水) 22:19:13.11

>>73
ハーメルンも

**名無しさん＠お腹いっぱい。** · 2017/04/27(木) 04:07:25.92

>>74
推測だけど、レンタルサーバーに自分のページを作って削除報告→ドメインごと見れなくなるだと思われ

**名無しさん＠お腹いっぱい。** · 2017/04/27(木) 11:19:11.36

そんな原理が発生しうるのか…

**名無しさん＠お腹いっぱい。** · 2017/04/27(木) 13:31:04.19

古いサイトの魚拓をとる場合はGoogleキャッシュ→archive_isが文字化けしないから確実だと思う

**名無しさん＠お腹いっぱい。** · 2017/04/27(木) 13:49:03.24

IAと違って何年も先の存続にはちょっと不安はある

**名無しさん＠お腹いっぱい。** · 2017/04/27(木) 13:57:40.78

IAも誰かが削除依頼すればドメインごと見れなくなるという欠点あるからなぁ
ドメイン（サブ含む）保有者ならrobot.txtを設置するだけで見れなくすることができるし

**名無しさん＠お腹いっぱい。** · 2017/04/27(木) 14:03:18.05

使い道次第ってことか

**名無しさん＠お腹いっぱい。** · 2017/04/28(金) 02:26:35.26

IAなら半永久的に残ると思って今まで一生懸命魚拓してきたのがほぼ全滅して虚しい…

**名無しさん＠お腹いっぱい。** · 2017/04/28(金) 22:16:54.34

最近旧operaだとうまく機能しなくなったからおかしいと思ったら他のブラウザもそうなのか
アドレスが文字化けしたりカレンダー画面出せなくなったり
JS切ると1つだけ検索出てくる(たくさん登録されてても)
システム戻してほしい

**名無しさん＠お腹いっぱい。** · 2017/04/28(金) 23:23:23.20

(´･ω･`)

**名無しさん＠お腹いっぱい。** · 2017/04/30(日) 22:51:56.31

本当に前と比べてかなりのサイトが魚拓できなくなってるし表示もおかしいし今までの魚拓も大部分見れなくなってるしでイライラする

**名無しさん＠お腹いっぱい。** · 2017/05/05(金) 10:09:28.44

もうダメだこのサイト使い物にならん…

**名無しさん＠お腹いっぱい。** · 2017/05/05(金) 10:23:10.93

Bummer
Hrm
robot.txt
こればっかりで今ネットの9割以上のサイトがこれで全く保存も閲覧もできなくなってる感じなんだけど？
InternetArchiveはネットの保存収集あきらめたの？バカなの？

**名無しさん＠お腹いっぱい。** · 2017/05/05(金) 14:17:44.03

ブンメルンとハラマはリロードしたら治ることも多い気がする

**名無しさん＠お腹いっぱい。** · 2017/05/07(日) 19:41:05.12

あるサイト(ジオ)で10あるサイト内リンクのうち6つが「7d6 0」としか表示されないんだけど、
これって何でか分かりますか？
他4つは正常に表示されるんですが……

**名無しさん＠お腹いっぱい。** · 2017/05/10(水) 16:29:22.43

「HTML はアーカイブされているけど、そこで使われている画像はアーカイブ無し」
という状況のとき、その画像について以前は /save/ の URL にリダイレクトして
オリジナルサーバへ読みに行かせていたのが、ただ 404 を返すだけに変わった。

**名無しさん＠お腹いっぱい。** · 2017/05/10(水) 16:47:46.15

>>89
Sorry. This URL has been excluded from the Wayback Machine.
これが抜けてる

**名無しさん＠お腹いっぱい。** · 2017/05/17(水) 18:54:55.38

●の丸マークがぐるぐる回ったまま、ページが開かない

**名無しさん＠お腹いっぱい。** · 2017/05/18(木) 01:30:13.32

わかる

94 · 2017/05/18(木) 08:40:15.31

え？
もしかしてfirefox10が悪いの？
つい先日まで使えてたのに。

**名無しさん＠お腹いっぱい。** · 2017/05/18(木) 19:48:20.59

収得ページの上に表示されるグラフやら時間移動の左右矢印やら消えてるのはIA側の不具合ですか？
一番新しい登録から移動できないのは不便。ブラウザ変えてもダメ

**名無しさん＠お腹いっぱい。** · 2017/05/18(木) 22:07:09.37

Firefox10ってマジ？

**名無しさん＠お腹いっぱい。** · 2017/05/19(金) 05:37:34.37

古いブラウザでは動作しなくなっていますね。
Firefox 13.0.1 ttp://i.imgur.com/D8ugVF8.png
Firefox 14.0.1 ttp://i.imgur.com/3VhIJse.png
Firefox 21.0 ttp://i.imgur.com/OqutIJD.png
Firefox 22.0 ttp://i.imgur.com/GFL3Imq.png

14.0.1 ～ 21.0 ではカレンダーは一応表示されるのですが、
日付が縦に並び、下の月の数字と重なってしまうので使い物になりません。

**名無しさん＠お腹いっぱい。** · 2017/05/19(金) 08:08:36.19

>>82
そのうち全サイトがrobots.txtかexcludedで見れなくなりそう

**名無しさん＠お腹いっぱい。** · 2017/05/19(金) 10:20:12.11

よくそんなテスト環境たくさん持ってるなあ

99 · 2017/05/19(金) 10:55:43.46

>>101
PortableApps.com のポータブル版ですよ。
Windows XP 自体も仮想環境でして、この仮想マシンを複数用意して
素の Firefox の各バージョンを個別にインストールしたとしても、
レンダリングに関しては有意な差は出ないと思います。

**名無しさん＠お腹いっぱい。** · 2017/05/19(金) 18:56:40.88

2000だと、まともに使える最終firefoxが10なんだよ。

**名無しさん＠お腹いっぱい。** · 2017/05/19(金) 23:41:12.51

なるほど2000
しかしどうして2000でInternet Archive

99 · 2017/05/21(日) 11:18:43.39

Windows 2000 SP4 + Opera 12.02 だとカレンダーは出るのですが、
日付が縦一列になってしまいますね。
素の Windows 2000 ではこの辺が限界でしょうか。
ttp://i.imgur.com/QxJpn2k.png

こっちは魔改造版 Windows 2000 (^_^;)
ttp://i.imgur.com/WTJsWcj.png

**名無しさん＠お腹いっぱい。** · 2017/05/21(日) 19:22:54.61

魔改造すげーなあ

**名無しさん＠お腹いっぱい。** · 2017/05/29(月) 22:36:35.50

ヤフーのニュース記事とか記録できないんだね
トップ画面に戻される

**名無しさん＠お腹いっぱい。** · 2017/05/30(火) 07:14:51.77

>>107
ttp://echo.2ch.net/test/read.cgi/esite/1189771222/823-834

**名無しさん＠お腹いっぱい。** · 2017/05/30(火) 08:05:17.69

そんなに前からなんだな

**名無しさん＠お腹いっぱい。** · 2017/06/04(日) 05:17:07.49

今まで自分の日記ブログを生きた証としてしこしこ魚拓し続けてきて
たとえサービス終了してもIAの中には残り続けるだろうと思ってたのに
突然robot.txtにより禁止で今まで保存してきた魚拓もすべて見れなくなった
自分のしてきた事は何の意味も無かった結局何も残らないんだと思うととても虚しい…何なんこの仕打ちは

**名無しさん＠お腹いっぱい。** · 2017/06/04(日) 08:48:06.37

イミフ
他人じゃなく自身がアカウント管理してるブログなんだから
公開/非公開の設定問わずいつの記事でも閲覧や編集できるじゃん

別業者の類似サービスへ引っ越しとかも自由だし
なによりオフラインで読み返せるダイアリーとして綴っていくっていう
他者が提供してるのに乗っかるより手近な途があるのに

**名無しさん＠お腹いっぱい。** · 2017/06/04(日) 21:42:34.02

いずれにせよブログサービスが終了しドメインが解放されたときには不死鳥のように蘇ることになるであろう

**名無しさん＠お腹いっぱい。** · 2017/06/05(月) 11:13:16.50

>>110
人ん家で遊んでるだけなのに何を勝手なこと言ってるんだ?
そこまでやりたかったら持ち家買えよ。

ユーザ用の空間をディレクトリ形式 (blog.example.com/user/) で提供している所は
robots.txt から見れば「管理権無しの借家人」だからしゃーないわな。

**名無しさん＠お腹いっぱい。** · 2017/06/07(水) 10:41:31.93

1月ごろまではフル取得できてたサイズのフォトギャラリー的なページが
最近取るとところどころ歯抜けになる
pngやjpgの個別アーカイブめんどいが取れるだけ良いか

**名無しさん＠お腹いっぱい。** · 2017/06/10(土) 04:54:34.00

今やったらrobotで魚拓できなくなってたサイトがまたできるようになってる！嬉しい！

**名無しさん＠お腹いっぱい。** · 2017/06/10(土) 10:24:53.43

自身のブログなんかIAでとってるやついるんだね
すごいキモい
こいつの事なんて他者はぜんぜん興味ないってのに
大仰にも「生きた証」とか・・・病的な自意識過剰やばい
危険人物

**名無しさん＠お腹いっぱい。** · 2017/06/10(土) 10:42:28.27

なんか変な人来ちゃった

**名無しさん＠お腹いっぱい。** · 2017/06/10(土) 12:25:31.02

炎上でもした時に自らが残した魚拓を掘り起こされて泣きを見るのはそいつ自身
自業自得

**名無しさん＠お腹いっぱい。** · 2017/06/10(土) 13:14:13.65

ブログ = 炎上って放火魔の発想じゃね

**名無しさん＠お腹いっぱい。** · 2017/06/10(土) 16:48:28.74

何を残そうが人の勝手
IAの趣旨には沿ってるし

**名無しさん＠お腹いっぱい。** · 2017/06/10(土) 18:59:22.23

うん、何を残してもいいと思うけど
突っ込むならば
大事な物をいつまでも残しておく手段にIAを使う
という所では^_^;

**名無しさん＠お腹いっぱい。** · 2017/06/11(日) 01:17:03.81

自殺配信して死んだだるまが生きた証と言って残したブログも速攻で消されたけど誰かがIAに保存してたおかげで読めたな

**名無しさん＠お腹いっぱい。** · 2017/06/11(日) 01:58:42.80

いい話だなあ

**名無しさん＠お腹いっぱい。** · 2017/06/11(日) 06:23:44.63

amebloをIAで開くと、トップページはアーカイブされているけど、
月別や個々のURLを入れるとアーカイブされていないことが多い。
まあ、amebloに限った話じゃないが。

**名無しさん＠お腹いっぱい。** · 2017/06/26(月) 01:23:07.16

HTMLだけで画像が全滅してるやつってどういうアーカイブのされかたなんだろ

**名無しさん＠お腹いっぱい。** · 2017/07/07(金) 22:15:10.17

>>125
普通に有り得る例としては、そのサイトに直リン除けが掛けられていて
画像向けのリファラーのチェックが行われていたとか。

**名無しさん＠お腹いっぱい。** · 2017/07/08(土) 00:56:44.12

Alexaのは画像なかったりするみたいね

**名無しさん＠お腹いっぱい。** · 2017/07/12(水) 16:31:21.72

伺かの小鳩とクロver1.0の2003年のファイル落としたら
中に2007年と2008年と2015年の日付のファイルが入ってた謎

**名無しさん＠お腹いっぱい。** · 2017/07/12(水) 17:12:45.51

日本語で

**名無しさん＠お腹いっぱい。** · 2017/07/12(水) 17:57:20.43

これの事
ttps://web.archive.org/web/*/http://kumamoto.cool.ne.jp:80/sorakarakobato/kobato_ver.1.0.nar

**名無しさん＠お腹いっぱい。** · 2017/07/12(水) 22:43:57.30

何か意味あるのかな。
ブログでトップに表示させるために2050年とかの記事があるようなものだったりするの？

**名無しさん＠お腹いっぱい。** · 2017/07/14(金) 13:10:28.89

何かまた見れなくなったサイトがあるんだが
余計な改悪してそう

**名無しさん＠お腹いっぱい。** · 2017/07/15(土) 15:00:32.61

何年か前からURLに「:80」が入るバグで見れないパターン出てくるな

**名無しさん＠お腹いっぱい。** · 2017/07/18(火) 05:49:05.50

これ、もうすぐ完全にダメになりそうだ

**名無しさん＠お腹いっぱい。** · 2017/07/27(木) 21:02:13.39

復活マダ～?!ﾁﾝﾁﾝ!!

**名無しさん＠お腹いっぱい。** · 2017/07/28(金) 01:59:47.19

どうにかなってたの？

**名無しさん＠お腹いっぱい。** · 2017/07/28(金) 11:48:29.31

過去の保存アーカイブの大半が死んでる。検索機能も駄目だし…

ミラー鯖は若干は検索機能でヒットするがやはりあるはずアーカイブにはエラーなのかたどりつけない。

**名無しさん＠お腹いっぱい。** · 2017/07/28(金) 17:22:45.77

アーカイブ済ページから未アーカイブページへのリンク踏むと
前はsave this url画面になったのに
こないだから404になっていちいちボックスにurl入れなきゃなので面倒

**名無しさん＠お腹いっぱい。** · 2017/07/28(金) 19:23:03.47

とうとうミラーのtopまで落ちた…

**名無しさん＠お腹いっぱい。** · 2017/07/29(土) 21:20:01.40

そんな調子悪いのか

**名無しさん＠お腹いっぱい。** · 2017/07/31(月) 02:10:36.37

末期感みなぎって来たねー

**名無しさん＠お腹いっぱい。** · 2017/07/31(月) 03:28:01.11

情報求めて初めて来たが、こんな板あったのか……
繋がらないのは俺だけじゃなかったんだな……
ここ使えないとマジで困りますよ……

**名無しさん＠お腹いっぱい。** · 2017/08/01(火) 08:56:54.10

トップ（ホーム）ページが糞化しすぎ。

**名無しさん＠お腹いっぱい。** · 2017/08/04(金) 18:31:32.95

503と504で全然つながらない
あと1年で終わるんだろうな

**名無しさん＠お腹いっぱい。** · 2017/08/04(金) 20:16:57.48

昨日から久しぶりに使ってたんだが、全然つながらなくなったので調べてたが
ずっと調子悪かったのか
便利なんだけどな

**名無しさん＠お腹いっぱい。** · 2017/08/05(土) 11:39:53.24

日刊ス○ーツ公式
記事に関して新しいものが取得できなくなってる！？

2～3日前までに取った記事は表示できるんだが

魚拓で取得不可能になったから（トップページは除く）
ここが使えないと何気に困る

**名無しさん＠お腹いっぱい。** · 2017/08/06(日) 17:17:00.96

ページによって時系列表示が出るのと出ないのがあるけど、何が違うんだろう？

**名無しさん＠お腹いっぱい。** · 2017/08/07(月) 04:38:18.77

>>146
/save/ で行けてるみたいだけどなぁ。

**名無しさん＠お腹いっぱい。** · 2017/08/16(水) 00:08:42.74

日付が変わって昨日になるが、18時ごろから1時間くらい、
タイムアウトとか言って、使い物にならなかった。

この時間帯で1時間も使えなかったのって、ほんと酷だわ…。

**名無しさん＠お腹いっぱい。** · 2017/08/16(水) 09:19:32.75

何か特別な時間帯なの？

**名無しさん＠お腹いっぱい。** · 2017/08/20(日) 21:48:59.46

ちょっと古いブラウザで動かないページってどんな作り方なの？

**名無しさん＠お腹いっぱい。** · 2017/08/20(日) 23:28:20.85

何が？

**名無しさん＠お腹いっぱい。** · 2017/08/31(木) 14:11:58.84

IA内に履歴ないURL踏んだときの
セーヴしないという選択なくしたんだな
ちょっと楽ちんになった

**名無しさん＠お腹いっぱい。** · 2017/08/31(木) 17:01:17.43

そうなの？

**名無しさん＠お腹いっぱい。** · 2017/09/01(金) 10:16:43.71

>>153だけど、きのう書いたように仕様変更と思いきや
以前と同じく404吐くのに戻っていた

ちなみに昨日取得したページは、某著名人のブログ2017.8.29夕方アップ記事
きょう取得したのは、昨日と同アカのブログ内の昨晩アップ記事

**名無しさん＠お腹いっぱい。** · 2017/09/01(金) 12:34:48.84

挙動がころころ変わるときはある気がするね。

**名無しさん＠お腹いっぱい。** · 2017/09/01(金) 21:02:34.83

> IA内に履歴ないURL踏ん
でみたけど
クリックと同時に"Saving page now..."になるページと404のワンクッションおくページとが混在。
中の人らがどこをどういじってるのか知らんが当分は不安定な状態が続きそう。
まーどうにかこうにか取得できてるんでありがたくフリー利用させてもらいまふ

**名無しさん＠お腹いっぱい。** · 2017/09/02(土) 01:51:59.68

一昨日（８月３１日）、「Wayback Exception」という表示が何度も出て、
サイトの取得を妨げていたんだけど、見られた方はいますか？

「Exception」は“例外”という意味らしいけど、毎日のように取ってるサイトで
このような現象が起きたので驚いてる。

因みに昨日（９月１日）は逆に、その表示を一切見ていない。

**名無しさん＠お腹いっぱい。** · 2017/09/02(土) 06:08:02.02

>>158
いわゆるプログラミング用語の「例外」でしょ?
どうして例外が発生したのか見てないの?

**名無しさん＠お腹いっぱい。** · 2017/09/03(日) 10:40:23.83

>>159
そう、確かにその表示なのだが、

＞どうして例外が発生したのか見てないの?

そこまでは見ていない、というよりも分からない。

何しろ、普段から取得している複数の新聞社のニュースサイトを
取る作業をしていた際に、この現象が起きたから。
どうにも原因が思いつかない。

**名無しさん＠お腹いっぱい。** · 2017/09/04(月) 21:57:17.78

Shift_JIS が宣言されていても Windows-31J として処理しくれるような
融通は利かせてくれないものだろうか。
http://web.archive.org/web/1/mevius.2ch.net/test/read.cgi/esite/1475246713/161

①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ㍉㌔
㌢㍍㌘㌧㌃㌶㍑㍗㌍㌦㌣㌫㍊㌻㎜㎝㎞㎎㎏㏄㎡㍻〝〟№㏍℡㊤㊥㊦㊧㊨
㈱㈲㈹㍾㍽㍼∮這�
ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ￤＇＂纊褜鍈銈蓜俉炻昱棈鋹曻彅丨仡仼伀伃伹佖
侒侊侚侔俍偀倢俿倞偆偰偂傔僴僘兊兤冝冾凬刕劜劦勀勛匀匇匤卲厓厲叝
﨎咜咊咩哿喆坙坥垬埈埇﨏塚增墲夋奓奛奝奣妤妺孖寀甯寘寬尞岦岺峵崧
嵓﨑嵂嵭嶸嶹巐弡弴彧德忞恝悅悊惞惕愠惲愑愷愰憘戓抦揵摠撝擎敎昀昕
昻昉昮昞昤晥晗晙晴晳暙暠暲暿曺朎朗杦枻桒柀栁桄棏﨓楨﨔榘槢樰橫橆
橳橾櫢櫤毖氿汜沆汯泚洄涇浯
涖涬淏淸淲淼渹湜渧渼溿澈澵濵瀅瀇瀨炅炫焏焄煜煆煇凞燁燾犱犾猤猪獷
玽珉珖珣珒琇珵琦琪琩琮瑢璉璟甁畯皂皜皞皛皦益睆劯砡硎硤硺礰礼神祥
禔福禛竑竧靖竫箞精絈絜綷綠緖繒罇羡羽茁荢荿菇菶葈蒴蕓蕙蕫﨟薰蘒﨡
蠇裵訒訷詹誧誾諟諸諶譓譿賰賴贒赶﨣軏﨤逸遧郞都鄕鄧釚釗釞釭釮釤釥
鈆鈐鈊鈺鉀鈼鉎鉙鉑鈹鉧銧鉷鉸鋧鋗鋙鋐﨧鋕鋠鋓錥錡鋻﨨錞鋿錝錂鍰鍗
鎤鏆鏞鏸鐱鑅鑈閒隆﨩隝隯霳霻靃靍靏靑靕顗顥飯飼餧館馞驎髙
髜魵魲鮏鮱鮻鰀鵰鵫鶴鸙黑

**名無しさん＠お腹いっぱい。** · 2017/09/06(水) 02:25:34.26

(´‥∀‥`)ほう

**名無しさん＠お腹いっぱい。** · 2017/09/07(木) 00:12:02.88

>>161 は (0x8794) が這 (0x9487) に化けてるけど、これは 2ch 側の問題だな。
具体的には、の文字の 1 個以上の連続のうち、先頭バイトだけが
なぜか HTML 上では脱落する。
専ブラで dat を直接読んでいれば脱落は起こらない。

バイト列で表現するとこんな感じ。
41 41 87 94 87 94 87 94 87 94 41 41 (AA這這這尿A)
↓
41 41 -- 94 87 94 87 94 87 94 41 41 (AA這這這尿A)
http://web.archive.org/web/1/mevius.2ch.net/test/read.cgi/esite/1475246713/163

算術記号のではなくて、ギリシャ文字の Σ (0x83B0) だと起こらない。

**名無しさん＠お腹いっぱい。** · 2017/09/07(木) 15:43:52.89

ほんとだ直アクセスでもそんな感じだな

**名無しさん＠お腹いっぱい。** · 2017/09/09(土) 15:12:07.27

取得したページ上部のデザインがまた変わったなあ
小さくなったり大きくなったり極端だ

**名無しさん＠お腹いっぱい。** · 2017/09/14(木) 10:27:22.74

（過去にもあったけど）
一部のサイトで、以前取ったアドレスが、取れなくなってるな。
取っても、現時点で最新のものしか出てこない。

https://web.archive.org/web/20170913155359/https://www.daily.co.jp/gossip/
https://web.archive.org/web/20170913094650/https://www.nikkansports.com/battle/

**名無しさん＠お腹いっぱい。** · 2017/09/16(土) 18:16:34.78

悪いひとたちがやって来て
みんなを殺した

理由なんて簡単さ
そこに弱いひとたちがいたから

女達は犯され
老人と子供は燃やされた

悪いひとたちはその土地に
家を建てて子供を生んだ

そして街ができ
悪いひとたちの子孫は増え続けた

朝鮮進駐軍関東大震災日本人大虐殺
https://goo.gl/1ntWvZ
https://youtu.be/D0vgxFC04JQ
https://goo.gl/h1o4eV
https://www.youtube.com/watch?v=sYsrzIjKJBc
https://goo.gl/FTqHJ1

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 14:00:49.17

こういうのもちゃんと読んで反応してるんだろうか
問答無用で弾いてるような印象があるが
http://yahoo-mbga.jp/robots.txt

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 14:03:00.66

User-Agent: *
Disallow: /

もうこれだけ読んでやめてる気がしてならない

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:07:51.75

10分くらい前から使えなくなってる
何が起きた

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:08:23.33

繋がらんな

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:12:57.86

一応戻ったが、何でまた急に…

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:13:02.20

なおったか

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:23:19.47

今落ちてないかい？
ついに…

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:26:13.63

うむ、まただ

メンテの予告はないよね？

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:26:58.18

落ちてるね
このところ順調だったけど

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:30:42.72

ネットワーク診断結果

デバイスまたはリソース（web.archive.org）が応答していません。

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:31:33.35

もう、急に何ヒス起こしてるんだよ…

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 19:38:10.25

>>168
問答無用も何も、その robots.txt を規則通りに解釈したら
Internet Archive (ia_archiver) の場合は全拒否になるのだが。

| User-Agent: ia_archiver
| Disallow: /

この少し後ろに "User-Agent: *" で始まるグループがあるが、
上の "User-Agent: ia_archiver" を優先するため無視される。

| User-Agent: *
| Disallow: /
| Allow: /sitemap
| Allow: /$
| ...

仮に上の "User-Agent: ia_archiver" とその次の行が無かったとしても、
Internet Archive は Allow 命令には対応していない。
つまり、"User-Agent: *" とその次の Disallow 命令だけが解釈されて、
どっちみち全拒否となる。

**名無しさん＠お腹いっぱい。** · 2017/09/20(水) 20:39:47.04

何度かYahooスポーツの世話になっていたが、久しぶりに古いページを
見ようとしたらデータが取れなくなってるな。

**名無しさん＠お腹いっぱい。** · 2017/09/26(火) 21:11:20.42

取得時モッサリと重たいんだけど時間帯のせいかな

**名無しさん＠お腹いっぱい。** · 2017/09/27(水) 06:43:46.15

Saving page now...が消えたと思いきやまた表示され
Saving page now...が今度こそ消えたと思いきやまた表示され
Saving page now...が（ｒｙ
この自動ループに陥って結局手動で停止させるんだが
後から確認してみると取れてるのと取れてないのが2:1ぐらい
めんどくせ

**名無しさん＠お腹いっぱい。** · 2017/09/30(土) 09:53:51.13

ﾓｻｰﾘ爆進中

**名無しさん＠お腹いっぱい。** · 2017/10/01(日) 01:02:16.28

根気テストされてるに違いない

**名無しさん＠お腹いっぱい。** · 2017/10/02(月) 11:53:53.32

画像が全然保存できてないな

下手するとさっき保存したものよりも同じページの2009年くらいのスナップショットのほうがたくさん画像が見れたりする

**名無しさん＠お腹いっぱい。** · 2017/10/02(月) 19:51:18.22

>>184
Bummerが3～4回繰り返されるので
既に根気もくそも無くなってるわ

特に19時台が酷い気がするけど
単に気のせいかな

**名無しさん＠お腹いっぱい。** · 2017/10/02(月) 21:30:39.54

気のせいだお
全時間帯まんべんなく酷い

**名無しさん＠お腹いっぱい。** · 2017/10/02(月) 23:44:48.37

ウェブ魚拓も「スカ」が多くなったな
魚拓の類がこんな調子だと本当に困る

**名無しさん＠お腹いっぱい。** · 2017/10/03(火) 18:10:31.64

もうBummer出るのがデフォになってるな
改善される時は来るのだろうか

**名無しさん＠お腹いっぱい。** · 2017/10/04(水) 20:16:52.84

URL検索機能が相変わらず死んだまんまや…

**名無しさん＠お腹いっぱい。** · 2017/10/04(水) 21:57:06.86

検索機能って/*/～*みたいなやつ？

**名無しさん＠お腹いっぱい。** · 2017/10/15(日) 18:42:33.29

wikiにつながらない

**名無しさん＠お腹いっぱい。** · 2017/10/15(日) 20:29:29.29

はぁ？

**名無しさん＠お腹いっぱい。** · 2017/10/16(月) 16:17:25.01

上旬は先月よりだいぶ調子よかったが昨日からまたダメダメ

**名無しさん＠お腹いっぱい。** · 2017/10/21(土) 14:00:43.25

/脱落に因む404大杉

**名無しさん＠お腹いっぱい。** · 2017/10/23(月) 14:40:32.65

去年冬ごろ取得したのは"/"が勝手に加えられての404が多かった

**名無しさん＠お腹いっぱい。** · 2017/10/24(火) 01:09:43.67

なんやそれ

**名無しさん＠お腹いっぱい。** · 2017/10/26(木) 00:50:42.39

悪いひとたちがやって来て
みんなを殺した

理由なんて簡単さ
そこに弱いひとたちがいたから

女達は犯され
老人と子供は燃やされた

悪いひとたちはその土地に
家を建てて子供を生んだ

そして街ができ
悪いひとたちの子孫は増え続けた

朝鮮進駐軍関東大震災日本人大虐殺
https://goo.gl/FTqHJ1
https://goo.gl/1ntWvZ
https://youtu.be/D0vgxFC04JQ
https://goo.gl/h1o4eV
https://www.youtube.com/watch?v=sYsrzIjKJBc

**名無しさん＠お腹いっぱい。** · 2017/10/30(月) 09:15:18.95

ページ自体が表示されないが、今はどういう状況？　メンテ中？

**名無しさん＠お腹いっぱい。** · 2017/11/01(水) 22:03:58.93

Wayback Exception
An unknown exception has occurred. Unexpected Error

こればっか