Internet Archive総合 (web.archive.org) #2 ©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php
インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
------------------
Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック
Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。
テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの? これでインフォシークの消えたページ見る方法ないの? Internet archiveでYoutubeの動画をダウンロードするのに簡単な方法は何かありますか? >>9
インフォシーク自身はロボット除けの robots.txt を置いたり
コンテンツを Internet Archive からごっそり削除させたりということは
やっていないので、アーカイブさえ残っていれば問題なく見られます。 >>11
>コンテンツを Internet Archive からごっそり削除させたり
これどういうこと? 削除なんてできるの? Youtubeとかrobots.txtで保存できないサイトは、
Archive.is→ウェブ魚拓と経由させると保存できるよ
これ結構やってる豆知識 robots.txtで
Disallow: /
Allow: /nullpo/
とかアロウ指定されてても効いてなくて一括ではじかれるやつが痛い >>15
一部のクローラが Allow 文の実装を始める前の、
初期の robots.txt の仕様で動作してるってことだね。 サービス終了したniftyの保存し忘れてたサイトをInternet archiveで
サルベージしようと思ったのに出来るサイトとできないサイトがあるんだな
homepage2.nifty.comはThis URL has been excluded from the Wayback Machine.が出て全くダメで
homepage3.nifty.comはいけた これ2の方はアーカイブされてないってことか
データベース系サイトの消失が勿体無い $50の募金?が必要?
1000円ぐらいなら払ってもいいんだけど。 前は500billionページ超えてた気がするけど保存ページへってない?
自分が以前保存させたのも今見てみたら保存できてないし >>21
ttp://web.archive.org/web/20161015012725/archive.org/web/web.php
510 billion web pages saved over time.
これが最高値かな。10 日後には半減してる。 paypalで寄付しようとしたらJPからじゃダメ言われた 今Chromeでアクセスして過去ページ見るとどこを見てもファビコンが「あたまにきた」になるんだけど俺だけ? 単語で検索できたら最高なのにな
URLが分からなきゃせっかく保存されてる過去の遺産も永遠に見れないままとか糞 過去にあったURLをキッチリ入れてても観れないサイトってあるんだね。 あちらの時間で9日に取得してアーカイブ成功したときの表示になった62ページのうち
20ちょっとが失敗してることを今確認してて気付いた
使ってた端末とかの環境も取得対象にしたドメインも分散してるからあちらの問題ぽい
そのあたりに取った人は成功してるかチェックしたほうがいいかも http://page.freett.com/brave_heart/atm_inspire/
こっちのサイトのFlashを見ようと思って、最近の日時のやつだと表示されないから古い日時のやつ見ようと思ったら勝手にinfoseekのトップに飛ばされてしまう…
飛ばされないようにすることとか出来ぬのか
(ブラウザはedge、chrome、Firefox) 見てみたけどInfoseekトップじゃなくてhttp://binyudaisuki.hp.infoseek.co.jp/に飛ばそうとしてる(そしてinfoseek側がトップにリダイレクトしてる)。
Flashのことは知らないけど、他サイト(この場合web.archive.org)からの再生を検出してそこに飛ばす、みたいなのが組み込まれてるんじゃないの? バイナリエディッタって復元したい画像があるんですが、やってくれる神様いますか?
潰れた撮影会系サイトのアーカイブデータなんですが、一連の画像のうち、ほぼ半分が割れて開けません
(わいせつ性もジポ性も皆無のピチピチという言葉にハマらないクソつまらない画像だというのは一連の画像なのでわかります。) 最近robot.txtで弾かれるの増えたな
ついったの動画とかみんなどうやって補完するんだろう
>>29
ここのファビコンはしょっちゅう化ける 原因は不明だが
最近自分が見たサイトのものと入れ替わることが多い
archive自体のファビコンはちゃんとあるのにな 昨日から調子悪くて遺跡発掘が捗らないな
メンテでもやってんのかね 自分だけじゃなくて良かった。
しばらく様子見てみるか。 横にツイッターボタンとかいらんのよ
ちゃんと見れるようにしてくれ ブクマしてたIAの中の某サイトがきれいさっぱり消滅してた 自分のサイトが中途半端にアーカイブされていて恥ずかしかったから
なんちゃらtxt入れたら過去の分もアクセスできなくなったがそれじゃないのか なんか数日前から突然ツイッターとか他のサイトも色々robot.txtが云々で保存できなくなってて絶望してたんだけど、みんなもそうだったのか
色々なサイトが仕様変更したんじゃなくてInternetArchiveの方が何か改悪したのか? >>54
自分のブクマしてた過去にアーカイブしといたはずのページも見れなくなってた…このままだったら最悪だ firefox10で表示できなくなった。
それとは別に、robots.txtのせいで表示できないサイトがあるのって全体的にそうなの? フレームの件はサイト名がタブに出るから直る可能性があるけど
biglobe系のサイトが全滅?してしまったのが痛すぎる なんとかアーカイブできるサイトでも表示がすごく変になってる co.jp/ の表示が co.jp:80/ になってない?
時系列を遡るとURLがおかしくなるな やはり不具合があるんですね。
保存しようとしたブログが文字化けしてしまう。 いわゆる機種依存文字だけが化けるという問題なら
2014 年 7 月にすでに始まっているはず。
自称 Shift_JIS の Windows-31J な文書も、あくまで厳密に Shift_JIS として
UTF-8 への変換を掛けてしまってるんだよね。 biglobe系が失われたのは地味にダメージでかいな フレームのページは見れるようになったが、通常は上に表示される棒グラフが出ないな。
フレームじゃないページでも棒グラフのところが真っ白になるのもある。 >>74
推測だけど、レンタルサーバーに自分のページを作って削除報告→ドメインごと見れなくなるだと思われ 古いサイトの魚拓をとる場合はGoogleキャッシュ→archive_isが文字化けしないから確実だと思う IAも誰かが削除依頼すればドメインごと見れなくなるという欠点あるからなぁ
ドメイン(サブ含む)保有者ならrobot.txtを設置するだけで見れなくすることができるし IAなら半永久的に残ると思って今まで一生懸命魚拓してきたのがほぼ全滅して虚しい… 最近旧operaだとうまく機能しなくなったからおかしいと思ったら他のブラウザもそうなのか
アドレスが文字化けしたりカレンダー画面出せなくなったり
JS切ると1つだけ検索出てくる(たくさん登録されてても)
システム戻してほしい 本当に前と比べてかなりのサイトが魚拓できなくなってるし表示もおかしいし今までの魚拓も大部分見れなくなってるしでイライラする Bummer
Hrm
robot.txt
こればっかりで今ネットの9割以上のサイトがこれで全く保存も閲覧もできなくなってる感じなんだけど?
InternetArchiveはネットの保存収集あきらめたの?バカなの? ブンメルンとハラマはリロードしたら治ることも多い気がする あるサイト(ジオ)で10あるサイト内リンクのうち6つが「7d6 0」としか表示されないんだけど、
これって何でか分かりますか?
他4つは正常に表示されるんですが…… 「HTML はアーカイブされているけど、そこで使われている画像はアーカイブ無し」
という状況のとき、その画像について以前は /save/ の URL にリダイレクトして
オリジナルサーバへ読みに行かせていたのが、ただ 404 を返すだけに変わった。 >>89
Sorry. This URL has been excluded from the Wayback Machine.
これが抜けてる ●の丸マークがぐるぐる回ったまま、ページが開かない え?
もしかしてfirefox10が悪いの?
つい先日まで使えてたのに。 収得ページの上に表示されるグラフやら時間移動の左右矢印やら消えてるのはIA側の不具合ですか?
一番新しい登録から移動できないのは不便。ブラウザ変えてもダメ 古いブラウザでは動作しなくなっていますね。
Firefox 13.0.1 ttp://i.imgur.com/D8ugVF8.png
Firefox 14.0.1 ttp://i.imgur.com/3VhIJse.png
Firefox 21.0 ttp://i.imgur.com/OqutIJD.png
Firefox 22.0 ttp://i.imgur.com/GFL3Imq.png
14.0.1 〜 21.0 ではカレンダーは一応表示されるのですが、
日付が縦に並び、下の月の数字と重なってしまうので使い物になりません。 >>82
そのうち全サイトがrobots.txtかexcludedで見れなくなりそう ■ このスレッドは過去ログ倉庫に格納されています