X



Internet Archive総合 (web.archive.org) #3
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。2020/04/02(木) 02:08:09.83
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
  ------------------


Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう

A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック


Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される

A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。


前スレッド
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
0003名無しさん@お腹いっぱい。2020/04/03(金) 06:21:50.54
保守しよう
0007名無しさん@お腹いっぱい。2020/04/10(金) 15:59:46.20
保守
0009名無しさん@お腹いっぱい。2020/04/13(月) 02:51:24.68
>>5
それいいね、こんなところだろうか
少し長すぎたかも

Q. 保存したはずなのに見れない!どういうこと?
A. Internet Archiveはアーカイブ量の増加ペースの速さにサーバが追いついておらず、不安定なことが多いです。安定するタイミングを待ちましょう。
またWayback Machineは、ページの保存作業を担当するクローラ部分(Heritrix)と、保存したページの保管・記録・表示を担当するビューワー部分(Wayback)の別々な2つのソフトウェアを組み合わせて動いています。
なので、保存したはずのアーカイブが表示されなくなっていても、クローラ部分がちゃんと動いていたのならアーカイブはちゃんと保存されています。サーバが安定するのを待ちましょう。
0013名無しさん@お腹いっぱい。2020/04/15(水) 21:01:13.80
Archive.st - Save The Internet

いま試してみたらヤフーニュースの魚拓が取れるみたいだぞ。
0014◆P0jSlC5fJs 2020/04/15(水) 22:26:34.61
本日1回目のSaveでいきなりToo Many Requests
0020名無しさん@お腹いっぱい。2020/04/21(火) 18:00:24.40
Internet Archive にアーカイブされたページを、
全文検索する方法ってないですか?
0021名無しさん@お腹いっぱい。2020/04/23(木) 17:18:11.04
homepage2.nifty.comがみれない
0023名無しさん@お腹いっぱい。2020/04/24(金) 08:26:30.95
https://it.srad.jp/story/18/12/04/0637201/
>少なくとも「インターネット上の情報を残しておく義務」も「過去にインターネット上にあった情報にアクセスできる権利」も法的にあるわけじゃないしね。

削除申請に応じる義務もないだろ
0024名無しさん@お腹いっぱい。2020/04/25(土) 13:24:52.15
ブロックされて見れません
どうしたらいいですか
0026名無しさん@お腹いっぱい。2020/04/27(月) 13:25:21.03
アーカイブされたサイトのホームページだけでなく
全文で全サイトを検索することってできますか?
0029名無しさん@お腹いっぱい。2020/04/28(火) 12:32:34.74
>>26だがあえて実現しないってことなのかな?
0038名無しさん@お腹いっぱい。2020/05/04(月) 23:49:37.23
なんでか分からないけどFirefoxだと/web/2/とか/save/が使えないのに
Google Chromeだと使えるっぽいんだよな。昔はFirefoxでも使えた。
最新版に更新してアドオン切っても駄目とかどうなってんだ。
> Firefox 75.0 64bit Firefoxは最新バージョンです
> Google Chrome は最新版です バージョン: 81.0.4044.129(Official Build) (64 ビット)
Firefoxで使えてる人いる?
0039名無しさん@お腹いっぱい。2020/05/05(火) 00:04:37.61
>>38の件の追記、何故か/web/2/の方だけ復活した。
/save/は使えないまま。開くと真っ白なページが出てそれ以上何も起きない。
0040名無しさん@お腹いっぱい。2020/05/11(月) 18:37:29.02
This snapshot cannot be displayed due to an internal error.

って出るサイトは無理?
0042名無しさん@お腹いっぱい。2020/05/13(水) 08:25:33.17
homepage2.nifty.comは1と3はできるのにどうして2だけ見れないの
0046名無しさん@お腹いっぱい。2020/05/17(日) 11:25:01.03
保存したものの特に重要なものはリスト化してチェックしてるが取りこぼしはないな
しかし反映の遅いものは一週間以上かかる場合もあった
0047名無しさん@お腹いっぱい。2020/05/17(日) 14:05:23.73
>>44
archive.today は他にもドメインがあるのに
わざわざ .vn なんか持ち出してくるとか笑える
ベトナム共産シンパかよ
0054名無しさん@お腹いっぱい。2020/05/22(金) 07:29:19.83
ヤフーニュースのスクリーンショット取れなくなった?
0056名無しさん@お腹いっぱい。2020/05/23(土) 14:05:21.25
>>55
どの方法でアーカイブが行われたのかも記録されているから、
おそらく IP も残っているんじゃないかねぇ。
ただ、アーカイブを読み出したときのレスポンスヘッダを見る限りでは、
その IP がアーカイブ閲覧者に漏れているような感じはしない。

あともう一つ、Archive.is がやっているような
リクエスト元 IP のアーカイブ対象サーバへのお漏らしは
Internet Archive では起きていない。
0057名無しさん@お腹いっぱい。2020/05/23(土) 14:20:07.01
>>55
この辺見る限り保存はされていないっぽい
https://help.archive.org/hc/en-us/articles/360001513491-Save-Pages-in-the-Wayback-Machine
https://help.archive.org/hc/en-us/articles/360018536672-What-is-a-view-
https://blog.archive.org/2013/10/25/reader-privacy-at-the-internet-archive/

・全てのユーザーの行動はIPアドレスを元にしたハッシュ値で記録される
・一日毎にハッシュ値は変更される

とか何とか、間違ってたらすまん
0058562020/05/24(日) 10:41:38.58
>>57
しっかり書いてありますね。勉強になります。
0059名無しさん@お腹いっぱい。2020/05/24(日) 17:36:51.34
ページの全文検索って募金が終わらないとできないの?
0060名無しさん@お腹いっぱい。2020/05/26(火) 17:22:56.02
>>54

回復した
0069名無しさん@お腹いっぱい。2020/06/03(水) 05:21:59.69
>>62
自分でパーサなり何なり通さないと読めないから言うほど便利じゃないぞ
それにWayback Machineを使う場合、jsonが欲しい時よりもhtmlとして描画された状態のアーカイブが欲しいことの方が多い
0071名無しさん@お腹いっぱい。2020/06/05(金) 02:20:35.43
Internet ArchiveってURLで保存する方法とは別に
htmlソースコピーで保存する方法も出来るようにすればいいのに
当然独自URL生成する必要性も出てくるけど
0073名無しさん@お腹いっぱい。2020/06/05(金) 11:50:13.06
ツイッターがInternet Explorerからの閲覧をできないようにしたらしく、その影響でツイッターのアーカイブがとれなくなってしまったんだけどどうしたらいいだろう?
今までInternet Explorerからならツイッターのアーカイブがとれたんだけど…他のブラウザからじゃアーカイブできないのよ困った
0076名無しさん@お腹いっぱい。2020/06/05(金) 15:25:45.36
>>74
今ためしてみたらmobileの方でならアーカイブできたわ
ありがとう
でもなんでまたツイッターは急にIEからの閲覧はじくようになったんだろう?
0077名無しさん@お腹いっぱい。2020/06/05(金) 15:27:58.42
>>75
よく分からないけどアーカイブしようとすると「このブラウザは現在サポートされていません」て出てくる
調べたら最近ツイッターがIEから閲覧できないようにしたらしいって言われてたから
0079名無しさん@お腹いっぱい。2020/06/06(土) 15:33:25.33
Internet Archive ってなんで全ページ検索できるようにしないの?
0080名無しさん@お腹いっぱい。2020/06/06(土) 15:33:25.70
Internet Archive ってなんで全ページ検索できるようにしないの?
0082名無しさん@お腹いっぱい。2020/06/08(月) 01:47:07.90
すみません
ツイッター保存してるとけっこう頻繁に.jsonてURLについて謎の文字化けみたいになってしまうんですが、これはいったい…?
どうしたらいいんだろう
0083名無しさん@お腹いっぱい。2020/06/08(月) 11:56:33.80
>>82
ちょっと前からたまに起きる現象、原因は分からない・・・
面倒だけどちゃんと取れるまで取り直すしかない
0087名無しさん@お腹いっぱい。2020/06/08(月) 13:29:41.66
しらんけど
例えば「404 Not Found」だけのページだった場合に
「そこにはなにもなかった」ってことにするか、
それとも「404 Not Foundがあったのだ」ってことにするかだと思う
0089名無しさん@お腹いっぱい。2020/06/08(月) 22:26:30.20
>>79
昔一度やったことあるけど情報量があまりにも多過ぎて重すぎてまともに検索できなかったとか見た
全文検索できたら本当にいいんだけど現時点では無理ぽい…
0096名無しさん@お腹いっぱい。2020/06/12(金) 19:12:09.28
Internet Archiveが公開してる電子書籍について出版社から訴えられたとかじゃなかったか
Gigazineだかどっかのネットニュースに出てたね
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況