X



Internet Archive総合 (web.archive.org) #3
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2020/04/02(木) 02:08:09.83
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
  ------------------


Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう

A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック


Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される

A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。


前スレッド
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
0039名無しさん@お腹いっぱい。
垢版 |
2020/05/05(火) 00:04:37.61
>>38の件の追記、何故か/web/2/の方だけ復活した。
/save/は使えないまま。開くと真っ白なページが出てそれ以上何も起きない。
0040名無しさん@お腹いっぱい。
垢版 |
2020/05/11(月) 18:37:29.02
This snapshot cannot be displayed due to an internal error.

って出るサイトは無理?
0042名無しさん@お腹いっぱい。
垢版 |
2020/05/13(水) 08:25:33.17
homepage2.nifty.comは1と3はできるのにどうして2だけ見れないの
0046名無しさん@お腹いっぱい。
垢版 |
2020/05/17(日) 11:25:01.03
保存したものの特に重要なものはリスト化してチェックしてるが取りこぼしはないな
しかし反映の遅いものは一週間以上かかる場合もあった
0054名無しさん@お腹いっぱい。
垢版 |
2020/05/22(金) 07:29:19.83
ヤフーニュースのスクリーンショット取れなくなった?
0056名無しさん@お腹いっぱい。
垢版 |
2020/05/23(土) 14:05:21.25
>>55
どの方法でアーカイブが行われたのかも記録されているから、
おそらく IP も残っているんじゃないかねぇ。
ただ、アーカイブを読み出したときのレスポンスヘッダを見る限りでは、
その IP がアーカイブ閲覧者に漏れているような感じはしない。

あともう一つ、Archive.is がやっているような
リクエスト元 IP のアーカイブ対象サーバへのお漏らしは
Internet Archive では起きていない。
0057名無しさん@お腹いっぱい。
垢版 |
2020/05/23(土) 14:20:07.01
>>55
この辺見る限り保存はされていないっぽい
https://help.archive.org/hc/en-us/articles/360001513491-Save-Pages-in-the-Wayback-Machine
https://help.archive.org/hc/en-us/articles/360018536672-What-is-a-view-
https://blog.archive.org/2013/10/25/reader-privacy-at-the-internet-archive/

・全てのユーザーの行動はIPアドレスを元にしたハッシュ値で記録される
・一日毎にハッシュ値は変更される

とか何とか、間違ってたらすまん
005856
垢版 |
2020/05/24(日) 10:41:38.58
>>57
しっかり書いてありますね。勉強になります。
0059名無しさん@お腹いっぱい。
垢版 |
2020/05/24(日) 17:36:51.34
ページの全文検索って募金が終わらないとできないの?
0060名無しさん@お腹いっぱい。
垢版 |
2020/05/26(火) 17:22:56.02
>>54

回復した
0069名無しさん@お腹いっぱい。
垢版 |
2020/06/03(水) 05:21:59.69
>>62
自分でパーサなり何なり通さないと読めないから言うほど便利じゃないぞ
それにWayback Machineを使う場合、jsonが欲しい時よりもhtmlとして描画された状態のアーカイブが欲しいことの方が多い
0071名無しさん@お腹いっぱい。
垢版 |
2020/06/05(金) 02:20:35.43
Internet ArchiveってURLで保存する方法とは別に
htmlソースコピーで保存する方法も出来るようにすればいいのに
当然独自URL生成する必要性も出てくるけど
0073名無しさん@お腹いっぱい。
垢版 |
2020/06/05(金) 11:50:13.06
ツイッターがInternet Explorerからの閲覧をできないようにしたらしく、その影響でツイッターのアーカイブがとれなくなってしまったんだけどどうしたらいいだろう?
今までInternet Explorerからならツイッターのアーカイブがとれたんだけど…他のブラウザからじゃアーカイブできないのよ困った
0076名無しさん@お腹いっぱい。
垢版 |
2020/06/05(金) 15:25:45.36
>>74
今ためしてみたらmobileの方でならアーカイブできたわ
ありがとう
でもなんでまたツイッターは急にIEからの閲覧はじくようになったんだろう?
0077名無しさん@お腹いっぱい。
垢版 |
2020/06/05(金) 15:27:58.42
>>75
よく分からないけどアーカイブしようとすると「このブラウザは現在サポートされていません」て出てくる
調べたら最近ツイッターがIEから閲覧できないようにしたらしいって言われてたから
0079名無しさん@お腹いっぱい。
垢版 |
2020/06/06(土) 15:33:25.33
Internet Archive ってなんで全ページ検索できるようにしないの?
0080名無しさん@お腹いっぱい。
垢版 |
2020/06/06(土) 15:33:25.70
Internet Archive ってなんで全ページ検索できるようにしないの?
0082名無しさん@お腹いっぱい。
垢版 |
2020/06/08(月) 01:47:07.90
すみません
ツイッター保存してるとけっこう頻繁に.jsonてURLについて謎の文字化けみたいになってしまうんですが、これはいったい…?
どうしたらいいんだろう
0087名無しさん@お腹いっぱい。
垢版 |
2020/06/08(月) 13:29:41.66
しらんけど
例えば「404 Not Found」だけのページだった場合に
「そこにはなにもなかった」ってことにするか、
それとも「404 Not Foundがあったのだ」ってことにするかだと思う
0089名無しさん@お腹いっぱい。
垢版 |
2020/06/08(月) 22:26:30.20
>>79
昔一度やったことあるけど情報量があまりにも多過ぎて重すぎてまともに検索できなかったとか見た
全文検索できたら本当にいいんだけど現時点では無理ぽい…
0096名無しさん@お腹いっぱい。
垢版 |
2020/06/12(金) 19:12:09.28
Internet Archiveが公開してる電子書籍について出版社から訴えられたとかじゃなかったか
Gigazineだかどっかのネットニュースに出てたね
0101名無しさん@お腹いっぱい。
垢版 |
2020/06/14(日) 15:05:21.28
インターネット初心者です。
質問なのですが、save page nowでページをアーカイブした場合、Internet archiveの説明ではIPアドレスを保持しないため匿名で保存できるとなっているのですが本当でしょうか。
また、save page nowでページを保存するとその瞬間のページだけが保存され、過去のページの情報は保存されないのでしょうか。(すでに削除されていて、今は見ることができずアーカイブもそれまでされていないようなページの場合)教えて頂きたいです。無知ですみません。
0102名無しさん@お腹いっぱい。
垢版 |
2020/06/14(日) 17:13:12.66
>>99
自分も今日いくらやっても連続してツイートのアーカイブに失敗するから、自分の環境が悪いのかと思ったけどこれは……
0103名無しさん@お腹いっぱい。
垢版 |
2020/06/14(日) 17:27:12.26
>>101
・IPアドレス:>>55-57を参照
・過去のページ情報:
「save page nowでページを保存するとその瞬間のページだけが保存され、過去のページの情報は保存されないのでしょうか。」
その認識で合ってる。SPNは「現時点でのページをアーカイブする」ことしか出来ない。
過去のページをアーカイブできる技術はないし、するにはタイムマシンが必要。
現在削除済みでアーカイブも残っていないページは諦めよう
0104名無しさん@お腹いっぱい。
垢版 |
2020/06/14(日) 17:48:04.05
「ツイッター魚拓」とかいう国産サービスができたらしいが。
0105名無しさん@お腹いっぱい。
垢版 |
2020/06/14(日) 18:09:23.85
>>103
ご回答ありがとうございます。それでは、自分が○月×日にしかアーカイブしていないのにそれ以前のページの情報が出てくるということは
、他の誰かが○月×日以前にアーカイブしたということでよろしいでしょうか?
0106名無しさん@お腹いっぱい。
垢版 |
2020/06/14(日) 18:29:19.48
>>105
Internet archiveは自動で色んなサイトをクロールして定期的にアーカイブして回ってるから別に誰かが保存したわけじゃなくて自動でアーカイブされてた可能性が高い
というかわざわざ手動でアーカイブするマニアなんてここの住人位しかいなそうだしほとんど自動取得
0107名無しさん@お腹いっぱい。
垢版 |
2020/06/14(日) 18:43:23.66
>>106
では、○月×日以前の情報は私がアーカイブしたものではないということでいいんでしょうか?
0109名無しさん@お腹いっぱい。
垢版 |
2020/06/14(日) 20:22:26.52
>>108
また質問なのですが、Twitterの動画をアーカイブした際、機種の差(Androidやios,PC)で見ることができないことってあるんですか?
0111名無しさん@お腹いっぱい。
垢版 |
2020/06/14(日) 22:49:30.89
>>104
アレはスクショ撮ってimgurに上げるだけの代物で、セッション情報の類は一切保存されないらしいから、
アーカイブサービスとしての信頼性はゼロに等しい(中傷書き込みの訴訟でも多分証拠として認められないんじゃないだろうか)
ただTwitterではやたらバズったから、固定ユーザーは一定数つくかもね
0113名無しさん@お腹いっぱい。
垢版 |
2020/06/15(月) 06:39:57.00
>>110

> TweetSave - Save tweets with a click
> https://tweetsave.com/


_φ(・_・メモメモ
0114名無しさん@お腹いっぱい。
垢版 |
2020/06/15(月) 06:41:39.22
>>110

> TweetSave - Save tweets with a click
> https://tweetsave.com/


Tweets are saved on TweetSave.com and also get mirrored to WayBack and Archive.is

とあるな。

これは使えるかもしれない。
0116◆P0jSlC5fJs
垢版 |
2020/06/15(月) 07:11:01.48
tweetsaveは不安定すぎて使い物にならなかった
0118名無しさん@お腹いっぱい。
垢版 |
2020/06/15(月) 07:26:47.37
以前はわからんが、今はまあまあ安定しているみたいだよ。

ちょっと試してみて。
0120名無しさん@お腹いっぱい。
垢版 |
2020/06/15(月) 09:06:38.20
>>103
This page is available on the web!でも一緒ですか?
0122名無しさん@お腹いっぱい。
垢版 |
2020/06/15(月) 12:01:07.51
>>121
うろ覚えの記憶ですが、3ヶ月位前にhttps://video.twimg.com...のページを探していて見つからず、This page is available on the web!となって訳も分からないでアーカイブしてしまい、その日のアーカイブでは黒い画面で動画が再生されず見れなかったのですが、なぜかカレンダーに一年程前のアーカイブが現れてそれでは動画を見ることができました。3ヶ月程前なので記憶が曖昧なのですがこういうことってありえますか?
0123名無しさん@お腹いっぱい。
垢版 |
2020/06/16(火) 16:07:46.24
>>121
それでは、Android(chrome,Firefox)で再生できなかったものは他の端末、ブラウザなどでも再生できないということでしょうか?
0124名無しさん@お腹いっぱい。
垢版 |
2020/06/17(水) 09:33:18.63
ログインしなくてもツイッター保存できますか?
JSONで保存されるか成功したかと思ったらこうなって保存されない……

Sorry, that page doesn’t exist!
Why not try a search to find something else?
0127名無しさん@お腹いっぱい。
垢版 |
2020/06/18(木) 09:37:49.00
>>125
基本的に取れる魚拓は複数でとるようにしてるんだけどTwitterの魚拓が現状二つだけになってしまって困る……
しかも片方は突然不安定になって一ヶ月まともに使えないこともあるからなー
0129名無しさん@お腹いっぱい。
垢版 |
2020/06/19(金) 00:13:10.75
でも15日に取ってる人がいるんだよなー
0134名無しさん@お腹いっぱい。
垢版 |
2020/06/19(金) 17:11:29.86
検索してからThis page available on the webからならとれた
でもそれ以外からだと即Not foundが出るだけで一切とれない
なんなんだ
0135名無しさん@お腹いっぱい。
垢版 |
2020/06/19(金) 17:59:07.87
検索からの「This page available on the web」は直接保存の/save/http〜なんだな。
Save page nowの方の「This page available on the web」が機能してないのか。
0137名無しさん@お腹いっぱい。
垢版 |
2020/06/20(土) 13:40:09.97
お、取れた
情報thx
0138名無しさん@お腹いっぱい。
垢版 |
2020/06/21(日) 19:56:01.96
ツイッター一応とれるようになったのもあるけど
頻繁にSorry that page doesn't exist!やエラーになって取れない事の方が多い…
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況