Internet Archive総合 (web.archive.org) #3
■ このスレッドは過去ログ倉庫に格納されています
なんだかんだでお世話になってるInternet Archiveについて語りましょう Internet Archive ttp://www.archive.org/index.php インターネット・アーカイブ - Wikipedia ttp://ja.wikipedia.org/wiki/InternetArchive ------------------ Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても 真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、 16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。 前スレッド Internet Archive総合 (web.archive.org) #2 http://mevius.5ch.net/test/read.cgi/esite/1475246713/ Archive.st - Save The Internet いま試してみたらヤフーニュースの魚拓が取れるみたいだぞ。 本日1回目のSaveでいきなりToo Many Requests 400 Bad Request Request Header Or Cookie Too Large 閲覧のほうでToo Many出すのはやめて欲しい 使い勝手が悪い Internet Archive にアーカイブされたページを、 全文検索する方法ってないですか? https://it.srad.jp/story/18/12/04/0637201/ >少なくとも「インターネット上の情報を残しておく義務」も「過去にインターネット上にあった情報にアクセスできる権利」も法的にあるわけじゃないしね。 削除申請に応じる義務もないだろ アーカイブされたサイトのホームページだけでなく 全文で全サイトを検索することってできますか? savingの読み込みから進まんね と思ったら何分か経って完了したわ なんでか分からないけどFirefoxだと/web/2/とか/save/が使えないのに Google Chromeだと使えるっぽいんだよな。昔はFirefoxでも使えた。 最新版に更新してアドオン切っても駄目とかどうなってんだ。 > Firefox 75.0 64bit Firefoxは最新バージョンです > Google Chrome は最新版です バージョン: 81.0.4044.129(Official Build) (64 ビット) Firefoxで使えてる人いる? >>38 の件の追記、何故か/web/2/の方だけ復活した。 /save/は使えないまま。開くと真っ白なページが出てそれ以上何も起きない。 This snapshot cannot be displayed due to an internal error. って出るサイトは無理? homepage2.nifty.comは1と3はできるのにどうして2だけ見れないの もうこっちは駄目だ >>9 のレスと現状は違う 保存したはずが後日何度見返しても保存されてない場合がある 10回につき2〜3回くらい https://web.archive.org/save/ こっちは大丈夫 http://archive.vn/ >>44 どーせスポーツ新聞のサイトだろ、保存してるのって 保存したものの特に重要なものはリスト化してチェックしてるが取りこぼしはないな しかし反映の遅いものは一週間以上かかる場合もあった >>44 archive.today は他にもドメインがあるのに わざわざ .vn なんか持ち出してくるとか笑える ベトナム共産シンパかよ ニッチなニーズかもしれませんがスクリプトを公開しました。 Wayback Machine でURL検索をした際、最古または最新のページに自動で飛びます。 https://greasyfork.org/ja/scripts/403724-wayback-machine-auto-hopper ヤフーニュースのスクリーンショット取れなくなった? Internet Archiveってサイト保存したらどのIPが保存したとかも記録されんの? >>55 どの方法でアーカイブが行われたのかも記録されているから、 おそらく IP も残っているんじゃないかねぇ。 ただ、アーカイブを読み出したときのレスポンスヘッダを見る限りでは、 その IP がアーカイブ閲覧者に漏れているような感じはしない。 あともう一つ、Archive.is がやっているような リクエスト元 IP のアーカイブ対象サーバへのお漏らしは Internet Archive では起きていない。 >>57 しっかり書いてありますね。勉強になります。 ページの全文検索って募金が終わらないとできないの? Twitterでたまにjsonが取れる現象なんとかならないのかね Vuepressのページを保存すると一瞬は表示されるけどすぐ404に画面が書き換わっちゃう https://web.archive.org/web/20200528205956/https ://hapicode.com/vuepress/config.html >>63 別サイトのページだが俺もそれ多い 全部じゃないけど… >>62 自分でパーサなり何なり通さないと読めないから言うほど便利じゃないぞ それにWayback Machineを使う場合、jsonが欲しい時よりもhtmlとして描画された状態のアーカイブが欲しいことの方が多い ttps://twitter.com/internetarchive/status/1268108466192703489 また落ちたか https://twitter.com/5chan_nel (5ch newer account) Internet ArchiveってURLで保存する方法とは別に htmlソースコピーで保存する方法も出来るようにすればいいのに 当然独自URL生成する必要性も出てくるけど ツイッターがInternet Explorerからの閲覧をできないようにしたらしく、その影響でツイッターのアーカイブがとれなくなってしまったんだけどどうしたらいいだろう? 今までInternet Explorerからならツイッターのアーカイブがとれたんだけど…他のブラウザからじゃアーカイブできないのよ困った 試してないけどmobile.twitter.comもだめなん >>73 もしかしてThis page is available on the web!から取ってない? あれは保存する奴の環境に左右されるから使えんよ https://web.archive.org/save からなら問題なく取れる >>74 今ためしてみたらmobileの方でならアーカイブできたわ ありがとう でもなんでまたツイッターは急にIEからの閲覧はじくようになったんだろう? >>75 よく分からないけどアーカイブしようとすると「このブラウザは現在サポートされていません」て出てくる 調べたら最近ツイッターがIEから閲覧できないようにしたらしいって言われてたから >>75 今そのURLから保存してみたらmobileじゃなくてもアーカイブできたわ どうもありがとう Internet Archive ってなんで全ページ検索できるようにしないの? Internet Archive ってなんで全ページ検索できるようにしないの? すみません ツイッター保存してるとけっこう頻繁に.jsonてURLについて謎の文字化けみたいになってしまうんですが、これはいったい…? どうしたらいいんだろう >>82 ちょっと前からたまに起きる現象、原因は分からない・・・ 面倒だけどちゃんと取れるまで取り直すしかない >>75 に追加 This page is available on the web!からだけじゃなくて https://archive.org/web/ のSave Page Nowもダメっぽい 基本的にhttps://web.archive.org/save を使った方が良さげ Save Page Nowにあるこのチェックは何の意味があるの >Save error pages (HTTP Status=4xx, 5xx) しらんけど 例えば「404 Not Found」だけのページだった場合に 「そこにはなにもなかった」ってことにするか、 それとも「404 Not Foundがあったのだ」ってことにするかだと思う >>83 どうも 取り直せばいけるなら何度かトライしてみます >>79 昔一度やったことあるけど情報量があまりにも多過ぎて重すぎてまともに検索できなかったとか見た 全文検索できたら本当にいいんだけど現時点では無理ぽい… <title>だけでも検索できるとめちゃ便利なんだけどな アーカイブってエロサイト保存した場合動画も保存されんの? 何か前にあったような気もするが フェアユースだしな Internet Archiveが公開してる電子書籍について出版社から訴えられたとかじゃなかったか Gigazineだかどっかのネットニュースに出てたね 電子書籍って保存出来るんなら無料で見れるやつじゃないの? これだな 詳しくは記事見てくれ 米国の複数の大手出版社がInternet Archive(IA)に対する著作権侵害訴訟を提訴 Posted 2020年6月3日 https://current.ndl.go.jp/node/41125 Internet Archive(IA)、“National Emergency Library”の終了を早めることを発表 Posted 2020年6月12日 https://current.ndl.go.jp/node/41213 こっちは拾える ttp://archive.fo/ インターネット初心者です。 質問なのですが、save page nowでページをアーカイブした場合、Internet archiveの説明ではIPアドレスを保持しないため匿名で保存できるとなっているのですが本当でしょうか。 また、save page nowでページを保存するとその瞬間のページだけが保存され、過去のページの情報は保存されないのでしょうか。(すでに削除されていて、今は見ることができずアーカイブもそれまでされていないようなページの場合)教えて頂きたいです。無知ですみません。 >>99 自分も今日いくらやっても連続してツイートのアーカイブに失敗するから、自分の環境が悪いのかと思ったけどこれは…… >>101 ・IPアドレス:>>55-57 を参照 ・過去のページ情報: 「save page nowでページを保存するとその瞬間のページだけが保存され、過去のページの情報は保存されないのでしょうか。」 その認識で合ってる。SPNは「現時点でのページをアーカイブする」ことしか出来ない。 過去のページをアーカイブできる技術はないし、するにはタイムマシンが必要。 現在削除済みでアーカイブも残っていないページは諦めよう 「ツイッター魚拓」とかいう国産サービスができたらしいが。 >>103 ご回答ありがとうございます。それでは、自分が○月×日にしかアーカイブしていないのにそれ以前のページの情報が出てくるということは 、他の誰かが○月×日以前にアーカイブしたということでよろしいでしょうか? >>105 Internet archiveは自動で色んなサイトをクロールして定期的にアーカイブして回ってるから別に誰かが保存したわけじゃなくて自動でアーカイブされてた可能性が高い というかわざわざ手動でアーカイブするマニアなんてここの住人位しかいなそうだしほとんど自動取得 >>106 では、○月×日以前の情報は私がアーカイブしたものではないということでいいんでしょうか? >>108 また質問なのですが、Twitterの動画をアーカイブした際、機種の差(Androidやios,PC)で見ることができないことってあるんですか? TweetSave - Save tweets with a click https://tweetsave.com/ >>104 アレはスクショ撮ってimgurに上げるだけの代物で、セッション情報の類は一切保存されないらしいから、 アーカイブサービスとしての信頼性はゼロに等しい(中傷書き込みの訴訟でも多分証拠として認められないんじゃないだろうか) ただTwitterではやたらバズったから、固定ユーザーは一定数つくかもね ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる