なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php
インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
------------------
Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック
Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。
前スレッド
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
探検
Internet Archive総合 (web.archive.org) #3
レス数が1000を超えています。これ以上書き込みはできません。
2020/04/02(木) 02:08:09.83
2名無しさん@お腹いっぱい。
2020/04/02(木) 02:12:07.12 関連スレッド
・ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
・【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
・ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
・【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
3名無しさん@お腹いっぱい。
2020/04/03(金) 06:21:50.54 保守しよう
2020/04/08(水) 23:23:12.60
追加した方がいいテンプレって何があるかな
2020/04/09(木) 13:43:59.23
保存したはずなのに消えてる!って質問よくされてるから
その辺の事とか?
その辺の事とか?
2020/04/10(金) 14:21:39.04
ホシュ
7名無しさん@お腹いっぱい。
2020/04/10(金) 15:59:46.20 保守
2020/04/11(土) 16:55:05.81
Hmmm
2020/04/13(月) 02:51:24.68
>>5
それいいね、こんなところだろうか
少し長すぎたかも
Q. 保存したはずなのに見れない!どういうこと?
A. Internet Archiveはアーカイブ量の増加ペースの速さにサーバが追いついておらず、不安定なことが多いです。安定するタイミングを待ちましょう。
またWayback Machineは、ページの保存作業を担当するクローラ部分(Heritrix)と、保存したページの保管・記録・表示を担当するビューワー部分(Wayback)の別々な2つのソフトウェアを組み合わせて動いています。
なので、保存したはずのアーカイブが表示されなくなっていても、クローラ部分がちゃんと動いていたのならアーカイブはちゃんと保存されています。サーバが安定するのを待ちましょう。
それいいね、こんなところだろうか
少し長すぎたかも
Q. 保存したはずなのに見れない!どういうこと?
A. Internet Archiveはアーカイブ量の増加ペースの速さにサーバが追いついておらず、不安定なことが多いです。安定するタイミングを待ちましょう。
またWayback Machineは、ページの保存作業を担当するクローラ部分(Heritrix)と、保存したページの保管・記録・表示を担当するビューワー部分(Wayback)の別々な2つのソフトウェアを組み合わせて動いています。
なので、保存したはずのアーカイブが表示されなくなっていても、クローラ部分がちゃんと動いていたのならアーカイブはちゃんと保存されています。サーバが安定するのを待ちましょう。
2020/04/13(月) 04:11:54.84
( ゚ー゚)Ъ イイネ
2020/04/15(水) 07:20:22.43
TMR出まくる
2020/04/15(水) 18:05:00.65
IAは滅亡する!
13名無しさん@お腹いっぱい。
2020/04/15(水) 21:01:13.80 Archive.st - Save The Internet
いま試してみたらヤフーニュースの魚拓が取れるみたいだぞ。
いま試してみたらヤフーニュースの魚拓が取れるみたいだぞ。
2020/04/15(水) 22:34:44.76
やっぱりTMRの出方おかしいよな
2020/04/16(木) 00:09:58.28
400 Bad Request
Request Header Or Cookie Too Large
Request Header Or Cookie Too Large
2020/04/16(木) 01:24:51.42
直ったっぽい >>16
2020/04/16(木) 14:27:01.09
閲覧のほうでToo Many出すのはやめて欲しい
使い勝手が悪い
使い勝手が悪い
19名無しさん@お腹いっぱい。
2020/04/16(木) 17:38:40.11 英語版ウィキペディア
List of Web archiving initiatives
https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives
List of Web archiving initiatives
https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives
20名無しさん@お腹いっぱい。
2020/04/21(火) 18:00:24.40 Internet Archive にアーカイブされたページを、
全文検索する方法ってないですか?
全文検索する方法ってないですか?
21名無しさん@お腹いっぱい。
2020/04/23(木) 17:18:11.04 homepage2.nifty.comがみれない
2020/04/23(木) 20:46:43.90
>>20
昔はあったらしいけど、今は無いね
昔はあったらしいけど、今は無いね
23名無しさん@お腹いっぱい。
2020/04/24(金) 08:26:30.95 https://it.srad.jp/story/18/12/04/0637201/
>少なくとも「インターネット上の情報を残しておく義務」も「過去にインターネット上にあった情報にアクセスできる権利」も法的にあるわけじゃないしね。
削除申請に応じる義務もないだろ
>少なくとも「インターネット上の情報を残しておく義務」も「過去にインターネット上にあった情報にアクセスできる権利」も法的にあるわけじゃないしね。
削除申請に応じる義務もないだろ
24名無しさん@お腹いっぱい。
2020/04/25(土) 13:24:52.15 ブロックされて見れません
どうしたらいいですか
どうしたらいいですか
2020/04/25(土) 13:31:44.54
諦めましょう。
26名無しさん@お腹いっぱい。
2020/04/27(月) 13:25:21.03 アーカイブされたサイトのホームページだけでなく
全文で全サイトを検索することってできますか?
全文で全サイトを検索することってできますか?
2020/04/27(月) 14:28:42.88
2020/04/27(月) 15:40:04.60
>>26
おじいちゃんさっき質問したばかりでしょ
おじいちゃんさっき質問したばかりでしょ
29名無しさん@お腹いっぱい。
2020/04/28(火) 12:32:34.74 >>26だがあえて実現しないってことなのかな?
2020/04/28(火) 22:44:19.58
ほんもののおじいちゃんだ・・・・
2020/04/30(木) 17:37:06.70
繋がらない
2020/04/30(木) 20:41:22.93
昨日から調子悪いな
2020/04/30(木) 21:50:33.66
いつ調子がよかったですか
2020/05/02(土) 09:18:23.41
savingの読み込みから進まんね
と思ったら何分か経って完了したわ
と思ったら何分か経って完了したわ
2020/05/02(土) 13:17:39.09
なおDLは出来ない程度には重い模様
2020/05/04(月) 17:31:58.48
そう言えばレジューム出来ないの?
2020/05/04(月) 20:01:13.97
アサシャンレジューム
2020/05/04(月) 23:49:37.23
なんでか分からないけどFirefoxだと/web/2/とか/save/が使えないのに
Google Chromeだと使えるっぽいんだよな。昔はFirefoxでも使えた。
最新版に更新してアドオン切っても駄目とかどうなってんだ。
> Firefox 75.0 64bit Firefoxは最新バージョンです
> Google Chrome は最新版です バージョン: 81.0.4044.129(Official Build) (64 ビット)
Firefoxで使えてる人いる?
Google Chromeだと使えるっぽいんだよな。昔はFirefoxでも使えた。
最新版に更新してアドオン切っても駄目とかどうなってんだ。
> Firefox 75.0 64bit Firefoxは最新バージョンです
> Google Chrome は最新版です バージョン: 81.0.4044.129(Official Build) (64 ビット)
Firefoxで使えてる人いる?
2020/05/05(火) 00:04:37.61
>>38の件の追記、何故か/web/2/の方だけ復活した。
/save/は使えないまま。開くと真っ白なページが出てそれ以上何も起きない。
/save/は使えないまま。開くと真っ白なページが出てそれ以上何も起きない。
40名無しさん@お腹いっぱい。
2020/05/11(月) 18:37:29.02 This snapshot cannot be displayed due to an internal error.
って出るサイトは無理?
って出るサイトは無理?
2020/05/12(火) 01:23:40.96
それはダメだな
諦めろ
諦めろ
42名無しさん@お腹いっぱい。
2020/05/13(水) 08:25:33.17 homepage2.nifty.comは1と3はできるのにどうして2だけ見れないの
2020/05/14(木) 03:12:02.56
わたしにもわかりません
2020/05/16(土) 17:43:07.77
もうこっちは駄目だ
>>9のレスと現状は違う
保存したはずが後日何度見返しても保存されてない場合がある
10回につき2〜3回くらい
https://web.archive.org/save/
こっちは大丈夫
http://archive.vn/
>>9のレスと現状は違う
保存したはずが後日何度見返しても保存されてない場合がある
10回につき2〜3回くらい
https://web.archive.org/save/
こっちは大丈夫
http://archive.vn/
2020/05/17(日) 09:37:06.63
>>44
どーせスポーツ新聞のサイトだろ、保存してるのって
どーせスポーツ新聞のサイトだろ、保存してるのって
2020/05/17(日) 11:25:01.03
保存したものの特に重要なものはリスト化してチェックしてるが取りこぼしはないな
しかし反映の遅いものは一週間以上かかる場合もあった
しかし反映の遅いものは一週間以上かかる場合もあった
2020/05/17(日) 14:05:23.73
2020/05/17(日) 14:52:36.40
そんなに悔しかったのかよ白湯でも飲んどけ
2020/05/17(日) 15:32:43.93
俺はこれ
http://archive.fo/
http://archive.fo/
2020/05/17(日) 17:08:08.07
流れ的におすすめの白湯の紹介かと思った
2020/05/17(日) 21:58:05.32
>>49
こういうマイナーなドメインのレジストリは騙されやすいのかねぇ。
https://twitter.com/archiveis/status/1188222460598116353
https://twitter.com/5chan_nel (5ch newer account)
こういうマイナーなドメインのレジストリは騙されやすいのかねぇ。
https://twitter.com/archiveis/status/1188222460598116353
https://twitter.com/5chan_nel (5ch newer account)
2020/05/21(木) 20:21:26.07
ニッチなニーズかもしれませんがスクリプトを公開しました。
Wayback Machine でURL検索をした際、最古または最新のページに自動で飛びます。
https://greasyfork.org/ja/scripts/403724-wayback-machine-auto-hopper
Wayback Machine でURL検索をした際、最古または最新のページに自動で飛びます。
https://greasyfork.org/ja/scripts/403724-wayback-machine-auto-hopper
2020/05/21(木) 23:47:38.42
ありがとこんばんは
54名無しさん@お腹いっぱい。
2020/05/22(金) 07:29:19.83 ヤフーニュースのスクリーンショット取れなくなった?
2020/05/22(金) 10:21:49.17
Internet Archiveってサイト保存したらどのIPが保存したとかも記録されんの?
2020/05/23(土) 14:05:21.25
>>55
どの方法でアーカイブが行われたのかも記録されているから、
おそらく IP も残っているんじゃないかねぇ。
ただ、アーカイブを読み出したときのレスポンスヘッダを見る限りでは、
その IP がアーカイブ閲覧者に漏れているような感じはしない。
あともう一つ、Archive.is がやっているような
リクエスト元 IP のアーカイブ対象サーバへのお漏らしは
Internet Archive では起きていない。
どの方法でアーカイブが行われたのかも記録されているから、
おそらく IP も残っているんじゃないかねぇ。
ただ、アーカイブを読み出したときのレスポンスヘッダを見る限りでは、
その IP がアーカイブ閲覧者に漏れているような感じはしない。
あともう一つ、Archive.is がやっているような
リクエスト元 IP のアーカイブ対象サーバへのお漏らしは
Internet Archive では起きていない。
2020/05/23(土) 14:20:07.01
>>55
この辺見る限り保存はされていないっぽい
https://help.archive.org/hc/en-us/articles/360001513491-Save-Pages-in-the-Wayback-Machine
https://help.archive.org/hc/en-us/articles/360018536672-What-is-a-view-
https://blog.archive.org/2013/10/25/reader-privacy-at-the-internet-archive/
・全てのユーザーの行動はIPアドレスを元にしたハッシュ値で記録される
・一日毎にハッシュ値は変更される
とか何とか、間違ってたらすまん
この辺見る限り保存はされていないっぽい
https://help.archive.org/hc/en-us/articles/360001513491-Save-Pages-in-the-Wayback-Machine
https://help.archive.org/hc/en-us/articles/360018536672-What-is-a-view-
https://blog.archive.org/2013/10/25/reader-privacy-at-the-internet-archive/
・全てのユーザーの行動はIPアドレスを元にしたハッシュ値で記録される
・一日毎にハッシュ値は変更される
とか何とか、間違ってたらすまん
59名無しさん@お腹いっぱい。
2020/05/24(日) 17:36:51.34 ページの全文検索って募金が終わらないとできないの?
60名無しさん@お腹いっぱい。
2020/05/26(火) 17:22:56.022020/05/29(金) 16:01:06.33
Twitterでたまにjsonが取れる現象なんとかならないのかね
2020/05/29(金) 19:18:21.90
やったじゃん
むしろほしい
むしろほしい
Vuepressのページを保存すると一瞬は表示されるけどすぐ404に画面が書き換わっちゃう
https://web.archive.org/web/20200528205956/https://hapicode.com/vuepress/config.html
https://web.archive.org/web/20200528205956/https://hapicode.com/vuepress/config.html
2020/05/30(土) 14:20:01.49
見たが普通に表示されてる
2020/05/30(土) 15:53:03.29
俺は見てない
2020/05/30(土) 16:31:26.19
2020/06/02(火) 20:27:56.79
平和(・∀・)イイ!!
2020/06/03(水) 02:42:09.09
2020/06/03(水) 05:21:59.69
>>62
自分でパーサなり何なり通さないと読めないから言うほど便利じゃないぞ
それにWayback Machineを使う場合、jsonが欲しい時よりもhtmlとして描画された状態のアーカイブが欲しいことの方が多い
自分でパーサなり何なり通さないと読めないから言うほど便利じゃないぞ
それにWayback Machineを使う場合、jsonが欲しい時よりもhtmlとして描画された状態のアーカイブが欲しいことの方が多い
2020/06/03(水) 18:43:00.59
ttps://twitter.com/internetarchive/status/1268108466192703489
また落ちたか
https://twitter.com/5chan_nel (5ch newer account)
また落ちたか
https://twitter.com/5chan_nel (5ch newer account)
2020/06/05(金) 02:20:35.43
Internet ArchiveってURLで保存する方法とは別に
htmlソースコピーで保存する方法も出来るようにすればいいのに
当然独自URL生成する必要性も出てくるけど
htmlソースコピーで保存する方法も出来るようにすればいいのに
当然独自URL生成する必要性も出てくるけど
2020/06/05(金) 02:53:38.00
うpろだかよw
2020/06/05(金) 11:50:13.06
ツイッターがInternet Explorerからの閲覧をできないようにしたらしく、その影響でツイッターのアーカイブがとれなくなってしまったんだけどどうしたらいいだろう?
今までInternet Explorerからならツイッターのアーカイブがとれたんだけど…他のブラウザからじゃアーカイブできないのよ困った
今までInternet Explorerからならツイッターのアーカイブがとれたんだけど…他のブラウザからじゃアーカイブできないのよ困った
2020/06/05(金) 13:28:28.43
試してないけどmobile.twitter.comもだめなん
2020/06/05(金) 15:25:44.03
>>73
もしかしてThis page is available on the web!から取ってない?
あれは保存する奴の環境に左右されるから使えんよ
https://web.archive.org/save
からなら問題なく取れる
もしかしてThis page is available on the web!から取ってない?
あれは保存する奴の環境に左右されるから使えんよ
https://web.archive.org/save
からなら問題なく取れる
2020/06/05(金) 15:25:45.36
2020/06/05(金) 15:27:58.42
2020/06/05(金) 15:31:37.89
79名無しさん@お腹いっぱい。
2020/06/06(土) 15:33:25.33 Internet Archive ってなんで全ページ検索できるようにしないの?
80名無しさん@お腹いっぱい。
2020/06/06(土) 15:33:25.70 Internet Archive ってなんで全ページ検索できるようにしないの?
>>79
高負荷だからだとおもう
高負荷だからだとおもう
2020/06/08(月) 01:47:07.90
すみません
ツイッター保存してるとけっこう頻繁に.jsonてURLについて謎の文字化けみたいになってしまうんですが、これはいったい…?
どうしたらいいんだろう
ツイッター保存してるとけっこう頻繁に.jsonてURLについて謎の文字化けみたいになってしまうんですが、これはいったい…?
どうしたらいいんだろう
2020/06/08(月) 11:56:33.80
2020/06/08(月) 12:01:17.42
>>75
に追加
This page is available on the web!からだけじゃなくて
https://archive.org/web/
のSave Page Nowもダメっぽい
基本的にhttps://web.archive.org/saveを使った方が良さげ
に追加
This page is available on the web!からだけじゃなくて
https://archive.org/web/
のSave Page Nowもダメっぽい
基本的にhttps://web.archive.org/saveを使った方が良さげ
2020/06/08(月) 12:11:18.46
Save Page Nowにあるこのチェックは何の意味があるの
>Save error pages (HTTP Status=4xx, 5xx)
>Save error pages (HTTP Status=4xx, 5xx)
2020/06/08(月) 13:28:21.88
エラー画面を保存するかしないか
2020/06/08(月) 13:29:41.66
しらんけど
例えば「404 Not Found」だけのページだった場合に
「そこにはなにもなかった」ってことにするか、
それとも「404 Not Foundがあったのだ」ってことにするかだと思う
例えば「404 Not Found」だけのページだった場合に
「そこにはなにもなかった」ってことにするか、
それとも「404 Not Foundがあったのだ」ってことにするかだと思う
2020/06/08(月) 20:02:31.91
2020/06/08(月) 22:26:30.20
2020/06/08(月) 23:59:41.72
<title>だけでも検索できるとめちゃ便利なんだけどな
2020/06/10(水) 17:55:12.02
アーカイブってエロサイト保存した場合動画も保存されんの?
2020/06/10(水) 19:12:24.60
基本的にされないと思った方が良い
2020/06/11(木) 11:34:40.23
訴訟問題は大丈夫なのかな
大事にならないといいが
大事にならないといいが
2020/06/11(木) 12:56:19.55
訴訟問題って何?
2020/06/12(金) 00:22:25.00
何か前にあったような気もするが
フェアユースだしな
フェアユースだしな
2020/06/12(金) 19:12:09.28
Internet Archiveが公開してる電子書籍について出版社から訴えられたとかじゃなかったか
Gigazineだかどっかのネットニュースに出てたね
Gigazineだかどっかのネットニュースに出てたね
2020/06/13(土) 00:03:15.44
電子書籍って保存出来るんなら無料で見れるやつじゃないの?
2020/06/13(土) 02:03:05.75
これだな
詳しくは記事見てくれ
米国の複数の大手出版社がInternet Archive(IA)に対する著作権侵害訴訟を提訴
Posted 2020年6月3日
https://current.ndl.go.jp/node/41125
Internet Archive(IA)、“National Emergency Library”の終了を早めることを発表
Posted 2020年6月12日
https://current.ndl.go.jp/node/41213
詳しくは記事見てくれ
米国の複数の大手出版社がInternet Archive(IA)に対する著作権侵害訴訟を提訴
Posted 2020年6月3日
https://current.ndl.go.jp/node/41125
Internet Archive(IA)、“National Emergency Library”の終了を早めることを発表
Posted 2020年6月12日
https://current.ndl.go.jp/node/41213
2020/06/13(土) 20:38:47.97
もしかしてTwitter取れなくなった?
https://web.archive.org/saveでもダメだ
https://web.archive.org/saveでもダメだ
2020/06/14(日) 11:13:18.22
こっちは拾える
ttp://archive.fo/
ttp://archive.fo/
101名無しさん@お腹いっぱい。
2020/06/14(日) 15:05:21.28 インターネット初心者です。
質問なのですが、save page nowでページをアーカイブした場合、Internet archiveの説明ではIPアドレスを保持しないため匿名で保存できるとなっているのですが本当でしょうか。
また、save page nowでページを保存するとその瞬間のページだけが保存され、過去のページの情報は保存されないのでしょうか。(すでに削除されていて、今は見ることができずアーカイブもそれまでされていないようなページの場合)教えて頂きたいです。無知ですみません。
質問なのですが、save page nowでページをアーカイブした場合、Internet archiveの説明ではIPアドレスを保持しないため匿名で保存できるとなっているのですが本当でしょうか。
また、save page nowでページを保存するとその瞬間のページだけが保存され、過去のページの情報は保存されないのでしょうか。(すでに削除されていて、今は見ることができずアーカイブもそれまでされていないようなページの場合)教えて頂きたいです。無知ですみません。
2020/06/14(日) 17:13:12.66
>>99
自分も今日いくらやっても連続してツイートのアーカイブに失敗するから、自分の環境が悪いのかと思ったけどこれは……
自分も今日いくらやっても連続してツイートのアーカイブに失敗するから、自分の環境が悪いのかと思ったけどこれは……
2020/06/14(日) 17:27:12.26
104名無しさん@お腹いっぱい。
2020/06/14(日) 17:48:04.05 「ツイッター魚拓」とかいう国産サービスができたらしいが。
105名無しさん@お腹いっぱい。
2020/06/14(日) 18:09:23.85 >>103
ご回答ありがとうございます。それでは、自分が○月×日にしかアーカイブしていないのにそれ以前のページの情報が出てくるということは
、他の誰かが○月×日以前にアーカイブしたということでよろしいでしょうか?
ご回答ありがとうございます。それでは、自分が○月×日にしかアーカイブしていないのにそれ以前のページの情報が出てくるということは
、他の誰かが○月×日以前にアーカイブしたということでよろしいでしょうか?
2020/06/14(日) 18:29:19.48
>>105
Internet archiveは自動で色んなサイトをクロールして定期的にアーカイブして回ってるから別に誰かが保存したわけじゃなくて自動でアーカイブされてた可能性が高い
というかわざわざ手動でアーカイブするマニアなんてここの住人位しかいなそうだしほとんど自動取得
Internet archiveは自動で色んなサイトをクロールして定期的にアーカイブして回ってるから別に誰かが保存したわけじゃなくて自動でアーカイブされてた可能性が高い
というかわざわざ手動でアーカイブするマニアなんてここの住人位しかいなそうだしほとんど自動取得
107名無しさん@お腹いっぱい。
2020/06/14(日) 18:43:23.66 >>106
では、○月×日以前の情報は私がアーカイブしたものではないということでいいんでしょうか?
では、○月×日以前の情報は私がアーカイブしたものではないということでいいんでしょうか?
2020/06/14(日) 20:09:22.90
>>107
うん
うん
109名無しさん@お腹いっぱい。
2020/06/14(日) 20:22:26.52 >>108
また質問なのですが、Twitterの動画をアーカイブした際、機種の差(Androidやios,PC)で見ることができないことってあるんですか?
また質問なのですが、Twitterの動画をアーカイブした際、機種の差(Androidやios,PC)で見ることができないことってあるんですか?
2020/06/14(日) 21:26:10.00
TweetSave - Save tweets with a click
https://tweetsave.com/
https://tweetsave.com/
2020/06/14(日) 22:49:30.89
>>104
アレはスクショ撮ってimgurに上げるだけの代物で、セッション情報の類は一切保存されないらしいから、
アーカイブサービスとしての信頼性はゼロに等しい(中傷書き込みの訴訟でも多分証拠として認められないんじゃないだろうか)
ただTwitterではやたらバズったから、固定ユーザーは一定数つくかもね
アレはスクショ撮ってimgurに上げるだけの代物で、セッション情報の類は一切保存されないらしいから、
アーカイブサービスとしての信頼性はゼロに等しい(中傷書き込みの訴訟でも多分証拠として認められないんじゃないだろうか)
ただTwitterではやたらバズったから、固定ユーザーは一定数つくかもね
2020/06/15(月) 02:28:53.83
>>109
ツイッターの動画は保存できなかったと思うが…
ツイッターの動画は保存できなかったと思うが…
113名無しさん@お腹いっぱい。
2020/06/15(月) 06:39:57.00114名無しさん@お腹いっぱい。
2020/06/15(月) 06:41:39.22 >>110
> TweetSave - Save tweets with a click
> https://tweetsave.com/
Tweets are saved on TweetSave.com and also get mirrored to WayBack and Archive.is
とあるな。
これは使えるかもしれない。
> TweetSave - Save tweets with a click
> https://tweetsave.com/
Tweets are saved on TweetSave.com and also get mirrored to WayBack and Archive.is
とあるな。
これは使えるかもしれない。
115名無しさん@お腹いっぱい。
2020/06/15(月) 06:43:57.132020/06/15(月) 07:23:11.71
118名無しさん@お腹いっぱい。
2020/06/15(月) 07:26:47.37 以前はわからんが、今はまあまあ安定しているみたいだよ。
ちょっと試してみて。
ちょっと試してみて。
119名無しさん@お腹いっぱい。
2020/06/15(月) 07:57:49.97120名無しさん@お腹いっぱい。
2020/06/15(月) 09:06:38.20 >>103
This page is available on the web!でも一緒ですか?
This page is available on the web!でも一緒ですか?
2020/06/15(月) 11:44:39.88
122名無しさん@お腹いっぱい。
2020/06/15(月) 12:01:07.51 >>121
うろ覚えの記憶ですが、3ヶ月位前にhttps://video.twimg.com...のページを探していて見つからず、This page is available on the web!となって訳も分からないでアーカイブしてしまい、その日のアーカイブでは黒い画面で動画が再生されず見れなかったのですが、なぜかカレンダーに一年程前のアーカイブが現れてそれでは動画を見ることができました。3ヶ月程前なので記憶が曖昧なのですがこういうことってありえますか?
うろ覚えの記憶ですが、3ヶ月位前にhttps://video.twimg.com...のページを探していて見つからず、This page is available on the web!となって訳も分からないでアーカイブしてしまい、その日のアーカイブでは黒い画面で動画が再生されず見れなかったのですが、なぜかカレンダーに一年程前のアーカイブが現れてそれでは動画を見ることができました。3ヶ月程前なので記憶が曖昧なのですがこういうことってありえますか?
123名無しさん@お腹いっぱい。
2020/06/16(火) 16:07:46.24 >>121
それでは、Android(chrome,Firefox)で再生できなかったものは他の端末、ブラウザなどでも再生できないということでしょうか?
それでは、Android(chrome,Firefox)で再生できなかったものは他の端末、ブラウザなどでも再生できないということでしょうか?
124名無しさん@お腹いっぱい。
2020/06/17(水) 09:33:18.63 ログインしなくてもツイッター保存できますか?
JSONで保存されるか成功したかと思ったらこうなって保存されない……
Sorry, that page doesn’t exist!
Why not try a search to find something else?
JSONで保存されるか成功したかと思ったらこうなって保存されない……
Sorry, that page doesn’t exist!
Why not try a search to find something else?
2020/06/17(水) 19:03:54.27
日テレNews24もキャプチャできないっぽい
Todayならできたのでそっちで取る
Todayならできたのでそっちで取る
2020/06/17(水) 20:06:39.58
なんか調子悪い?
ツイッター全然とれなくなったし他のサイトでもちょくちょくエラー出る
ツイッター全然とれなくなったし他のサイトでもちょくちょくエラー出る
127名無しさん@お腹いっぱい。
2020/06/18(木) 09:37:49.002020/06/18(木) 23:45:04.10
Twitterが取れなくなったのはTwitter側の仕様変更のせいじゃないかな
129名無しさん@お腹いっぱい。
2020/06/19(金) 00:13:10.75 でも15日に取ってる人がいるんだよなー
2020/06/19(金) 02:33:11.77
UAをUtsubotにしたら撮れるとかなんとか
2020/06/19(金) 11:05:22.72
http://web.archive.org/save/のページで保存しようとするとこんな画面になってしまう…
ttps://i.imgur.com/1ebLT02.png
ttps://i.imgur.com/1ebLT02.png
2020/06/19(金) 11:40:27.27
2020/06/19(金) 15:14:08.19
自分もNot Foundになって5ちゃん含め何一つとれなくなった…
2020/06/19(金) 17:11:29.86
検索してからThis page available on the webからならとれた
でもそれ以外からだと即Not foundが出るだけで一切とれない
なんなんだ
でもそれ以外からだと即Not foundが出るだけで一切とれない
なんなんだ
2020/06/19(金) 17:59:07.87
検索からの「This page available on the web」は直接保存の/save/http〜なんだな。
Save page nowの方の「This page available on the web」が機能してないのか。
Save page nowの方の「This page available on the web」が機能してないのか。
2020/06/20(土) 13:37:10.95
お、Twitter取れるようになったか
137名無しさん@お腹いっぱい。
2020/06/20(土) 13:40:09.97 お、取れた
情報thx
情報thx
2020/06/21(日) 19:56:01.96
ツイッター一応とれるようになったのもあるけど
頻繁にSorry that page doesn't exist!やエラーになって取れない事の方が多い…
頻繁にSorry that page doesn't exist!やエラーになって取れない事の方が多い…
2020/06/21(日) 21:14:32.41
アーカイブって動画のURL直入力したら保存されるの?
2020/06/22(月) 11:45:10.84
ものによってはとれる事もあるけど基本とれないと思った方が良い
2020/06/22(月) 11:51:39.66
2020/06/22(月) 13:50:04.34
143名無しさん@お腹いっぱい。
2020/06/22(月) 14:27:28.61 保存は複数の鯖から暇している鯖が取りに行くんだけど
ロシア語、英語、ドイツ語などランダムで取られていたから経由する鯖が更新されてないと取れないと予想
ロシア語、英語、ドイツ語などランダムで取られていたから経由する鯖が更新されてないと取れないと予想
144名無しさん@お腹いっぱい。
2020/06/23(火) 15:16:09.68 >>142
> まあやり直してたら3回目位でとれたけど
なにげにお役立ち情報 _φ(・_・メモメモ
> まあやり直してたら3回目位でとれたけど
なにげにお役立ち情報 _φ(・_・メモメモ
2020/06/23(火) 15:37:49.72
>>57
これ保存に利用したIPアドレスは暗号化されて運営側も解読無理って事?
これ保存に利用したIPアドレスは暗号化されて運営側も解読無理って事?
2020/06/23(火) 22:38:01.52
147名無しさん@お腹いっぱい。
2020/06/23(火) 23:06:54.24 自分はあ複数保存したいからこっちも保存したいだけで合計3箇所で保存してる
Web魚拓はブロックされるようになった
Web魚拓はブロックされるようになった
2020/06/23(火) 23:41:38.01
スポーツ新聞野郎まだ居たのか
2020/06/24(水) 10:25:28.90
スポーツ新聞ほんと好きだな
取るのは勝手だけど常軌を逸した取り方だと思う
取るのは勝手だけど常軌を逸した取り方だと思う
2020/06/25(木) 08:06:11.23
ヤフーニュースほんと取れない
2020/06/25(木) 10:19:57.09
2020/06/25(木) 12:04:47.38
取れないという前に少しは過去ログ読んでくれと言いたくなる
154名無しさん@お腹いっぱい。
2020/06/25(木) 13:17:04.712020/06/25(木) 16:34:55.93
Yahoo!とか散々既出
156名無しさん@お腹いっぱい。
2020/06/26(金) 10:45:18.41 SAVE完了でスナップショット見に行こうとすると昔の日付にリダイレクトされるの困るな
アドレス切り張りして今日の日付にしてもダメ
アドレス切り張りして今日の日付にしてもダメ
2020/06/26(金) 10:48:12.10
パーツのアドレスで叩いたら今日の日付で出てくるからひとまずはよしとすべきか
2020/06/26(金) 12:04:49.45
いつもの調子が悪い周期に入ったかな
APIも不安定
APIも不安定
2020/06/26(金) 14:02:50.79
5ちゃんも全然とれない
時間あけて何度もトライしても時々とれるだけでほとんどダメ…
時間あけて何度もトライしても時々とれるだけでほとんどダメ…
2020/06/26(金) 15:47:14.61
2020/06/26(金) 21:15:33.82
>>160
それ取得者の環境に左右されるからあんまり使いたくないんだよね
それ取得者の環境に左右されるからあんまり使いたくないんだよね
2020/06/27(土) 08:54:45.81
Hrmになって取れてなかったと思っても
後で検索するとちゃんと取れてることも多いな
後で検索するとちゃんと取れてることも多いな
2020/06/27(土) 13:38:29.18
Hrm連発でも3回ほどチャレンジしとくと高確率で取れてた
2020/06/27(土) 14:05:54.69
2020/06/27(土) 15:09:04.44
ここ数日のは反映がかなり遅いだけでちゃんと取れてるね
2020/06/30(火) 16:11:19.16
https://web.archive.org/save/http://〜は即時反映でSave Page Nowは遅れて反映されるっぽい
168名無しさん@お腹いっぱい。
2020/07/01(水) 11:23:57.89 かなりデカい保存対象がやってきた
NAVERまとめ サービス終了のお知らせ : NAVERまとめ公式ブログ
http://navermatome-official.blog.jp/archives/83259956.html
>突然ではございますが、NAVERまとめは2020年9月30日をもちましてサービスを終了することとなりました。
>下書きや非表示のまとめも含め、9月30日をもちましてすべて閲覧ができなくなります。
NAVERまとめ サービス終了のお知らせ : NAVERまとめ公式ブログ
http://navermatome-official.blog.jp/archives/83259956.html
>突然ではございますが、NAVERまとめは2020年9月30日をもちましてサービスを終了することとなりました。
>下書きや非表示のまとめも含め、9月30日をもちましてすべて閲覧ができなくなります。
169名無しさん@お腹いっぱい。
2020/07/01(水) 16:43:58.70 雑多なまとめサイトすぎて好きじゃなかったな
2020/07/01(水) 16:49:15.19
所詮は南鮮資本w
2020/07/01(水) 17:09:06.99
雑多なまとめも多いけど、これを個人サイト的に使ってる人も割といるんだよね
そういう人の書いた良質なページが消えるのは困る
そういう人の書いた良質なページが消えるのは困る
2020/07/01(水) 18:04:14.59
閉鎖される予定のサイトってnaverまとめ以外何かある?
173名無しさん@お腹いっぱい。
2020/07/01(水) 20:31:56.992020/07/01(水) 20:47:21.16
2020/07/01(水) 20:57:22.61
NAVERまとめ、サラッと見た感じだと1ページ目は取ってあるけど
2ページ目以降が無いっていういつものパターンが多いな
2ページ目以降が無いっていういつものパターンが多いな
2020/07/02(木) 21:17:22.61
177名無しさん@お腹いっぱい。
2020/07/02(木) 22:52:12.91 最近のサイトはスマホ用とPC用の画面分けてるが
アーカイブってPC用しか保存されんの?
アーカイブってPC用しか保存されんの?
2020/07/03(金) 00:34:04.34
スマホのUAでアクセスしたらスマホ用が保存されんじゃないの知らんけど
2020/07/03(金) 11:11:11.87
Googleが10年以上前のサイトはもう検索結果に出すのやめたそう
やっぱページ膨大だと検索きついのか…
にしても10年より前の情報にはアクセスする手段が無くなるってすごい損失な気がするが
やっぱページ膨大だと検索きついのか…
にしても10年より前の情報にはアクセスする手段が無くなるってすごい損失な気がするが
2020/07/03(金) 14:23:53.34
10年以上前のサイトはそれ専用Googleとか検索エンジン用意すりゃいいのに
2020/07/03(金) 23:52:26.95
>>179
期間指定すれば普通に検索できるって聞いてたけど違うの?
期間指定すれば普通に検索できるって聞いてたけど違うの?
182名無しさん@お腹いっぱい。
2020/07/04(土) 15:07:25.272020/07/04(土) 16:05:37.33
普通に10年前以上の結果出るしデマでは?
2020/07/04(土) 16:52:27.76
Internet Archiveはgoogleみたいにキーワード検索出来るようにすればいいのに
2020/07/04(土) 17:06:10.22
デジャブジャブジャブなスレだな
186名無しさん@お腹いっぱい。
2020/07/04(土) 17:08:23.67 >>184
鯖に負担かかりすぎてえらいことになりそう
鯖に負担かかりすぎてえらいことになりそう
2020/07/04(土) 17:49:51.86
検索機能の話もテンプレ入れた方が良さげだな
数年前に一度全文検索機能が入ったことがあったんだけど、検索対象となるデータの量があまりに急速に増えて追いつかないとかですぐ無くなったんだよ
数年前に一度全文検索機能が入ったことがあったんだけど、検索対象となるデータの量があまりに急速に増えて追いつかないとかですぐ無くなったんだよ
2020/07/04(土) 17:51:21.60
検索エンジンってサーバリソースを大量に必要とするから、ギリギリの状態でサーバ動かしてる現状のIAではまず無理なんじゃないだろうか
2020/07/04(土) 21:11:27.16
全文検索ほしい人は10億円くらい寄付しろ
2020/07/04(土) 21:32:30.78
せめてタイトルだけでも検索できればいいのにな
2020/07/04(土) 21:49:53.36
この流れ前も見たぞ
2020/07/04(土) 23:55:00.95
検索したいならInternet Archiveに金落とせ、話はそれからだ
2020/07/05(日) 00:02:58.15
金落とす金額が鯖代と維持費込みじゃないと無理だろうな
194名無しさん@お腹いっぱい。
2020/07/05(日) 00:41:08.37 一つのURLに重複保存される画像・動画をAIで認識して削除したら、容量の削減になるのに
2020/07/05(日) 00:53:13.92
ツイッターの失敗は保存しなくていいのにね
2020/07/05(日) 02:47:20.57
2020/07/05(日) 04:54:05.25
AIとIA
2020/07/05(日) 12:05:45.68
そんな用途のためにわざわざAI使ったりしないだろうと思うけどそこは置いておいて、
AI動かすのにだって大量のサーバリソースは必要なんだよ
本末転倒
AI動かすのにだって大量のサーバリソースは必要なんだよ
本末転倒
2020/07/05(日) 12:09:03.83
普通に考えて重複保存じゃなくて差分を保存してると思うんだけど・・・
2020/07/05(日) 12:29:12.66
アーカイブ見てるとどう考えてもまったく同じ内容のページを何回も重複して保存してるのよくあってサーバーの容量がもったいないなと思う事はよくある
特に自動クロールでとってるであろうサイトのメインページなんて毎日何百ページ位も同じ画面とり続けてたりする
特に自動クロールでとってるであろうサイトのメインページなんて毎日何百ページ位も同じ画面とり続けてたりする
2020/07/05(日) 13:10:12.04
全く同じなら容量変わらなくね?
タイムスタンプが更新されるだけでは
まぁWayBackの仕組みが分からないので断言は出来ないけど
タイムスタンプが更新されるだけでは
まぁWayBackの仕組みが分からないので断言は出来ないけど
2020/07/05(日) 13:43:22.32
最近アーカイブしても存在してないって言われることが多くなったから
archive.today使ってる
archive.today使ってる
2020/07/05(日) 14:42:20.88
同じurlのzipで古い物は破損していて
それより新しい物は正常だった事がある
それより新しい物は正常だった事がある
2020/07/05(日) 15:37:07.67
バイナリデータで1バイトか2バイトか3バイトか忘れたけどファイルの最後にブランクデータが追加か削除されたせいで破損扱いになってる
バイナリエディタで00を増減すれば大丈夫だよ
バイナリエディタで00を増減すれば大丈夫だよ
2020/07/05(日) 16:02:13.33
googleもmetaタグを元に表示してるだけだし
Internet Archiveも最低限の情報だけ検索表示出来るようにすればいいのに
Internet Archiveも最低限の情報だけ検索表示出来るようにすればいいのに
2020/07/05(日) 19:38:36.99
>>203
2000 年代の古いアーカイブを漁っていたりすると、
中身が数メガバイトでちょん切れてしまっているものがかなりある。
古い Microsoft のバイナリ等で良く出くわす。
データ化けは見たことが無い。
おそらく、IA は Content-Length ヘッダの値と
コンテントボディの実サイズとの整合をチェックしていない。
何か巨大ファイルをアーカイブさせて、それが正しく保管できたか調べたい場合は
実際に当該アーカイブを最後まで読み出すしか無い。
>>204
それは昔のアーカイブ出力段の問題ではなかったか。
コンテントの末尾 1 バイトが \x00 だと、それが欠ける。
2011 年あたりの大改変の後は見たことが無い。
>>201
タイムスタンプだけかw
アーカイブ時のサーバ側のシステム時計の値 (たまにズレてる奴がいる)、
使用されていたサーバソフトウェアの名前、
読み出したファイル自身のサイズやタイムスタンプ、
ETag のような識別子、
その他サーバが垂れ流した、ありとあらゆるものを
そのまま丸ごと保存してるんだよ。
2000 年代の古いアーカイブを漁っていたりすると、
中身が数メガバイトでちょん切れてしまっているものがかなりある。
古い Microsoft のバイナリ等で良く出くわす。
データ化けは見たことが無い。
おそらく、IA は Content-Length ヘッダの値と
コンテントボディの実サイズとの整合をチェックしていない。
何か巨大ファイルをアーカイブさせて、それが正しく保管できたか調べたい場合は
実際に当該アーカイブを最後まで読み出すしか無い。
>>204
それは昔のアーカイブ出力段の問題ではなかったか。
コンテントの末尾 1 バイトが \x00 だと、それが欠ける。
2011 年あたりの大改変の後は見たことが無い。
>>201
タイムスタンプだけかw
アーカイブ時のサーバ側のシステム時計の値 (たまにズレてる奴がいる)、
使用されていたサーバソフトウェアの名前、
読み出したファイル自身のサイズやタイムスタンプ、
ETag のような識別子、
その他サーバが垂れ流した、ありとあらゆるものを
そのまま丸ごと保存してるんだよ。
207名無しさん@お腹いっぱい。
2020/07/06(月) 20:56:53.08 ガチでTwitterからツイートをアーカイブするなと圧力受けてんのか?
このスレ読んで何回やってもアーカイブできんぞ
このスレ読んで何回やってもアーカイブできんぞ
2020/07/06(月) 21:01:27.66
Tweetsaveもタイムアウトばっかで保存できん
2020/07/06(月) 21:13:49.37
Tweetsaveは半年前に比べたら生きまくってるよ
半年前までは1ヶ月まともに動かないとかあったし半月は当たり前に動かなかったわ
半年前までは1ヶ月まともに動かないとかあったし半月は当たり前に動かなかったわ
2020/07/06(月) 21:41:33.52
>>207
最近出版業界から訴えられたから有り得る話だな
最近出版業界から訴えられたから有り得る話だな
2020/07/06(月) 21:49:26.34
2020/07/07(火) 14:31:16.24
もう全部テンプレに書いた方がいいんじゃね?
話題が無限ループしてる
話題が無限ループしてる
2020/07/07(火) 14:49:56.67
もともと話題も少ないからな
保守してると思えばいい
保守してると思えばいい
2020/07/07(火) 14:52:23.22
2020/07/08(水) 07:37:39.06
最近TwitterがJob failedになって全然保存できない…
2020/07/08(水) 07:39:08.58
今やってたけど同じだわ
2020/07/08(水) 14:28:55.01
Tweetsaveで保存してもIAにはアーカイブされない
やっぱり圧力掛かってんのかな
誰も問題にしないのが驚きだけど
やっぱり圧力掛かってんのかな
誰も問題にしないのが驚きだけど
2020/07/08(水) 16:39:05.98
Tweetsaveからのはすぐに保存されてる印象が無いな
2020/07/09(木) 03:08:56.30
Job failedになっても検索すると出てくるから一応保存されてるっぽい
2020/07/09(木) 04:44:07.65
確かにちょっと待てば保存されてた
2020/07/09(木) 16:54:29.37
Twitterじゃない普通のウェブサイトを保存しようとしても
保存できたと思ってクリックしたら404 not foundが出てアーカイブされてませんと出る
10分待たないと再保存できない
保存できたと思ってクリックしたら404 not foundが出てアーカイブされてませんと出る
10分待たないと再保存できない
2020/07/09(木) 17:04:17.03
10分経ったから同じサイトをやってみようとしても404としか出ない
2020/07/09(木) 17:42:01.05
どこのサイトか言わないと永久に誰も分からない案件
2020/07/09(木) 21:01:04.00
Twitter、いくつかアーカイブして実験したけど
Job failedやtask limitになっても取れてるっぽい
しばらくしてから確認したらカレンダーに反映されてた
Job failedやtask limitになっても取れてるっぽい
しばらくしてから確認したらカレンダーに反映されてた
2020/07/11(土) 15:52:13.92
/save/がNot FoundやらBad Gatewayになるけど少したってAPIを見ると保存されていたりなかったりする。どうなってんだ
2020/07/11(土) 16:13:06.22
Not Foundくらったわ
2020/07/11(土) 18:00:18.44
2020/07/11(土) 19:22:59.78
今日はなんか調子悪いね
2020/07/11(土) 20:04:52.37
なんかこのスレの雰囲気って気象板にある地域の天気スレに似てる気がしてきた
2020/07/12(日) 02:05:50.03
2020/07/12(日) 02:08:06.41
アーカイブ(Heritrix)とインデクシング(Wayback)は別々のソフトウェアで分担して動いてるから、
反映されてないように見えても実は取れてることが多いんだよと何度言ったら
反映されてないように見えても実は取れてることが多いんだよと何度言ったら
2020/07/12(日) 03:04:42.31
どちらの調子の悪い時もあるからな
裏で取れてると思い込んでたら取れてなかったじゃ話にならん品
裏で取れてると思い込んでたら取れてなかったじゃ話にならん品
2020/07/12(日) 11:35:09.50
電子コミックとか一時無料になる場合あるけど
ああいうの保存出来ないの?
ああいうの保存出来ないの?
2020/07/12(日) 13:02:43.51
出来るか否かは試すしかない
有料サイトのはリスクありそうだから試さないけど
有料サイトのはリスクありそうだから試さないけど
2020/07/13(月) 01:01:32.93
仮に取れてもサイト側が削除申請出せば消せるしね
10年くらい前の話だけど、二次創作小説専門サイトが著作権の問題で閉鎖になった時、
Wayback Machineに残ってたアーカイブもまとめて全部削除されちゃったんだよね
10年くらい前の話だけど、二次創作小説専門サイトが著作権の問題で閉鎖になった時、
Wayback Machineに残ってたアーカイブもまとめて全部削除されちゃったんだよね
236名無しさん@お腹いっぱい。
2020/07/13(月) 15:07:19.26 自分で保存するのが確実だね
2020/07/14(火) 03:49:25.53
保存したマンガのファイルを自分でInternet Archiveにアップロードするという手も一応ある(IAのアカウント登録が必要なはず)
アメリカではフェアユース関連でその辺が緩いのかは知らないが、
マイナーな日本漫画の英訳版zipがアップされてる事も時たまあるよ
日本からこれをやって捕まったという話は聞いたことがないけど、お勧めはしないし止めておいた方が無難
アメリカではフェアユース関連でその辺が緩いのかは知らないが、
マイナーな日本漫画の英訳版zipがアップされてる事も時たまあるよ
日本からこれをやって捕まったという話は聞いたことがないけど、お勧めはしないし止めておいた方が無難
2020/07/14(火) 03:56:30.73
補足しておくとInternet Archive上の漫画etcが全部グレーゾーンな訳ではなくて、
著作権者の許諾を得て大っぴらに収録されてるものもかなり多い
著作権者の許諾を得て大っぴらに収録されてるものもかなり多い
2020/07/14(火) 11:01:46.40
例えば?
2020/07/14(火) 21:34:43.78
ttps://togetter[.]com/li/1559186
これをアーカイブすると一瞬表示できたかと思ったら「ERR_HTTP2_SERVER_REFUSED_STREAM」と出る
これをアーカイブすると一瞬表示できたかと思ったら「ERR_HTTP2_SERVER_REFUSED_STREAM」と出る
2020/07/15(水) 01:59:24.55
>>239
適当に検索して出てきたのを貼っておく
とある科学の超電磁砲8巻
https://archive.org/details/certainscientifi0000kama_m4a2
Internet Archiveの検索欄から"Search metadata"で探すと色々出てくるよ
適当に検索して出てきたのを貼っておく
とある科学の超電磁砲8巻
https://archive.org/details/certainscientifi0000kama_m4a2
Internet Archiveの検索欄から"Search metadata"で探すと色々出てくるよ
2020/07/15(水) 11:10:44.09
日本語版はないのか
2020/07/15(水) 17:35:15.30
最新版をアーカイブできたと思ったら数年前のアーカイブに強制リダイレクトされる
2020/07/15(水) 19:09:31.66
2020/07/15(水) 21:25:17.65
>>241
こういうのってIA側が出版社に表示使用料払ったりしてんの?
こういうのってIA側が出版社に表示使用料払ったりしてんの?
2020/07/15(水) 21:49:14.83
無許可
2020/07/15(水) 22:30:09.70
2020/07/15(水) 23:31:02.72
版権の所在がもうつかめない作品もゴロゴロでてくるから
基本無許可だろ
基本無許可だろ
2020/07/16(木) 15:31:48.35
togetterって保存できない?
2020/07/16(木) 18:48:52.81
やっぱりtogetterはダメだな
意図的にアーカイブ出来ないように設定されてんのか?
意図的にアーカイブ出来ないように設定されてんのか?
2020/07/16(木) 18:59:38.76
>>250
https://togetter.com/robots.txt
> User-agent: ia_archiver
> Disallow: /
robots.txt で拒否設定してるけど、それ以前に IP か何かで弾いてるようだな。
https://togetter.com/robots.txt
> User-agent: ia_archiver
> Disallow: /
robots.txt で拒否設定してるけど、それ以前に IP か何かで弾いてるようだな。
2020/07/16(木) 19:21:22.62
魚拓とか他の試せばええやん
2020/07/16(木) 23:40:51.82
どうしてもIAに入れたいなら
他のサイトでアーカイブ→そのアーカイブをIAでアーカイブ
すればいい
他のサイトでアーカイブ→そのアーカイブをIAでアーカイブ
すればいい
2020/07/17(金) 01:12:59.61
>>253
できなくない?他のどの魚拓サイトのURL入れてもNGになって無理なんだけど
できなくない?他のどの魚拓サイトのURL入れてもNGになって無理なんだけど
2020/07/17(金) 03:03:38.51
https://web.archive.org/web/20200713012608/https://togetter.com/li/1558179
2020/07/17(金) 12:10:51.26
todayが死んでる……
2020/07/18(土) 13:51:46.77
todayは運営元が不明な時点でいつ消えてもおかしくないので
あくまで気休め用
あくまで気休め用
2020/07/18(土) 15:14:17.58
todayもウェブ魚拓も固定回線からのアクセスをブロックするようになった気がする
2020/07/18(土) 20:08:24.38
それをすることに何の意味があるのでせう
2020/07/19(日) 00:36:31.27
分からん
自分の場合、todayに固定回線でアクセスすると
「Access to this website is blocked Plume」ってメッセージが出てくるようになった
ウェブ魚拓はHTTP 511エラーを吐いてくる
これまではInternet Archiveと使い分けてたんだけど、こうなるとInternet Archiveで色々保存しないといけなくなるな
自分の場合、todayに固定回線でアクセスすると
「Access to this website is blocked Plume」ってメッセージが出てくるようになった
ウェブ魚拓はHTTP 511エラーを吐いてくる
これまではInternet Archiveと使い分けてたんだけど、こうなるとInternet Archiveで色々保存しないといけなくなるな
2020/07/19(日) 00:43:41.76
today復活したか
結構長く止まってたな
結構長く止まってたな
2020/07/21(火) 00:34:16.68
重杉
2020/07/21(火) 01:39:06.41
俺はarchive.todayは問題なく使えてる
Wayback Machineは繋がらなかったり取りこぼしが結構あって残念
後日見返しても取れてないし
いまも繋がらない…
Unknown Error
502 Bad Gateway
Wayback Machineは繋がらなかったり取りこぼしが結構あって残念
後日見返しても取れてないし
いまも繋がらない…
Unknown Error
502 Bad Gateway
2020/07/22(水) 22:35:35.00
2020/07/22(水) 23:22:28.96
todayのCloudflareうぜええ
てかなんでこいつはいつまでもreCAPTCHAのままなんだよ
てかなんでこいつはいつまでもreCAPTCHAのままなんだよ
2020/07/22(水) 23:31:19.40
重杉
2020/07/23(木) 03:51:45.43
Cloudflare「もどき」しか見ないなw

2020/07/23(木) 20:33:40.82
ボタンの外見が変わって見づらく感じる
2020/07/24(金) 00:40:34.99
ボタン?
2020/07/24(金) 10:54:38.67
https://web.archive.org/save/の後に続く数字が保存中に
_embed/に勝手に変わって保存されない。。。
_embed/に勝手に変わって保存されない。。。
2020/07/24(金) 12:49:21.81
保存失敗していたと思ったら1日やら何時間も経ってからやっと反映された
そろそろ限界が近いのだろうか?
そろそろ限界が近いのだろうか?
2020/07/24(金) 17:29:43.07
それは普通だが4月に保存したものがいくつか保存されてなかった
2020/07/24(金) 18:10:50.68
実はそれも普通なのだ
2020/07/24(金) 18:44:38.56
何事も一期一会、保存などという邪道なものに頼ろうとするな
275名無しさん@お腹いっぱい。
2020/07/24(金) 22:49:38.35 http://web.archive.org/web/数字/http://
↓
http://web.archive.org/web/数字/https://
httpsになっているサイトがhttp時代の過去のサイトの画像が自動表示保存されない場合は、https://を入れると自動表示保存される。(例:impress・itmediaなど)
↓
http://web.archive.org/web/数字/https://
httpsになっているサイトがhttp時代の過去のサイトの画像が自動表示保存されない場合は、https://を入れると自動表示保存される。(例:impress・itmediaなど)
2020/07/25(土) 00:04:58.43
どういうことだ
2020/07/25(土) 11:48:35.27
503が出てアーカイブされてるかどうかすら確認できなくなってる
2020/07/25(土) 22:31:53.72
ここ2週間ほど調子悪杉だろ
2020/07/25(土) 23:31:37.24
仕方ないからarchive.today使ってる
2020/07/26(日) 21:51:46.95
>>278
done!が出るまで何度もやらないと、魚拓検索ではweb.archive.orgで取れてる扱いでも取れてない
んで失敗してるうちに待ち時間が10分近くとかに増えていくから、合計だと何分かかるか分からない
消えちゃ困るフリーソフトとかぐらいしか、そんだけ待って取る価値ないわな
archive.todayは数十とか一気に取るとbanされるし、碌なアーカイブサイトないわ
done!が出るまで何度もやらないと、魚拓検索ではweb.archive.orgで取れてる扱いでも取れてない
んで失敗してるうちに待ち時間が10分近くとかに増えていくから、合計だと何分かかるか分からない
消えちゃ困るフリーソフトとかぐらいしか、そんだけ待って取る価値ないわな
archive.todayは数十とか一気に取るとbanされるし、碌なアーカイブサイトないわ
2020/07/26(日) 22:00:36.20
2020/07/26(日) 22:09:17.35
2020/07/26(日) 22:10:02.48
archive.todayはとまりすぎじゃね?
2020/07/27(月) 11:53:01.60
>> archive.todayは数十とか一気に取るとbanされるし、碌なアーカイブサイトないわ
いやそりゃBANされるだろ
サーバ動かすのだってタダじゃないんだよ
自分がアーカイブサイト運営してたとしてもそれはしばらくアク禁にするわ
いやそりゃBANされるだろ
サーバ動かすのだってタダじゃないんだよ
自分がアーカイブサイト運営してたとしてもそれはしばらくアク禁にするわ
2020/07/27(月) 12:24:25.45
2020/07/27(月) 15:06:40.42
IAってスクリプトとか保存しないように設定出来れば
保存容量や表示軽く出来そうなのに
保存容量や表示軽く出来そうなのに
2020/07/27(月) 16:25:19.72
それはもう別もんやろ
2020/07/27(月) 16:54:48.41
どうしてもアーカイブできないサイトはページ丸ごとスクショしてそれをどっかにあげてアーカイブすればいいか
でも大きなスクショ劣化なしであげられるとこってなかなかないよね
どっかあるかな?
でも大きなスクショ劣化なしであげられるとこってなかなかないよね
どっかあるかな?
2020/07/27(月) 21:08:42.38
Tweetsaveも不安定過ぎる
アーカイブ化を妨害したい勢力が暗躍してんだな
アーカイブ化を妨害したい勢力が暗躍してんだな
2020/07/27(月) 21:18:11.93
クラウドフレア依存が不安定の原因に思えてくる
IAは違いそうだが
IAは違いそうだが
2020/07/28(火) 01:10:49.40
スクショって画像化の事言ってんの?
そんな事するくらいならWebページ保存ソフト使えよ
そんな事するくらいならWebページ保存ソフト使えよ
2020/07/28(火) 01:15:00.88
web保存じゃないと捏造言われるからなぁ
2020/07/28(火) 01:30:19.93
スクショは捏造できる
2020/07/28(火) 05:58:41.77
295名無しさん@お腹いっぱい。
2020/07/28(火) 06:39:39.83 https://gigazine.net/news/20191212-thread-internet-archives-silent-killer/
コストを削減したければクローリングするウェブサイトを減らし、一部のデータ保存活動を停止すればOKですが、この考えは世界全体にとっていいアイデアではないとスコット氏は主張。
↑
1分20ページから50ページ保存に緩和してくれ
或いは有料プランを作ってくれ
コストを削減したければクローリングするウェブサイトを減らし、一部のデータ保存活動を停止すればOKですが、この考えは世界全体にとっていいアイデアではないとスコット氏は主張。
↑
1分20ページから50ページ保存に緩和してくれ
或いは有料プランを作ってくれ
>>288
大抵はWayback Machineかarchive.todayかWebrecorderかSingleFileZで保存できる
おーぷん2chは基本拒まれるけどdatはアーカイブできる
例: http://archive.vn/nxwaU
通常のページを保存できるにしろできないにしろ、APIも保存してくれると助かる
例えばニコ生のAPIは
https://api.cas.nicovideo.jp/v1/services/live/programs/(番組ID)
番組IDのところをlv123とするとその番組の詳細情報が得られる
大抵はWayback Machineかarchive.todayかWebrecorderかSingleFileZで保存できる
おーぷん2chは基本拒まれるけどdatはアーカイブできる
例: http://archive.vn/nxwaU
通常のページを保存できるにしろできないにしろ、APIも保存してくれると助かる
例えばニコ生のAPIは
https://api.cas.nicovideo.jp/v1/services/live/programs/(番組ID)
番組IDのところをlv123とするとその番組の詳細情報が得られる
2020/07/29(水) 02:58:32.75
Internet Archive以外はいつサービス終了するか分からない
ローカルやログインして自分しか見れない所にアーカイブしても意味ない
ローカルやログインして自分しか見れない所にアーカイブしても意味ない
298名無しさん@お腹いっぱい。
2020/07/29(水) 03:33:40.66 Internet Archiveも見れないURLあるからなあ
2020/07/29(水) 09:39:20.49
>>298
キャプチャ失敗か削除済みではなく?
キャプチャ失敗か削除済みではなく?
2020/07/29(水) 13:06:06.70
> archive.todayは数十とか一気に取るとbanされるし、碌なアーカイブサイトないわ
いっぺんにそんな数ひろったことないな
やるねえ
いっぺんにそんな数ひろったことないな
やるねえ
2020/07/29(水) 15:30:15.66
>>300
不良(品)の武勇伝(悪行)みたいなもんよ
不良(品)の武勇伝(悪行)みたいなもんよ
2020/07/29(水) 17:24:51.15
500 Internal Server Error
2020/07/29(水) 18:01:01.11
2020/07/29(水) 18:21:15.86
それはサイト側がIAに連絡して保存しないようにして貰っただけ
2020/07/29(水) 18:50:00.52
2020/07/29(水) 19:06:54.26
閲覧のみならやや重い程度なのだが
2020/07/29(水) 20:25:58.03
International Server Errorはつなぎなおすと動くことも多い気がする
2020/07/29(水) 23:12:14.28
2020/07/29(水) 23:34:29.23
つなぎなおすとはしいたけ押して更新することだと思ってた・・・・
2020/07/30(木) 04:36:43.89
確かに保存されたページが閲覧できているのに、APIの方では保存されていないかのような
表示になっていることもあるんだな。単にAPIの調子が悪いのか
表示になっていることもあるんだな。単にAPIの調子が悪いのか
312名無しさん@お腹いっぱい。
2020/07/30(木) 07:36:04.75313名無しさん@お腹いっぱい。
2020/07/30(木) 07:40:56.06 あー、すまん。
これは自分がページを指定して魚拓とることはできないのか。
これは自分がページを指定して魚拓とることはできないのか。
2020/07/30(木) 10:12:47.18
Sorry.
This URL has been excluded from the Wayback Machine.
この文が出るサイトはどんな方法でも保存はおろか閲覧すらできないんでしょうか
This URL has been excluded from the Wayback Machine.
この文が出るサイトはどんな方法でも保存はおろか閲覧すらできないんでしょうか
2020/07/30(木) 10:17:20.01
>>310
archive todayってどこの会社が運営してるのか資金はどうしてるのかも分からないし比較的最近できた歴史もサイト
36年の歴史があって米国政府も利用してて組織内部まで公開してるInternet archiveとは信頼度が違う
WebrecorderやSingleFileZは共有機能あるの?見た感じ個人向けのキャプチャソフトみたいだけど
archive todayってどこの会社が運営してるのか資金はどうしてるのかも分からないし比較的最近できた歴史もサイト
36年の歴史があって米国政府も利用してて組織内部まで公開してるInternet archiveとは信頼度が違う
WebrecorderやSingleFileZは共有機能あるの?見た感じ個人向けのキャプチャソフトみたいだけど
2020/07/30(木) 10:21:32.94
2020/07/30(木) 10:22:24.11
途中で送信してしまった
連投失礼
なのでもともと保存されていたものも当然見れなくなる
連投失礼
なのでもともと保存されていたものも当然見れなくなる
2020/07/30(木) 13:59:17.34
2020/07/30(木) 14:01:25.19
>>318
期間はどの辺です?
期間はどの辺です?
2020/07/30(木) 14:43:03.28
期間とか決まってるわけじゃない
homepage2.nifty.comなんかも昔は見られたが
もうずっと見られないしな
homepage2.nifty.comなんかも昔は見られたが
もうずっと見られないしな
321名無しさん@お腹いっぱい。
2020/07/30(木) 21:03:12.09 >>318
マジ?
マジ?
2020/07/30(木) 22:23:53.68
2020/07/30(木) 22:27:38.32
archive.todayは誰がどこでどういう風に運営してるのかまるで分からない(=いつデータが全て消し飛ぶか分からない)という怖さがある
だから自分はarchive.todayを可能な限り使わないようにしてるし、運営体制が公開されてるInternet Archiveを信用してる
だから自分はarchive.todayを可能な限り使わないようにしてるし、運営体制が公開されてるInternet Archiveを信用してる
2020/07/30(木) 22:33:49.07
「データが改変されていないこと」を保証するのって結構厄介で、
Internet ArchiveはWARC形式っていうWebアーカイブ専用フォーマットを使って保存してるくらい
archive.todayやウェブ魚拓はその辺が全く公開されてない
スクショなんて論外だよ(ブラウザの開発者機能で画面表示を書き換えた上でスクショされたらどうしようもないから)
Internet ArchiveはWARC形式っていうWebアーカイブ専用フォーマットを使って保存してるくらい
archive.todayやウェブ魚拓はその辺が全く公開されてない
スクショなんて論外だよ(ブラウザの開発者機能で画面表示を書き換えた上でスクショされたらどうしようもないから)
2020/07/30(木) 23:11:23.68
用途にもよる
単に面白いサイトだから残したい程度ならどこでもいい訳だし
何かの証拠として残すんなら信頼高いアーカイブの方がいいしな
単に面白いサイトだから残したい程度ならどこでもいい訳だし
何かの証拠として残すんなら信頼高いアーカイブの方がいいしな
2020/07/30(木) 23:49:49.99
通常はそこまで手間じゃないんだから両方やっとけ
自分は3つやってる
自分は3つやってる
327322-324
2020/07/31(金) 00:23:14.62 証拠だろうと面白いサイトだろうと消えてほしくないからアーカイブする訳だから、
自分は信頼性の高さを重視して何でも基本的にInternet Archiveのみを使っている
archive.todayではIAで保存できなかったものと、特に証拠として残したいものを保存してる(削除申請が通りにくいため)
ウェブ魚拓は「申請が来たらすぐ消している」という運営のインタビューを見てから一切使わなくなった
自分は信頼性の高さを重視して何でも基本的にInternet Archiveのみを使っている
archive.todayではIAで保存できなかったものと、特に証拠として残したいものを保存してる(削除申請が通りにくいため)
ウェブ魚拓は「申請が来たらすぐ消している」という運営のインタビューを見てから一切使わなくなった
2020/07/31(金) 03:22:56.77
今のIAは激烈不調で信頼できるとはとても言えんがな
2020/07/31(金) 03:53:08.45
そろそろ調子なおった?
2020/07/31(金) 03:54:59.78
直ってない
2020/07/31(金) 03:59:36.76
ぴえん
332名無しさん@お腹いっぱい。
2020/07/31(金) 07:54:38.33 全ページ検索ってまだできない?
そんなに機密情報とか簡単に検索されたくない?
そんなに機密情報とか簡単に検索されたくない?
2020/07/31(金) 08:11:09.60
またお前か
2020/07/31(金) 10:08:22.40
自分の主張は正当化されるべきと信じ込んでる・とりあえず何でも陰謀論に結び付けるとか数え役満だな...
Internet Archiveにそんなサービスやってる余裕ないんだよ、一時期やってたけど処理が追いつかなくてすぐ廃止になったって前にも誰かが言ってただろ
Internet Archiveにそんなサービスやってる余裕ないんだよ、一時期やってたけど処理が追いつかなくてすぐ廃止になったって前にも誰かが言ってただろ
2020/07/31(金) 19:43:31.80
そもそも最近のInternet Archiveは一枚もキャプチャ出来ない日がずっと続いてる
BANか時間帯か何が原因か知らんけど、VPNで時間帯変えても無理
BANか時間帯か何が原因か知らんけど、VPNで時間帯変えても無理
2020/07/31(金) 19:50:35.35
いやキャプは内部的に出来てるけど反映されるのが3日4日かかってるっぽい
2020/07/31(金) 19:58:20.86
2020/07/31(金) 20:02:11.39
>>337
ツイッターでその症状が出てた
ツイッターでその症状が出てた
2020/07/31(金) 22:03:51.17
500 Internal Server Error
502 Bad Gateway
520 Unknown Error
今日は特におかしい
何だこの三役揃い踏みは
502 Bad Gateway
520 Unknown Error
今日は特におかしい
何だこの三役揃い踏みは
2020/07/31(金) 22:17:37.78
>>339
404も忘れないであげて下さい
404も忘れないであげて下さい
2020/07/31(金) 22:45:54.54
huh?
2020/07/31(金) 22:47:37.43
200以外でリトライし続けるようなスクリプト組んでるけどもう三日間は1ページも保存できてないし
2020/08/01(土) 01:02:58.62
三日間なにものどを通ってないみたいな言い方するな
2020/08/01(土) 02:24:02.89
>>342
どのくらい間隔あけているの?
どのくらい間隔あけているの?
2020/08/01(土) 02:33:21.99
1年間以上定期的にツイッターで保存していたせいかtodayはBANされてるなぁ
どうやっても404になるわ
使える串探すか
どうやっても404になるわ
使える串探すか
2020/08/01(土) 15:49:18.93
自分はsave page nowのフォームから保存すると毎回問題なくいけてる(少なくともここ一週間くらいは)
spnフォーム保存時の通信を覗いて、処理をスクリプトに落とし込むというのも不可能ではないのでは
spnフォーム保存時の通信を覗いて、処理をスクリプトに落とし込むというのも不可能ではないのでは
2020/08/01(土) 15:53:57.90
確かにsave page nowは確率が高いね
2020/08/01(土) 23:59:08.53
いろいろやってみたけど、俺の結論
7月後半ぐらいから/save/の後ろのURLつけて保存しようとすると、そのページにある画像とかも一部保存もしくはURLを確認しに行く(保存はされない)ように設計が変わったようで、
そのせいでページに張り付いてる画像やスクリプトファイルが多いブログを保存する時は特に時間かかりまくってる
スクリプトで保存してる場合、ヘッダーにno-cacheやetagが出てきたら、それは保存失敗
ブログやニュースサイトの画像URLやスクリプトURLの過去の履歴を見ると、
1日以下の短期間で何十回も何百回も保存してるのを7月以降たくさん見かけるのはこのせいだと思う
Internet Archive側のアーカイブシステムの改悪だ、保存が遅くなる一方だよこれ
7月後半ぐらいから/save/の後ろのURLつけて保存しようとすると、そのページにある画像とかも一部保存もしくはURLを確認しに行く(保存はされない)ように設計が変わったようで、
そのせいでページに張り付いてる画像やスクリプトファイルが多いブログを保存する時は特に時間かかりまくってる
スクリプトで保存してる場合、ヘッダーにno-cacheやetagが出てきたら、それは保存失敗
ブログやニュースサイトの画像URLやスクリプトURLの過去の履歴を見ると、
1日以下の短期間で何十回も何百回も保存してるのを7月以降たくさん見かけるのはこのせいだと思う
Internet Archive側のアーカイブシステムの改悪だ、保存が遅くなる一方だよこれ
2020/08/02(日) 03:25:42.91
その保存しない確認ってのは一体何の意味があるんだろう
2020/08/02(日) 08:37:26.17
本来ならInternet archiveをメインに使いたいところだが、いかんせん取れないままではなぁ
サイトに繋がるだけじゃ意味がない
337や339のレスと同じ結果ばかりで、もう一週間くらい取れてないから渋々archive.todayメインに切り替えてる
サイトに繋がるだけじゃ意味がない
337や339のレスと同じ結果ばかりで、もう一週間くらい取れてないから渋々archive.todayメインに切り替えてる
2020/08/02(日) 17:49:10.54
いざとなったらspnフォームのHTTP通信解析してcurlで直接叩けばいいやと思ってるから特に気にしてない
2020/08/02(日) 19:09:18.50
もう使い物にならんな
2020/08/02(日) 20:24:52.19
Tweetsaveもタイムアウトなどクラウドフレアのエラーばっか出て心折れそう
2020/08/02(日) 20:27:40.48
Tweetsaveは年間通して繋がらないことは頻繁にあるからもう慣れた
2020/08/02(日) 20:41:54.12
2020/08/02(日) 23:24:33.52
>>355
1分間400回とかそれは多すぎるよ、逮捕者が出た岡崎図書館事件ですら1回のアクセス毎に2秒の間隔を置いてたくらいなのに
みんながそんなことやりすぎたからアクセス回数の制限入ったんじゃないの?
万が一訴えられた時のことも考えて、どんなサイトでも1回のリクエスト送ってから最低1秒空けるのが不文律
1分間400回とかそれは多すぎるよ、逮捕者が出た岡崎図書館事件ですら1回のアクセス毎に2秒の間隔を置いてたくらいなのに
みんながそんなことやりすぎたからアクセス回数の制限入ったんじゃないの?
万が一訴えられた時のことも考えて、どんなサイトでも1回のリクエスト送ってから最低1秒空けるのが不文律
2020/08/02(日) 23:27:33.15
どうしても早く保存したいなら自分で保存対象サイトにwgetを走らせて、
そこからInternet Archiveのmetadataとしてアップロードすりゃいい
Wayback Machineには収録されないが、早くやりたいんならそれくらい我慢しなきゃ仕方ないだろ
そこからInternet Archiveのmetadataとしてアップロードすりゃいい
Wayback Machineには収録されないが、早くやりたいんならそれくらい我慢しなきゃ仕方ないだろ
2020/08/02(日) 23:31:20.30
どうしても高速でWayback Machineに保存したいなら、
ArchiveTeamのIRCから「このサイトを保存してほしい」と依頼してArchiveBotで作業してもらうという手もある
https://www.archiveteam.org/index.php?title=ArchiveBot
ArchiveTeamのIRCから「このサイトを保存してほしい」と依頼してArchiveBotで作業してもらうという手もある
https://www.archiveteam.org/index.php?title=ArchiveBot
2020/08/03(月) 01:38:24.57
2020/08/03(月) 02:02:51.37
ナニコレ
ttps://i.imgur.com/eYAu2fb.png
ttps://i.imgur.com/eYAu2fb.png
2020/08/03(月) 03:21:13.16
>>360
自分も全部それになる…
自分も全部それになる…
2020/08/03(月) 10:30:06.00
なぜかTweetsaveを素早く庇う奴が常駐してる
不思議だ
不思議だ
2020/08/03(月) 10:45:09.75
2020/08/03(月) 14:19:45.15
save page nowのリンク先保存は読み込まれる数に制限あるぞ
2020/08/03(月) 14:46:11.43
>>362
確かに怖すぎ・・・
確かに怖すぎ・・・
2020/08/03(月) 15:59:02.06
庇ってるか?
年間通して続いてるから事実を言っただけだ
改善する希望なんて持てないしさ
年間通して続いてるから事実を言っただけだ
改善する希望なんて持てないしさ
2020/08/03(月) 16:26:43.83
常駐ご苦労さん
368名無しさん@お腹いっぱい。
2020/08/03(月) 16:32:26.47 保存するのは芸能人のブログとかじゃないの
芸能人の画像をPCに保存にしないでIAを、クラウド代わりにする。
芸能人の画像をPCに保存にしないでIAを、クラウド代わりにする。
2020/08/03(月) 20:28:28.24
検索がfailed to fetchになってしまって全然できない…
2020/08/04(火) 05:32:30.73
save pageボタン押してもなかなか画面が変わらなくて
最後は502 Bad Gateway表示ばっかり
最後は502 Bad Gateway表示ばっかり
2020/08/04(火) 08:25:42.60
SPNは復帰
/save/は502 Bad Gateway
/save/は502 Bad Gateway
2020/08/04(火) 08:28:31.29
The capture is estimated to start in 600 minutes.
昨日ぐらいからSave Page Nowでこんな表示出てくるんだけど、あと10時間も待ってないといけないわけ?
いい加減にサーバー増強しろよ。。
昨日ぐらいからSave Page Nowでこんな表示出てくるんだけど、あと10時間も待ってないといけないわけ?
いい加減にサーバー増強しろよ。。
2020/08/04(火) 10:01:44.45
Tweetsaveについて知らないニワカが落ちてると叩くのは
サービスを潰しかねない迷惑行為なのでやめてもらいたい
サービスを潰しかねない迷惑行為なのでやめてもらいたい
2020/08/04(火) 11:54:09.68
今Save Nowに突っ込んだら680分待ちでワロタ
2020/08/04(火) 11:54:46.66
そもそもいつからTweetsaveがInternet Archiveの傘下に入ったんだ?
ウェブアーカイブ総合スレでやれ
ウェブアーカイブ総合スレでやれ
2020/08/04(火) 11:57:24.72
Internet Archiveも資金繰りが厳しいらしいからな
サーバの重さに文句言っていいのは寄付した人間だけだろ、自分は寄付してないから当然言えない
サーバの重さに文句言っていいのは寄付した人間だけだろ、自分は寄付してないから当然言えない
2020/08/04(火) 14:03:24.88
IA目線になる必要はない
向こうにクレームつけてるワケでなし
向こうにクレームつけてるワケでなし
2020/08/04(火) 17:08:02.52
Internet archive取得できないな
Saving..のままだ
Saving..のままだ
379名無しさん@お腹いっぱい。
2020/08/04(火) 17:50:56.70 なんでこんなんなっちゃったんだ
380名無しさん@お腹いっぱい。
2020/08/04(火) 18:13:31.23 国外のニュースサイトとかじゃあまり話題にしないな
2020/08/04(火) 19:50:11.42
The capture is estimated to start in 264 minutes.
382名無しさん@お腹いっぱい。
2020/08/04(火) 20:45:36.63 ここに書いてもしょうがないかしらんが
サイト撤去跡などでリダイレクトされるやつのリダイレクトが早すぎて
結局アドレスバーに直打ちしないと目当てのサイトを探せないのは何かなあ
サイト撤去跡などでリダイレクトされるやつのリダイレクトが早すぎて
結局アドレスバーに直打ちしないと目当てのサイトを探せないのは何かなあ
2020/08/05(水) 03:17:21.99
FirefoxなんでYahoo!BlogならRedirectorで/web/2/に飛ばしてるよ
多分クロームにも似たような拡張あるだろう
多分クロームにも似たような拡張あるだろう
2020/08/05(水) 03:25:10.25
2020/08/05(水) 03:50:11.53
2020/08/05(水) 04:34:39.82
/save/
520 Unknown Error
failed to archive the URL. specifics of failure is unknown
520 Unknown Error
failed to archive the URL. specifics of failure is unknown
2020/08/05(水) 13:52:57.91
520エラーでも数日後に見ると保存されるケースとされてないケースがあってよくわからん
2020/08/05(水) 14:18:52.88
保存されるケースだけなら困らないが
されてないケースがあるから困る
されてないケースがあるから困る
2020/08/05(水) 14:57:05.28
キャプチャまでの待ち時間がとんでもない事になってるけど
あれってタブ閉じるとダメなのかな?
内部的には処理待ち行列に入ってるとかならいいんだが
あれってタブ閉じるとダメなのかな?
内部的には処理待ち行列に入ってるとかならいいんだが
2020/08/05(水) 19:10:38.98
タブ閉じても保存されるっぽい
2020/08/05(水) 19:38:11.52
The capture is estimated to start in 0 minutes.
今待ち時間0分になってる
save/でもすぐに保存されてるし、やっと緩和したかな
これが続けばありがたいんだが
今待ち時間0分になってる
save/でもすぐに保存されてるし、やっと緩和したかな
これが続けばありがたいんだが
2020/08/05(水) 23:07:39.24
やっと不具合解消されたか
長かったな
長かったな
2020/08/05(水) 23:18:38.18
行列で密になるところだった
2020/08/06(木) 07:52:14.90
保存待ち状態もAPIで判別可能ならもっといいんだけどな
2020/08/07(金) 08:24:06.69
平常通りと言いたいとこだけど、上部の棒グラフみたいな外観のリンクがバグってる
396名無しさん@お腹いっぱい。
2020/08/09(日) 01:14:41.21 24h後に再度試してもスナップショットがThis page is available on the web!になるな
2020/08/09(日) 01:49:03.68
それはわかってるわって言いたくなるな
2020/08/10(月) 02:19:13.94
お 保存成功
>396になった分はノーカンだから相当な足止めだな
>396になった分はノーカンだから相当な足止めだな
2020/08/10(月) 08:53:33.67
なんだこれ気持ちわりいw ほぼノータイムで保存されたw
2020/08/11(火) 14:54:46.93
The same snapshot had been made 1 minutes and 3 seconds ago.
We only allow new captures of the same URL every 20 minutes.
We only allow new captures of the same URL every 20 minutes.
401名無しさん@お腹いっぱい。
2020/08/11(火) 17:42:27.57 わお
2020/08/11(火) 23:40:05.49
何を保存してんだか
2020/08/12(水) 00:39:05.37
URL末尾に?を付けたらおk?
2020/08/13(木) 13:31:37.01
>>402
間違えて同じのやっちゃっただけだよ
間違えて同じのやっちゃっただけだよ
2020/08/13(木) 23:35:13.19
最近必ず保存されていい感じ
2020/08/14(金) 02:26:01.50
同じURL保存の待ち時間が20分になったな
jsonになってしまう事も結構あるのにこれはつらい…
jsonになってしまう事も結構あるのにこれはつらい…
2020/08/14(金) 09:07:40.78
IPアドレス変えたりsave nowとアドレスバーにsave直打ちとかで同じかどうかも判定変わるから
いろいろ試せば1分未満でも再保存できる場合もあるよ
いろいろ試せば1分未満でも再保存できる場合もあるよ
2020/08/14(金) 10:19:15.30
x-archive-wayback-runtime-error: WaybackException: java.lang.IllegalStateException: Payload size does not match content-length!
ここ数日このエラー多すぎ
ここ数日このエラー多すぎ
2020/08/14(金) 16:29:46.94
todayスマホからアクセスするとCAPTCHAの無限ループなんだけどこれって俺だけ?
2020/08/14(金) 18:09:50.06
俺もなるわ
どうやらユーザーエージェントでブロックしてるらしい
別のブラウザアプリ使えば回避できる
どうやらユーザーエージェントでブロックしてるらしい
別のブラウザアプリ使えば回避できる
411名無しさん@お腹いっぱい。
2020/08/14(金) 18:35:19.64 無限リキャプチャなんだこれ…って思ったら同じ人がいて安心した
2020/08/15(土) 00:29:36.27
>>409だけどいつの間にか直ってたわ
2020/08/16(日) 22:58:30.65
ワープ用の棒グラフをクリックするとこんなふざけたアドレスに飛ばされる。当然表示できない。
https://web.archive.org/web/20130821015518if_/http://*****.com/web/20191201000000/http://*****.com/
https://web.archive.org/web/20130821015518if_/http://*****.com/web/20191201000000/http://*****.com/
2020/08/17(月) 00:28:22.30
ほんとだバグってる
2020/08/17(月) 09:21:29.95
メンテ中で何も見れない
2020/08/17(月) 17:09:41.45
保存されてたはずのページが今日確認したらされてなかったことに・・・
特に今年7月あたりがひどい。
特に今年7月あたりがひどい。
2020/08/17(月) 22:57:21.09
以前はちゃんと保存されて見れてたのなら、サイト運営者からの削除申請があったとかでもない限りは一時的なトラブルだから待ってれば直る
2020/08/18(火) 15:30:05.05
保存直後は問題なく見れるが数日後は無くなってるのが多いね
保存失敗したならちゃんと失敗したとエラー表示出して欲しい
保存失敗したならちゃんと失敗したとエラー表示出して欲しい
2020/08/18(火) 16:08:16.30
2020/08/19(水) 01:14:34.33
URLから日付を選ぶページで保存元(Reason:)がNo Collection Infoって表示が出てるのは時間かかってるっぽい
保存されたらlivewebかsave-nowになるはず
保存されたらlivewebかsave-nowになるはず
2020/08/20(木) 13:37:54.14
2020/08/20(木) 13:40:37.45
noteのIP漏洩事案だけど、Wayback MachineのアーカイブのソースにIP情報が残ってる記事が結構あるらしい
削除申請が出される可能性があるから、noteのアーカイブを取ったことのある人は改めて保存し直しておくことを推奨
削除申請が出される可能性があるから、noteのアーカイブを取ったことのある人は改めて保存し直しておくことを推奨
2020/08/20(木) 16:42:28.79
IA側がIPアドレスは個人情報じゃないので削除却下と行ってきたらどうすんの?
個人的には今回の件どうでもいいと思ってるし、note運営がどうこういう話じゃないしな
個人的には今回の件どうでもいいと思ってるし、note運営がどうこういう話じゃないしな
2020/08/20(木) 23:09:46.55
IPアドレスはEUの一般データ保護規則で個人情報とされてるからIA側が却下する可能性は微妙
もちろんnote運営を介さないと削除申請は出せないはずだけど、
某自主制作コミュニティで「note運営に働きかけて記事のアーカイブを削除してもらおう」
って動きがあったのを見かけたものだから念の為と思ってね
もちろんnote運営を介さないと削除申請は出せないはずだけど、
某自主制作コミュニティで「note運営に働きかけて記事のアーカイブを削除してもらおう」
って動きがあったのを見かけたものだから念の為と思ってね
2020/08/21(金) 00:04:13.83
運営に言わずに自分や自社のブログを消したいなら自分で削除依頼出せばいいのにな
初めっからやる気なさそう
初めっからやる気なさそう
2020/08/21(金) 00:22:21.22
今気付いたんだけど、削除申請を受けてWayback Machineから恒久的に削除されたサイトでも
スクリーンショット機能を使えば普通に保存・閲覧出来るんだな
(つまりスクリーンショットはWayback Machine削除申請の影響を受けない?
単にスクリーンショット機能実装以前に削除されたからかもしれないけど)
既出ならすまない
スクリーンショット機能を使えば普通に保存・閲覧出来るんだな
(つまりスクリーンショットはWayback Machine削除申請の影響を受けない?
単にスクリーンショット機能実装以前に削除されたからかもしれないけど)
既出ならすまない
2020/08/21(金) 00:23:29.07
× スクリーンショット機能実装以前に削除されたから
○ スクリーンショット機能実装以前に削除されたページだったから
○ スクリーンショット機能実装以前に削除されたページだったから
2020/08/21(金) 00:26:14.79
2020/08/22(土) 22:36:33.52
削除申請してる時間あるならルーター再起動するなりすればいいだけじゃないんかね…
ipバレてビビるとか古のネット民じゃないんだから
ipバレてビビるとか古のネット民じゃないんだから
2020/08/23(日) 00:29:25.80
固定IPなんかはそうもいかんだろ
2020/08/24(月) 03:31:06.48
>>426
スクショ機能なんて使う場面ないだろと思ってたけどそういう使い道があったか
スクショ機能なんて使う場面ないだろと思ってたけどそういう使い道があったか
2020/08/24(月) 16:55:38.02
スクリーンショットとサイト保存って何が違うの?
2020/08/24(月) 18:05:25.38
普通のサイト保存→
HTML/CSS/JSなどを実行した結果のデータやアクセス日時などの情報を、WARCファイルという専用フォーマットにまとめて保存する。WARCの表示には専用のビューワが必要
スクリーンショット→
ページのスクリーンショットを撮った画像ファイルを保存する。やってることはスマホやパソコンのスクリーンショットと違いはない
要は保存する方法が全く違う
HTML/CSS/JSなどを実行した結果のデータやアクセス日時などの情報を、WARCファイルという専用フォーマットにまとめて保存する。WARCの表示には専用のビューワが必要
スクリーンショット→
ページのスクリーンショットを撮った画像ファイルを保存する。やってることはスマホやパソコンのスクリーンショットと違いはない
要は保存する方法が全く違う
2020/08/24(月) 23:21:34.82
どのサイトからのものってのはわかるのかな
2020/08/25(火) 15:21:15.62
>>434
URLの先頭にarchive.orgのものが付く以外は普通のURLと変わらないので分かる
URLの先頭にarchive.orgのものが付く以外は普通のURLと変わらないので分かる
2020/08/25(火) 23:20:57.08
なら便利だな
2020/08/26(水) 00:43:57.57
表示中のアーカイブサイトのどこを押せばサイト内容まとめたWARCファイルとやらをDL出来んの
2020/08/26(水) 01:26:16.34
別にわざわざWARC落とさなくても、ブラウザのWayback Machineで表示されてるのがWARCの内容だぞ
アーカイブされたサイトはWARCファイルとしてまとめられ、Internet Archiveのサーバに保存される
Wayback Machineは、サーバ内のWARCを呼び出してブラウザで見れるように適切に変換しているだけ
アーカイブされたサイトはWARCファイルとしてまとめられ、Internet Archiveのサーバに保存される
Wayback Machineは、サーバ内のWARCを呼び出してブラウザで見れるように適切に変換しているだけ
2020/08/30(日) 08:16:25.60
/save/の保存制限ってここ数日は緩和されてる?
時間なかったのでダメ元で何ページか同時に/save/の後ろにURLつけてブラウザで開いてみたら
去年の後半以降からずっと出てた「制限に達したから5分待ってください」のエラーが全く出ずに保存できた
時間なかったのでダメ元で何ページか同時に/save/の後ろにURLつけてブラウザで開いてみたら
去年の後半以降からずっと出てた「制限に達したから5分待ってください」のエラーが全く出ずに保存できた
440439
2020/08/30(日) 08:20:18.13 保存時に画像やスクリプトファイルで待たされるのは
去年の快適だったころとは比べてまだ元通りではないけど、ちょっとストレス減った
去年の快適だったころとは比べてまだ元通りではないけど、ちょっとストレス減った
2020/08/30(日) 19:10:13.20
442名無しさん@お腹いっぱい。
2020/08/30(日) 19:59:54.58 ローカルhtmlにsave/httpのリンク複数貼って
それ一斉に開いたらちゃんと保存されてんの?
それ一斉に開いたらちゃんと保存されてんの?
443名無しさん@お腹いっぱい。
2020/08/30(日) 20:07:43.20 本当だ
しかもnoteの以前のドメイン(note.mu)の方は完全にブロックされてる
Twitterでは8月上旬までこのドメインの魚拓が共有されてるからIP流出事件後にブロックされたっぽい
https://i.imgur.com/BAAGgrQ.jpg
しかもnoteの以前のドメイン(note.mu)の方は完全にブロックされてる
Twitterでは8月上旬までこのドメインの魚拓が共有されてるからIP流出事件後にブロックされたっぽい
https://i.imgur.com/BAAGgrQ.jpg
444名無しさん@お腹いっぱい。
2020/08/30(日) 20:35:37.142020/08/31(月) 04:33:09.24
>>423みたいな懐疑的意見もあったけど、個人的には予想通りの措置って感じだな...
robots.txt見たらia_archiverとmegalodonをブロックしてた
robots.txt見たらia_archiverとmegalodonをブロックしてた
2020/08/31(月) 04:34:52.71
>>445
わかると思うけどnoteの話な
わかると思うけどnoteの話な
2020/09/01(火) 03:46:44.96
robots.txtでブロックしてようがIAのバグで保存しちゃう方法はあるので、
Noteがサービス終了してrobots.txtの規制解除まで見るのだけはお預けだね
Noteがサービス終了してrobots.txtの規制解除まで見るのだけはお預けだね
2020/09/01(火) 05:36:23.80
サービス終了しても解除されない場合があるからそんなに楽観的には見れないな...
そういうサイトはおそらくメールの申請で、Wayback Machineから恒久的に削除されてるんだと思われる
そういうサイトはおそらくメールの申請で、Wayback Machineから恒久的に削除されてるんだと思われる
2020/09/01(火) 12:18:32.04
excludedって削除じゃなくて除外処置じゃないっけ?確証は持てないけど
復活したアーカイブは見たことあるけどそのままの例は知らないので教えて欲しい
復活したアーカイブは見たことあるけどそのままの例は知らないので教えて欲しい
2020/09/01(火) 17:10:02.85
自分が知ってる例は、URLは忘れてしまったけど、
だいたい10年近く前に閉鎖された版権作品の二次創作小説投稿サイトだった
2, 3年前にそのサイトのアーカイブをWayback Machineで見ようとしたんだが、
"このサイトはWayback Machineから削除されました"というような内容のエラーメッセージが出て見れなかった
だいたい10年近く前に閉鎖された版権作品の二次創作小説投稿サイトだった
2, 3年前にそのサイトのアーカイブをWayback Machineで見ようとしたんだが、
"このサイトはWayback Machineから削除されました"というような内容のエラーメッセージが出て見れなかった
2020/09/01(火) 19:38:09.98
>>448
IAに除外要請を出しておいて、サービス終了時に再度
「うち辞めるから、もう見せても良いですよ」とか通知する奴が居たらアホだなw
実際に削除してるのか、単に非表示フラグを立ててるだけなのかは知らんけど。
IAに除外要請を出しておいて、サービス終了時に再度
「うち辞めるから、もう見せても良いですよ」とか通知する奴が居たらアホだなw
実際に削除してるのか、単に非表示フラグを立ててるだけなのかは知らんけど。
2020/09/01(火) 19:57:29.68
心配しなくとも炎上させたいネットストーカーされてるところは他で流出するがな
5chや通販サイト等のクレカ含めた個人情報しかり
ここに挙がらないアーカイブサイトで取った魚拓はまだ残ってるし
マイナー過ぎていつ消えるか分からないけど晒すと使えなくなるから輸出してるが証拠能力が下がるのが悩み
5chや通販サイト等のクレカ含めた個人情報しかり
ここに挙がらないアーカイブサイトで取った魚拓はまだ残ってるし
マイナー過ぎていつ消えるか分からないけど晒すと使えなくなるから輸出してるが証拠能力が下がるのが悩み
2020/09/03(木) 16:37:02.03
>> web archiveは robots.txt での制御をしばらく前にやめている。
>> ドメインオーナーとしての個別連絡も同時期にやっていると思われる。
https://twitter.com/bulkneets/status/1300967926397194240
だそうな
IPアドレスはいわば「準・個人情報」にあたるものだし、
非表示の申請を出すこと自体は企業の対応として真っ当だし当然だとは思うけど、アーカイブできなくなるのは非常に困る
https://twitter.com/5chan_nel (5ch newer account)
>> ドメインオーナーとしての個別連絡も同時期にやっていると思われる。
https://twitter.com/bulkneets/status/1300967926397194240
だそうな
IPアドレスはいわば「準・個人情報」にあたるものだし、
非表示の申請を出すこと自体は企業の対応として真っ当だし当然だとは思うけど、アーカイブできなくなるのは非常に困る
https://twitter.com/5chan_nel (5ch newer account)
2020/09/03(木) 16:37:02.33
>> web archiveは robots.txt での制御をしばらく前にやめている。
>> ドメインオーナーとしての個別連絡も同時期にやっていると思われる。
https://twitter.com/bulkneets/status/1300967926397194240
だそうな
IPアドレスはいわば「準・個人情報」にあたるものだし、
非表示の申請を出すこと自体は企業の対応として真っ当だし当然だとは思うけど、アーカイブできなくなるのは非常に困る
https://twitter.com/5chan_nel (5ch newer account)
>> ドメインオーナーとしての個別連絡も同時期にやっていると思われる。
https://twitter.com/bulkneets/status/1300967926397194240
だそうな
IPアドレスはいわば「準・個人情報」にあたるものだし、
非表示の申請を出すこと自体は企業の対応として真っ当だし当然だとは思うけど、アーカイブできなくなるのは非常に困る
https://twitter.com/5chan_nel (5ch newer account)
2020/09/03(木) 16:37:29.67
二重投稿になってしまった、すまない
2020/09/03(木) 16:43:17.13
非表示にされたサイトでもスクリーンショットで保存できるテクニック、noteでも行けるわ
今試したら問題なく取れた
https://web.archive.org/web/20200903074132/http://web.archive.org/screenshot/https://note.com/
今試したら問題なく取れた
https://web.archive.org/web/20200903074132/http://web.archive.org/screenshot/https://note.com/
2020/09/05(土) 11:20:03.73
スクショはアーカイブデータとして見ると微妙なのがね・・・(単に見る分には良いけど)
全く取れないよりはましだけども
全く取れないよりはましだけども
2020/09/05(土) 13:25:56.74
アーカイブ見ようとすると時々出る。いつも出るわけではない。更新で解決するときとしないときがある。
> ページの自動転送設定が正しくありません
> web.archive.org への接続中にエラーが発生しました。
> Cookie を無効化したり拒否していることにより、この問題が発生している可能性もあります。
> ページの自動転送設定が正しくありません
> web.archive.org への接続中にエラーが発生しました。
> Cookie を無効化したり拒否していることにより、この問題が発生している可能性もあります。
2020/09/06(日) 01:34:21.61
ちょくちょく下の画面か503とかになるな…
https://i.imgur.com/wFIxonH.png
https://i.imgur.com/wFIxonH.png
2020/09/06(日) 23:16:00.13
すみません、どなたかスクリーンショットでのアーカイブのやり方を教えていただけませんか?
ぐぐっても分からずじまいでしたので
よろしくお願いいたします
ぐぐっても分からずじまいでしたので
よろしくお願いいたします
2020/09/07(月) 00:10:02.21
Sorry.
This snapshot cannot be displayed due to an internal error.
This snapshot cannot be displayed due to an internal error.
2020/09/07(月) 05:00:01.20
noteってアーカイブできない?
いくらやってもHrmになっちゃう
いくらやってもHrmになっちゃう
2020/09/07(月) 08:25:07.14
>>460
https://blog.archive.org/wp-content/uploads/2019/10/SPN-1.png
続きです
「save page now」を押してもこのチェックボックスがすべて出ず「save error pages」のチェックボックスしか出ないのです
何かアカウント登録とか必要なのでしょうか?
https://blog.archive.org/wp-content/uploads/2019/10/SPN-1.png
続きです
「save page now」を押してもこのチェックボックスがすべて出ず「save error pages」のチェックボックスしか出ないのです
何かアカウント登録とか必要なのでしょうか?
2020/09/07(月) 14:52:00.26
>>463
Sign in to use extra features: "Save outlinks", "Save screen shot" and "My web archive".
中学英語でも十分理解できる文章だと思うけどねぇ。
Sign in to use extra features: "Save outlinks", "Save screen shot" and "My web archive".
中学英語でも十分理解できる文章だと思うけどねぇ。

2020/09/07(月) 16:27:47.09
homepage2.nifty.comってWayback Machineで非表示になってるのか...
2020/09/07(月) 17:20:20.83
↑これどうにかならいあのんかな
niftyのhomepageなんてもう終わってるのに
niftyのhomepageなんてもう終わってるのに
2020/09/07(月) 19:00:05.38
>>464
どうもありがとうございます
どうもありがとうございます
2020/09/07(月) 20:31:13.49
Wayback Machineで非表示になってるサイトでも、
自前でクローラ動かしてWARC作ってInternet Archiveにアップロードすれば一応アーカイブを残すこと自体は出来るんだけどね...
APIを活用した支援ソフトを作ることや、WARCファイルの取り扱い方を幅広い人に周知することが重要になりそうだ
自前でクローラ動かしてWARC作ってInternet Archiveにアップロードすれば一応アーカイブを残すこと自体は出来るんだけどね...
APIを活用した支援ソフトを作ることや、WARCファイルの取り扱い方を幅広い人に周知することが重要になりそうだ
469名無しさん@お腹いっぱい。
2020/09/08(火) 14:39:27.94 Save outlinksがアカウント必須になったのってどういう事情なのかね
やっぱり容量が逼迫してるから?
やっぱり容量が逼迫してるから?
2020/09/08(火) 21:41:40.80
みんなはスキャンしてみたい本はある?
2020/09/08(火) 21:57:00.84
2020/09/08(火) 23:04:42.17
>>470
本は流石に日本の著作権法上難しいからスキャンして上げる勇気はないな
本は流石に日本の著作権法上難しいからスキャンして上げる勇気はないな
2020/09/09(水) 14:34:19.54
青空文庫の対象になっている本だけにしておこう。
474名無しさん@お腹いっぱい。
2020/09/09(水) 16:24:22.162020/09/10(木) 18:29:24.96
>>472
海外も同じ?
海外も同じ?
2020/09/10(木) 20:53:03.63
2020/09/12(土) 15:50:29.35
>>476
そのうち海外でも違法になるし、削除対象になるな。
そのうち海外でも違法になるし、削除対象になるな。
2020/09/12(土) 19:01:28.95
2020/09/12(土) 19:15:32.10
>>477
頭悪そう
頭悪そう
2020/09/12(土) 19:54:33.10
多分中国人なんだろ
例の国家保安法みたいに、国外での行為も国内で処罰対象になるとか言うやつ
例の国家保安法みたいに、国外での行為も国内で処罰対象になるとか言うやつ
2020/09/16(水) 12:31:27.10
著作権法は「送信元の国」と「送信先の国」どちらの法律を適用するかで見解が分かれること自体は事実だから、あながち間違ってるわけでもない
合ってるわけでもないのが微妙な点だけど
合ってるわけでもないのが微妙な点だけど
482名無しさん@お腹いっぱい。
2020/09/16(水) 19:20:01.19 【ネット】1000万件以上の研究論文がオンライン上から消失することを防ぐインターネットアーカイブの取り組みとは? [すらいむ★]
https://egg.5ch.net/test/read.cgi/scienceplus/1600244016/
https://egg.5ch.net/test/read.cgi/scienceplus/1600244016/
2020/09/18(金) 08:59:11.97
今ってYahoo知恵袋アーカイブできるようになってるんだね
昔はできなかった記憶
昔はできなかった記憶
2020/09/18(金) 09:41:08.71
Yahooの件はさんざん既出
2020/09/20(日) 00:05:31.29
Temporarily Offline
The Internet Archive's sites are temporarily offline.
We apologize for the inconvenience.
The Internet Archive's sites are temporarily offline.
We apologize for the inconvenience.
486名無しさん@お腹いっぱい。
2020/09/20(日) 07:21:40.11 >>473
あとはフリーのWeb小説やWeb漫画だね
あとはフリーのWeb小説やWeb漫画だね
2020/09/20(日) 11:05:31.96
pixivって閉鎖はされなそうだけど、作品は自主削除が多発するしな。
2020/09/20(日) 11:59:03.96
epubファイルをアップロードすると、その場で、ページをめくって内容を確認できるようになった。
便利。
便利。
2020/09/20(日) 18:26:41.77
pixivをWayback Machineでアーカイブすると英語版が保存されるんだよね
Internet Archiveのサーバがアメリカにあるためだと思われる
Internet Archiveのサーバがアメリカにあるためだと思われる
2020/09/20(日) 20:31:33.86
リアリー?
491489
2020/09/20(日) 21:54:54.16 >>490
試してみたら?
今まで自分がやったやつは全部そうなったし今試してみてもそうなった
https://web.archive.org/web/20200920125157/https://www.pixiv.net/en/artworks/84437660
試してみたら?
今まで自分がやったやつは全部そうなったし今試してみてもそうなった
https://web.archive.org/web/20200920125157/https://www.pixiv.net/en/artworks/84437660
2020/09/21(月) 12:54:15.78
こっちの環境だけかな?
今朝から新規の保存をしても反映されない様で…
今朝から新規の保存をしても反映されない様で…
2020/09/21(月) 13:28:38.55
We can't retrieve all the files we need to display that page. Please try again later.
今朝からこのエラーばっかり、時間置いても同じエラー出る
今朝からこのエラーばっかり、時間置いても同じエラー出る
2020/09/21(月) 15:08:51.20
俺も保存できてない。
APIもShow Allも反応なし
APIもShow Allも反応なし
2020/09/21(月) 16:58:59.37
今朝からのエラーまだ直ってないのか
2020/09/22(火) 00:15:15.42
おま環かと思ったら俺の他にも取れない人いたのか
2020/09/22(火) 01:10:54.32
ブログから
Cloudflare and the Wayback Machine, joining forces for a more reliable Web
ttps://blog.archive.org/2020/09/17/internet-archive-partners-with-cloudflare-to-help-make-the-web-more-useful-and-reliable/
クラウドフレアと連携
簡単な要約
クラウドフレアのAlways Onlineサービスを使っているサイトは、サイトが鯖落ちしてるときにIAで保存されてるページを表示かもしれない
それとは別にIAに保存されていないURLの場合、システムで自動的に保存するかもしれない
Cloudflare and the Wayback Machine, joining forces for a more reliable Web
ttps://blog.archive.org/2020/09/17/internet-archive-partners-with-cloudflare-to-help-make-the-web-more-useful-and-reliable/
クラウドフレアと連携
簡単な要約
クラウドフレアのAlways Onlineサービスを使っているサイトは、サイトが鯖落ちしてるときにIAで保存されてるページを表示かもしれない
それとは別にIAに保存されていないURLの場合、システムで自動的に保存するかもしれない
2020/09/22(火) 01:27:34.31
ますます重くなるから余計な事はやめろ
2020/09/22(火) 02:07:08.22
ようやく新規の保存が通るようになった…
この後どうなるかわからんけど…
この後どうなるかわからんけど…
2020/09/22(火) 02:22:24.50
2020/09/22(火) 03:13:49.79
いつかはパンクする
その時期が早まるだけだ
その時期が早まるだけだ
2020/09/22(火) 08:08:56.42
てか、去年の同じ時期にも保存できなくなってたような
9月20日に保存できなかったのを覚えてる
9月20日に保存できなかったのを覚えてる
2020/09/23(水) 01:15:58.22
覚えてられないほど頻繁に起きている気がするが
2020/09/25(金) 10:19:01.03
4GB超の更新ファイルを保存しようとしたら、2GBでカットされちゃったんだけど
ファイルの上限あるのかな。問題になりそう。
ファイルの上限あるのかな。問題になりそう。
2020/09/25(金) 12:38:17.33
SPNで保存後、Visitの後ろに表示されるリンクがデタラメで不安になる
2020/09/25(金) 21:15:42.10
保存直後、即時反映される場合と一日経っても反映されない場合があって、差が激しい。
2020/09/28(月) 16:44:07.73
質問です
ログインしなければ見れない記事などは
どうすればアーカイブできるのでしょうか?
単にバックアップしてもログイン画面が表示されるだけなのです
ログインしなければ見れない記事などは
どうすればアーカイブできるのでしょうか?
単にバックアップしてもログイン画面が表示されるだけなのです
2020/09/30(水) 13:25:58.72
2020/09/30(水) 20:22:18.87
今時ベーシックはないだろうしねえ
2020/09/30(水) 20:55:20.93
OAuthも無理だろうしSPNでログインが必要なページは事実上無理じゃないかな
2020/10/03(土) 20:46:46.28
ログインするページは魚拓出来ないのですね・・・
ご回答ありがとうございました。
ご回答ありがとうございました。
2020/10/03(土) 22:59:15.77
そもそもパスワード等を知らない「アカの他人」には見えないようになっているページを
どうして Internet Archive という「他人」に保存させようとするんだ?
リテラシーが崩壊してるわw
どうして Internet Archive という「他人」に保存させようとするんだ?
リテラシーが崩壊してるわw
2020/10/04(日) 00:30:28.82
むやみに笑うなよ…もっと平和にいこうぜ
2020/10/04(日) 01:06:25.33
「リテラシーが崩壊してるわw」では済まされないくらい重要な問題なんだけどな
例えば学術論文リポジトリはログインしないと閲覧出来ない場合も多くて問題になってたりする
例えば学術論文リポジトリはログインしないと閲覧出来ない場合も多くて問題になってたりする
2020/10/04(日) 01:17:45.63
「ログインしないと入れないページ」は深層ウェブというものの一つでもあるんだけど、
ディープウェブのWebアーカイブをどうやってやっていくべきかというのは割と難しい課題なのよ
ログインしないと入れないページは、ちゃんとした理由があるからこそ閲覧に制限がかかってる
でもそれと同時に、ちゃんとした理由があってログインしないと入れないページをアーカイブしたい場合というのも往々にしてあるわけ(上で挙げた学術論文リポジトリはその一例)
とは言え、いくらアーカイブする必然性があってもだからと言ってアクセス制限を無視して良いわけではないし、両者の兼ね合いは結構難しい
ともかくこういうのを単なるネットリテラシーの問題として済ますのは良くない
ディープウェブのWebアーカイブをどうやってやっていくべきかというのは割と難しい課題なのよ
ログインしないと入れないページは、ちゃんとした理由があるからこそ閲覧に制限がかかってる
でもそれと同時に、ちゃんとした理由があってログインしないと入れないページをアーカイブしたい場合というのも往々にしてあるわけ(上で挙げた学術論文リポジトリはその一例)
とは言え、いくらアーカイブする必然性があってもだからと言ってアクセス制限を無視して良いわけではないし、両者の兼ね合いは結構難しい
ともかくこういうのを単なるネットリテラシーの問題として済ますのは良くない
2020/10/04(日) 01:22:42.49
理由は何であろうが、ログインを要求してるんだから
それ以上は IA 側の知った話じゃないよ
それ以上は IA 側の知った話じゃないよ
2020/10/04(日) 03:15:02.69
「知った話じゃない」ってのは
「関心を持って注視しているが現時点では対応していない」状況にぴったりな言葉じゃないと思う
「関心を持って注視しているが現時点では対応していない」状況にぴったりな言葉じゃないと思う
2020/10/04(日) 15:45:40.69
519名無しさん@お腹いっぱい。
2020/10/04(日) 17:10:59.85 >>515
言ってることがただの自己中だってことに気付けよ
言ってることがただの自己中だってことに気付けよ
2020/10/04(日) 17:23:57.00
横からだけど全然自己中じゃないと思うよ。
2020/10/04(日) 21:38:12.33
保存される側のルール>保存する側の都合だしな
2020/10/04(日) 22:44:09.00
>>521
だよねー、普通は
だよねー、普通は
2020/10/05(月) 01:02:47.64
2020/10/05(月) 01:05:22.46
ウェブアーカイブが単純にローカルで保存しとけば済む話だったらInternet Archiveという団体は存在しえない
保存する側とされる側の都合の兼ね合いは「自己中」で一蹴せず、ちゃんと考えていかなきゃいけないシリアスな問題だと思うよ
保存する側とされる側の都合の兼ね合いは「自己中」で一蹴せず、ちゃんと考えていかなきゃいけないシリアスな問題だと思うよ
2020/10/05(月) 02:54:18.28
まだ引っ張んのかこいつw
2020/10/05(月) 04:15:46.32
草生やしてるほうレッテル貼りしかしてないもんなあ
2020/10/05(月) 04:55:38.02
自己中呼ばわりやら草生やしたりやらしてる方は
何か恨みでもあるんかってくらい食い付いてるしな
感情論で殴ってるだけだから話自体に説得力ないし
何か恨みでもあるんかってくらい食い付いてるしな
感情論で殴ってるだけだから話自体に説得力ないし
2020/10/05(月) 10:48:51.05
>>522
正義マンがポリコレ棒めっちゃぶんぶんしてるのに似てる
なんでルール守れないゴミ自己中のくせに被害者面してんの?
やべーわ
それで管理人がサイト更新意欲なくなっても
俺は悪くない!
とか宣うんだろw
正義マンがポリコレ棒めっちゃぶんぶんしてるのに似てる
なんでルール守れないゴミ自己中のくせに被害者面してんの?
やべーわ
それで管理人がサイト更新意欲なくなっても
俺は悪くない!
とか宣うんだろw
529名無しさん@お腹いっぱい。
2020/10/05(月) 17:14:59.29 おもしれー
もっとやれ
もっとやれ
2020/10/05(月) 19:42:44.10
もっとやれって言われた以上この話題は無視するか
ここはTwitterのリプライかよ、くだらない
ここはTwitterのリプライかよ、くだらない
2020/10/06(火) 21:16:26.76
ルールに従えとしか言えないな
考えていかなきゃいけない問題だとは思うが、ここで議論する意味は無い
考えていかなきゃいけない問題だとは思うが、ここで議論する意味は無い
2020/10/07(水) 18:39:57.75
またデータ取れない状態になったみたいね
533名無しさん@お腹いっぱい。
2020/10/15(木) 08:59:33.08 1980年代のインターネットの書き込みが磁気テープから復活 2020/10/14 [朝一から閉店までφ★]
https://asahi.5ch.net/test/read.cgi/newsplus/1602676258/
https://asahi.5ch.net/test/read.cgi/newsplus/1602676258/
2020/10/16(金) 05:28:12.15
昨日ぐらいから/save/の後にURLつけると520エラーばっかりなんだが
保存すらされてない
保存すらされてない
2020/10/16(金) 07:12:52.64
Sorry
Cannot start capture
Cannot start capture
2020/10/16(金) 07:24:27.85
>>535
これ
これ
2020/10/16(金) 12:16:07.53
Cannot start capture
これ俺以外もなってたのか
おま環じゃなくてよかった
これ俺以外もなってたのか
おま環じゃなくてよかった
2020/10/16(金) 14:04:37.17
2020/10/16(金) 14:10:34.97
2020/10/16(金) 16:57:00.72
Unknown Errorのままで使えない
2020/10/16(金) 17:35:10.02
ここ何周か archive.st が取得完了してもアーカイブされない不具合なままだ……
2020/10/16(金) 17:40:36.68
2020/10/17(土) 05:55:06.62
とりあえず今の所は/save/もSPNも保存できるね
直ったかな
直ったかな
2020/10/17(土) 05:58:22.64
https://archive.org/post/1110563/archive-url-10-times-today-limit
俺の環境では確認できてないけど、
同じ日に10回以上保存されてるURLをさらに保存するとこんなエラーが出る場合があるらしい。
This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.
まあ、ニュースサイトとかじゃない限り10回も保存はしないだろうけど。
俺の環境では確認できてないけど、
同じ日に10回以上保存されてるURLをさらに保存するとこんなエラーが出る場合があるらしい。
This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.
まあ、ニュースサイトとかじゃない限り10回も保存はしないだろうけど。
2020/10/17(土) 09:10:23.03
相変わらずページの一部画像が欠けて保存される
546名無しさん@お腹いっぱい。
2020/10/17(土) 15:39:48.96 アーカイブが存在しなければ保存するみたいな選択項目があればもう少し容量削減できそうなのにな
2020/10/18(日) 13:05:45.08
このスレにかつて居たスポーツ新聞野郎がキチガイ扱いされたのは、
個々のニュースではなくサイトのトップとか一覧とかのアーカイブに固執してたから。
個々のニュースではなくサイトのトップとか一覧とかのアーカイブに固執してたから。
2020/10/18(日) 16:03:43.18
>>546
isみたくトップからやり直さないと何年も前のアーカイブ開くだけで取り直すか聞かないのもウザイけどな
isみたくトップからやり直さないと何年も前のアーカイブ開くだけで取り直すか聞かないのもウザイけどな
2020/10/19(月) 00:06:20.58
>>547
あの人最近見かけないけど今どうしてるのかね
トップページや一覧ページの保存だけに血道を上げている様子は、正直言って病的というか空恐ろしいものがあった
他のスレ住人に何を言われてもほぼ反応なしで、何だか自分の世界に入り込んでるみたいだったね
彼は未だにスポーツ新聞のトップページを毎日手動で保存し続けているんだろうかね
あの人最近見かけないけど今どうしてるのかね
トップページや一覧ページの保存だけに血道を上げている様子は、正直言って病的というか空恐ろしいものがあった
他のスレ住人に何を言われてもほぼ反応なしで、何だか自分の世界に入り込んでるみたいだったね
彼は未だにスポーツ新聞のトップページを毎日手動で保存し続けているんだろうかね
2020/10/19(月) 04:33:54.40
archive.isでとった魚拓をinternet archiveで保存すると
できるのとできないのがあるんだけど
違いはなんだろう
できるのとできないのがあるんだけど
違いはなんだろう
2020/10/19(月) 06:12:33.66
あ、時間おいて再度やったら保存できたのもあるから単にサーバー側の不具合かも
2020/10/20(火) 17:14:46.24
Unknown Errorが多いな
2020/10/20(火) 19:10:14.06
既出かもしれないけど、こんなページがある。
Wayback Stats
https://archive.org/stats/
https://analytics0.archive.org/stats/wb.php
注目したいのはHTTP 200と503エラーのグラフと404エラーの割合グラフ
このスレでも報告があった10/15〜10/16は表示エラーが多くて、
10/17は一時半分近くエラー続きだったそうだ。
このURLはテンプレか>>1に入れといていいと思う。
Wayback Stats
https://archive.org/stats/
https://analytics0.archive.org/stats/wb.php
注目したいのはHTTP 200と503エラーのグラフと404エラーの割合グラフ
このスレでも報告があった10/15〜10/16は表示エラーが多くて、
10/17は一時半分近くエラー続きだったそうだ。
このURLはテンプレか>>1に入れといていいと思う。
2020/10/20(火) 21:53:07.53
ずっと見られなくなってたtripod.com系のサイトがいつの間にか見れるようになってた
あとIEで見れなくなった
印刷プレビューはIEが一番使いやすかったのに…
あとIEで見れなくなった
印刷プレビューはIEが一番使いやすかったのに…
2020/10/20(火) 22:53:30.54
IE排除は英断というか当たり前だと思う
開発元のマイクロソフトもとっくにサポートやめて「代わりにEdge使ってね」ってしつこいくらい宣伝してたし...
開発元のマイクロソフトもとっくにサポートやめて「代わりにEdge使ってね」ってしつこいくらい宣伝してたし...
2020/10/20(火) 23:00:54.10
運営側にとってはIEってセキュリティホールも仕様の古さも色々と面倒で、本当に悩みの種なんだわ
Internet Archiveに限らずIEでの閲覧を想定しないサイトは今後どんどん増えていくだろうし、
悪いこと言わないから他のブラウザに乗り換えた方が良いよ
というか、これはあくまで個人的な感想だからつもりはないけど、
IEの印刷プレビューって言うほど使いやすいかな?
Chromeに印刷プレビュー機能がなかった10年前じゃあるまいし
Internet Archiveに限らずIEでの閲覧を想定しないサイトは今後どんどん増えていくだろうし、
悪いこと言わないから他のブラウザに乗り換えた方が良いよ
というか、これはあくまで個人的な感想だからつもりはないけど、
IEの印刷プレビューって言うほど使いやすいかな?
Chromeに印刷プレビュー機能がなかった10年前じゃあるまいし
2020/10/20(火) 23:21:09.35
UserAgentをIEに変えても、普通に見れるが。。
Your browser may not be compatible〜ってのは出るけど。
Your browser may not be compatible〜ってのは出るけど。
2020/10/21(水) 00:30:53.60
「The server didn't respond in time for http://〜」がよく表示されると思ったら特定のサイトだけだったか・・・
>10/17は一時半分近くエラー続きだったそうだ。
道理で保存されてないのがいくつかあるなと思ったら・・・
>10/17は一時半分近くエラー続きだったそうだ。
道理で保存されてないのがいくつかあるなと思ったら・・・
2020/10/21(水) 10:59:34.87
2020/10/21(水) 18:00:01.04
>>550
archive.is の拓が直接 archive.orgに取り込めない場合は少し前までなら anonymouse のWebプロキシのURL付けると取り込めたりしたが、
(例:http://anonymouse.org/cgi-bin/anon-www.cgi/http://e-words.jp/w/%E3%82%A2%E3%83%BC%E3%82%AB%E3%82%A4%E3%83%96.html で取り込む)
…今秋から archive.is へのアクセスが暗号通信( https://archive.is/XXXXX )強制にされてしまったんで不可になってしまった。
( anonymouse.は非暗号アクセス http:// のサイトにしか対応してない )
archive.is の拓が直接 archive.orgに取り込めない場合は少し前までなら anonymouse のWebプロキシのURL付けると取り込めたりしたが、
(例:http://anonymouse.org/cgi-bin/anon-www.cgi/http://e-words.jp/w/%E3%82%A2%E3%83%BC%E3%82%AB%E3%82%A4%E3%83%96.html で取り込む)
…今秋から archive.is へのアクセスが暗号通信( https://archive.is/XXXXX )強制にされてしまったんで不可になってしまった。
( anonymouse.は非暗号アクセス http:// のサイトにしか対応してない )
2020/10/21(水) 19:01:46.68
10/19あたりもひどいなぁ・・・
きちんと保存されてたはずのものがされてないことに。
きちんと保存されてたはずのものがされてないことに。
2020/10/21(水) 23:45:30.07
保存が10/19ならもう数日待つべし
2020/10/22(木) 00:43:54.18
一時期なものならまだ良いが・・・
2020/10/22(木) 12:51:56.97
最低でも一週間は待てとあれほど
まぁ話題が少ないからループするのはしょうがないけど
まぁ話題が少ないからループするのはしょうがないけど
2020/10/22(木) 19:24:33.27
>>46のことか。
ここのところあまりにもひどくてさ・・・
ここのところあまりにもひどくてさ・・・
2020/10/23(金) 03:51:33.89
もはや不安定さには完全に慣れてしまった
2020/10/23(金) 11:25:58.48
一定周期で不安定化するのは
もう定期イベントみたいなもの
もう定期イベントみたいなもの
2020/10/24(土) 22:48:06.96
なんか急にやたら長い変なURLになって保存失敗することが増えた
2020/10/24(土) 23:09:23.02
ワケわからんurlになるよな
2020/10/25(日) 01:01:50.22
URLはバグってるけど少し経ってから元のURLでAPI確認すると取れてるぽい
2020/10/25(日) 01:34:37.40
"The server didn't respond in time for (保存URL)."
ってエラーメッセージが出ても、後で確認すると取れてることが多かったりする
ってエラーメッセージが出ても、後で確認すると取れてることが多かったりする
572名無しさん@お腹いっぱい。
2020/10/25(日) 12:49:20.36 とうとうエラーでサイト見れなくなったか?
2020/10/25(日) 13:16:13.93
>>572
何を言ってるのか良く判らない、と良く言われるだろw
何を言ってるのか良く判らない、と良く言われるだろw
2020/10/25(日) 13:24:21.46
503エラー出てるね
メンテ中かな
メンテ中かな
2020/10/25(日) 13:29:27.09
https://archive.org/
まさかのトップページで 500 エラーを返されたわw
まさかのトップページで 500 エラーを返されたわw
2020/10/25(日) 14:45:08.36
復旧はしたが再度保存するのに要求される待ち時間が30分になってる…
ちょっと前は20分、去年あたりは10分で良かったのに…
ちょっと前は20分、去年あたりは10分で良かったのに…
2020/10/25(日) 21:11:43.05
/save/で1ページ保存できたっぽいから、もう1ページやったら
Unknown Errorになった。
Unknown Errorになった。
2020/10/25(日) 21:16:36.58
スポーツ新聞野郎まだ居たのか
2020/10/25(日) 21:57:17.13
また取れない
Unknown Errorを繰り返すようになった
Unknown Errorを繰り返すようになった
2020/10/26(月) 00:51:01.37
cloudfront.netがなぜか全部ブロックされていて、こんな風に表示される
Sorry
This URL is in our block list and cannot be captured. Please email us at "info@archive.org" if you would like to discuss this more.
会社のプレスリリースなどでcloudfront.net使ってるところは保存できなくなってるわ
Sorry
This URL is in our block list and cannot be captured. Please email us at "info@archive.org" if you would like to discuss this more.
会社のプレスリリースなどでcloudfront.net使ってるところは保存できなくなってるわ
2020/10/26(月) 17:19:48.92
Wayback Statsによると
24日午後4時〜8時(日本時間25日午前8時〜12時頃)にサーバーダウンして4時間ほどページすら見れなかったらしい
24日午後4時〜8時(日本時間25日午前8時〜12時頃)にサーバーダウンして4時間ほどページすら見れなかったらしい
2020/10/26(月) 19:05:44.02
アメブロとったらかたつむりの画像かえされたんだけどなんでw
2020/10/26(月) 21:03:32.40
リアルなやつか?
2020/10/26(月) 23:46:49.93
これwマウスの上にかたつむり乗ってるのwリアルがダメな人は見ないで
http://web.archive.org/web/20201024183048/https://pbs.twimg.com/card_img/1318252845452374016/A4POgMBd?format=jpg&name=600x314
上にも書いたけどアメブロの魚拓をとったんだよね
あとからチェックしたら魚拓自体はとれてたんだけどw謎杉
数日前から変なURLに飛ばされることがあるけど結果的に取れてるんだよ
http://web.archive.org/web/20201024183048/https://pbs.twimg.com/card_img/1318252845452374016/A4POgMBd?format=jpg&name=600x314
上にも書いたけどアメブロの魚拓をとったんだよね
あとからチェックしたら魚拓自体はとれてたんだけどw謎杉
数日前から変なURLに飛ばされることがあるけど結果的に取れてるんだよ
2020/10/27(火) 00:07:16.71
想像以上にリアルだった
きもE
きもE
2020/10/27(火) 00:49:59.93
googleに飛ばされたりpbs.twimgに飛ばされたり
よく分からん怪しいurlに飛ばされたりしてるな
よく分からん怪しいurlに飛ばされたりしてるな
2020/10/27(火) 01:26:19.05
>>584
それここ何日か発生してるバグっぽい。
save nowで保存すると、そのページじゃなくて読み込まれるURLの1個が帰ってくる。
変なURLが帰ってくるとびっくりするけど一応保存はされてる模様。
それここ何日か発生してるバグっぽい。
save nowで保存すると、そのページじゃなくて読み込まれるURLの1個が帰ってくる。
変なURLが帰ってくるとびっくりするけど一応保存はされてる模様。
2020/10/27(火) 01:28:05.49
確認してないけど、もしかしたら一番長いURLが戻ってくるのかもしれない。
2020/10/27(火) 02:13:12.17
そのバグだいぶ前からあった
バグったり直ったりしていた
バグったり直ったりしていた
2020/10/27(火) 02:27:39.41
AmebloじゃなくてInternet Achieveのほうの不具合なのか
2020/10/27(火) 10:08:38.57
昨日は謎の文字列頁が表示されてびっくりしたよ
2020/10/29(木) 03:45:25.34
Your capture will begin in 15s.
またsave nowが混み始めたぞ
またsave nowが混み始めたぞ
2020/10/29(木) 11:59:23.94
本レビューサイト「ブクログ」、2年弱ソースコード上にメールアドレスが表示された状態に
https://security.srad.jp/story/20/10/25/1638251/
Noteに続き、今度はブクログのメルアド流出でbooklog.jpまるごとブロックか削除になったそう
https://security.srad.jp/story/20/10/25/1638251/
Noteに続き、今度はブクログのメルアド流出でbooklog.jpまるごとブロックか削除になったそう
2020/10/29(木) 16:27:01.75
結局Wayback Machine頼りじゃなく、自分で保存してInternet Archiveのアカウントでアップロードするのが安全なんだよな
2020/10/29(木) 17:39:46.40
excluded表記は削除じゃなくてWaybackMachineのアクセス拒否だって事を願ってる
こんなしょうもない事でポンポン消されたらたまったもんじゃない
こんなしょうもない事でポンポン消されたらたまったもんじゃない
2020/10/29(木) 22:34:14.27
中国本土で、アメリカのInternet Archive相当の役割をしているサイト、サービスは、どこですか?
URLが知りたいです。
URLが知りたいです。
2020/10/30(金) 02:14:44.13
>>596
ざっと検索したらそれらしい情報は出てきたが、あなたの欲しい情報が入ってるかは分からん
IPLC Launches the Greater China Archival Resources Web Archive(Ivy Plus Libraries Confederation, 2020/9/9)
https://ivpluslibraries.org/2020/09/iplc-launches-the-greater-china-archival-resources-web-archive/
Greater China Archival Resources Web Archive(Archive-It)
https://archive-it.org/collections/14767
ざっと検索したらそれらしい情報は出てきたが、あなたの欲しい情報が入ってるかは分からん
IPLC Launches the Greater China Archival Resources Web Archive(Ivy Plus Libraries Confederation, 2020/9/9)
https://ivpluslibraries.org/2020/09/iplc-launches-the-greater-china-archival-resources-web-archive/
Greater China Archival Resources Web Archive(Archive-It)
https://archive-it.org/collections/14767
2020/10/30(金) 02:16:14.21
archive.orgは金盾でブロックされてるのか
まあ当然っちゃ当然かもしれないけど
まあ当然っちゃ当然かもしれないけど
2020/10/30(金) 09:30:17.93
>>597
ありがとうございます!とても参考になりました。
ありがとうございます!とても参考になりました。
2020/10/31(土) 21:34:11.67
どうでもいい話だけど
「インターネットアーカイブ」で検索しても1ページ目にすら出ないんだな
「internet archive」だとトップなのに
日本人はあんまり使ってないのかな・・・?
「インターネットアーカイブ」で検索しても1ページ目にすら出ないんだな
「internet archive」だとトップなのに
日本人はあんまり使ってないのかな・・・?
2020/10/31(土) 21:44:23.02
ウェーバック・マシーンは出てくる
2020/11/01(日) 15:21:23.61
603名無しさん@お腹いっぱい。
2020/11/05(木) 14:53:16.09 半角無理そう?
604名無しさん@お腹いっぱい。
2020/11/05(木) 14:55:42.77605名無しさん@お腹いっぱい。
2020/11/05(木) 16:20:41.64 sakura03鯖のログって全損なんかな
2020/11/06(金) 13:29:44.23
googleキャッシュならまだあるだろうから
保存するなら今のうちだな
保存するなら今のうちだな
2020/11/06(金) 21:12:40.12
ここって昔のPCゲームもあるんだな
diablo2ゲット
diablo2ゲット
2020/11/07(土) 01:44:34.11
お宝見つけても名前は出さない方が無難
こっそり楽しめ
こっそり楽しめ
2020/11/07(土) 10:41:21.23
>>595
それで合っていると思う
試しにツールを使って、すでにその状態になっているものをここからダウンロードしようとしたら
「403 Forbidden」が出たから
だからまた見るにはインターネットアーカイブ側でアクセス許可にされるか
それともそれをかいくぐれるツールが出来るかのどっちかしか無いかも
それで合っていると思う
試しにツールを使って、すでにその状態になっているものをここからダウンロードしようとしたら
「403 Forbidden」が出たから
だからまた見るにはインターネットアーカイブ側でアクセス許可にされるか
それともそれをかいくぐれるツールが出来るかのどっちかしか無いかも
2020/11/07(土) 14:46:43.61
>>607
シリアルが画が画が
シリアルが画が画が
2020/11/10(火) 00:24:38.75
角煮ログも封鎖されたかな
2020/11/11(水) 23:22:46.65
ttps://analytics0.archive.org/stats/wb.php
日本時間で午後10時50分過ぎから鯖落ちしてる模様
日本時間で午後10時50分過ぎから鯖落ちしてる模様
2020/11/12(木) 02:34:24.00
今はサーバー復活してる、保存も問題なし
2020/11/19(木) 10:57:43.27
寄付催促してんな
2020/11/19(木) 13:48:19.34
seesaawikiのサイトを取ろうとするとクラッシュしたり挙動がおかしくなる
2020/11/19(木) 16:14:02.21
寄付の表示のところに毎日7億5000万ページ(画像やスクリプトを多分含む)保存してると出てるね
2020/11/19(木) 23:46:06.93
コスパティオのページ保存すると変なとこにリダイレクトされて上手く保存できなくなった
2020/11/20(金) 04:16:43.66
寄付の表示がでるようになったり
一昨日くらいにUnknown Error表示でまくりで放置してた分も依然そのままの状態で取れない
なんだかうまく取れたらクリアってゲームやってる気がしてきた・・・
一昨日くらいにUnknown Error表示でまくりで放置してた分も依然そのままの状態で取れない
なんだかうまく取れたらクリアってゲームやってる気がしてきた・・・
2020/11/20(金) 08:15:01.59
save page nowでやってダメなら時間置いてもう一度やるのが一番早いと思う
2020/11/20(金) 08:19:32.56
2020/11/20(金) 21:31:52.70
こっちで出なくなったと思ったら魚拓で502
おま環?
おま環?
622名無しさん@お腹いっぱい。
2020/11/21(土) 14:12:11.95 >>615
Archiveteamにwiki専門のグループがあるからそのIRCで頼めば保存してもらえるかも
以前別件でコンタクト取ったときに向こうから保存したい日本のwikiはないかって尋ねてきたこともあるくらいだから積極的に動いてくれると思う
https://archiveteam.org/index.php?title=WikiTeam
Archiveteamにwiki専門のグループがあるからそのIRCで頼めば保存してもらえるかも
以前別件でコンタクト取ったときに向こうから保存したい日本のwikiはないかって尋ねてきたこともあるくらいだから積極的に動いてくれると思う
https://archiveteam.org/index.php?title=WikiTeam
2020/11/21(土) 20:01:45.32
なんか古いデータどんどん消してる気がする・・・
何年も前から取ってるページなのに2020年7月からしかないとか変だわ
何年も前から取ってるページなのに2020年7月からしかないとか変だわ
2020/11/21(土) 23:16:26.36
削除以外でもメンテか障害かなんかで
一時的に一部データが閲覧できない場合もあるからな
一時的に一部データが閲覧できない場合もあるからな
625名無しさん@お腹いっぱい。
2020/11/22(日) 01:23:53.80 【Web】Internet Archive、Flashコンテンツをアーカイブ プラグインなしで21年以降も閲覧可能に【Rust】 [少考さん★]
https://asahi.5ch.net/test/read.cgi/newsplus/1605969388/l50
https://asahi.5ch.net/test/read.cgi/newsplus/1605969388/l50
2020/11/23(月) 22:59:21.80
妥当だね
メニューがFlashのサイトとかナビゲーションさえできなくなっちゃうからな
メニューがFlashのサイトとかナビゲーションさえできなくなっちゃうからな
2020/11/26(木) 06:49:26.37
MacかiPhoneのSafariで見るとkCF〜のエラーが出るのは何度か再読み込みすれば直る
ダメなら時間おくしかない
ダメなら時間おくしかない
2020/11/29(日) 12:26:24.57
save page nowから2GB以上のファイルを保存しようとすると「Resource file size is over 2GB.」のエラーが出るようになってる
ちょっと前までは出なかったのに
ちょっと前までは出なかったのに
2020/11/29(日) 13:46:55.47
何を保存してるのか気になる
2020/11/29(日) 15:50:01.95
ゲームの修正パッチとか体験版とかだとたまにそのくらい行くな>2GB以上
2020/11/29(日) 16:02:24.61
2020/12/01(火) 10:52:52.75
curlで保存してるけど、最近は調子良すぎなんだが
20秒ぐらいで保存が終わってタイムアウトも1割ぐらい
タイムアウトでもちゃんと保存されてるし、画像やスクリプト込みでこの時間だから、
以前より早いかも
(100個も画像やスクリプトあるページは無理だが)
20秒ぐらいで保存が終わってタイムアウトも1割ぐらい
タイムアウトでもちゃんと保存されてるし、画像やスクリプト込みでこの時間だから、
以前より早いかも
(100個も画像やスクリプトあるページは無理だが)
2020/12/04(金) 23:38:28.47
Unknown Errorが出たら保存し直した方がいいかもな
一ヶ月前のUnknown Error保存分をチェックしてみたら
日付だけ表示されたが中身は保存されてないようだ
一ヶ月前のUnknown Error保存分をチェックしてみたら
日付だけ表示されたが中身は保存されてないようだ
2020/12/05(土) 16:22:36.31
最近APIが重すぎる
2020/12/05(土) 17:14:55.42
Sorry
Job failed
Job failed
2020/12/06(日) 13:21:09.09
You have already reached the limit of active sessions
今日2回目の保存なのにこのエラーが出るとか、ふざけすぎでしょw
今日2回目の保存なのにこのエラーが出るとか、ふざけすぎでしょw
2020/12/06(日) 13:23:29.09
IPアドレス変えてもこのエラー出るので
active sessionsだからサイト全体のセッション数の制限を超えてるということかもしれないが
active sessionsだからサイト全体のセッション数の制限を超えてるということかもしれないが
2020/12/06(日) 19:32:55.17
>>637
host規制かそのサイトだけ取れないように規制されてるかじゃね知らんけど
host規制かそのサイトだけ取れないように規制されてるかじゃね知らんけど
2020/12/06(日) 23:36:07.44
2020/12/07(月) 10:35:04.56
2020/12/07(月) 17:09:05.18
200ページ程度で規制されるわけない、スクリプトなら数分レベル
寄付しろってのはそう
寄付しろってのはそう
2020/12/07(月) 17:39:59.48
そうやって間隔あけずに一気に叩き込むからすぐサーバー落ちるんじゃないのかよ
2020/12/07(月) 21:09:46.97
間隔開けなかったら数分もかからんよ
2020/12/07(月) 23:07:54.27
利用者も多いから負荷は可能な限り抑えて利用すべきではあるな
2020/12/08(火) 18:52:05.48
1日3億ページ保存してるとサイトで書いてあるのに、たった1人が数百ページ保存したぐらいでなんてこともないわw
2020/12/08(火) 22:29:27.53
実際にクッソ重い状態が続く事も珍しくないからな
2020/12/09(水) 10:26:17.35
本来機械化しないことを想定して作られてるんだから、
大量にリクエストしたら通常よりも大きな負荷がかかるかもしれない、くらいのことは想像つかないのかよ
やるならせめて寄付くらいはしろ
大量にリクエストしたら通常よりも大きな負荷がかかるかもしれない、くらいのことは想像つかないのかよ
やるならせめて寄付くらいはしろ
2020/12/09(水) 10:29:24.14
1つのIPからの接続回数や間隔が以前よりも制限されているという事実は、
どのような形であれ大量アクセスはInternet Archiveにとって困るってことの証拠じゃないの
どのような形であれ大量アクセスはInternet Archiveにとって困るってことの証拠じゃないの
2020/12/09(水) 13:07:12.73
てか>>645と同じアホが真に受けて俺も俺もとなるのが1番怖い
自制が効かない・寄付もしないゴミに目を付けられたサービスが改悪しまくるのは分かりきってる
自制が効かない・寄付もしないゴミに目を付けられたサービスが改悪しまくるのは分かりきってる
2020/12/09(水) 14:19:34.60
数分ってのが10分と仮定しても60秒×10分÷200件=3秒にならん?
間隔短すぎだから間隔を30秒にしろ。
間隔短すぎだから間隔を30秒にしろ。
2020/12/09(水) 15:04:53.49
なんだ、自動化できずに必死にキーボード叩いてる無能が騒いでるのか
2020/12/09(水) 15:26:57.33
キーボード?手動でやるときはマウスだよ
653名無しさん@お腹いっぱい。
2020/12/09(水) 15:52:40.47 curlでの保存方法、教えて
2020/12/09(水) 17:22:41.08
>>653
/save/にリクエスト送るだけ
/save/にリクエスト送るだけ
2020/12/09(水) 17:52:48.98
適当なヘッダ付けて/save/を叩くだけだから、
HTTP通信さえ出来るツール使えばcurlじゃなくて問答無用で自動化できる
でも下手に叩きすぎてサーバ圧迫して結果制限が厳しくなったら元も子もないから、俺はやった事ない
HTTP通信さえ出来るツール使えばcurlじゃなくて問答無用で自動化できる
でも下手に叩きすぎてサーバ圧迫して結果制限が厳しくなったら元も子もないから、俺はやった事ない
656名無しさん@お腹いっぱい。
2020/12/09(水) 17:53:20.92 curlじゃなくても
657名無しさん@お腹いっぱい。
2020/12/09(水) 19:40:19.272020/12/09(水) 21:53:36.06
2020/12/09(水) 21:56:26.36
ちゃんと下まで読んでなかったわ、>>658は取り消す
少なくとも静的サイトはこの方法で行けるね、wgetのmirrorオプションでURLリストを作るとは上手いこと考えたな
少なくとも静的サイトはこの方法で行けるね、wgetのmirrorオプションでURLリストを作るとは上手いこと考えたな
2020/12/09(水) 22:01:16.11
ただwgetは、JSとかで動的にコンテンツを取ってくるサイトやFlashが使われたサイトには対応できないから、
この回答の方法ではあらゆる種類のサイトを保存することはできない
でもHTMLとCSSだけで頑張ってるような昔の個人サイトなら問題ない
この回答の方法ではあらゆる種類のサイトを保存することはできない
でもHTMLとCSSだけで頑張ってるような昔の個人サイトなら問題ない
2020/12/11(金) 02:53:02.33
間隔っていうか、現状同じIPアドレスから5ページまでしか同時保存リクエスト受け付けてくれない。
6ページ目以上は保存処理が終わってないのが残ってると、タイムアウトになって保存されないよ。
自動化以前にウェブサーフィン(死語)中、手動でブラウザから/save/開いて保存したい時でも、状況は同じ。
今はこの制限内でやればいいだけ。
6ページ目以上は保存処理が終わってないのが残ってると、タイムアウトになって保存されないよ。
自動化以前にウェブサーフィン(死語)中、手動でブラウザから/save/開いて保存したい時でも、状況は同じ。
今はこの制限内でやればいいだけ。
662名無しさん@お腹いっぱい。
2020/12/12(土) 02:57:25.07 archive teamは数千単位のページを保存する場合はarchive botのIRCで保存依頼するのを推奨してるみたい
> avoid trying to send many thousands URLs; there's Archivebot for that
https://archiveteam.org/index.php?title=Internet_Archive
archive bot
https://archiveteam.org/index.php?title=ArchiveBot
> avoid trying to send many thousands URLs; there's Archivebot for that
https://archiveteam.org/index.php?title=Internet_Archive
archive bot
https://archiveteam.org/index.php?title=ArchiveBot
2020/12/15(火) 21:01:34.37
新規に保存するとどうやってもこの画面になってしまう…
ttps://i.imgur.com/7Jip0Y5.png
ttps://i.imgur.com/7Jip0Y5.png
2020/12/15(火) 21:02:45.84
Sorry.
This snapshot cannot be displayed due to an internal error.
さっき初めて出た、保存はされてるがエラーで表示できないという謎のエラー
This snapshot cannot be displayed due to an internal error.
さっき初めて出た、保存はされてるがエラーで表示できないという謎のエラー
665664
2020/12/15(火) 21:04:28.30 タッチの差だったごめん
2020/12/15(火) 23:57:41.06
そのエラー出ても後で取り直せば大丈夫っぽい
2020/12/16(水) 06:37:15.41
てか、以前は保存終わった後に保存しますか?の表示出たのがこれに変わっただけじゃね
なんかバグってるんだよね
なんかバグってるんだよね
2020/12/16(水) 17:34:12.89
今は正常になったか
669名無しさん@お腹いっぱい。
2020/12/16(水) 20:02:08.13 Magic Viewer
https://chrome.google.com/webstore/detail/magic-viewer-for-chrome/npkhecbdgglnkjjaiojienebokcjbgmi?hl=ja
chromeの拡張機能を入れて、右クリックして、「すべての画像を見る」をクリックすると外部リンクの画像が自動でアーカイブされる。
サイトによっては、ブラウザのページを数回、再読み込みをする。
https://chrome.google.com/webstore/detail/magic-viewer-for-chrome/npkhecbdgglnkjjaiojienebokcjbgmi?hl=ja
chromeの拡張機能を入れて、右クリックして、「すべての画像を見る」をクリックすると外部リンクの画像が自動でアーカイブされる。
サイトによっては、ブラウザのページを数回、再読み込みをする。
2020/12/17(木) 04:44:35.32
前は/save/で保存したページはLive Web Proxyってコレクションに入ってたのに
最近はSave Page Nowコレクション扱いになってるな
10月ぐらいからファイルが増えてないし、Live Web Proxyって引退したのかもしれない
https://archive.org/details/liveweb?sort=-addeddate
このスレでも10月はエラー多かった書き込みあったしな、移行期間だったのだろう
最近はSave Page Nowコレクション扱いになってるな
10月ぐらいからファイルが増えてないし、Live Web Proxyって引退したのかもしれない
https://archive.org/details/liveweb?sort=-addeddate
このスレでも10月はエラー多かった書き込みあったしな、移行期間だったのだろう
2020/12/17(木) 10:47:26.64
後で取り直したけど取れてないわ
取れてる取れてないの繰り返しにはうんざり
どこが運営してるのかわからないのは限りなく不安だが
もうarchive.todayしかない
取れてる取れてないの繰り返しにはうんざり
どこが運営してるのかわからないのは限りなく不安だが
もうarchive.todayしかない
2020/12/17(木) 16:01:59.78
過去レスすら読めない人の為に次スレではこれ(>>9)をテンプレに入れた方がいいな
2020/12/17(木) 16:39:47.92
11月分でいまだに反映されてないものも多々あるから
システムいじくってる最中で保存されてないものもあるかもな
システムいじくってる最中で保存されてないものもあるかもな
2020/12/17(木) 17:05:10.84
スポーツ新聞野郎、まだ居たのか。
2020/12/17(木) 21:53:46.16
なにかしらのerrorが頻発するのが困りもの
2020/12/17(木) 23:36:55.01
677名無しさん@お腹いっぱい。
2020/12/18(金) 00:36:49.29 お前らがしているのは多分、アイドル・声優のブログのアーカイブだろ
678名無しさん@お腹いっぱい。
2020/12/18(金) 01:28:46.93 504とか503で何のアーカイブも見られん
2020/12/18(金) 01:47:52.99
アイドルも声優も、ブログどころかウィキペディアの記事すら見たことないわ
偏見すぎ
偏見すぎ
680名無しさん@お腹いっぱい。
2020/12/19(土) 23:30:14.53 「curl -Ll ttp://web.archive.org/web/2020/ttp://○○○○.com/[(数字)-(数字)].html(.jpg)」
ttpではなく、httpに修正して
saveではなく、エラー軽減のため西暦の数字で
連番の数字で自動保存される。
ttpではなく、httpに修正して
saveではなく、エラー軽減のため西暦の数字で
連番の数字で自動保存される。
681名無しさん@お腹いっぱい。
2020/12/20(日) 03:27:16.25 エラーさんざんでまくり&数日たって再度見に行くと真っ白のページが保存された形跡
これじゃしばらく試行しながら様子見するしかねえな
これじゃしばらく試行しながら様子見するしかねえな
682名無しさん@お腹いっぱい。
2020/12/24(木) 21:46:55.38 Fail with status: 503
ばっか表示される
ばっか表示される
2020/12/25(金) 04:04:48.90
あだしまの公式サイトは33回も保存されていて、IAでもちゃんと開けるのにAPIは情報なし。
APIがぶっ壊れたのか。
APIがぶっ壊れたのか。
2020/12/25(金) 22:32:48.69
保存してHrmになってしまうと日付だけ保存&表示されて
以後同一ページを保存してもずっとHrmになってしまう状況が11月から続いている
以後同一ページを保存してもずっとHrmになってしまう状況が11月から続いている
2020/12/26(土) 02:55:00.36
news.yahoo.co.jp/bylineから始まるYahooニュースの記事を保存しようとするとこれが表示される
専門家のブログのコピー記事だからブロックしてるのかな
Sorry
This URL is in our block list and cannot be captured. Please email us at "info@archive.org" if you would like to discuss this more.
専門家のブログのコピー記事だからブロックしてるのかな
Sorry
This URL is in our block list and cannot be captured. Please email us at "info@archive.org" if you would like to discuss this more.
2020/12/26(土) 07:23:35.18
録れてる奴もあるみたいだしよくわからんな
繰り返される悲劇はもうウンザリだ 「右直事故」防止に切り札はあるのか!?(佐川健太郎) - 個人 - Yahoo!ニュース
http://web.archive.org/web/20201219152606/https://news.yahoo.co.jp/byline/sagawakentaro/20201219-00213273/
繰り返される悲劇はもうウンザリだ 「右直事故」防止に切り札はあるのか!?(佐川健太郎) - 個人 - Yahoo!ニュース
http://web.archive.org/web/20201219152606/https://news.yahoo.co.jp/byline/sagawakentaro/20201219-00213273/
2020/12/26(土) 11:36:52.53
archive.org ? ウェブサイト全体をアーカイブする方法は?
http://web.archive.org/web/20201220090718/https://www.it-swarm-ja.tech/ja/archive.org/%E3%82%A6%E3%82%A7%E3%83%96%E3%82%B5%E3%82%A4%E3%83%88%E5%85%A8%E4%BD%93%E3%82%92%E3%82%A2%E3%83%BC%E3%82%AB%E3%82%A4%E3%83%96%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95%E3%81%AF%EF%BC%9F/965342469/
2020/12/26(土) 17:10:27.56
>>686
これArchive Teamが保存したものをWayback Machineに移管したやつだね
Save Page Nowでは取れないけど、外部の人間が取ったものを移管したから結果的に取れてるように見えてる
これArchive Teamが保存したものをWayback Machineに移管したやつだね
Save Page Nowでは取れないけど、外部の人間が取ったものを移管したから結果的に取れてるように見えてる
689名無しさん@お腹いっぱい。
2020/12/30(水) 16:01:54.23 寄付を煽るためにわざとエラー連発させるように仕込んでるのかな
2020/12/30(水) 17:30:24.61
そんなリスキーなことしないでしょ
2021/01/02(土) 23:03:35.16
>>684のHrmのままのページは保存し直せば反映されるようになった
放置しとくと日付だけ表示されるHrmのまま
放置しとくと日付だけ表示されるHrmのまま
2021/01/03(日) 14:23:02.24
Hrmって何て発音するんだ
2021/01/04(月) 09:24:29.97
「ふーむ」って言う途中でちょっと舌を丸める感じだと思っている
正確な発音はわからん
正確な発音はわからん
2021/01/04(月) 21:44:38.49
ハァーンムッって読んでた
2021/01/07(木) 05:03:25.08
>>688
Collectionsのところ見たけど、Focused CrawlsとTop DomainsはArchive Teamが収集してるものじゃないよ
ブロックされているURLも移管してるのはそういう仕組みだろうけど
ヤフージャパンはアクセス数多いドメインとはいえ、ニュース系のページは収集してくれないんだなぁ
Collectionsのところ見たけど、Focused CrawlsとTop DomainsはArchive Teamが収集してるものじゃないよ
ブロックされているURLも移管してるのはそういう仕組みだろうけど
ヤフージャパンはアクセス数多いドメインとはいえ、ニュース系のページは収集してくれないんだなぁ
2021/01/07(木) 13:28:13.11
ヤフーニュースはSavePageNowでも取れるよ
ただ一部の記事で何故かBlockListエラーが出る
理由は謎(メールすれば聞けるのかもしれないけど)
ただ一部の記事で何故かBlockListエラーが出る
理由は謎(メールすれば聞けるのかもしれないけど)
2021/01/07(木) 13:35:08.85
なんか待ち時間すごい長くて全然アーカイブできない
2021/01/07(木) 14:27:18.78
既アーカイブへのURL検索落ちてる?
2021/01/07(木) 16:30:50.05
The capture is estimated to start in xxx minutes
今日はこればっかり
今日はこればっかり
2021/01/08(金) 02:00:41.10
今は直ったかな?
2021/01/08(金) 10:11:43.26
The capture is estimated to start in 61 minutes.
2021/01/09(土) 00:15:31.32
2021/01/09(土) 04:00:24.16
改憲などという重要なものをアニメ絵に頼るカス団体は信用しない
2021/01/09(土) 11:27:19.35
しかもその絵、無断使用じゃねーの?
2021/01/09(土) 11:47:42.84
落ち着いたかと思ったらJob failed祭り
2021/01/09(土) 16:52:25.91
ヨブ無能
2021/01/09(土) 21:56:53.82
実はちうごくじんなんじゃね
2021/01/11(月) 04:45:59.10
寄付した人間のジョブは優先して処理するみたいな仕組みが導入されたらできる限り寄付したい
2021/01/11(月) 13:33:23.25
年収20万ドルのエンジニア雇うだけの金があるのに、金で困ってすらないよ
その割にサーバーはザコだが
その割にサーバーはザコだが
2021/01/12(火) 10:01:11.50
Job failed.ばかりで全然アーカイブできない
2021/01/14(木) 08:53:53.82
Sorry
This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.
これは今日10回じゃなくて過去24時間に10回の文間違いじゃないの
内容が変わりまくるサイトを保存できなくなった
This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.
これは今日10回じゃなくて過去24時間に10回の文間違いじゃないの
内容が変わりまくるサイトを保存できなくなった
2021/01/14(木) 11:03:11.23
自分以外の誰かも同じサイト保存してる可能性もあるしな
2021/01/14(木) 15:57:48.45
一覧性は下がるが、とりあえず後ろに適当なパラメーターでもつければどうか。?1とか。
サイト側にとって未定義のパラメーターなら大抵のサイトはパラメーターなしと同じものを返してくるだろう。
サイト側にとって未定義のパラメーターなら大抵のサイトはパラメーターなしと同じものを返してくるだろう。
2021/01/14(木) 22:53:43.10
またスポーツ新聞野郎か
2021/01/15(金) 05:48:54.80
例の人は書き込みの中に必ずスポーツ新聞の話を含めるから多分別人
2021/01/15(金) 05:50:45.57
まあ別にスポーツ新聞のアーカイブを手作業で何回取ろうがそれは個人の勝手だから、外野がどうこう言うもんじゃないよ
随分遠回りなことしてるように見えても本人にとっては大事なんだろ、ほっとけ
随分遠回りなことしてるように見えても本人にとっては大事なんだろ、ほっとけ
2021/01/16(土) 00:22:05.68
Please email us at "info@archive.org" if you would like to discuss this more.
ってあるんだから
ここで愚痴言うくらいならメール送ったらいいんじゃない?
ってあるんだから
ここで愚痴言うくらいならメール送ったらいいんじゃない?
718名無しさん@お腹いっぱい。
2021/01/16(土) 16:38:22.29 皆さんに質問です!
アーカイブされたページを全文検索できるようになるまで、
あと何年くらいかかると思いますか?
アーカイブされたページを全文検索できるようになるまで、
あと何年くらいかかると思いますか?
2021/01/16(土) 20:12:08.58
昔はできてたこともある気がするから負の数じゃないかな
2021/01/17(日) 00:21:40.84
いつにも増して調子悪いな
2021/01/18(月) 13:51:31.62
undefined is not an object (evaluating 'e.map')
これって保存できてるの?
これって保存できてるの?
722721
2021/01/18(月) 15:47:47.92 公開待ち状態みたいだったらしく、1時間後に見たら保存したページが見れるようになった。
マッピングが届いてないとかそんな感じっぽい。
マッピングが届いてないとかそんな感じっぽい。
2021/01/21(木) 23:18:29.78
Sorry
Live page is not available: chrome-error://chromewebdata/
Live page is not available: chrome-error://chromewebdata/
2021/01/22(金) 15:38:58.53
Changesの項目消えた?
あんま使ってなかったからいいけどさ
あんま使ってなかったからいいけどさ
725名無しさん@お腹いっぱい。
2021/01/22(金) 16:01:35.20 724
今見たら復活してた
タイミングが悪かっただけかな
今見たら復活してた
タイミングが悪かっただけかな
726名無しさん@お腹いっぱい。
2021/01/22(金) 16:51:49.89 4日ぐらい前に保存した画像でSaved 2 timesとなってるのに青い丸が出ないが
遅れてるだけなのかこれ
遅れてるだけなのかこれ
727名無しさん@お腹いっぱい。
2021/01/22(金) 22:31:31.692021/01/24(日) 01:33:05.61
ただRecallを復活させればよくね
2021/01/24(日) 04:31:27.21
ttps://blog.archive.org/2019/10/23/the-wayback-machines-save-page-now-is-new-and-improved/
ここに載ってる、savepagenow@archive.orgに他人から来たメールをFwdで送ったら
URLを抽出して保存された後に保存済URLが返ってくるのって今も機能してるのか?
メールが返ってこないんだが
ブログ記事の数日後に書かれたコメント欄の時点でメール返ってこねぇって書いてる人いるけども
ここに載ってる、savepagenow@archive.orgに他人から来たメールをFwdで送ったら
URLを抽出して保存された後に保存済URLが返ってくるのって今も機能してるのか?
メールが返ってこないんだが
ブログ記事の数日後に書かれたコメント欄の時点でメール返ってこねぇって書いてる人いるけども
2021/01/24(日) 14:34:02.42
>>662
英語での交渉が得意な人しか使えないじゃん
英語での交渉が得意な人しか使えないじゃん
2021/01/24(日) 19:17:01.62
2021/01/24(日) 19:18:46.98
英語が嫌だったらArchiveTeamの日本支部でも作るしかないよね
まあそうなったとしても誰かが英語で本部とやり取りしないといけない訳だからあんまり意味無いけど
まあそうなったとしても誰かが英語で本部とやり取りしないといけない訳だからあんまり意味無いけど
2021/01/25(月) 09:13:54.98
おいおい何だよこれ

2021/01/25(月) 10:13:47.99
2021/01/25(月) 20:24:16.53
次スレの>>1にはアーカイブが取れない問題のQ&A入れないとダメだな
2021/01/26(火) 20:37:45.84
エラー文が多すぎて週に1個は新しいのが増えてるからまとめるのめんどくさいわw
2021/02/07(日) 15:31:24.66
おまえ今日もう10回とったからダメーっていうのやめて欲しいわ
そもそもエラーだったから取り直してるのはカウントすんなよ
そもそもエラーだったから取り直してるのはカウントすんなよ
738名無しさん@お腹いっぱい。
2021/02/14(日) 16:09:56.27 archive.isの同じurlの取得間隔が伸びてるっぽい
前にとってから10時間以上経つのに取れない
前にとってから10時間以上経つのに取れない
2021/02/15(月) 17:54:43.88
追記
やっぱり丸一日経たないと同じurlのアーカイブ取得出来なくなってるっぽい 全てのurlかどうかは不明
やっぱり丸一日経たないと同じurlのアーカイブ取得出来なくなってるっぽい 全てのurlかどうかは不明
2021/02/15(月) 19:35:35.74
>>739
>>739
毎日保存してるのに24時間以上たたないと保存できないのは困る
----------
> このサイトにアクセスできませんweb.archive.org で接続が拒否されました。
> ERR_CONNECTION_REFUSED
保存しすぎて個人的に Web.archive.org にアクセス拒否されたかと思ったw
Down for Everyone or Just Me
https://downforeveryoneorjustme.com/web.archive.org
> Web.archive.org Status
> Is web.archive.org down right now?
> It's not just you! web.archive.org is down.
>>739
毎日保存してるのに24時間以上たたないと保存できないのは困る
----------
> このサイトにアクセスできませんweb.archive.org で接続が拒否されました。
> ERR_CONNECTION_REFUSED
保存しすぎて個人的に Web.archive.org にアクセス拒否されたかと思ったw
Down for Everyone or Just Me
https://downforeveryoneorjustme.com/web.archive.org
> Web.archive.org Status
> Is web.archive.org down right now?
> It's not just you! web.archive.org is down.
2021/02/15(月) 19:36:14.63
Internet Archive 鯖落ち?繋がらないわ
2021/02/15(月) 19:40:02.46
>>740
その表示初めて見るけどブラウザ何使ってる?
その表示初めて見るけどブラウザ何使ってる?
743名無しさん@お腹いっぱい。
2021/02/15(月) 19:52:03.70 wayback machineぶっ壊れた
2021/02/15(月) 20:02:02.56
2021/02/15(月) 20:18:19.09
telnet で web.archive.org:80 へ接続を仕掛けても繋がらない。
鯖が死んでるわ。
鯖が死んでるわ。
2021/02/15(月) 21:30:42.26
アメリカは今早朝だから運営寝てるのか
747名無しさん@お腹いっぱい。
2021/02/15(月) 22:21:55.65 メンテナンス情報も書いてない。まさか、F5アタックなのか?
2021/02/15(月) 22:24:25.21
あぁ朝鮮半島からか
2021/02/15(月) 23:18:16.36
復活したね
保存もできるよ
保存もできるよ
2021/02/15(月) 23:21:29.92
あ、何ページか保存したら接続エラーの連続だらけになった
まだ完全復活できてない模様
まだ完全復活できてない模様
2021/02/16(火) 01:10:12.48
>>747
てかIAは鯖落ちしようが何も言わない
サンフランシスコ時間で朝になったから、今日も@internetarchiveは更新を始めたようだが、
いつも通りだんまりだね。4時間近く止まってたんだから一言欲しいけど
てかIAは鯖落ちしようが何も言わない
サンフランシスコ時間で朝になったから、今日も@internetarchiveは更新を始めたようだが、
いつも通りだんまりだね。4時間近く止まってたんだから一言欲しいけど
2021/02/16(火) 02:53:38.24
2021/02/16(火) 10:22:33.21
APIのレスポンス増やしてほしいな
せめて落ちてるときは今落ちてるよ的なのを返して欲しい
せめて落ちてるときは今落ちてるよ的なのを返して欲しい
2021/02/16(火) 22:20:35.70
https://twitter.com/internetarchive/status/1361387442410938370
午前中に技術的な問題が発生
https://twitter.com/internetarchive/status/1361454580869947395
鯖落ちは一時的なバグが原因
https://twitter.com/5chan_nel (5ch newer account)
午前中に技術的な問題が発生
https://twitter.com/internetarchive/status/1361454580869947395
鯖落ちは一時的なバグが原因
https://twitter.com/5chan_nel (5ch newer account)
755名無しさん@お腹いっぱい。
2021/02/17(水) 23:26:58.40 東京大学総合図書館、Internet Archiveとの連携を開始:同館デジタルアーカイブ資料4,000点以上が対象
ttps://current.ndl.go.jp/node/43304
ttps://current.ndl.go.jp/node/43304
2021/02/19(金) 13:11:41.55
job failedの連打
2021/02/19(金) 18:11:43.08
job failed多すぎて笑う
APIの反映も遅いし
APIの反映も遅いし
2021/02/19(金) 22:14:59.50
job failedでも保存はされてるか
2021/02/20(土) 20:16:11.82
job failedは保存されてなくね?
internal server errorは一応されてるみたいだけど
internal server errorは一応されてるみたいだけど
2021/02/21(日) 09:59:06.84
時間おいてやり直すしかないね
2021/02/21(日) 13:11:02.40
あれ?job failedでもThis URL has been already captured 10 times todayが出たな
ということは内部的には取れてるのか・・・?よく分からん
ということは内部的には取れてるのか・・・?よく分からん
2021/02/22(月) 14:27:20.34
Fail with status: 498 No Reason Phrase
なんやこれ
なんやこれ
2021/02/24(水) 15:46:58.89
2021/02/25(木) 00:31:49.91
job faildばっかり(´・ω・`)
2021/02/25(木) 14:27:18.94
job faildは取れている時と取れていない時があるから困りもの
2021/02/27(土) 10:54:16.04
We're sorry ― something's gone wrong.
Our team has been notified.
これしか表示されなくなった
完全にぶっ壊れてる
Our team has been notified.
これしか表示されなくなった
完全にぶっ壊れてる
2021/02/27(土) 21:12:05.69
チームは何してるの
2021/02/28(日) 11:46:27.82
769名無しさん@お腹いっぱい。
2021/03/01(月) 20:37:48.02 ここ2週間ぐらい、
archive.todayで、
インスタグラムを保存できなくなってるの 俺だけ?
2週間くらい前までは、インスタグラム保存できてたのに。
他に インスタグラムを保存できる魚拓サイトありますか?
archive.todayで、
インスタグラムを保存できなくなってるの 俺だけ?
2週間くらい前までは、インスタグラム保存できてたのに。
他に インスタグラムを保存できる魚拓サイトありますか?
2021/03/01(月) 23:25:20.89
インスタビューア的な外部サイトがいくつもあるから
それを介して保存するって方法がある
URLをしっかり記録しておかないと参照できなくなるってのが面倒だけど
それを介して保存するって方法がある
URLをしっかり記録しておかないと参照できなくなるってのが面倒だけど
771名無しさん@お腹いっぱい。
2021/03/02(火) 14:01:49.74 web.archive.org/save であるべーじを保存できた(3月2日)
保存出来た時に表示されるリンクをクリック
→二月中旬に保存したものに飛ぶ
カレンダーを見ると3月2日に保存マークがある
→それをクリックすると二月中旬に保存したものに飛ぶ
これって3月2日に保存は出来たけど閲覧できない状態ということ?
保存出来た時に表示されるリンクをクリック
→二月中旬に保存したものに飛ぶ
カレンダーを見ると3月2日に保存マークがある
→それをクリックすると二月中旬に保存したものに飛ぶ
これって3月2日に保存は出来たけど閲覧できない状態ということ?
772名無しさん@お腹いっぱい。
2021/03/03(水) 13:37:44.10 >>770
>インスタビューア的な外部サイトがいくつもあるから
>それを介して保存するって方法がある
回答 ありがとうございます。
「インスタビューア的な外部サイト」でググっていますが、見つかりませんorz。
ちなみにパソコン ユーザーです。
保存ができる、おすすめのインスタビューア的な外部サイトを教えていただければ幸いです。m(_ _)m
>インスタビューア的な外部サイトがいくつもあるから
>それを介して保存するって方法がある
回答 ありがとうございます。
「インスタビューア的な外部サイト」でググっていますが、見つかりませんorz。
ちなみにパソコン ユーザーです。
保存ができる、おすすめのインスタビューア的な外部サイトを教えていただければ幸いです。m(_ _)m
2021/03/03(水) 15:26:40.68
この保存職人たちの怒りのスレいわく、
ttps://archive.org/post/1105471/pages-refusing-to-save-this-is-asinine
Poster: Hitsmello Date: Nov 29, 2020 10:39am
Also, lately, I've noticed that the "Job failed" only seems to happen if I check the "Save outlinks" AND the "Please email me the results" boxes.
It WILL save properly if I just check "Save also in my web archive" and "Save outlinks". Gee, I wonder why...
ログインしてSave outlinksとPlease email me the resultsにチェックを入れるとjob failedが出ずに保存できるらしい
俺はアカウントから保存して、ファイルに名前が残るのはやだから、試してないけど
ttps://archive.org/post/1105471/pages-refusing-to-save-this-is-asinine
Poster: Hitsmello Date: Nov 29, 2020 10:39am
Also, lately, I've noticed that the "Job failed" only seems to happen if I check the "Save outlinks" AND the "Please email me the results" boxes.
It WILL save properly if I just check "Save also in my web archive" and "Save outlinks". Gee, I wonder why...
ログインしてSave outlinksとPlease email me the resultsにチェックを入れるとjob failedが出ずに保存できるらしい
俺はアカウントから保存して、ファイルに名前が残るのはやだから、試してないけど
2021/03/03(水) 15:31:00.65
>>771
反映待ち状態になってるから、数日後に見れるようになったか確認してみて
大抵は24時間、遅くても2日以内に見れるようになるはず
急いでるか保存失敗してそうなら、同じURLなら30分後以降にまた保存できるので再度保存するのもあり
反映待ち状態になってるから、数日後に見れるようになったか確認してみて
大抵は24時間、遅くても2日以内に見れるようになるはず
急いでるか保存失敗してそうなら、同じURLなら30分後以降にまた保存できるので再度保存するのもあり
2021/03/03(水) 18:22:54.32
This URL has been already captured 10 times today
同じURLで連続10回保存失敗した場合でもこのエラーが出る。
失敗してるのにこれはないだろ。capturedできてねーぞ。
同じURLで連続10回保存失敗した場合でもこのエラーが出る。
失敗してるのにこれはないだろ。capturedできてねーぞ。
2021/03/03(水) 20:33:32.32
>>772
instagram viewerとかでググって出てきたサイトに投稿を表示させて、その内容を保存するってこと
サイトによって表示される情報量がまちまちだから色々試して使いやすいのを探す必要がある
(例) プロフィール画面
https://web.archive.org/web/20210303101254/https://instastory.net/profile/cristiano
(例) 投稿画面
https://web.archive.org/web/20210303090845/https://instastory.net/post/CL7sxQPgvB6
可能な限りは公式サイトを保存したいところだけど
どうしても無理ならこうするしかないんじゃないかな
instagram viewerとかでググって出てきたサイトに投稿を表示させて、その内容を保存するってこと
サイトによって表示される情報量がまちまちだから色々試して使いやすいのを探す必要がある
(例) プロフィール画面
https://web.archive.org/web/20210303101254/https://instastory.net/profile/cristiano
(例) 投稿画面
https://web.archive.org/web/20210303090845/https://instastory.net/post/CL7sxQPgvB6
可能な限りは公式サイトを保存したいところだけど
どうしても無理ならこうするしかないんじゃないかな
777名無しさん@お腹いっぱい。
2021/03/04(木) 17:47:00.70 save画面でキャプチャできたのかリンクが出たからクリックしたらサイトは保存されていませんと出る
2021/03/05(金) 04:44:26.90
なんか調子悪いな?
2021/03/05(金) 16:53:21.35
さっき知ったけど、IAの社員でWayback Machine責任者のマーク・グラハムさんがSave Page Nowや/save/のAPIの仕様説明書を公開してくれた
ttps://webapps.stackexchange.com/a/151360
自動翻訳かけても読む価値あると思う
Save Page Now 2 Public API Docs Draft
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit
https://docs.google.com/document/d/19RJsRncGUw2qHqGGg9lqYZYf7KKXMDL1Mro5o1Qw6QI/edit
Limitationsのところに制限について書いてあるのを拾ってみると
・同じIPアドレスから同時に6ページ以上SPNや/save/で保存すると自動でエラーになる
・10秒でレスポンス戻ってこなかったらタイムアウト
・50秒で保存先URLはタイムアウト
・spn@archive.org宛に保存したいURLのメールを送ると500個まで保存してくれる(俺の経験上結果がエラーだらけになる可能性大なので確実に保存したいなら手動で)
・ログインしてない同じIPアドレスから画像なども含めて1日2万ページ以上は保存リクエストだせない、ログインしてれば制限なし
・ログインしてAPIキーを取得すれば、プログラムから保存するのもできる
この制限に引っかからないようにすれば、大量保存してる人はうまくいくはず
サンプルコードにも失敗したら保存を繰り返すようなコードになってるから、保存エラーが多いのは認識してるんだろう
ttps://webapps.stackexchange.com/a/151360
自動翻訳かけても読む価値あると思う
Save Page Now 2 Public API Docs Draft
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit
https://docs.google.com/document/d/19RJsRncGUw2qHqGGg9lqYZYf7KKXMDL1Mro5o1Qw6QI/edit
Limitationsのところに制限について書いてあるのを拾ってみると
・同じIPアドレスから同時に6ページ以上SPNや/save/で保存すると自動でエラーになる
・10秒でレスポンス戻ってこなかったらタイムアウト
・50秒で保存先URLはタイムアウト
・spn@archive.org宛に保存したいURLのメールを送ると500個まで保存してくれる(俺の経験上結果がエラーだらけになる可能性大なので確実に保存したいなら手動で)
・ログインしてない同じIPアドレスから画像なども含めて1日2万ページ以上は保存リクエストだせない、ログインしてれば制限なし
・ログインしてAPIキーを取得すれば、プログラムから保存するのもできる
この制限に引っかからないようにすれば、大量保存してる人はうまくいくはず
サンプルコードにも失敗したら保存を繰り返すようなコードになってるから、保存エラーが多いのは認識してるんだろう
2021/03/05(金) 16:59:20.94
あとこんなのを発見
IAにログインした上で、Googleスプレットシートに保存したいURLを並べて登録すると保存してくれるサービス
https://archive.org/services/wayback-gsheets
IAにログインした上で、Googleスプレットシートに保存したいURLを並べて登録すると保存してくれるサービス
https://archive.org/services/wayback-gsheets
781名無しさん@お腹いっぱい。
2021/03/05(金) 18:13:28.082021/03/05(金) 19:51:34.90
A snapshot was captured.が出ればとりあえずは様子見でいいんかな
スナップショット等への反応が即時でないが
スナップショット等への反応が即時でないが
2021/03/05(金) 20:16:22.56
保存できてもその保存できたページが表示できるまで時間かかってるっぽい?
カレンダーで確かに今日の日付で保存されてるのにそこをクリックしても過去に保存されたページしか出ない
first archiveの場合は成功しましたのリンククリックしても保存されてないになっちゃう
カレンダーで確かに今日の日付で保存されてるのにそこをクリックしても過去に保存されたページしか出ない
first archiveの場合は成功しましたのリンククリックしても保存されてないになっちゃう
2021/03/05(金) 21:10:51.47
>>9を見ろ
2021/03/06(土) 02:15:27.01
>>779
思ってたより全然神サービスだったわありがてー
思ってたより全然神サービスだったわありがてー
2021/03/06(土) 17:13:17.16
>>775
これが一番腹立つ
これが一番腹立つ
2021/03/07(日) 17:50:27.08
頑なにとってくれないサイトあるよね
788名無しさん@お腹いっぱい。
2021/03/09(火) 01:33:30.80 ページによって挙動が違うのがなんとも
2021/03/09(火) 01:45:34.00
数日にわたって全く保存されなかったやつが今試したら一発で通りやがる
気分屋だなあ
気分屋だなあ
2021/03/09(火) 21:49:05.86
またおかしなurlに飛ぶようになった
今回はgoogle系ばかり
今回はgoogle系ばかり
2021/03/10(水) 07:27:06.81
2021/03/10(水) 21:05:30.75
google系の変なurlに飛ぶようになってない?今までもそんなことあった?
2021/03/10(水) 21:12:27.07
去年もあったが今回はgoogle系にだけだな
794名無しさん@お腹いっぱい。
2021/03/10(水) 21:25:03.54 >>793
なるほど しばらく待てば直るものか?
なるほど しばらく待てば直るものか?
2021/03/10(水) 22:53:02.34
http://web.archive.org/web/1im_/i.imgur.com/DCiDUjh.png
Save Page Now から保存を完了した後に表示される Visit page のリンク先が
保存したページそのもののアーカイブではなく、
その中の画像だったりスクリプトだったりのアーカイブになることがあるんだよね。
これも一連の異常と関係してるのかな。
Save Page Now から保存を完了した後に表示される Visit page のリンク先が
保存したページそのもののアーカイブではなく、
その中の画像だったりスクリプトだったりのアーカイブになることがあるんだよね。
これも一連の異常と関係してるのかな。
796名無しさん@お腹いっぱい。
2021/03/11(木) 00:11:38.24 >>795そう!それになるんだよ。最近調子悪いんだな……
2021/03/11(木) 13:41:23.28
結局最近のは保存できていないってことかな?
798名無しさん@お腹いっぱい。
2021/03/11(木) 15:47:38.66 >>797
その通り…保存できてなくて困ってるよ
その通り…保存できてなくて困ってるよ
799795
2021/03/11(木) 15:57:13.93 念のため記しておくと、こちらでは「保存できない」という問題は起きていない。
確かに保存完了直後には見られないことがあっても、数時間〜数日後には表示できている。
保存完了画面のリンクが別のファイルを指しているので、実際に見てみるには
URL を入れ直さなきゃならないという点は何とかしてほしいと思う。
確かに保存完了直後には見られないことがあっても、数時間〜数日後には表示できている。
保存完了画面のリンクが別のファイルを指しているので、実際に見てみるには
URL を入れ直さなきゃならないという点は何とかしてほしいと思う。
2021/03/11(木) 17:54:51.72
おかしなurlに飛ばされても後でチェックすると保存はできているな
801名無しさん@お腹いっぱい。
2021/03/11(木) 18:44:03.64 おお、今確認したらちゃんと保存されてた!保存しなおさないといけないと思ったから焦ったよ
教えてくれてありがとう
教えてくれてありがとう
2021/03/12(金) 02:59:00.85
google系だけじゃないぞ、多分アナリティクスのjsファイルURLが帰ってくることがあるからそう言ってるだろうけど
例えばある人のfc2ブログの記事を保存したら帰ってきたのはそのページで読み込まれるcssやjsファイルだったし
例えばある人のfc2ブログの記事を保存したら帰ってきたのはそのページで読み込まれるcssやjsファイルだったし
2021/03/13(土) 18:56:41.68
Live page is not available:が出たけどちゃんとセーブされてるのもあるな
2021/03/13(土) 22:35:06.61
「おかしなurlに飛ばされる」ってのは結局
物事をきちんと説明できない池沼が騒いでいただけなのか?
物事をきちんと説明できない池沼が騒いでいただけなのか?
2021/03/15(月) 00:54:48.12
保存して本来表示されるべきページではないurlが表示されている事を報告しているものを
池沼呼ばわりとはどういう了見かな?
池沼呼ばわりとはどういう了見かな?
806名無しさん@お腹いっぱい。
2021/03/15(月) 08:05:56.29 韓国人・朝鮮人式に考えれば良いのですよ。
行先の違うリンクを確認もせずにクリックして、勝手に飛んで行ったのであっても、
チョンにとっては「自分は常に正しい、悪いのは他人」ですから
飛ばされたことになっちゃうんですよ。
行先の違うリンクを確認もせずにクリックして、勝手に飛んで行ったのであっても、
チョンにとっては「自分は常に正しい、悪いのは他人」ですから
飛ばされたことになっちゃうんですよ。
2021/03/15(月) 11:07:06.87
Job failedは無くなったけどエラー自体はあんまり変わってないな
ページが存在するのにLive page is not availableが出たりするし
ページが存在するのにLive page is not availableが出たりするし
2021/03/15(月) 15:13:50.78
全く意味がわかってないアホがいるようだ
まあ今はあの現象は直ってるようだがな
まあ今はあの現象は直ってるようだがな
2021/03/18(木) 01:41:28.07
あーページにぐぐる地図が埋め込まれてるとおかしくなるな なるほど
2021/03/18(木) 09:04:58.59
Google地図だけtodayで取る
2021/03/20(土) 19:27:34.98
直ってないな
812イモー虫
2021/03/22(月) 04:29:32.07 あんま騒ぎになってないがなんでだろ
ガラケーからだけエラーが頻発かと思えば違うんだね
ガラケーからだけエラーが頻発かと思えば違うんだね
813名無しさん@お腹いっぱい。
2021/03/24(水) 20:24:38.95 twitterでjsonとられる現象減ったね
2021/03/27(土) 19:47:08.19
Live page is not available
815名無しさん@お腹いっぱい。
2021/04/01(木) 09:36:27.49 案の定エイプリルフールページで殺到してるのか重いな
2021/04/02(金) 14:14:32.26
そういうことか
2021/04/04(日) 15:52:25.36
archive,todayってURL保存した後にzipでDL出来るみたいだけど
攻略サイト保存したらちゃんと階層や画像も一括でまとめてzipでDL出来んの?
攻略サイト保存したらちゃんと階層や画像も一括でまとめてzipでDL出来んの?
818名無しさん@お腹いっぱい。
2021/04/05(月) 16:29:25.73819名無しさん@お腹いっぱい。
2021/04/07(水) 05:09:08.66 This page is not available on the web/because of server error がでてこんにゃろと思ってたら
いきなりロードされて保存済みページが表示されたりがあるな
いきなりロードされて保存済みページが表示されたりがあるな
2021/04/16(金) 00:59:24.77
なんかYahooニュースのURLを保存するとこれが出たりする
ブロックリストに入れるような記事かこれ?
This URL is in our block list and cannot be captured.
Please email us at "info@archive.org" if you would like to discuss this more.
ブロックリストに入れるような記事かこれ?
This URL is in our block list and cannot be captured.
Please email us at "info@archive.org" if you would like to discuss this more.
2021/04/16(金) 05:40:19.79
特定個人が発信する政治的記事の過去の言質を取られないようにするためと思われる
主にコロナ関連で
主にコロナ関連で
822名無しさん@お腹いっぱい。
2021/04/16(金) 07:10:27.48 もしあれだったら5chのニュースキャップなどでニューススレ立ててそっちを保存するか
yahooなら大抵二次なので一次ソースをたどってそっちを保存
yahooなら大抵二次なので一次ソースをたどってそっちを保存
2021/04/16(金) 10:12:44.29
24時間経過しないと取得できたか分からない
2021/04/16(金) 17:12:55.38
同じドメインのサイトを一括で保存してDL用にZipでまとめてくれるサイトってねーの?
2021/04/17(土) 09:24:30.32
ウェブ魚拓の方なんだけど取得できる時とできない時の条件の違いがよく分からんわ
2021/04/17(土) 11:41:17.37
IA全然とれねー
2021/04/19(月) 11:42:38.28
iaは最近ずっと調子悪い印象
828名無しさん@お腹いっぱい。
2021/04/20(火) 01:48:29.85 最近またjob failed出るようになったな
2021/04/20(火) 16:17:10.58
>>825
うちウェブ魚拓いくら待ってもロボット拒否でbanされたわw
うちウェブ魚拓いくら待ってもロボット拒否でbanされたわw
830名無しさん@お腹いっぱい。
2021/04/20(火) 21:36:13.88 twitterぜんぜん保存されてないな。万単位のフォローがいる垢でも保存されてなかったりする
2021/04/21(水) 21:20:44.52
2021/04/21(水) 23:45:37.52
スマートフォンでアーカイブしたものをスマートフォンで見ようとすると見れないが3Gガラケーでは見れる謎
2021/04/22(木) 21:24:08.86
俺が対策書いた途端にWeb魚拓の仕様が変わって草。
このスレ見てる誰かがスクリプトでも走らせてるのか
このスレ見てる誰かがスクリプトでも走らせてるのか
2021/04/23(金) 17:18:11.69
最新のブラウザ使ってても「お前のブラウザ古いぞ」的な警告文(黄色)出るの俺だけ?
835名無しさん@お腹いっぱい。
2021/04/25(日) 18:05:22.97 インターネット官報誰も保存してない
2021/04/30(金) 13:23:56.96
アカウント作成時の捨てアド排除が始まってるなぁ
二ヶ月前はこんなこと無かったのに
二ヶ月前はこんなこと無かったのに

2021/04/30(金) 13:34:48.94
あと、ユーザプロフ画面でアバター画像をアップロードしてない場合に
Gravatarを参照しなくなった
画像のタイムスタンプからして先月初旬の変更か
https://archive.org/images/person2.png
Last-Modified: Sun, 07 Mar 2021 00:42:48 GMT
Gravatarを参照しなくなった
画像のタイムスタンプからして先月初旬の変更か
https://archive.org/images/person2.png
Last-Modified: Sun, 07 Mar 2021 00:42:48 GMT

2021/04/30(金) 18:23:16.44
>>830
ちょっと違うけど20年近く続いてる個人サイトとか、あとベテラン作家のブログが保存されてたのにサイトの方は自分が作業するまでアーカイブに無かったってことはあったな
(後者は今のサイトが出来てから2年ぐらいしか経ってなかったのもあるんだろうけど)
ちょっと違うけど20年近く続いてる個人サイトとか、あとベテラン作家のブログが保存されてたのにサイトの方は自分が作業するまでアーカイブに無かったってことはあったな
(後者は今のサイトが出来てから2年ぐらいしか経ってなかったのもあるんだろうけど)
2021/04/30(金) 21:42:19.54
Twitterのアーカイブは殆どArchive Teamのやつだから
ユーザーページは取られてないけど個別のツイートは殆ど取られてるはず
ユーザーページは取られてないけど個別のツイートは殆ど取られてるはず
2021/05/03(月) 02:26:37.76
ページが存在するのにLive page is not availableになるのいい加減にしてくれ
841名無しさん@お腹いっぱい。
2021/05/04(火) 08:19:29.48 「Check My Links」という拡張機能を使えばリンクの未保存ページが自動アーカイブできるよ
https://www.jtm.gr.jp/technote/chrome/check-my-links/
https://www.jtm.gr.jp/technote/chrome/check-my-links/
2021/05/04(火) 22:21:00.51
アカウントの Mailing Lists Settings の項目が増えたな。
Stay up to date with what’s happening at the Internet Archive by signing up for our free newsletters.
□ Best of the Archive: Useful resources, unique stories, and fun finds from our collections
□ Monthly Updates: A snapshot of the main news stories about the archive each month
□ Event Notices: Invitations to and news about our events
□ Donor Communications: Messages for and about our generous supporters
どれも要らないけどw
Stay up to date with what’s happening at the Internet Archive by signing up for our free newsletters.
□ Best of the Archive: Useful resources, unique stories, and fun finds from our collections
□ Monthly Updates: A snapshot of the main news stories about the archive each month
□ Event Notices: Invitations to and news about our events
□ Donor Communications: Messages for and about our generous supporters
どれも要らないけどw
843名無しさん@お腹いっぱい。
2021/05/05(水) 11:05:32.13 インスタ保存したいんだけどできないね
2021/05/05(水) 21:50:33.16
2021/05/06(木) 13:16:03.43
Batchの設定も少し増えた
2021/05/07(金) 09:48:31.47
Save screen shotにチェック入れても取られないときあるな
後から取られてるんだろうか?
後から取られてるんだろうか?
847イモー虫
2021/05/07(金) 16:22:46.45 ちなみにその個別画像urlテンプレ
https●:●//www.●instagram.●com/p/11桁のインスタ画像個別の英数/media/?size=l
https●:●//www.●instagram.●com/p/11桁のインスタ画像個別の英数/media/?size=l
2021/05/07(金) 18:40:26.38
こっちもほぼsavescreenshotが機能してない
裏で取れてたりするんかね
裏で取れてたりするんかね
2021/05/08(土) 03:19:50.67
たまにyoutubeの動画がアーカイブされてるけど手動で取る方法はないんですかね?
2021/05/08(土) 05:54:04.89
APIの情報も信用できないし、どれが取れていて どれが取れていないかは
結局自分たちの目で見て確認するしかないという現状。
結局自分たちの目で見て確認するしかないという現状。
2021/05/08(土) 16:28:03.01
保存の確認のためにWayback Machine Availability APIを使ってみたけど、
保存されてるURLでもスナップショット無しだと返ってくる
壊れてるなこれw
保存されてるURLでもスナップショット無しだと返ってくる
壊れてるなこれw
852名無しさん@お腹いっぱい。
2021/05/08(土) 17:02:12.53 >>849
https://web.archive.org/saveにhttps://www.youtube.com/watch?v=動画のID と入力し保存。すぐには保存されないけど、数週間待って見てみると保存できてる
https://web.archive.org/saveにhttps://www.youtube.com/watch?v=動画のID と入力し保存。すぐには保存されないけど、数週間待って見てみると保存できてる
2021/05/08(土) 19:57:36.18
>>852
4K画質のとかでも保存されるの?
4K画質のとかでも保存されるの?
2021/05/08(土) 23:10:05.55
855名無しさん@お腹いっぱい。
2021/05/09(日) 02:38:40.842021/05/09(日) 03:59:33.78
>>852
それ動画ページが見れるだけで動画自体は保存されないんじゃないの?
それ動画ページが見れるだけで動画自体は保存されないんじゃないの?
2021/05/09(日) 04:04:52.08
>>853
YouTubeのビデオは、訴えられる危険を犯した専用の解読スクリプトを書かないと
ビデオを保存できないので無理。
imgurのようなビデオに静的なリンクを張っている所とは違う。
https://web.archive.org/web/20210508173359/https://imgur.com/z55iZcq
<video draggable="false" playsinline="" autoplay="" … >
<source type="video/mp4" src=
"https://web.archive.org/web/20210508173359oe_/https://i.imgur.com/z55iZcq.mp4"
></video>
YouTubeのビデオは、訴えられる危険を犯した専用の解読スクリプトを書かないと
ビデオを保存できないので無理。
imgurのようなビデオに静的なリンクを張っている所とは違う。
https://web.archive.org/web/20210508173359/https://imgur.com/z55iZcq
<video draggable="false" playsinline="" autoplay="" … >
<source type="video/mp4" src=
"https://web.archive.org/web/20210508173359oe_/https://i.imgur.com/z55iZcq.mp4"
></video>
858名無しさん@お腹いっぱい。
2021/05/09(日) 04:48:52.27 動画自体も保存されてるよ。自動クロール率は低いけど
適当にURL貼るとこれとか
http://web.archive.org/web/20150815193649/https://www.youtube.com/watch?v=WJzSBLCaKc8
適当にURL貼るとこれとか
http://web.archive.org/web/20150815193649/https://www.youtube.com/watch?v=WJzSBLCaKc8
2021/05/09(日) 21:18:48.23
2021/05/10(月) 02:03:24.91
>>859
保存された動画を再生してるみたい
動画のソース
http://web.archive.org/web/20170214133548oe_/https://r4---sn-n4v7sne7.googlevideo.com/videoplayback?ipbits=0&mm=31&mn=sn-n4v7sne7&ratebypass=yes&expire=1487100946&signature=CA5A22657FBABB6AE773DB9B798B5BA86AE9B362.763F505CD7B9A750710077F92F766E70F1A57187&requiressl=yes&sparams=dur%2Cid%2Cinitcwndbps%2Cip%2Cipbits%2Citag%2Clmt%2Cmime%2Cmm%2Cmn%2Cms%2Cmv%2Cpl%2Cratebypass%2Crequiressl%2Csource%2Cupn%2Cexpire&ms=au&mt=1487079325&upn=NGplNw4c3TQ&mv=m&dur=291.108&pl=20&itag=22&key=yt6&ip=207.241.229.47&lmt=1472445730364669&mime=video%2Fmp4&id=o-ADUZW6CaxfO1uC---vHzDaHvx1GQWxmO717IBgPDVTS0&source=youtube&initcwndbps=2738750&signature=
保存された動画を再生してるみたい
動画のソース
http://web.archive.org/web/20170214133548oe_/https://r4---sn-n4v7sne7.googlevideo.com/videoplayback?ipbits=0&mm=31&mn=sn-n4v7sne7&ratebypass=yes&expire=1487100946&signature=CA5A22657FBABB6AE773DB9B798B5BA86AE9B362.763F505CD7B9A750710077F92F766E70F1A57187&requiressl=yes&sparams=dur%2Cid%2Cinitcwndbps%2Cip%2Cipbits%2Citag%2Clmt%2Cmime%2Cmm%2Cmn%2Cms%2Cmv%2Cpl%2Cratebypass%2Crequiressl%2Csource%2Cupn%2Cexpire&ms=au&mt=1487079325&upn=NGplNw4c3TQ&mv=m&dur=291.108&pl=20&itag=22&key=yt6&ip=207.241.229.47&lmt=1472445730364669&mime=video%2Fmp4&id=o-ADUZW6CaxfO1uC---vHzDaHvx1GQWxmO717IBgPDVTS0&source=youtube&initcwndbps=2738750&signature=
2021/05/10(月) 02:10:49.84
Youtubeの動画とかもちゃんと保存されんのか……
2021/05/10(月) 02:13:29.44
YouTubeは定期的に仕様変更してるからIAがそれに対応していくのは難しいらしい
だから昔のページだと動画が保存されてるのもあるけど今はされてない
だから昔のページだと動画が保存されてるのもあるけど今はされてない
2021/05/10(月) 05:21:32.71
>>862
自分もよく分かってないけど今も保存されてるっぽいよ
昨日の動画が保存されてたから
http://web.archive.org/web/20210509030617/https://www.youtube.com/watch?v=ZxjaW7zGTbA
自分もよく分かってないけど今も保存されてるっぽいよ
昨日の動画が保存されてたから
http://web.archive.org/web/20210509030617/https://www.youtube.com/watch?v=ZxjaW7zGTbA
2021/05/10(月) 14:48:04.32
またサーバーが落ちたのか繋がらないな
archive.orgの方は接続出来るみたいだが…
archive.orgの方は接続出来るみたいだが…
2021/05/10(月) 16:09:21.18
ttps://archive.org/stats/
日本時間で14時20分すぎから鯖落ち中らしい
日本時間で14時20分すぎから鯖落ち中らしい
2021/05/10(月) 16:34:25.60
web.archive.org までは到達できている。また内部のネットワーク障碍か。

2021/05/10(月) 17:37:18.38
復旧したっぽい
2021/05/11(火) 13:44:37.60
なんか今日はIAの調子やたらいいな
これまで表示されなかったスクショなんかもちゃんと取れてるし
これまで表示されなかったスクショなんかもちゃんと取れてるし
869名無しさん@お腹いっぱい。
2021/05/11(火) 15:27:21.28 Youtubeは少なくとも今年1月にとった分は動画まで保存できてたから、時間が経てば取れると思う。
2021/05/11(火) 19:00:41.67
>>847
わからん…
わからん…
871名無しさん@お腹いっぱい。
2021/05/14(金) 18:54:25.52 waybackmachine使っただけで訴えられた事例とかあるの?
2021/05/15(土) 00:01:24.67
IA自体はともかく利用者はないだろ
873名無しさん@お腹いっぱい。
2021/05/15(土) 00:54:51.91 ウェブ魚拓保存者がIP開示されたケース
https://gigazine.net/amp/20090628_megalodon
https://gigazine.net/amp/20090628_megalodon
2021/05/15(土) 02:45:03.16
ウェブ魚拓はそういうのもあって今は利用していない
2021/05/16(日) 07:35:08.10
429エラーでもこれはお手上げ

876名無しさん@お腹いっぱい。
2021/05/17(月) 10:22:21.67 Cannot get status of 16進数(32桁)というのが出る
2021/05/18(火) 16:27:53.74
保存日時の情報は記録されているけれど、外部リンク調査日時の記録はされていないんだろうな。
これも記録してあればいいのに。
これも記録してあればいいのに。
2021/05/18(火) 18:54:24.22
なんではてなブログアーカイブするとfacebookなんちゃらになるんだ
2021/05/19(水) 03:51:09.54
ツイッターも意味不明な表示になったがちゃんと正式urlでアーカイブされてた
2021/05/19(水) 23:05:23.86
サイト内のzip落としたらUAが表示される某サイトで
二度Sorry出したら二度ともUAが表示されていたから保存されてはいるようだ
二度Sorry出したら二度ともUAが表示されていたから保存されてはいるようだ
2021/05/20(木) 17:13:05.62
Cannot save Internet Archive URLs!
今日はこのエラー連発で1時間後にやり直したらできたり不安定すぎる
保存できなかった理由も書いてない
今日はこのエラー連発で1時間後にやり直したらできたり不安定すぎる
保存できなかった理由も書いてない
2021/05/21(金) 18:08:48.24
Twitterで特定のアカウントだけexcludedってあるんだな
本人が申請したっぽいけど
本人が申請したっぽいけど
2021/05/22(土) 13:44:06.50
ハイパーリンクの情報は当然持ってるとして各ファイルの被リンク情報はなくてもやっていけるんだろうかと少々心配になる
ビッグデータとして利用する客が考えればいいことか知らんが
ビッグデータとして利用する客が考えればいいことか知らんが
2021/05/23(日) 07:32:01.41
そもそも今のIAはとにかく情報を溜め込むことだけ考えてそれをどう活用するかは今後次第って感じじゃないかなあ
現状のsaveだけでもサーバー不安定になるレベルで常にやってるし(それでも全然間に合ってなさそうなのが怖いが)
現状のsaveだけでもサーバー不安定になるレベルで常にやってるし(それでも全然間に合ってなさそうなのが怖いが)
2021/05/23(日) 22:01:09.82
URLで検索してアーカイブ一覧を表示しようとすると次のエラーが出るのだけど
混雑で検索エンジンが止まってるだけかな
The search engine encountered the following error: invalid or no response from Elasticsearch
混雑で検索エンジンが止まってるだけかな
The search engine encountered the following error: invalid or no response from Elasticsearch
2021/05/24(月) 07:19:04.30
887名無しさん@お腹いっぱい。
2021/05/25(火) 04:48:03.822021/05/25(火) 08:24:52.11
Cannot fetch the target URL due to system overload.
ナニコレ
ナニコレ
2021/05/25(火) 08:29:38.17
2021/05/25(火) 17:48:23.78
>>888
https://translate.google.co.jp/?sl=auto&tl=ja&text=Cannot%20fetch%20the%20target%20URL%20due%20to%20system%20overload.%20&op=translate&hl=ja
https://translate.google.co.jp/?sl=auto&tl=ja&text=Cannot%20fetch%20the%20target%20URL%20due%20to%20system%20overload.%20&op=translate&hl=ja
891名無しさん@お腹いっぱい。
2021/05/25(火) 23:05:34.28 オーバーロードはなろう系で唯一お薦めできる作品
2021/05/26(水) 03:28:24.76
最近データベースの入れ替えでもしてるの?
Explore more than X billion web pages saved over time
のXが一瞬半分になったり変動がすごい
Explore more than X billion web pages saved over time
のXが一瞬半分になったり変動がすごい
2021/05/26(水) 05:53:27.55
オーバーロードが良かったのは一期だけ(アニメ
894名無しさん@お腹いっぱい。
2021/05/26(水) 18:10:11.99 This snapshot cannot be displayed due to an internal error.
895名無しさん@お腹いっぱい。
2021/05/26(水) 21:05:39.01 回復したかな
2021/05/27(木) 03:31:52.31
system overloadが出ても/*/の後にURLつけると保存できてることがあるので、
一応確認してみるのおすすめ
一応確認してみるのおすすめ
2021/05/27(木) 22:10:47.88
保存時間の間隔が30分から45分になってる…
2021/05/28(金) 02:03:32.64
アイヤー
2021/05/28(金) 09:59:53.85
http://homepage2.nifty.com/
が
This URL has been excluded from the Wayback Machine.
になってるのはなんでだろう?ジオシティーズみたいな普通のホームページサービスだったみたいだけど
が
This URL has been excluded from the Wayback Machine.
になってるのはなんでだろう?ジオシティーズみたいな普通のホームページサービスだったみたいだけど
2021/05/28(金) 10:04:26.18
2021/05/28(金) 15:24:41.10
ジオシティーズやトクトクは普通だけどフリーティケットシアターは普通じゃない的な
2021/05/30(日) 04:42:48.43
/*/はFail with status: 498 No Reason Phrase
2021/05/30(日) 17:45:08.98
なるべく円高米ドル安の時に寄付したほうがいいんだろうな。
2021/05/30(日) 19:21:56.74
batchのページ開いてもトップに飛ばされてしまうようになった
2021/05/31(月) 01:22:39.81
batchのページが復活したっぽい。よかった
2021/06/01(火) 03:49:59.92
swfのあるページの取得厳しいんだっけ
Cannot fetch the target URL due to system overload.がでる
todayのほうで試したらプロセスが空白で進行せず
megarodonは見かけ上はとれてるがソースからswfの現物アドレスを消して保存してるっぽい
ファイル固有の問題だろうか
デバッガでは開けるんだが
Cannot fetch the target URL due to system overload.がでる
todayのほうで試したらプロセスが空白で進行せず
megarodonは見かけ上はとれてるがソースからswfの現物アドレスを消して保存してるっぽい
ファイル固有の問題だろうか
デバッガでは開けるんだが
2021/06/01(火) 04:36:21.94
swfってただのファイルじゃないの
どうしてそんなことが起こるのですか
どうしてそんなことが起こるのですか
2021/06/01(火) 11:28:13.18
We only allow new captures of the same URL every 45 minutes.
2021/06/01(火) 13:18:27.55
That's too hard to me...
2021/06/01(火) 13:20:35.24
激遅の/save/で行けたりしない?>swf
保存できても表示が更新されないので本当に保存されているか未確認だけど
保存できても表示が更新されないので本当に保存されているか未確認だけど
2021/06/01(火) 17:10:58.68
flash表示システムってどうなったんだっけ
2021/06/01(火) 19:40:12.28
サポート終了で表示できないっぽい
2021/06/02(水) 01:04:22.30
ファイル1個だけなら画像の確認とかやらないから拡張子関係なく超高速で保存できるはずだけど
2021/06/02(水) 01:50:07.20
Cannot fetch the target URL due to system overload.
出すぎ
出すぎ
915名無しさん@お腹いっぱい。
2021/06/02(水) 04:57:26.972021/06/02(水) 08:47:16.75
3Gガラケーの本体自体にフラッシュの再生機能付いててアーカイブ含め見れるが画面が小さいのがあかんな
ガラケー向けの時計フラッシュまちうけフラッシュは本体が壊れない限り確実に永遠に見れるけどペリーのピアノ講師ネタとか永遠に失われそう
ガラケー向けの時計フラッシュまちうけフラッシュは本体が壊れない限り確実に永遠に見れるけどペリーのピアノ講師ネタとか永遠に失われそう
2021/06/02(水) 14:33:51.58
SPNを保存されたかの確認に使うというわけ分からん状況になってる。
誰かが過去に保存したであろう複数ページの記事が途中歯抜けで保存されているのを見かけた。保存失敗か?
元の記事はもう見れないから補完してあげることもできなかった。
誰かが過去に保存したであろう複数ページの記事が途中歯抜けで保存されているのを見かけた。保存失敗か?
元の記事はもう見れないから補完してあげることもできなかった。
918名無しさん@お腹いっぱい。
2021/06/02(水) 14:54:32.98 twitterの保存だけやけに時間かかるんだけど
919名無しさん@お腹いっぱい。
2021/06/09(水) 00:42:55.87 「Ruffle」というchrome拡張機能使えばFlash見れるよ
920名無しさん@お腹いっぱい。
2021/06/09(水) 01:11:29.08 Sorry
You have already reached the limit of active sessions
↑
先週からエラー出まくり
You have already reached the limit of active sessions
↑
先週からエラー出まくり
2021/06/09(水) 06:03:50.69
>>920
おまいさんのやり方が悪いだけ。先月の制限強化に引っ掛かってるんだろ。
https://docs.google.com/document/d/19RJsRncGUw2qHqGGg9lqYZYf7KKXMDL1Mro5o1Qw6QI/edit
> 2021-05-23
> Anonymous users have lower concurrent captures limit (limit=3) compared to authenticated users (limit=5).
制限値を超えないよう、保存開始のタイミングを調整するしか無い。
アカウントを作ってログインすれば従前の制限値に戻る上、空きセッション数を API で
得られるようになるので、自動的に空きを待ってから保存するようなシステムも
組めるようになる。
https://web.archive.org/save/status/user (ログインしていなければ 503 エラー)
Change Log に記載は無いが、ログイン済みユーザの制限値は 6 に緩和されている模様。
("available":6)
おまいさんのやり方が悪いだけ。先月の制限強化に引っ掛かってるんだろ。
https://docs.google.com/document/d/19RJsRncGUw2qHqGGg9lqYZYf7KKXMDL1Mro5o1Qw6QI/edit
> 2021-05-23
> Anonymous users have lower concurrent captures limit (limit=3) compared to authenticated users (limit=5).
制限値を超えないよう、保存開始のタイミングを調整するしか無い。
アカウントを作ってログインすれば従前の制限値に戻る上、空きセッション数を API で
得られるようになるので、自動的に空きを待ってから保存するようなシステムも
組めるようになる。
https://web.archive.org/save/status/user (ログインしていなければ 503 エラー)
Change Log に記載は無いが、ログイン済みユーザの制限値は 6 に緩和されている模様。
("available":6)

2021/06/09(水) 15:34:51.37
なんかリファラー変更ができなくなったっぽいんだけど俺環?
2021/06/09(水) 16:25:44.73
ブラウザが (IA のヘッドレスブラウザも含めて) リファラを送らなくなったとか
そういう話じゃ無くて?
そういう話じゃ無くて?
2021/06/09(水) 17:46:21.43
マジか。じゃ もうリファラ必要なサイトは保存できなくなったのか
925名無しさん@お腹いっぱい。
2021/06/09(水) 18:29:55.92 制限するぐらいなら、有料化しろよ
2021/06/10(木) 05:14:53.41
金ローの画像はどういう仕組みなんだろう
https://kinro.ntv.co.jp/lineup/20210611
保存ができてるのかできてないのかがようわからん
/*/上の階層/*/ってファイルサイズは見れんよね
https://kinro.ntv.co.jp/lineup/20210611
保存ができてるのかできてないのかがようわからん
/*/上の階層/*/ってファイルサイズは見れんよね
2021/06/10(木) 09:28:25.29
API を使うとクッキーも送れるけど、ハイジャック耐性の無いユルいサイトしか使い道が無いな。
http://web.archive.org/web/20210610001000/taruo.net/e/
ちなみに force_get を 0 (または省略) にしておかないと capture_cookie を指定しても無視される。
http://web.archive.org/web/20210610001000/taruo.net/e/
ちなみに force_get を 0 (または省略) にしておかないと capture_cookie を指定しても無視される。
2021/06/10(木) 09:46:43.59
そうそう、IA のアーカイブはサーバのレスポンスヘッダが丸ごと保存されていることに留意。
つまり Set-Cookie でクッキーが返されていた場合、それも保存されているという事。
ログイン管理にクッキーを利用しているサイトで、アーカイブのデータを利用して
誰かに勝手にログインされるという事も起こりうる。
つまり Set-Cookie でクッキーが返されていた場合、それも保存されているという事。
ログイン管理にクッキーを利用しているサイトで、アーカイブのデータを利用して
誰かに勝手にログインされるという事も起こりうる。
2021/06/10(木) 16:53:57.18
なにそれこわい
2021/06/12(土) 22:30:39.38
また繋がらなくなった?
保存しようとしても503やら404の画面になるんだけど…
保存しようとしても503やら404の画面になるんだけど…
2021/06/12(土) 22:36:49.23
そうみたい
2021/06/12(土) 22:49:26.53
しばらくは駄目そうだな
2021/06/12(土) 23:14:58.67
最近、頻繁に使うようになったけど、今繋がらないみたいだね。
だいたいどれくらいで復帰するんだろうか?
1日2日はかかるかな?
だいたいどれくらいで復帰するんだろうか?
1日2日はかかるかな?
2021/06/12(土) 23:18:19.16
503エラー?
2021/06/13(日) 00:44:05.86
さっき見たときは直ってた
2021/06/13(日) 08:29:59.22
親切な表示が出るようになってる
You may close your browser window and the page will still be saved.
You may close your browser window and the page will still be saved.
2021/06/13(日) 17:29:48.96
さじをなげたか
2021/06/14(月) 11:43:37.62
Batch Archiveに入れない
2021/06/15(火) 07:00:28.90
向こうで計画停電が起こるみたいだから、こっちの時刻で16日の0時30分からしばらくサービス停止するらしい。
https://i.imgur.com/upjcBi3.png
https://www.jisakeisan.com/?y=2021&m=6&d=15&hh=8&mm=30&t1=pdt&t2=jst
https://i.imgur.com/upjcBi3.png
https://www.jisakeisan.com/?y=2021&m=6&d=15&hh=8&mm=30&t1=pdt&t2=jst
2021/06/15(火) 09:25:17.87
>>939
Due to a planned power outage, our services will be reduced on Tuesday, June 15th, starting at 8:30am PDT until the work is complete. We apologize for the inconvenience.
この程度の英文すら機械翻訳使わなきゃ読めない低能
Due to a planned power outage, our services will be reduced on Tuesday, June 15th, starting at 8:30am PDT until the work is complete. We apologize for the inconvenience.
この程度の英文すら機械翻訳使わなきゃ読めない低能
2021/06/15(火) 14:04:45.44
喧嘩はよそで一人でやってろよ
2021/06/15(火) 15:21:07.34
人は上から目線で間違いを訂正するときに性行為より快感を感じるらしい
943イモー虫
2021/06/18(金) 20:45:23.13 読み込み機能は機能しているのか
2021/06/19(土) 14:06:16.43
The capture is estimated to start in 120 minutes. You may close your browser window and the page will still be saved.
うっかりログインし忘れるとこれだわw
うっかりログインし忘れるとこれだわw
2021/06/19(土) 18:36:08.03
523分待ちだったわ 撮ってくれるんならまあいいけど
2021/06/19(土) 19:35:06.80
>>899
members.jcom.home.ne.jpも This URL has been excluded from the Wayback Machine.になるね
members.jcom.home.ne.jpも This URL has been excluded from the Wayback Machine.になるね
2021/06/19(土) 21:03:13.89
残り763分
2021/06/19(土) 23:24:40.50
今968分待ち、今日中に1000分超えるかな
2021/06/20(日) 00:40:25.87
1085分、てかアカウントでログインして保存しようとしてもこの表示出るじゃん
アカウント作った意味ないわ
アカウント作った意味ないわ
2021/06/20(日) 01:26:26.34
待ち時間が一度表示されてしまうと、その後ログインして
同じURLの再保存を試みても待ち時間が延びるだけ。
同じURLの再保存を試みても待ち時間が延びるだけ。
2021/06/20(日) 03:44:33.22
1393分待ちになってる
952名無しさん@お腹いっぱい。
2021/06/20(日) 12:42:15.80 保存は匿名で出来るんですか?
2021/06/20(日) 12:58:58.94
まだログインしないと待ち時間が出る状態なの?
ご愁傷様w
ご愁傷様w
2021/06/20(日) 15:59:50.29
今は直ってるな
というか別に待ち時間があっても後で保存されるんだから良くね?
というか別に待ち時間があっても後で保存されるんだから良くね?
2021/06/21(月) 02:12:27.28
伊是名夏子のブログのアーカイブを見ようとすると
6月初めぐらいからThis URL has been excluded〜が出るようになってるんだけど、
非表示化か削除依頼出したみたいだねこれ。
6月初めぐらいからThis URL has been excluded〜が出るようになってるんだけど、
非表示化か削除依頼出したみたいだねこれ。
956名無しさん@お腹いっぱい。
2021/06/21(月) 10:45:02.62 アーカイブのアーカイブが必要になりそう
2021/06/21(月) 14:15:21.05
archive.isなら消されない
2021/06/21(月) 14:49:55.10
archive.is 自体が消えてしまったりしないの? という話が。
2021/06/21(月) 19:46:33.38
永久不滅アーカイヴが必要
2021/06/22(火) 06:37:35.24
Cannot get status of spn2-2afbf2c51be876410f7a78331b331ea74cd21c67-5a282757
2021/06/24(木) 00:03:38.03
>>953
ログインしてても普通に待ち時間表示出るけど、時間帯によって変わったりするの?
ログインしてても普通に待ち時間表示出るけど、時間帯によって変わったりするの?
2021/06/27(日) 13:37:52.83
2021/06/28(月) 11:48:52.21
何度許可してもログインしなおしてもBatchのArchive URLsに入れない
2021/07/02(金) 11:56:14.72
Batch入れないけど、騒いでるの俺だけっぽいから俺環なのか
2021/07/02(金) 15:17:24.60
皆さん自前でバッチ処理しているから使ってない、に一票
966名無しさん@お腹いっぱい。
2021/07/12(月) 07:09:59.53 あるWEBサイトの一部が消えているのだけれど、
インターネットアーカイブでも履歴が残っていないことがある
忍者とかいうブログサイトを使っているのだが、
あそこって削除した画像とかの履歴を残さないようにする機能とかあるのだろうか
インターネットアーカイブでも履歴が残っていないことがある
忍者とかいうブログサイトを使っているのだが、
あそこって削除した画像とかの履歴を残さないようにする機能とかあるのだろうか
967名無しさん@お腹いっぱい。
2021/07/12(月) 16:06:59.65 >>966
他の魚拓サイトにも残ってないの?まあブログはアーカイブされてないことが多いからなぁ。
他の魚拓サイトにも残ってないの?まあブログはアーカイブされてないことが多いからなぁ。
2021/07/12(月) 16:33:16.08
忍者って昔やたらボット除けに精を出してた所じゃないか
って今時の人は知らんのか
で、もうそろそろ次スレテンプレの話題でも
って今時の人は知らんのか
で、もうそろそろ次スレテンプレの話題でも
969名無しさん@お腹いっぱい。
2021/07/12(月) 23:07:03.452021/07/14(水) 01:47:06.23
ツイッターのアーカイブ保存、回収の法則テンプレに入れようぜ。
アーカイブ保存は
mobile.ツイッター.com
でなければならないが
回収web.archive.org/web/9999/はmobile.を外さなきゃならない
ってこれガラケーだけ?
アーカイブ保存は
mobile.ツイッター.com
でなければならないが
回収web.archive.org/web/9999/はmobile.を外さなきゃならない
ってこれガラケーだけ?
2021/07/14(水) 04:14:39.67
ガラケー?そんなものの情報要るの?
2021/07/16(金) 04:27:32.78
普通にTwitterをアーカイブすればmobileは付かないと思うんだが・・・
それは置いといて>>5とかの話は入れたほうが良さそう
それは置いといて>>5とかの話は入れたほうが良さそう
2021/07/16(金) 13:46:21.98
最近は反映が早い
2021/07/18(日) 03:03:30.60
Hrm.
The Wayback Machine has not archived that URL.って出るサイトは
どうやってもみれないんですか?
The Wayback Machine has not archived that URL.って出るサイトは
どうやってもみれないんですか?
2021/07/18(日) 18:09:30.90
>>974
アーカイブしてないからそもそも保存されてない
アーカイブしてないからそもそも保存されてない
2021/07/18(日) 19:27:16.87
ttps://wiki.archiveteam.org/images/e/e6/Archiveteam.jpg
archiveteamが保存した一部のスナップショットを見ると、この「俺たちが保存したぜ」画像のURLを読み込むから、
誰がどのページを見たかarchiveteamのウィキサイトに情報が漏れるんだけど、ただのスパイじゃねーか。
Internet Archiveの人は誰も気付いてないのかなこれ。
archiveteamが保存した一部のスナップショットを見ると、この「俺たちが保存したぜ」画像のURLを読み込むから、
誰がどのページを見たかarchiveteamのウィキサイトに情報が漏れるんだけど、ただのスパイじゃねーか。
Internet Archiveの人は誰も気付いてないのかなこれ。
2021/07/18(日) 20:43:46.80
と、自分でスクリプトを組んでアーカイブできない無能が文句を垂れております。
2021/07/19(月) 02:22:16.98
2021/07/19(月) 05:43:32.79
そのレベルの情報を気にするなら個人でproxyなりVPNなり使えばいいのでは
なぜArchiveTeamだけを気にしてるのかは知らんが
なぜArchiveTeamだけを気にしてるのかは知らんが
980名無しさん@お腹いっぱい。
2021/07/19(月) 22:59:58.68 >>976
ほんまや
About this captureの説明のところに埋め込んであった
でもブラウザの挙動はCSPで読み込みブロックってなってるから
インターネットアーカイブ側の対策でデータは送信されてない感じかね
ほんまや
About this captureの説明のところに埋め込んであった
でもブラウザの挙動はCSPで読み込みブロックってなってるから
インターネットアーカイブ側の対策でデータは送信されてない感じかね
2021/07/23(金) 00:21:19.80
25周年記念サイト
https://anniversary.archive.org/
https://anniversary.archive.org/
2021/07/23(金) 16:15:09.58
インターネットアーカイブが25歳になったら、知識がすべての人にとってよりアクセスしやすくなった極めて重要な瞬間を経て、戻る方法から進む方法への旅にあなたを招待します。
アレクサンドリア図書館からヨハネスグーテンベルクによる印刷機の発明まで。
情報への権利の第一修正の保証からワールドワイドウェブの作成まで、知識へのアクセスは常に建設者と夢想家のおかげでした。
さて、ブリュースター・ケールという若いコンピューター科学者がデジタル時代の「すべての図書館」を建設することを夢見ていた1996年にさかのぼります。
人類の出版されたすべての作品を含み、一般に無料で、時代を超えて非営利団体として構成されたライブラリ。彼はこのデジタルライブラリをインターネットアーカイブと名付けました。
その使命は、すべての人に「すべての知識への普遍的なアクセス」を提供することです。
この25年のマイルストーンに関するブリュースターの考察を読む
バーチャルセレブレーションに参加する
あなたが世界のどこにいても、私たちと一緒に祝いに来てください。
ウェイバックからウェイフォワードへ:25のインターネットアーカイブ
星を目指して到達したビルダーと夢想家との仮想の旅。
10月21日木曜日午後6時PT(午後9時ET)
アレクサンドリア図書館からヨハネスグーテンベルクによる印刷機の発明まで。
情報への権利の第一修正の保証からワールドワイドウェブの作成まで、知識へのアクセスは常に建設者と夢想家のおかげでした。
さて、ブリュースター・ケールという若いコンピューター科学者がデジタル時代の「すべての図書館」を建設することを夢見ていた1996年にさかのぼります。
人類の出版されたすべての作品を含み、一般に無料で、時代を超えて非営利団体として構成されたライブラリ。彼はこのデジタルライブラリをインターネットアーカイブと名付けました。
その使命は、すべての人に「すべての知識への普遍的なアクセス」を提供することです。
この25年のマイルストーンに関するブリュースターの考察を読む
バーチャルセレブレーションに参加する
あなたが世界のどこにいても、私たちと一緒に祝いに来てください。
ウェイバックからウェイフォワードへ:25のインターネットアーカイブ
星を目指して到達したビルダーと夢想家との仮想の旅。
10月21日木曜日午後6時PT(午後9時ET)
2021/07/24(土) 02:54:26.16
YoutubeのURL取ったら下のメッセージが出た
It may take a few days for YouTube videos to become available for playback.
動画もアーカイブされてるってことでいいのかな?
It may take a few days for YouTube videos to become available for playback.
動画もアーカイブされてるってことでいいのかな?
984名無しさん@お腹いっぱい。
2021/07/24(土) 13:53:59.14 Youtubeを保存したいなら手動保存が望ましい。クローラーの保存だと再生できないケースあり。
2021/07/31(土) 03:20:35.58
そろそろ6000億超えるか
2021/07/31(土) 19:00:56.16
<title>だけでも検索できるといいんだけどなあ
2021/07/31(土) 21:11:28.65
いまツイッターの動画って保存できねえんだっけ
2021/08/01(日) 03:48:55.71
そうなの?(そうなの?)
989名無しさん@お腹いっぱい。
2021/08/01(日) 16:10:13.052021/08/01(日) 18:08:12.29
ページからたどれなくならね
991名無しさん@お腹いっぱい。
2021/08/01(日) 18:27:20.02 それはしゃーない
992名無しさん@お腹いっぱい。
2021/08/01(日) 19:07:49.48 次スレたのんます
2021/08/13(金) 03:38:50.58
>>992
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/
2021/08/13(金) 07:19:48.01
Tor clients have already done 200,000 captures today. Please email us at "info@archive.org" if you would like to discuss this more.
とか出てきたんやけど・・・
とか出てきたんやけど・・・
2021/08/13(金) 09:36:18.65
Tor使ってないのに俺も今日初めてそのエラーが出てきた
9時過ぎたので、一応リセットされて表示されなくなったが、
毎日これが出たら困るな、特に朝保存したい場合は
9時過ぎたので、一応リセットされて表示されなくなったが、
毎日これが出たら困るな、特に朝保存したい場合は
2021/08/13(金) 13:38:54.09
健康のための朝保存
997名無しさん@お腹いっぱい。
2021/08/13(金) 19:21:46.352021/08/13(金) 19:26:23.91
IAの中の人はTorがどういうものか分かってないらしいw
2021/08/13(金) 20:25:45.61
999!
1000名無しさん@お腹いっぱい。
2021/08/13(金) 20:56:15.43 【 html化されたこのスレを読んでいるお前へ 】
おい、お前。そう、お前だよ。
「このスレおもろいから見てみ」「2ちゃんの歴史に残る名スレだぜ」とか言われてホイホイと
このhtml化されたスレを見にきた、お前のことだ。
どうだ?このスレおもしれーだろ。
でもな、お前はこのスレを読むだけで、参加することはできねーんだよ。
可愛そうにな、プププ。
俺は今、ライブでこのスレに参加してる。
すっげー貴重な経験したよ。この先いつまでも自慢できる。
まあ、お前みたいな出遅れ君は、html化されたこのスレを指くわえて眺めてろってこった。
おい、お前。そう、お前だよ。
「このスレおもろいから見てみ」「2ちゃんの歴史に残る名スレだぜ」とか言われてホイホイと
このhtml化されたスレを見にきた、お前のことだ。
どうだ?このスレおもしれーだろ。
でもな、お前はこのスレを読むだけで、参加することはできねーんだよ。
可愛そうにな、プププ。
俺は今、ライブでこのスレに参加してる。
すっげー貴重な経験したよ。この先いつまでも自慢できる。
まあ、お前みたいな出遅れ君は、html化されたこのスレを指くわえて眺めてろってこった。
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 498日 18時間 48分 6秒
新しいスレッドを立ててください。
life time: 498日 18時間 48分 6秒
10021002
Over 1000Thread 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 【映画】永野芽郁主演『かくかくしかじか』 公開初日から空席祭り [ネギうどん★]
- 政府備蓄米の価格上乗せが拡大、卸売業者から小売り・外食へは60kgで7593円 [おっさん友の会★]
- 日産 追浜と湘南の2工場閉鎖へ…7工場削減計画 海外はメキシコや南アフリカなど ★2 [蚤の市★]
- 松村沙友理、男性に怒りの問題提起「スナックに行くことに罪悪感がなさ過ぎ」「キャバクラもスナックも一緒」共演者ら反論「全く違う!」 [muffin★]
- 【速報】1人約2万円の現金給付案を立憲・野田代表が発表 食料品の消費税ゼロの財源も示す [パンナ・コッタ★]
- イオンがカリフォルニア産米を販売、これが日本の食料安全保障に… (青沼 陽一郎氏) ★2 [少考さん★]
- 年金満額納付したのに68歳くらいで亡くなるおじいちゃんいるでしょ🥺 [929293504]
- 【実況】博衣こよりのえちえち鬼武者🧪★3
- 【実況】博衣こよりのえちえち鬼武者🧪★2
- 【悲報】ジークアクス、「鶴巻が2014年を改変しようとしてる」説が有力視されてしまうwwwww [339035499]
- アジとイカ、高級魚へ… ありがとう自民党、安倍さんありがとう [667744927]
- 【鶴巻】機動戦士ガンダムジークアクス、乃木坂要素を軸にしない考察は的外れという前代未聞の状況になる。 [608329945]