なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php
インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
------------------
Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック
Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。
前スレッド
Internet Archive総合 (web.archive.org) #3
https://mevius.5ch.net/test/read.cgi/esite/1585760889/
探検
Internet Archive総合 (web.archive.org) #4
レス数が1000を超えています。これ以上書き込みはできません。
2021/08/13(金) 03:38:17.64
2021/08/13(金) 04:29:40.41
>>1おつ
Internet Archive総合 (web.archive.org) #2
https://mevius.5ch.net/test/read.cgi/esite/1475246713/5
5 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2016/10/01(土) 04:24:53.46
テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの?
Internet Archive総合 (web.archive.org) #2
https://mevius.5ch.net/test/read.cgi/esite/1475246713/5
5 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2016/10/01(土) 04:24:53.46
テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの?
2021/08/13(金) 09:15:19.20
Q. 寄付したいんだけど?
こちらから金額と、一度きりか毎月か、送金方法、を選んで寄付してください
ttps://archive.org/donate
Q. すぐに保存したい場合は?
Save Page NowにURLを入力して「SAVE PAGE」ボタンを押す
ttps://web.archive.org/save/
Q. アカウント作ったらなんかいいことあるの?
A. ページのスクリーンショットを保存したり、ページの全てのリンク先を保存できる「Save outlinks」という機能が使える
Q. spn@archive.orgにメールでURLを送ったら保存されるの?
A. 1週間後に保存完了のメールが届いたり、何も戻ってこない失敗した場合があるので、確実に保存したいなら辞めたほうがいい
Q. インスタのURLが保存できないんだけど
A. ログインしないとコンテンツが表示されない仕様になったので保存自体が無理になってます
Q. robots.txtでia_archiverをDisallowしても無視されるの?
A. 中古ドメインでサイト見れなくするやつのせいでrobots.txtを見ない仕様になったので無視されることも従うこともあります、
保存できることもあるので確認してみたほうが早い
Q. 鯖落ちしてる?
A. ここで鯖状態を見れる
ttps://analytics0.archive.org/stats/wb.php
ttps://archive.org/stats/
こちらから金額と、一度きりか毎月か、送金方法、を選んで寄付してください
ttps://archive.org/donate
Q. すぐに保存したい場合は?
Save Page NowにURLを入力して「SAVE PAGE」ボタンを押す
ttps://web.archive.org/save/
Q. アカウント作ったらなんかいいことあるの?
A. ページのスクリーンショットを保存したり、ページの全てのリンク先を保存できる「Save outlinks」という機能が使える
Q. spn@archive.orgにメールでURLを送ったら保存されるの?
A. 1週間後に保存完了のメールが届いたり、何も戻ってこない失敗した場合があるので、確実に保存したいなら辞めたほうがいい
Q. インスタのURLが保存できないんだけど
A. ログインしないとコンテンツが表示されない仕様になったので保存自体が無理になってます
Q. robots.txtでia_archiverをDisallowしても無視されるの?
A. 中古ドメインでサイト見れなくするやつのせいでrobots.txtを見ない仕様になったので無視されることも従うこともあります、
保存できることもあるので確認してみたほうが早い
Q. 鯖落ちしてる?
A. ここで鯖状態を見れる
ttps://analytics0.archive.org/stats/wb.php
ttps://archive.org/stats/
2021/08/13(金) 09:19:36.55
Q. Save Page Nowの制限などの仕様は?
A. ここを参照
ttps://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit
Q. Save Page Nowで保存完了しても保存されたページが表示されないんだけど
A. 完全にページが見れるようになるのと、/*/のページ一覧やカレンダーに反映されるまで時間かかるので最大数日待ってください
ほとんどは数分後には見えるようになってるはず、もしくはウェブブラウザのキャッシュを削除するといいかも
Q. 「 The capture is estimated to start in XX minutes. 」って何?
A. Save Page Nowの保存サーバーの空きがなくて保存処理に時間がかかってる状態、急いでなければあとでやるのも手
Q. The same snapshot had been made XX minutes and XX seconds ago. We only allow new captures of the same URL every XX minutes.
A. 同じURLを短期間の間に何度も保存できない仕様になっています、誰かが数分前に保存したか、自分で保存したときに一部の画像がかけて保存されている状態でも表示されることがあります
気になるなら1時間後ぐらいにもう一度保存してください
Q. Temporarily Offline The Internet Archive's sites are temporarily offline. We apologize for the inconvenience. って何?
A. たまにメンテやってサイト見れなくなることがあるので、待ちましょう。ツイッター(@InternetArchive)でメンテ予告は発表しています
Q.「The server didn't respond in time for https://(保存しようとしたURL)」
A. 極端にページの返答が遅いサイトを保存しようとするとこの表示が出ます、何度かやれば保存できることもあります
A. ここを参照
ttps://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit
Q. Save Page Nowで保存完了しても保存されたページが表示されないんだけど
A. 完全にページが見れるようになるのと、/*/のページ一覧やカレンダーに反映されるまで時間かかるので最大数日待ってください
ほとんどは数分後には見えるようになってるはず、もしくはウェブブラウザのキャッシュを削除するといいかも
Q. 「 The capture is estimated to start in XX minutes. 」って何?
A. Save Page Nowの保存サーバーの空きがなくて保存処理に時間がかかってる状態、急いでなければあとでやるのも手
Q. The same snapshot had been made XX minutes and XX seconds ago. We only allow new captures of the same URL every XX minutes.
A. 同じURLを短期間の間に何度も保存できない仕様になっています、誰かが数分前に保存したか、自分で保存したときに一部の画像がかけて保存されている状態でも表示されることがあります
気になるなら1時間後ぐらいにもう一度保存してください
Q. Temporarily Offline The Internet Archive's sites are temporarily offline. We apologize for the inconvenience. って何?
A. たまにメンテやってサイト見れなくなることがあるので、待ちましょう。ツイッター(@InternetArchive)でメンテ予告は発表しています
Q.「The server didn't respond in time for https://(保存しようとしたURL)」
A. 極端にページの返答が遅いサイトを保存しようとするとこの表示が出ます、何度かやれば保存できることもあります
2021/08/13(金) 09:20:54.64
Q.「This URL has been excluded from the Wayback Machine. 」って何?
A. robots.txtのブロックや、サイトの運営者や著作権者がドメインやこのディレクトごと非表示化の申請した可能性があります、
ただしURLの保存はできますし、未来にブロックが解除されて見れるようになる可能性もあります
Q.「Cannot get status of spn2-乱数」のエラーは何?
A. Save Page Nowで保存中にサーバーの状態が取得できなかったときのエラーで、/*/で保存されているか確認して、されてなければもう一度保存してください
Q. 「404 Not Found」のエラーは何?
A. サイトが存在していてもこのエラーが出ることがあります。その場合は時間あけて一度保存してみましょう
A. robots.txtのブロックや、サイトの運営者や著作権者がドメインやこのディレクトごと非表示化の申請した可能性があります、
ただしURLの保存はできますし、未来にブロックが解除されて見れるようになる可能性もあります
Q.「Cannot get status of spn2-乱数」のエラーは何?
A. Save Page Nowで保存中にサーバーの状態が取得できなかったときのエラーで、/*/で保存されているか確認して、されてなければもう一度保存してください
Q. 「404 Not Found」のエラーは何?
A. サイトが存在していてもこのエラーが出ることがあります。その場合は時間あけて一度保存してみましょう
2021/08/13(金) 09:22:41.85
2021/08/13(金) 10:10:50.77
Q. 「Sorry Job failed」が出た
A. このエラーが出たとしても一部画像やスクリプトファイルが欠けた状態でページ保存できていることがありますので、/*/で確認してみてください
保存できてない場合はやり直してください
Q. 「You have already reached the limit of active sessions」が出た
A. 同じIPアドレスからの同時保存制限に引っかかってる状態。2021年5月24日以降はログインしていないユーザーは同時保存は3個まで
1分ほど待てば制限解除される
Q.「This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.」が出た
A. 1日に同じURLは10回まで保存できる制限に達したので、また明日
A. このエラーが出たとしても一部画像やスクリプトファイルが欠けた状態でページ保存できていることがありますので、/*/で確認してみてください
保存できてない場合はやり直してください
Q. 「You have already reached the limit of active sessions」が出た
A. 同じIPアドレスからの同時保存制限に引っかかってる状態。2021年5月24日以降はログインしていないユーザーは同時保存は3個まで
1分ほど待てば制限解除される
Q.「This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.」が出た
A. 1日に同じURLは10回まで保存できる制限に達したので、また明日
8名無しさん@お腹いっぱい。
2021/08/13(金) 19:21:23.04 いきなり保守
2021/08/13(金) 19:22:42.15
乙
2021/08/14(土) 04:09:32.12
Hmm
2021/08/14(土) 05:27:47.12
乙
2021/08/14(土) 12:34:36.90
乙
13名無しさん@お腹いっぱい。
2021/08/15(日) 00:20:19.31 archive .foはインスタ取れるの?
2021/08/15(日) 12:59:22.50
立て乙
pcからしかアクセスしてないのに3割ぐらいの確率でsp用ページが保存されるサイトあるのなんでだろ
sp用になってしまったページを後日とり直しても3割ぐらいが再度sp用になる
3度目の正直でもダメだったページは諦めてる
pcからしかアクセスしてないのに3割ぐらいの確率でsp用ページが保存されるサイトあるのなんでだろ
sp用になってしまったページを後日とり直しても3割ぐらいが再度sp用になる
3度目の正直でもダメだったページは諦めてる
2021/08/16(月) 08:34:43.27
>>1乙
2021/08/16(月) 17:49:00.62
17名無しさん@お腹いっぱい。
2021/08/17(火) 13:27:51.78 .>>1
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
共通の検索キーで特定するのが不可能なスレタイ
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
共通の検索キーで特定するのが不可能なスレタイ
18名無しさん@お腹いっぱい。
2021/08/17(火) 13:30:21.3919名無しさん@お腹いっぱい。
2021/08/17(火) 13:31:36.792021/08/17(火) 21:27:46.03
なにそれ
2021/08/18(水) 00:02:25.05
96年あたりに保存されたサイトは大抵が不完全だな
2021/08/18(水) 00:26:50.73
むしろ96年によく保存し始めたもんだなと思う
2021/08/19(木) 03:12:23.86
こちらのアーカイブの閲覧方法、どなたか分かる方がいらっしゃったら教えて頂きたいです…
https://archive.org/details/soundcloud_api_201707
https://archive.org/details/soundcloud_api_201707
2021/08/19(木) 03:50:10.13
2021/08/20(金) 09:52:35.14
>>24
ありがとうございます…!まさしく求めてたモノっぽいです。アーカイブの容量大きいですがローカルに落として見てみます!
ありがとうございます…!まさしく求めてたモノっぽいです。アーカイブの容量大きいですがローカルに落として見てみます!
2021/08/21(土) 09:40:47.52
404出るわ
2021/08/21(土) 12:43:47.02
久しぶりに重いね
2021/08/21(土) 17:10:20.07
調子悪いな
2021/08/21(土) 23:26:59.75
今日はプロトコルのエラーばっかりで
何度か読み込まないとウェブブラウザから表示も保存もできない
何度か読み込まないとウェブブラウザから表示も保存もできない
30名無しさん@お腹いっぱい。
2021/08/21(土) 23:40:35.02 ?何かあったの?
2021/08/25(水) 00:00:25.31
OutLinksがほぼThe server didn't respond in time for 「URL」になる
2021/08/25(水) 00:36:06.75
thisって何なん
2021/08/25(水) 00:36:27.41
thisじゃなかったthe
theは何を指してるん
theは何を指してるん
34名無しさん@お腹いっぱい。
2021/08/25(水) 22:21:16.75 twitterでjsonばっかのときどうすればいいの
2021/08/25(水) 22:50:55.34
>>31-33
>>4に書いてある
保存するページのサーバー側の応答が遅いとタイムアウトになってdidn't respondエラー返ってくる場合がある
outlinksでも同じ
URLわかってるなら1ページずつ保存したほうが早いかもしれないよ
>>34
俺の環境では最近Save Page Nowでも/save/を踏んでもjsonへリダイレクトされなくなってるけど
普通の「https://twitter.com/ユーザ名/status/ツイート番号」のURLで保存してみるとか
>>4に書いてある
保存するページのサーバー側の応答が遅いとタイムアウトになってdidn't respondエラー返ってくる場合がある
outlinksでも同じ
URLわかってるなら1ページずつ保存したほうが早いかもしれないよ
>>34
俺の環境では最近Save Page Nowでも/save/を踏んでもjsonへリダイレクトされなくなってるけど
普通の「https://twitter.com/ユーザ名/status/ツイート番号」のURLで保存してみるとか
2021/08/25(水) 23:45:21.72
Twitter 総合スレ 85
https://egg.5ch.net/test/read.cgi/sns/1602048057/
532 友達の友達の名無しさん (ワッチョイ ffeb-j7M8) sage 2021/08/25(水) 21:23:21.22 ID:Vyk92XNE0
Twitterが「ツイートの表示にログインを義務化する」仕様を段階的に導入している可能性
https://gigazine.net/news/20210825-twitter-require-login-to-view-tweets/
>ついにツイートの表示もログイン必須とする仕様をTwitterが段階的に
>導入し始めているのではないかと指摘されています
37名無しさん@お腹いっぱい。
2021/08/26(木) 00:20:29.10 ツイッターも魚拓とるなら今のうちか
インスタもフェイスブックもとれなくなったし
SNSの記録ができなくなるのは将来悔やまれるでしょうね
インスタもフェイスブックもとれなくなったし
SNSの記録ができなくなるのは将来悔やまれるでしょうね
2021/08/26(木) 04:17:45.08
>>37
自前のクロールソフト使うしかないもんな
自前のクロールソフト使うしかないもんな
2021/08/26(木) 07:53:54.44
今さっき、UTC 22 時台に玉葱経由で保存させようとしたらこれが来たw
おそらく他の制限と同様に 0 時にはリセットされるのかと。
この状態でもアカウントでログインしてあれば保存は可能。
(当然、生で使うものとはアカウントは分けてますよ。)
おそらく他の制限と同様に 0 時にはリセットされるのかと。
この状態でもアカウントでログインしてあれば保存は可能。
(当然、生で使うものとはアカウントは分けてますよ。)
![](http://o.5ch.net/1upwk.png)
2021/08/26(木) 12:20:31.50
なんかSave Page Nowのページ固まってね?
表示が固まるだけで取得は出来てるけど
表示が固まるだけで取得は出来てるけど
41名無しさん@お腹いっぱい。
2021/08/26(木) 15:05:07.942021/08/26(木) 15:10:10.17
>>41
生挿入と勘違いしたはるで、英文読めへんのかw
生挿入と勘違いしたはるで、英文読めへんのかw
2021/08/27(金) 16:18:35.90
2021/08/28(土) 05:34:32.31
https://archive.org/details/save-page-now-outlinks
なんか新しいことを始めてる模様
Save Page Nowでも自動でリンク先を保存してる
これで1ページ保存リクエスト出せばリンク辿って全部保存してくれるかも
なんか新しいことを始めてる模様
Save Page Nowでも自動でリンク先を保存してる
これで1ページ保存リクエスト出せばリンク辿って全部保存してくれるかも
2021/08/28(土) 05:48:06.55
ちなみに俺がSPNで保存したのを確認してみると、2日後にリンク先をsave-page-now-outlinksで保存してるので時間差がある感じ
将来的にログインしなくてもoutlinksと同じように保存されるならすごく時間の節約になってみんな助かるので期待したい
将来的にログインしなくてもoutlinksと同じように保存されるならすごく時間の節約になってみんな助かるので期待したい
2021/08/28(土) 08:50:45.75
>>37
このサイトからログインすると任意のアカウントの最新3000件ぐらいのツイートURLを取り出せる
ただしリツイートしてるのも含めてだが
ttps://www.allmytweets.net/
あとは/save/に投げていけばいい
このサイトからログインすると任意のアカウントの最新3000件ぐらいのツイートURLを取り出せる
ただしリツイートしてるのも含めてだが
ttps://www.allmytweets.net/
あとは/save/に投げていけばいい
2021/08/28(土) 17:09:28.57
自動でリンク先を撮ってくれるのはいいけど負荷分散も自動化してくれ
2021/08/29(日) 13:11:32.00
ArchiveTeamが取ったアーカイブってなぜかCollectionsやAPIに反映されてないことが多いんだよな
何でなんだろ?
何でなんだろ?
49名無しさん@お腹いっぱい。
2021/08/30(月) 19:15:15.06 いつの間にかヤフーニュースを
(トップページに遷移されずに)
スクリーンショットできる機能が復活していた。
(トップページに遷移されずに)
スクリーンショットできる機能が復活していた。
2021/09/04(土) 00:54:52.92
SPNの送信ヘッダのクッキーにdonation-identifier=英数字; abtest-identifier=英数字とかいうのがあるけど
寄付した金額で扱いを変えていたりするのだろうか?あとABテストの被験者にもされているのか?
Google関連?
寄付した金額で扱いを変えていたりするのだろうか?あとABテストの被験者にもされているのか?
Google関連?
2021/09/04(土) 03:07:26.10
Hrm.
The Wayback Machine has not archived that URL.
Click here to search for all archived pages under https://~
The Wayback Machine has not archived that URL.
Click here to search for all archived pages under https://~
2021/09/04(土) 13:59:14.93
hrmの発音がわからん
2021/09/04(土) 14:04:48.54
2021/09/04(土) 14:48:54.37
Forvoで調べたらエイチ・アール・エムって読みやがった。
そっちじゃねえ
そっちじゃねえ
2021/09/04(土) 14:50:36.84
Google翻訳の発音機能だとフーム
2021/09/04(土) 16:23:45.81
はらむ?えいちあーるえむ?ふーむ?
割れすぎワラタ
割れすぎワラタ
2021/09/04(土) 16:33:53.91
Youtube
Sorry
Please try again in ~1 min. Crawling this host is paused
because they notified us that are overloaded right now.
Sorry
Please try again in ~1 min. Crawling this host is paused
because they notified us that are overloaded right now.
2021/09/04(土) 17:57:59.71
( >ω<)/~~ ~1 min
2021/09/06(月) 06:21:44.18
>>36
スクロールしての読み下しは出来るが個別ツイートをクリックしても阻まれるな
スクロールしての読み下しは出来るが個別ツイートをクリックしても阻まれるな
2021/09/06(月) 18:56:51.87
別タブで開いたらまだ大丈夫
2021/09/08(水) 19:18:54.65
archive.is が落ちたままだ
https://web.archive.org/web/20210908101504/https://www.isitdownrightnow.com/archive.is.html
https://web.archive.org/web/20210908101504/https://www.isitdownrightnow.com/archive.is.html
2021/09/08(水) 22:00:50.95
ここの住人になるとそういうのさえアーカイブを通して貼るのかw
2021/09/08(水) 22:30:15.17
「落ちてる?」「生きてるだろ」という応酬を何度見てきたことか。
2021/09/16(木) 12:24:13.93
ツイッターアーカイブできなくない?
65名無しさん@お腹いっぱい。
2021/09/16(木) 16:29:05.86 668 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2021/09/16(木) 14:26:46.31
Save Page Now
が昨日から全然安定しない・・・
いつ正常になるんだ
Save Page Now
が昨日から全然安定しない・・・
いつ正常になるんだ
2021/09/19(日) 10:58:54.62
YouTubeの動画が保存されるのはいいんだけど、さっき見つけた今年の8月に保存されたページでは30秒の広告動画だけしか保存されてない。
parma.ccを見習えよ、てかparma.ccがアップロードしてるのをWaybackに反映させればいいのに
parma.ccを見習えよ、てかparma.ccがアップロードしてるのをWaybackに反映させればいいのに
2021/09/19(日) 19:26:35.26
/save/がNot Foundedになる
2021/09/19(日) 19:58:51.28
Temporarily Offlineが出たり404や503だらけで今日は保存できない
2021/09/20(月) 01:48:42.70
サンフランシスコで停電起きてるそうで、IAも巻き込まれてるかもしれない
シスコ近くの複数箇所にデータセンターがあるって昔発表してたけど、
場所を非公開だから停電の地図を見ても確かめられない
まだ完全に復旧するまで時間かかりそう
シスコ近くの複数箇所にデータセンターがあるって昔発表してたけど、
場所を非公開だから停電の地図を見ても確かめられない
まだ完全に復旧するまで時間かかりそう
2021/09/20(月) 01:50:37.08
貼り忘れ
IA代表のケールさんのツイート曰く
https://twitter.com/brewster_kahle/status/1439622667120754689
https://twitter.com/5chan_nel (5ch newer account)
IA代表のケールさんのツイート曰く
https://twitter.com/brewster_kahle/status/1439622667120754689
https://twitter.com/5chan_nel (5ch newer account)
2021/09/20(月) 02:37:27.85
太平洋標準時で午後5時(日本時間で20日午前9時)までに復旧予定
https://twitter.com/brewster_kahle/status/1439641066869645313
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/brewster_kahle/status/1439641066869645313
https://twitter.com/5chan_nel (5ch newer account)
2021/09/20(月) 05:15:32.58
外部要因かもしれんのか
2021/09/20(月) 22:14:43.29
無知ですみません。質問させてください。
スプレッドシートのリストでアーカイブをかけています。作業の完了メールを受信し、シートには成功したと記述があっても、実際にURLにアクセスしてみると、アーカイブの取得が完了していない旨のメッセージが表示されます。
この場合、内部的にはアーカイブの取得に成功していますか?
それともアーカイブはとれていないのでしょうか。
スプレッドシートのリストでアーカイブをかけています。作業の完了メールを受信し、シートには成功したと記述があっても、実際にURLにアクセスしてみると、アーカイブの取得が完了していない旨のメッセージが表示されます。
この場合、内部的にはアーカイブの取得に成功していますか?
それともアーカイブはとれていないのでしょうか。
2021/09/20(月) 22:31:00.44
両方よくある
2021/09/20(月) 23:31:50.62
>>73
保存したURLが見れるようになるまで時間かかっているか、一部のURLだけ保存に失敗している可能性もある。
/*/でカレンダーに直近の日付で保存されているか確認するのが一番簡単だが、
内部的に保存されているか確認したいなら、ウェブブラウザでも見れるけどcurlのコマンドの場合
curl https://archive.org/wayback/available?url=********
返答に「"available": true」と直近の日付のtimestampがあるかどうか。あるなら保存できてる。
"available": falseの場合はその次に
curl -I https://web.archive.org/web/********
ヘッダーに「x-archive-redirect-reason: found capture at 直近の保存時間」があれば保存されている。
この2つのコマンドで見当たらない場合は保存をやり直ししたほうが早い。
ただ、この確認方法でも保存できているのに保存されてないと返ってくることがあるので、俺も困ってる。
保存したURLが見れるようになるまで時間かかっているか、一部のURLだけ保存に失敗している可能性もある。
/*/でカレンダーに直近の日付で保存されているか確認するのが一番簡単だが、
内部的に保存されているか確認したいなら、ウェブブラウザでも見れるけどcurlのコマンドの場合
curl https://archive.org/wayback/available?url=********
返答に「"available": true」と直近の日付のtimestampがあるかどうか。あるなら保存できてる。
"available": falseの場合はその次に
curl -I https://web.archive.org/web/********
ヘッダーに「x-archive-redirect-reason: found capture at 直近の保存時間」があれば保存されている。
この2つのコマンドで見当たらない場合は保存をやり直ししたほうが早い。
ただ、この確認方法でも保存できているのに保存されてないと返ってくることがあるので、俺も困ってる。
2021/09/21(火) 01:12:46.90
今日も停電だって
https://twitter.com/internetarchive/status/1439984427145121792
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/internetarchive/status/1439984427145121792
https://twitter.com/5chan_nel (5ch newer account)
2021/09/21(火) 01:15:13.36
スレタイのアーカイブサイトってもしかして停電が相次ぐ州にあるのか?
2021/09/21(火) 11:17:06.02
dropboxも除外されてるか
以前は保存できて落とせた気がしたが
以前は保存できて落とせた気がしたが
79名無しさん@お腹いっぱい。
2021/09/22(水) 19:37:04.10 著作権法厳しくなったら、誰が保存したとか調べよとする輩も出てくるんかね。無理だと信じたいが
2021/09/24(金) 03:01:13.72
2021/09/25(土) 06:46:20.97
archive.isで.txtをアーカイブした場合、プレーンテキストを表示させるにはどうしたら良い?
2021/09/25(土) 18:39:38.36
im_
fw_
fw_
2021/09/26(日) 06:37:37.39
それarchive.orgだろ
84名無しさん@お腹いっぱい。
2021/09/29(水) 20:05:16.09 いつの間にかtwitterの動画保存できるようになってるじゃん
85名無しさん@お腹いっぱい。
2021/09/29(水) 20:49:15.4486名無しさん@お腹いっぱい。
2021/09/29(水) 23:07:40.75 消されたtwitterアカウントの過去ツイ遡りたいんだけど、どうやって検索すればいいか分からん
2021/10/01(金) 01:01:19.89
わからんならやめたれ
2021/10/01(金) 04:25:58.46
中国のweiboってアーカイブ出来ないんでしょうか?
2021/10/01(金) 12:24:43.05
新しくURLsタブ出来たけど、バグってるのか表示されないな
2021/10/01(金) 14:04:39.61
2021/10/01(金) 20:37:46.76
夏にTwitterアカウントのアーカイブ削除依頼を出したんだけど、
翻訳ソフト使ったけど、
回答が難解すぎてまったく分からない。
アドレスだとかURLか何か要求していることだけは分かったけど、
この場合、何を出せばいいのですか?
今まで使ってたサービスとか昔書いてたブログとか
順次アーカイブから除去していくつもりなんだけど、
最初に手を付けたTwitterですら消し方が分からない……
翻訳ソフト使ったけど、
回答が難解すぎてまったく分からない。
アドレスだとかURLか何か要求していることだけは分かったけど、
この場合、何を出せばいいのですか?
今まで使ってたサービスとか昔書いてたブログとか
順次アーカイブから除去していくつもりなんだけど、
最初に手を付けたTwitterですら消し方が分からない……
2021/10/01(金) 21:04:21.76
残されて困るようなことを書いたお前が悪い。諦めろ。
93名無しさん@お腹いっぱい。
2021/10/01(金) 22:48:00.80 >>91
本人証明して削除してもらうみたいな話は聞いたことある
Twitterとかブログで削除依頼出してます的な文を投稿をすれば本人だと証明できるのかな
取り敢えず個人情報伏せてメール文貼り付ければ誰か解読してくれるんじゃね?
本人証明して削除してもらうみたいな話は聞いたことある
Twitterとかブログで削除依頼出してます的な文を投稿をすれば本人だと証明できるのかな
取り敢えず個人情報伏せてメール文貼り付ければ誰か解読してくれるんじゃね?
2021/10/02(土) 04:31:41.79
こころんにあるミラーはIAを弾いてるっぽいし、エロゲ系ミラーサイトの大半は閉鎖済みだし どうしようもない
2021/10/02(土) 23:58:43.15
ttps://wayforward.archive.org/ia2046/
この未来起こりうる陰謀論みたいなシナリオみたいなのはなんなの
がっかり
この未来起こりうる陰謀論みたいなシナリオみたいなのはなんなの
がっかり
96名無しさん@お腹いっぱい。
2021/10/03(日) 00:58:38.212021/10/03(日) 19:43:00.18
コスパ系のサイト保存すると盥回しみたいに転送されまくって元のドメインに戻ってくる仕様クソ過ぎるな。
IAではなくコスパ側の仕様だが。
IAではなくコスパ側の仕様だが。
2021/10/03(日) 20:00:54.17
無限盥回しで いつになってもアーカイブが表示されない場合もある。これは酷い
2021/10/04(月) 01:43:25.24
コスパ系のサイトとは一体
2021/10/05(火) 15:38:13.03
前までURL入れたら見れていたサイトが急に見れなくなる原因ってなんですか?
随分昔の個人サイトで今さら削除申請した訳でも無さそうなのですが何が原因なんでしょう
こういう例がいくつもあります
随分昔の個人サイトで今さら削除申請した訳でも無さそうなのですが何が原因なんでしょう
こういう例がいくつもあります
2021/10/05(火) 22:21:22.34
2021/10/08(金) 09:09:08.20
>>97
TMJ移転のお知らせ
TMJ移転のお知らせ
103名無しさん@お腹いっぱい。
2021/10/09(土) 15:57:54.85 ヤフーニュースをアーカイブしてもトップページに遷移されずに
無難にアーカイブできるようになっている。
いつの間にか。
無難にアーカイブできるようになっている。
いつの間にか。
2021/10/09(土) 18:48:40.91
楽天は?
2021/10/10(日) 06:38:26.34
save-page-now-outlinksが復活してる。
SPN使って手動で保存したページのリンク先がいくつか保存されてるのも確認。
SPN使って手動で保存したページのリンク先がいくつか保存されてるのも確認。
2021/10/11(月) 06:09:54.04
2021/10/13(水) 21:58:44.94
Sorry
This host has been already captured 100,000 times today. Please email us at "info@archive.org" if you would like to discuss this more.
This host has been already captured 100,000 times today. Please email us at "info@archive.org" if you would like to discuss this more.
2021/10/14(木) 03:19:26.35
応じてくれるの?
109名無しさん@お腹いっぱい。
2021/10/14(木) 05:00:41.52 アーカイブが見れなくなったことを質問したときの回答
>Please note that the Wayback Machine uses multiple layers of indexes to internally access archives of URLs.
>Therefore, from time to time, information is moved from one index before it is available in the “next” index.
>Our engineers are working to address the root cause of this breakdown to reduce the probability it will happen.
>However, with > 1 billion URLs/day flowing into the system, and less hardware than we would like, it is a bit harder to fix once and for all.
>Typically, though, what you see is what the Archive captured when it visited the webpage (and what we have).
>Please note that the Wayback Machine uses multiple layers of indexes to internally access archives of URLs.
>Therefore, from time to time, information is moved from one index before it is available in the “next” index.
>Our engineers are working to address the root cause of this breakdown to reduce the probability it will happen.
>However, with > 1 billion URLs/day flowing into the system, and less hardware than we would like, it is a bit harder to fix once and for all.
>Typically, though, what you see is what the Archive captured when it visited the webpage (and what we have).
2021/10/14(木) 18:30:08.24
英語じゃないか
2021/10/14(木) 19:17:27.38
2021/10/14(木) 20:54:09.53
口が悪い…
2021/10/16(土) 01:27:51.93
2021/10/16(土) 06:14:39.06
>>113
既に「一日」の3分の2が過ぎてる時間帯にそんなこと書いてる時点でお察し
既に「一日」の3分の2が過ぎてる時間帯にそんなこと書いてる時点でお察し
2021/10/17(日) 21:25:56.42
>>114
アメリカ基準だからってこと?
アメリカ基準だからってこと?
2021/10/18(月) 07:27:23.85
2021/10/18(月) 08:57:01.05
ああ、UTC基準なのか
所在地の日時かと思ってた
所在地の日時かと思ってた
118名無しさん@お腹いっぱい。
2021/10/19(火) 15:38:16.80 ロンドン時間なのか
2021/10/19(火) 19:05:40.90
ロンドンタイムズ
120名無しさん@お腹いっぱい。
2021/10/20(水) 22:39:18.13 皆さんはどのようなサイトを保存していますか?
121名無しさん@お腹いっぱい。
2021/10/22(金) 20:16:41.27 https://web.archive.org/web/20130206020226/http://bbs.avi.jp/457036/
https://web.archive.org/web/20121014071653/http://bbs.avi.jp/457037
このサイトの小説を見たいのだけど復旧方法あるかな
https://web.archive.org/web/20121014071653/http://bbs.avi.jp/457037
このサイトの小説を見たいのだけど復旧方法あるかな
2021/10/22(金) 20:26:16.31
123名無しさん@お腹いっぱい。
2021/10/22(金) 21:29:48.28 >>122
うーん、このサイトのが見たいんだよな
うーん、このサイトのが見たいんだよな
124名無しさん@お腹いっぱい。
2021/10/27(水) 13:57:13.16125名無しさん@お腹いっぱい。
2021/10/27(水) 13:57:51.32 >10/27(水)の午前8時から午後1時(太平洋夏時間)の間に計画停電が発生したため、一部のサービスが影響を受ける可能性があります。
2021/10/27(水) 16:25:16.45
日本時間で28日午前0時から5時だな
2021/10/27(水) 16:46:00.02
検索するとサンフランシスコでは先週末の暴風雨の影響で一部の地域で停電とネット停止してまだ復旧終わってないそう
電気自動車やカリフォルニアの窃盗軽犯罪化と盗電どころじゃねーわw
データセンターがある環境悪すぎ
電気自動車やカリフォルニアの窃盗軽犯罪化と盗電どころじゃねーわw
データセンターがある環境悪すぎ
2021/10/28(木) 00:06:10.40
2021/10/28(木) 14:30:10.73
>>122 昨日そのサイト内の保存されてない40ページほどをSPNに投げて保存しといた
130名無しさん@お腹いっぱい。
2021/10/28(木) 15:40:15.32 俺はTwitter保存してる
131名無しさん@お腹いっぱい。
2021/10/29(金) 00:37:39.372021/10/29(金) 01:28:08.82
最近 Google Chrome で archive.is が archive.md にリダイレクトして
DNS_PROBE_FINISHED_NXDOMAIN エラーになってた。
セキュアDNS設定を Cloudflare から Google に変更して解決。
DNS_PROBE_FINISHED_NXDOMAIN エラーになってた。
セキュアDNS設定を Cloudflare から Google に変更して解決。
133名無しさん@お腹いっぱい。
2021/10/29(金) 12:42:57.33 >>128
同じこと考えてた。
同じこと考えてた。
2021/10/30(土) 00:38:00.23
世界史に残る病気ってもっと「半分の確率で死ぬ恐怖の奇病」みたいなものを想像してたな
「風邪+α」の、+α部分が絶妙に対処しづらくてこんな大事件になるとは
「風邪+α」の、+α部分が絶妙に対処しづらくてこんな大事件になるとは
2021/10/31(日) 20:50:00.87
とあるサイトをアーカイブしたいのですが
No URL has been captured for this domain.
と出ます
これはもう何をしても無理でしょうか?
No URL has been captured for this domain.
と出ます
これはもう何をしても無理でしょうか?
2021/10/31(日) 21:14:29.11
2021/10/31(日) 23:18:41.29
2021/11/01(月) 01:35:41.17
If something went wrong click here to send us an error report.
2021/11/01(月) 10:33:55.59
2021/11/01(月) 10:34:20.66
>>139
誤爆すまん
誤爆すまん
2021/11/02(火) 17:31:29.73
>>139
ちゃんとアーカイブされていた
ちゃんとアーカイブされていた
2021/11/02(火) 18:50:30.74
インターネットアーカイブがサービス終了する未来はあると思いますか?
サーバーの維持費や違法性などが理由で
サーバーの維持費や違法性などが理由で
2021/11/02(火) 18:56:43.14
違法性w
144名無しさん@お腹いっぱい。
2021/11/03(水) 19:05:27.57 internetarchiveに寄付しよう
2021/11/04(木) 01:52:35.20
そういえば訴訟の裁判は今月から始まるんだっけか?
今はどうなってるか分からないけど
https://www.publishersweekly.com/pw/by-topic/digital/copyright/article/84239-judge-sets-tentative-schedule-for-internet-archive-copyright-case.html
今はどうなってるか分からないけど
https://www.publishersweekly.com/pw/by-topic/digital/copyright/article/84239-judge-sets-tentative-schedule-for-internet-archive-copyright-case.html
146名無しさん@お腹いっぱい。
2021/11/04(木) 16:28:58.64 自分のツイートのアーカイブって消そうと思えば消せるの?
2021/11/04(木) 17:46:33.64
2021/11/05(金) 01:58:35.57
APIのレスポンス、リダイレクトの場合も空で返ってくるのか・・・
2021/11/07(日) 05:47:59.29
何この訳分からんエラー
Unknown error for chrome-error://chromewebdata/ (HTTP status=0).
Unknown error for chrome-error://chromewebdata/ (HTTP status=0).
2021/11/13(土) 23:05:28.24
【皆様へ大切なお知らせ】過去動画の公開停止と今後の配信について - YouTube
https://www.youtube.com/watch?v=BLxknbNae14
https://www.youtube.com/watch?v=BLxknbNae14
151名無しさん@お腹いっぱい。
2021/11/14(日) 17:31:28.15 noteとInstagram保存したい
152名無しさん@お腹いっぱい。
2021/11/15(月) 01:03:53.70 ヤフオクのページを取得しようとすると、
Unknown error for chrome-error://chromewebdata/ (HTTP status=0).
と出て取得できない。
Unknown error for chrome-error://chromewebdata/ (HTTP status=0).
と出て取得できない。
2021/11/15(月) 03:36:09.51
>>152
試しに force_get=1 のパラメータを追加して保存させてみると
The server didn't respond in time for https:〜 のエラーが返る。
ヤフオクが Internet Archive の接続を拒否しているのは間違いないね。
ただ、どうしてこれが IA から事前に送られているはずの HEAD リクエストで
検出できていないのかが解らん。
HEAD は 200 OK しておきながらいざ GET となると無応答で、
ヘッドレスブラウザの返したエラーページの chrome-error URL を
そのまま表示しちゃったりしているのか?
パラメータについても HEAD やら GET やらについても >>4 のドキュメントを参照。
試しに force_get=1 のパラメータを追加して保存させてみると
The server didn't respond in time for https:〜 のエラーが返る。
ヤフオクが Internet Archive の接続を拒否しているのは間違いないね。
ただ、どうしてこれが IA から事前に送られているはずの HEAD リクエストで
検出できていないのかが解らん。
HEAD は 200 OK しておきながらいざ GET となると無応答で、
ヘッドレスブラウザの返したエラーページの chrome-error URL を
そのまま表示しちゃったりしているのか?
パラメータについても HEAD やら GET やらについても >>4 のドキュメントを参照。
2021/11/16(火) 06:06:12.95
This page is unavailable for archiving right now!
This page is available on the web but its quite busy. Please check again later.
This page is available on the web but its quite busy. Please check again later.
2021/11/16(火) 19:54:51.84
それって何がbusyなの?元サイト?アーカイブ?
2021/11/16(火) 20:46:36.21
weiboってアーカイブできない?
157名無しさん@お腹いっぱい。
2021/11/17(水) 02:09:52.09 imgurがserver errorやnot foundでとれない
2021/11/17(水) 04:30:52.28
たまにsavepagenowで404NotFoundが出るのは鯖が重いんだろうか
2021/11/17(水) 04:50:37.25
Not FoundだったりThe same snapshot had been made * minutes and ** seconds ago. だったり
2021/11/17(水) 05:16:51.29
Not Foundと出る割には取得できてる場合も
2021/11/17(水) 23:42:00.76
中国とロシアからブロックされてるというのは中国ロシアの国からはアクセスできないってこと?
weibo普通に保存できたけど中国のサイトを日本人がアーカイブするのは可能なんだね
weibo普通に保存できたけど中国のサイトを日本人がアーカイブするのは可能なんだね
2021/11/18(木) 00:21:19.12
>>161
お前が無知だからそんなことで感心していられるんだよ
お前が無知だからそんなことで感心していられるんだよ
2021/11/18(木) 11:09:29.58
無知ですいません
てっきり中華サイトとか無理なのかと思ってた
てっきり中華サイトとか無理なのかと思ってた
2021/11/20(土) 06:50:42.94
Service Unavailable for None (HTTP status=503).
2021/11/21(日) 14:54:01.35
Sorry
Please try again in ~1 min. Crawling this host is paused
because they notified us that are overloaded right now.
Please try again in ~1 min. Crawling this host is paused
because they notified us that are overloaded right now.
2021/11/21(日) 20:24:57.76
in ~1 minってどういう意味なん?
日本語で「〜1分」だったら1分以内だけど文脈的に逆っぽい気がする
もし以上だとしたらどういう原理で前に~が付くんだろうか
日本語で「〜1分」だったら1分以内だけど文脈的に逆っぽい気がする
もし以上だとしたらどういう原理で前に~が付くんだろうか
2021/11/21(日) 20:57:53.56
英語では約 1 分 (approximately)
https://docs.google.com/document/d/19RJsRncGUw2qHqGGg9lqYZYf7KKXMDL1Mro5o1Qw6QI/edit
2021-05-23
(略)
If a target site returns HTTP status=429 (too many requests), we pause crawling that for a minute.
この仕様をそのように説明してるんじゃないのか
https://docs.google.com/document/d/19RJsRncGUw2qHqGGg9lqYZYf7KKXMDL1Mro5o1Qw6QI/edit
2021-05-23
(略)
If a target site returns HTTP status=429 (too many requests), we pause crawling that for a minute.
この仕様をそのように説明してるんじゃないのか
2021/11/21(日) 23:34:58.31
なるほど、約なんだ。
2021/11/22(月) 00:52:22.11
旧~聖書
2021/11/22(月) 23:31:51.26
もしかしてYouTubeのプレイリストでOutlinks使うと
表示されていない下の方の動画も保存しといてくれるのか?
表示されていない下の方の動画も保存しといてくれるのか?
2021/11/23(火) 00:33:15.25
そもそもどういうときに保存されるのかよくわからんぜ
2021/11/23(火) 19:59:31.87
>>170
outlink とは、自ホスト内でなく他ホストへのリンクのことですよ
outlink とは、自ホスト内でなく他ホストへのリンクのことですよ
2021/11/23(火) 20:25:03.86
2021/11/24(水) 20:00:32.10
画像単独でSPNする人いるんだね
2021/11/25(木) 10:09:28.50
普通にやるでしょ。
うpろだやImgurの画像を保存したい時とか。期限切れや削除依頼されてすぐ消えるじゃん。
うpろだやImgurの画像を保存したい時とか。期限切れや削除依頼されてすぐ消えるじゃん。
2021/11/25(木) 15:47:24.28
単独なのかどこかに埋まってたのかはどう判別したらいいの?
2021/11/25(木) 16:32:19.77
画像付きってアーカイブしても何年後とかに消えたりしませんか?
昔のサイトを見ても画像だけ見れないの多くて
昔のサイトを見ても画像だけ見れないの多くて
2021/11/26(金) 02:35:55.32
それは単にアーカーブされてないんだと思う
2021/11/26(金) 05:49:26.19
昔のアーカイヴ技術が微妙で上手く保存できてなかったんでしょ、どうせ。
2021/11/26(金) 12:17:41.76
今でもJavaScript乱用していてスクロールやクリックしないとサイトの内容が完全に表示されなかったり、
レイジーロードで遅延読み混みしてるサイトは画像が保存されてない可能性がある。
画像のURLを抜き出してSPNで1個ずつ保存するのが一番確実だけど、まあめんどくさい。
Googlebotですら対応できてないものをIAでできないだろうな。
レイジーロードで遅延読み混みしてるサイトは画像が保存されてない可能性がある。
画像のURLを抜き出してSPNで1個ずつ保存するのが一番確実だけど、まあめんどくさい。
Googlebotですら対応できてないものをIAでできないだろうな。
2021/11/26(金) 13:56:44.46
そもそもヘッドレスブラウザを実装して、必要な画像も一緒に保存できるようになったのが
Internet Archive の長い歴史の中でごく最近の話なんだけどな。
それまではアーカイブ済み HTML を誰かが表示して初めて画像の URL が IA に送られ
保存を試行するという仕組みが採られていたけど、種々の利用により
上手く動作しないことがあった。
Internet Archive の長い歴史の中でごく最近の話なんだけどな。
それまではアーカイブ済み HTML を誰かが表示して初めて画像の URL が IA に送られ
保存を試行するという仕組みが採られていたけど、種々の利用により
上手く動作しないことがあった。
182名無しさん@お腹いっぱい。
2021/11/26(金) 17:30:44.16 昨日辺りからTwitterのツイートのページを取得すると新UIになってしまった・・・
数日前までは取得すると何故か旧UIで取得されるようになってたけど、ついに対策されたか・・・
数日前までは取得すると何故か旧UIで取得されるようになってたけど、ついに対策されたか・・・
183名無しさん@お腹いっぱい。
2021/11/26(金) 23:50:05.84 twitterの魚拓の質が上がってきてるな
2021/11/27(土) 20:44:50.24
俺が7月にSPNで保存したページに表示されていた、保存失敗した画像を、
11月の今になってsave-page-now-outlinksが保存してるのを発見した。
過去のページをさかのぼって保存できてない画像を自動で保存してくれるのはありがたい。
11月の今になってsave-page-now-outlinksが保存してるのを発見した。
過去のページをさかのぼって保存できてない画像を自動で保存してくれるのはありがたい。
2021/11/28(日) 14:35:12.25
wayforwardって以前waybackmachineから削除されたサイトでもタイムカプセル出来るの?
2021/11/28(日) 20:47:12.32
>>181
ページ中の画像が取得されるようになったのってマジで最近(2020年)だしな
ページ中の画像が取得されるようになったのってマジで最近(2020年)だしな
2021/11/28(日) 23:36:13.01
まあ大変なのは素人目にもわかるわ
2021/11/30(火) 01:01:47.65
No URL has been captured for this domain.
日本語がURLに入ると上のように出てダメです
どうやって保存したら良いですか?
初心者なので誰か教えて下さると有難いです
日本語がURLに入ると上のように出てダメです
どうやって保存したら良いですか?
初心者なので誰か教えて下さると有難いです
2021/11/30(火) 19:41:07.68
2021/11/30(火) 21:27:20.15
191名無しさん@お腹いっぱい。
2021/12/01(水) 15:39:29.57 >>174
NHK系とか素直じゃない構造のやつとか期間が来たら別画像で上書きしたり引っ越したりするサイトで必要
NHK系とか素直じゃない構造のやつとか期間が来たら別画像で上書きしたり引っ越したりするサイトで必要
2021/12/01(水) 22:24:22.95
>>186
えー、/web/http://&#12316;をWebブラウザから見て、そのページの画像が保存されてなかったら自動で元のサイトに取りに行って保存して表示する仕組みは昔からあったよ。
少なくとも10年前にはあったはず。今のSave Page Nowの前身Liveweb Proxyでもやってた。SPN登場前は今みたいな同時保存回数の制限すらなかった。
といっても、サイト消えてる時にWayback Machineの保存ページを見るのがほとんどだから、消えたサイトの保存されてない画像は永遠に表示されないのが現実なわけで。
えー、/web/http://&#12316;をWebブラウザから見て、そのページの画像が保存されてなかったら自動で元のサイトに取りに行って保存して表示する仕組みは昔からあったよ。
少なくとも10年前にはあったはず。今のSave Page Nowの前身Liveweb Proxyでもやってた。SPN登場前は今みたいな同時保存回数の制限すらなかった。
といっても、サイト消えてる時にWayback Machineの保存ページを見るのがほとんどだから、消えたサイトの保存されてない画像は永遠に表示されないのが現実なわけで。
2021/12/01(水) 23:32:05.46
それの話をしてるんじゃないと思うよ…
それはレス元の>>181が言ってるやつの派生かと
それはレス元の>>181が言ってるやつの派生かと
2021/12/02(木) 20:17:19.41
リダイレクトのとき、if_not_archived_within が効かない
2021/12/02(木) 22:42:31.47
えー効いてるように思えるけどな
逆に、直近の 200 応答のアーカイブが無視されてしまい、
アーカイブしない条件のはずなのにアーカイブしてしまったことがある
逆に、直近の 200 応答のアーカイブが無視されてしまい、
アーカイブしない条件のはずなのにアーカイブしてしまったことがある
2021/12/03(金) 00:33:15.45
前スレ836で捨てアドでアカウント作れないって書いてる人いたけど、色々試したが今は作れるみたい。
ただし、アップロードするときにお前のメアドはスパム臭えってエラーが出ることがあるので、
適当すぎる文字列じゃなくてフィルタに引っかからない自然なメアドでアカウント作ればOK。
ただし、アップロードするときにお前のメアドはスパム臭えってエラーが出ることがあるので、
適当すぎる文字列じゃなくてフィルタに引っかからない自然なメアドでアカウント作ればOK。
2021/12/03(金) 00:36:39.06
あと、
ttp://web.archive.org/*/から始まる保存されてるページを一覧表示してくれる機能がちょっと新しくなったみたいで、表示できない問題が起きてる。
フォームにも書いてる人いる。
ttps://archive.org/post/1121385/urls-feature-on-wayback-machine-is-broken
ttp://web.archive.org/*/から始まる保存されてるページを一覧表示してくれる機能がちょっと新しくなったみたいで、表示できない問題が起きてる。
フォームにも書いてる人いる。
ttps://archive.org/post/1121385/urls-feature-on-wayback-machine-is-broken
2021/12/03(金) 16:05:14.95
今のところ197のエラーは直ったかな
2021/12/03(金) 20:38:52.18
サイト側から削除依頼以外で消されることってあるの?excludedって出る。復活掲載は絶望的かしら。
2021/12/03(金) 23:27:32.07
永久に残るなんて有り得ないからね
2021/12/04(土) 10:23:17.08
save out linksにチェックを入れてるのに無視しやがる…
最近は取得エラーも多発してたし、そんなに負荷のかかる代物なのだろうか…
最近は取得エラーも多発してたし、そんなに負荷のかかる代物なのだろうか…
202名無しさん@お腹いっぱい。
2021/12/04(土) 10:35:35.43 IAに削除させたのに自社サイトに他社のIAアーカイブURLのリンク貼ってる企業ってどう思いますか?
A「B社は過去にこんなサイト内容でした、と」
A「おいIA、勝手にうちのサイトをアーカイブしてんじゃねえ!」
A「B社は過去にこんなサイト内容でした、と」
A「おいIA、勝手にうちのサイトをアーカイブしてんじゃねえ!」
2021/12/04(土) 12:03:29.09
>>202
中国人・朝鮮人・韓国人や奴らの政府の身になって考えてみなよ。
中国人・朝鮮人・韓国人や奴らの政府の身になって考えてみなよ。
204名無しさん@お腹いっぱい。
2021/12/04(土) 15:02:23.86 >>203
難しすぎてわかりません。
難しすぎてわかりません。
2021/12/04(土) 19:05:52.50
Unknown error多すぎ
2021/12/05(日) 16:41:53.58
なんか最近3分の2くらいの確率で保存できない
2021/12/05(日) 19:37:59.98
Unknown error for chrome-error://chromewebdata/ (HTTP status=0).
これはもう諦めるしかない?
これはもう諦めるしかない?
2021/12/06(月) 18:56:36.91
Firefox のプライベートモードで https://archive.org/ を開いて入力欄に文字を入れると
その文字が見えなくなってしまうという問題が起きていたけど、直ったのね
その文字が見えなくなってしまうという問題が起きていたけど、直ったのね
2021/12/08(水) 00:32:57.69
https://web.archive.org/web/*/
でドメインとディレクトリ指定して保存されてるページが一覧で見れるのが改悪してる!
今まで10万ページまでだったのに、1万ページに減ってるんだが
More than 10,000 URLs have been captured for this URL prefix.
でドメインとディレクトリ指定して保存されてるページが一覧で見れるのが改悪してる!
今まで10万ページまでだったのに、1万ページに減ってるんだが
More than 10,000 URLs have been captured for this URL prefix.
2021/12/08(水) 22:28:45.46
ここの老舗魚拓サイトって、BATとかいう仮想通貨をコジってるよな
Braveってブラウザ使って閲覧すると、寄付の案内が出てくるんだが
この話既出だったらゴメン
Braveってブラウザ使って閲覧すると、寄付の案内が出てくるんだが
この話既出だったらゴメン
2021/12/09(木) 22:30:51.97
そりゃBraveブラウザで広告費や寄付受け取るサイト運営者の登録やってるから表示はするでしょ。
寄附キャンペーン中だからってのもあるだろうけど、気になるなら広告ブロックか何かで要素ごと消せばいいよ。
寄附キャンペーン中だからってのもあるだろうけど、気になるなら広告ブロックか何かで要素ごと消せばいいよ。
2021/12/10(金) 05:27:52.68
BATが寄付出来るのはBraveブラウザの基本機能なんだがな・・・
単なるアドブロッカーか何かと勘違いしてないか?
単なるアドブロッカーか何かと勘違いしてないか?
2021/12/11(土) 13:17:53.59
https://web.archive.org/429.html
へぇーこんなページがあるんだ
https://web.archive.org/save/status/user からここへリダイレクトされたわw
へぇーこんなページがあるんだ
https://web.archive.org/save/status/user からここへリダイレクトされたわw
![](http://o.5ch.net/1vpbv.png)
2021/12/11(土) 17:06:24.95
腹立つわ 鍵の開け閉めを繰り返してすぐツイ消しする奴のツイート記録しようと思ったのにここ最近上手く記録してくれないから記録出来てない内にツイート消された
そもそもツイ垢のトークンとか使えるようにしてくれたら鍵垢の鍵が開くまで待って開いた瞬間から開いてる内に飢えたピラニアみたいにアーカイブ録りまくる必要もなくなるのに
そもそもツイ垢のトークンとか使えるようにしてくれたら鍵垢の鍵が開くまで待って開いた瞬間から開いてる内に飢えたピラニアみたいにアーカイブ録りまくる必要もなくなるのに
2021/12/11(土) 21:41:13.96
Twitterは、
https://web.archive.org/ (いつも失敗)と
https://archive.today の両方で保存してるわ
https://archive.md/EczQp
https://web.archive.org/ (いつも失敗)と
https://archive.today の両方で保存してるわ
https://archive.md/EczQp
2021/12/11(土) 21:57:37.67
>>214
自身はTwitterにログインしてないブラウザで取りに行ってるの?
俺が巡回してた鍵アカのログは直接本人にフォロー承認もらったから残そうと思えば何時でもブラウザのページ保存で残せるけど…
最近のTwitter社はアーカイブするとレイアウトが崩れたり議論ツリー記録しに行っても余計な「固定ツイート」まで混ざったりして改悪し過ぎだけど…
自身はTwitterにログインしてないブラウザで取りに行ってるの?
俺が巡回してた鍵アカのログは直接本人にフォロー承認もらったから残そうと思えば何時でもブラウザのページ保存で残せるけど…
最近のTwitter社はアーカイブするとレイアウトが崩れたり議論ツリー記録しに行っても余計な「固定ツイート」まで混ざったりして改悪し過ぎだけど…
2021/12/11(土) 22:36:19.94
2021/12/11(土) 23:55:31.56
>>214
今仕方なくPCとスマホアプリのTL参照しながらどれが消えててどれが消えてないかを確かめながらスクショをペイントに貼って1日のツイート纏めてるところ
twitterのTLもずっと残らないのが腹立つんだよなぁ
やり方さえ知ってればネット使える誰もが見れるってのがいいんだよ
暇さえあれば消えたツイ垢のツイートひたすら漁ったりするし何年も活動してる垢が将来的に消える可能性に備えてウン万ある過去のツイートを一個一個手作業で保存させたり…
この保存作業もたった一人の人力だと不毛なんだよなぁ Wayback machineが自動でツイート取るようになる以前のツイートも自動で集めとけよって思う
今仕方なくPCとスマホアプリのTL参照しながらどれが消えててどれが消えてないかを確かめながらスクショをペイントに貼って1日のツイート纏めてるところ
twitterのTLもずっと残らないのが腹立つんだよなぁ
やり方さえ知ってればネット使える誰もが見れるってのがいいんだよ
暇さえあれば消えたツイ垢のツイートひたすら漁ったりするし何年も活動してる垢が将来的に消える可能性に備えてウン万ある過去のツイートを一個一個手作業で保存させたり…
この保存作業もたった一人の人力だと不毛なんだよなぁ Wayback machineが自動でツイート取るようになる以前のツイートも自動で集めとけよって思う
2021/12/12(日) 03:19:28.82
2:00くらいからずっと503 Service Unavailable
2021/12/12(日) 09:50:54.47
TLS1.2の壁なのかどうしても取れなかったり、表示レイアウトの異なるUserAgent別(PC⇔スマホ⇔ガラケー等)には直接取り分けらなかったりするのは、いったんローカル保存してからどっかのレンタル鯖に上げ直してアーカイブしている。
2021/12/13(月) 20:11:59.31
jsonファイルで保存されたツイートのアーカイブって復元出来んのかなぁ
何て描かれてたかすらわからん
何て描かれてたかすらわからん
2021/12/14(火) 00:44:54.05
最終的に残りそうなアーカイブサイトは何処?
やはりウェイバックマシン?
やはりウェイバックマシン?
223名無しさん@お腹いっぱい。
2021/12/14(火) 16:23:58.84 ウェイバック
2021/12/14(火) 17:05:35.98
営利企業がやってるやつとかtodayみたいに素性が不明のものは消える可能性が高いと思う
残るのはIAかCommon Crawlらへんだと思う
残るのはIAかCommon Crawlらへんだと思う
2021/12/14(火) 18:47:58.89
Waybackは広く浅くはいけるが深い所まで保存出来んのがな
ツイートの2分までしかアップロード出来ん動画すら保存されないという有様だ
動画みたいな重めのファイルを自分の手許にずっと置きたくはないけどネット上からは消えさせないようにするにはどこにアップロードするのがいいんだろうか?
ツイートの2分までしかアップロード出来ん動画すら保存されないという有様だ
動画みたいな重めのファイルを自分の手許にずっと置きたくはないけどネット上からは消えさせないようにするにはどこにアップロードするのがいいんだろうか?
2021/12/14(火) 19:44:04.04
227名無しさん@お腹いっぱい。
2021/12/14(火) 21:56:30.93 twitterのプロフィールを片っ端から手動保存してる人おる?
228名無しさん@お腹いっぱい。
2021/12/14(火) 23:01:17.40 Waybackは保存してるサイト自体は多くて助かるんだが検索機能が糞過ぎるんよな
229名無しさん@お腹いっぱい。
2021/12/14(火) 23:02:57.85 昨日からサイトマップが何も表示されないんだが俺だけか?
https://web.archive.org/web/sitemap/http://www.2ch.net/
https://web.archive.org/web/sitemap/http://www.2ch.net/
230名無しさん@お腹いっぱい。
2021/12/15(水) 11:31:05.78 高性能なワード検索機能欲しいよな
2021/12/16(木) 00:50:27.36
URL部分マッチと<title>検索だけでもあれば全然違う
2021/12/16(木) 22:47:16.08
PDF検索は出来るようになったっぽい?
2021/12/19(日) 15:01:04.51
Youtubeの規制が緩くなったと思ったら今度はTwitterが厳しくなってる
前から思うけど1分待っても取れないの笑う
Sorry
Please try again in ~1 min. Crawling this host is paused because they notified us that are overloaded right now.
前から思うけど1分待っても取れないの笑う
Sorry
Please try again in ~1 min. Crawling this host is paused because they notified us that are overloaded right now.
2021/12/19(日) 20:12:59.69
CDX APIのURLはweb.archive.org/cdx/以降は適当でも大丈夫なんだな
2021/12/19(日) 20:24:57.52
( >ω<)/~~ ~1 min
2021/12/21(火) 06:05:09.19
API調子悪い
2021/12/22(水) 12:56:49.40
>>233
Google検索結果も取りにくい
Google検索結果も取りにくい
2021/12/24(金) 21:50:09.68
Sorry
This URL is in our block list and cannot be captured.
これ初めて見た。公式Twitterだし変な内容でもないのに
This URL is in our block list and cannot be captured.
これ初めて見た。公式Twitterだし変な内容でもないのに
2021/12/25(土) 01:03:49.06
2021/12/25(土) 02:45:51.97
インターネットアーカイブが存在する意味が無くなる
2021/12/25(土) 11:12:34.49
まあ別にSPNに頼らず、捨て垢作ってarchive.orgの方にwarcかzipでアップロードしとけば保存できるし、
将来非表示ブロックが解除されたときに見れればいいので、ブロックされてようがあんまり気にはしない。
将来非表示ブロックが解除されたときに見れればいいので、ブロックされてようがあんまり気にはしない。
242名無しさん@お腹いっぱい。
2021/12/27(月) 18:52:49.92 twitterの保存制限する理由がよくわからん
2021/12/29(水) 20:59:16.27
Twitter公式がムチャクチャ重くなったからツイート本文だけ取りたい場合は
「Twitter検索サービス( https://t-proj.com/twitter/ )」
のキャッシュログから取ったりする。
「Twitter検索サービス( https://t-proj.com/twitter/ )」
のキャッシュログから取ったりする。
2021/12/31(金) 15:53:34.66
>>225
ソースコードから動画のURL(pbs.twimg.comから始まるやつ)を抜き出して、そのURLをそのまま保存すればいいよ、
と思ったが、最近Twitterの動画は仕様が変わって、mp4ファイルとかじゃなくて、m3u8とm4sファイルで小分けになってるのか。
UserAgent変えて昔のWebブラウザのに変えても完全なmp4ファイルのURLが流れてこなかった。
これは保存できないな。
ソースコードから動画のURL(pbs.twimg.comから始まるやつ)を抜き出して、そのURLをそのまま保存すればいいよ、
と思ったが、最近Twitterの動画は仕様が変わって、mp4ファイルとかじゃなくて、m3u8とm4sファイルで小分けになってるのか。
UserAgent変えて昔のWebブラウザのに変えても完全なmp4ファイルのURLが流れてこなかった。
これは保存できないな。
2021/12/31(金) 20:49:57.68
そういうやつ困るわね
2021/12/31(金) 23:32:11.69
m3u8ったらアニメイトのWebラジオをひさびさ端末に保存試行したさい遭遇して苦闘したことあったな…
あの後すぐ配信変更でもう付き合いきれなくなったわ
あの後すぐ配信変更でもう付き合いきれなくなったわ
2022/01/01(土) 01:14:26.06
あけましておめでとうございます
2022/01/01(土) 04:26:13.37
明けましておめでとう。
前からあるTwitterの動画URL抽出するサイトにツイートのURLを入れると、mp4とm4sファイルのURL一覧が出てくる。今でも機能するっぽい。(アフィ広告注意)
ttps://lab.syncer.jp/Tool/Twitter-Video-URL-Converter/
ちょっと検索して出てきたのは、Bearerトークンを使えばAPIからmp4のURLを抜き出せるらしい。こんなツールを公開してる人もいる。
ttps://github.com/89z/mech/tree/master/twitter
動画URL単独の保存もいいけど、保存したツイートのスナップショット自体に動画が表示されて再生できないと、証拠目的なら意味ない気がする・・・
前からあるTwitterの動画URL抽出するサイトにツイートのURLを入れると、mp4とm4sファイルのURL一覧が出てくる。今でも機能するっぽい。(アフィ広告注意)
ttps://lab.syncer.jp/Tool/Twitter-Video-URL-Converter/
ちょっと検索して出てきたのは、Bearerトークンを使えばAPIからmp4のURLを抜き出せるらしい。こんなツールを公開してる人もいる。
ttps://github.com/89z/mech/tree/master/twitter
動画URL単独の保存もいいけど、保存したツイートのスナップショット自体に動画が表示されて再生できないと、証拠目的なら意味ない気がする・・・
2022/01/01(土) 21:39:29.68
動画とか画像のURLから元記事がわからないからな
2022/01/03(月) 11:52:12.86
The capture is estimated to start in 367 minutes
6時間待ち
6時間待ち
2022/01/03(月) 11:58:05.21
3分ぐらいほっといたら保存終わってた
待ち時間の計算ガバガバすぎない?
待ち時間の計算ガバガバすぎない?
2022/01/03(月) 14:58:50.23
たまにestimated toが表示されずに、割り込みですぐ保存できる場合もあるな
タイミング良く保存してるサーバーが空いたのかは知らんが謎
タイミング良く保存してるサーバーが空いたのかは知らんが謎
2022/01/03(月) 23:40:25.27
2022/01/04(火) 13:34:43.15
今日はPDFの保存がしづらい
2022/01/04(火) 14:43:51.33
永遠のクルクル挙動で取れない…
2022/01/04(火) 16:17:38.71
2022/01/08(土) 19:23:32.92
ツイッターとれない
258名無しさん@お腹いっぱい。
2022/01/10(月) 19:03:37.94 twitter取れないのどうにかならないのか?
2022/01/13(木) 21:15:26.72
archive.orgのページ上部の〇〇billionの数字を更新し忘れてるのいつ気づくんだろ?w
どうでもいいといえばどうでもいいんだけど
どうでもいいといえばどうでもいいんだけど
260名無しさん@お腹いっぱい。
2022/01/17(月) 08:32:14.67 503 Service Unavailable
No server is available to handle this request.
No server is available to handle this request.
2022/01/17(月) 15:38:02.43
PDF・画像絡みだけ時間かかるときがあるが、
今日は全般的に時間かかる
今日は全般的に時間かかる
2022/01/17(月) 15:42:44.22
失礼、そこまででもなかった
2022/01/17(月) 22:20:01.40
Twitterはもう取得出来ないっぽいか
2022/01/18(火) 03:58:18.45
The capture is estimated to start in 23 hours, 56 minutes.
( ゚д゚)
( ゚д゚)
2022/01/18(火) 13:02:41.80
You may close your browser window and the page will still be saved.
といっても保存できてたりできてなかったり
といっても保存できてたりできてなかったり
2022/01/18(火) 16:01:41.49
archive.is は http:// アクセスが https:// へ強制リダイレクトされちまうのをどうにかしてほしい
更新の頻繁なページを後で archive.org へ追加取りするとき、リンク先のオリジナルURLが判別可能なまま再アーカイブするには
anonymous のWebプロキシ( http://anonymouse.org/cgi-bin/anon-www.cgi/http://www.〜 )経由でないと取れない仕様だったけど、anonymous はSSLアクセスに非対応だから http:// のままでないと接続エラーになっちまう…
更新の頻繁なページを後で archive.org へ追加取りするとき、リンク先のオリジナルURLが判別可能なまま再アーカイブするには
anonymous のWebプロキシ( http://anonymouse.org/cgi-bin/anon-www.cgi/http://www.〜 )経由でないと取れない仕様だったけど、anonymous はSSLアクセスに非対応だから http:// のままでないと接続エラーになっちまう…
2022/01/19(水) 06:39:39.44
なんか先週末の停電の後から、SPNの保存の仕様変わった?
今まで30秒ぐらいで保存できたのに、1分近くかかってるんだが
ブラウザでもcurlでも遅くなってるし、単独の画像やPDFファイルはここ数日保存できてない
保存始まる待ち時間増えたような感覚
ヘッダーにcapture_outlinks=0を付けても早くならないし
今まで30秒ぐらいで保存できたのに、1分近くかかってるんだが
ブラウザでもcurlでも遅くなってるし、単独の画像やPDFファイルはここ数日保存できてない
保存始まる待ち時間増えたような感覚
ヘッダーにcapture_outlinks=0を付けても早くならないし
2022/01/19(水) 07:04:29.09
Sorry
Cannot start capture
保存すらできん
このエラー初めて見た
Cannot start capture
保存すらできん
このエラー初めて見た
2022/01/20(木) 14:05:44.79
保存に少し時間がかかって違和感あるのを除いて上の障害は解消済み。
日本時間19日の朝5時半〜8時半は、save-page-nowの保存ファイルが1個しかないから、この時間帯は保存できなくて止まってたっぽい。
公式な発表はないし、発表すらしないだろうけど、記録として残しとくわ。
ttps://archive.org/details/save-page-now?&sort=-addeddate
spn2-20220118234307 Jan 18, 2022 web ← 通常の追加間隔
spn2-20220118233913 Jan 18, 2022 web ← 3時間でようやく新しいファイル、この間Save Page Now停止
spn2-20220118203649 Jan 18, 2022 web ← 18分
spn2-20220118201816 Jan 18, 2022 web ← 通常は1分〜10分で1個増えるのに、前のファイルからの間隔が24分
spn2-20220118195414 Jan 18, 2022 web
日本時間19日の朝5時半〜8時半は、save-page-nowの保存ファイルが1個しかないから、この時間帯は保存できなくて止まってたっぽい。
公式な発表はないし、発表すらしないだろうけど、記録として残しとくわ。
ttps://archive.org/details/save-page-now?&sort=-addeddate
spn2-20220118234307 Jan 18, 2022 web ← 通常の追加間隔
spn2-20220118233913 Jan 18, 2022 web ← 3時間でようやく新しいファイル、この間Save Page Now停止
spn2-20220118203649 Jan 18, 2022 web ← 18分
spn2-20220118201816 Jan 18, 2022 web ← 通常は1分〜10分で1個増えるのに、前のファイルからの間隔が24分
spn2-20220118195414 Jan 18, 2022 web
2022/01/20(木) 19:31:02.77
1回保存できませんでした…ってエラー吐かれたら何度保存させ直しても保存されないもんなの?
すっげぇ腹立つ
すっげぇ腹立つ
2022/01/21(金) 08:49:08.28
まあ相変わらずな常態だな
Archive.st も重くて取り込みエラー頻発中
Archive.st も重くて取り込みエラー頻発中
2022/01/21(金) 22:29:24.38
うーん、Twitterが死ぬとは思わなかった
Unknown errorだから詳細は分からないけど、Twitter側から拒絶されてるのか?
Unknown errorだから詳細は分からないけど、Twitter側から拒絶されてるのか?
273名無しさん@お腹いっぱい。
2022/01/22(土) 19:10:56.08 twitterとれるようになったね
274名無しさん@お腹いっぱい。
2022/01/22(土) 19:31:50.70 今度は Archive.is が死んでるよ…
2022/01/22(土) 21:37:09.07
ここ大体死んでる話ばっかやな
2022/01/23(日) 07:10:05.41
>>266
このサイトを使うのはどうかな
webページに注釈をつけて共有するのがメイン機能だけどプロキシとしても使える
非営利団体が運営してて学術団体と連携したりしてるから信頼性もそれなりにあると思う
稀にアクセスできないサイトもあるけど大抵はうまくいく
https://via.hypothes.is/http://www.〜
このサイトを使うのはどうかな
webページに注釈をつけて共有するのがメイン機能だけどプロキシとしても使える
非営利団体が運営してて学術団体と連携したりしてるから信頼性もそれなりにあると思う
稀にアクセスできないサイトもあるけど大抵はうまくいく
https://via.hypothes.is/http://www.〜
2022/01/23(日) 11:42:27.84
>>276
ありがと。そっちでArchive.isの拓へアクセスしても画像認証通さないと取ったページが開けないから .orgへの再アーカイブには使えそうにないけど他の取り方で選択肢が拡がりそうだ。
ありがと。そっちでArchive.isの拓へアクセスしても画像認証通さないと取ったページが開けないから .orgへの再アーカイブには使えそうにないけど他の取り方で選択肢が拡がりそうだ。
2022/01/23(日) 11:49:14.48
… .is アーカイブ済みページの画像認証も https:// 強制化で始まったけど、端末ブラウザの直アクセスなら今のところは異なる数種の UserAgent 変更でスルーできる。
2022/01/23(日) 15:21:44.44
ふむ
2022/01/23(日) 16:05:22.21
2022/01/23(日) 20:06:48.89
Sorry
Cannot save Internet Archive URLs!
https://web.archive.org/web/20220122124542/http://sanukisoraumi.blog.***.com/blog-entry-996.html.
Cannot save Internet Archive URLs!
https://web.archive.org/web/20220122124542/http://sanukisoraumi.blog.***.com/blog-entry-996.html.
2022/01/23(日) 20:31:59.27
GoogleとヤフーJAPANの画像検索結果が日本語の検索ワードだと変なパラメータ文字列に入れ替わられて、取りたいリンクとサムネイルが取れなくなってやがる。
ウェブ魚拓もMetaタグ妨害で既に取れなくなってやがるし…
ウェブ魚拓もMetaタグ妨害で既に取れなくなってやがるし…
2022/01/25(火) 17:48:32.48
保存されたページから違うページに飛べない(正確には同じページだけどリンク先をクリックすると補足が書いてある感じ)
urlが同じなのでこういう時はどうすれば良いんだろう初心者ですみません
urlが同じなのでこういう時はどうすれば良いんだろう初心者ですみません
2022/01/25(火) 21:17:12.42
>>283
ページ更新なしでサーバー情報とってきて内容が変化するサイト(例:google map)とか
更新有りで同じURLだけど、ユーザーのアクションに依存して内容が変化するサイト(例:画像認証付きサイト)とかは難しいと思う
実際に確認しないと分からないけどこのケースは後者に近いのかな?
Waybackでの保存が無理そうなら、Webrecorderとかのソフトを使ってローカル環境に保存するしか方法はないかもね
(※独自にローカル保存したアーカイブファイルを直接IAにアップすることは可能。ただしwaybackからの参照は不可)
ページ更新なしでサーバー情報とってきて内容が変化するサイト(例:google map)とか
更新有りで同じURLだけど、ユーザーのアクションに依存して内容が変化するサイト(例:画像認証付きサイト)とかは難しいと思う
実際に確認しないと分からないけどこのケースは後者に近いのかな?
Waybackでの保存が無理そうなら、Webrecorderとかのソフトを使ってローカル環境に保存するしか方法はないかもね
(※独自にローカル保存したアーカイブファイルを直接IAにアップすることは可能。ただしwaybackからの参照は不可)
2022/01/26(水) 01:00:59.97
Archive.st で取った分を.orgへ転送する形でページ内容の意図しない改変は避けれる場合もあるけど .stのエンジンが不具合長引きがちだからなあ
2022/01/26(水) 01:57:26.30
ローカル保存って今もあるんだ
なんか大昔そういうソフトで保存してたけどhttps非対応で最近のやつ全然取れなくなってしまったので離れていた
なんか大昔そういうソフトで保存してたけどhttps非対応で最近のやつ全然取れなくなってしまったので離れていた
2022/01/26(水) 15:12:35.98
サイトのTOPから階層段でまとめ取りするやつはAndroid用でTLS1.2対応アプリがあるかも
2022/01/26(水) 23:30:50.77
全巡回したいねえ
2022/01/29(土) 21:06:23.44
ブログだったらサイトマップや記事一覧ページを見れば全てのURL探すの楽だけどな
たまにサイトマップを非表示にしてるブログもあるけどさ
たまにサイトマップを非表示にしてるブログもあるけどさ
2022/02/05(土) 11:46:13.30
こないだまで問題なく使えてたのにirvineでファイルのダウンロードができなくなった
403エラーで切されてる・・・どうすればいいの
403エラーで切されてる・・・どうすればいいの
2022/02/08(火) 20:03:05.74
Sorry.
This snapshot cannot be displayed due to an internal error.
This snapshot cannot be displayed due to an internal error.
292名無しさん@お腹いっぱい。
2022/02/11(金) 06:25:36.17 Got an HTTP 302 response at crawl time
これが出て開けないんだけど、どうすりゃいい?
これが出て開けないんだけど、どうすりゃいい?
2022/02/11(金) 07:38:53.86
そのリダイレクト先が未アーカイブなら、ご愁傷様としか
294名無しさん@お腹いっぱい。
2022/02/11(金) 10:54:11.582022/02/11(金) 11:21:47.72
2022/02/13(日) 21:12:12.36
>>294
カレンダーのとこのURLを直接開く
ダメなら そのURLの魚拓とArchive.todayを開く
ダメなら そのURLのGoogleキャッシュとBingキャッシュを探す
ここまでしてダメなら諦めるしかない
カレンダーのとこのURLを直接開く
ダメなら そのURLの魚拓とArchive.todayを開く
ダメなら そのURLのGoogleキャッシュとBingキャッシュを探す
ここまでしてダメなら諦めるしかない
2022/02/14(月) 21:49:48.84
boothの魚拓が綺麗に取れない…
2022/02/15(火) 10:37:47.00
>>297
ブラウザ上のスクリプトで画像の読み込み処理してるっぽいからURLが違うとうまく動かないのかな
見た目だけでいいならwayback machineにユーザーログイン後に"Save screen shot"からスクショ保存したり、archive.today使ったりすれば保存できるよ
ブラウザ上のスクリプトで画像の読み込み処理してるっぽいからURLが違うとうまく動かないのかな
見た目だけでいいならwayback machineにユーザーログイン後に"Save screen shot"からスクショ保存したり、archive.today使ったりすれば保存できるよ
2022/02/15(火) 15:58:32.32
アフィでない個人サイトでoutlinksしてFirstArchive連発すると、
「ん゛ぎも゛ぢい゛い゛ぃ゛っ」ってなる
「ん゛ぎも゛ぢい゛い゛ぃ゛っ」ってなる
2022/02/15(火) 16:51:39.80
>>298
ありがとう。スクリーンショット試してみるよ。
ありがとう。スクリーンショット試してみるよ。
2022/02/16(水) 21:40:43.32
2022/02/19(土) 10:06:34.35
>>301
初雪に足跡つけるような気持ちになれる
初雪に足跡つけるような気持ちになれる
2022/02/19(土) 16:49:11.58
むしろちょっと申し訳ない気分になる
2022/02/19(土) 23:51:17.14
Too Many Requests
In order to protect the Wayback Machine we have limits on different services. Unfortunately you have hit one of those limits. It can be caused by:
Being an automatic bot that does not appear to be human
A playback page that has an unusual number of components
Excessive load on the Wayback machine not related to your activities
Saving too many pages in a give time frame
The best solution is to wait a few seconds and reload the existing page.
Please feel free to write to us at info@archive.org if you have questions about this. Please include the following information in your email:
Reference number: 0.000.000.00
Date: Saturday, 19-Feb-2022 14:47:00 GMT
Thank you
In order to protect the Wayback Machine we have limits on different services. Unfortunately you have hit one of those limits. It can be caused by:
Being an automatic bot that does not appear to be human
A playback page that has an unusual number of components
Excessive load on the Wayback machine not related to your activities
Saving too many pages in a give time frame
The best solution is to wait a few seconds and reload the existing page.
Please feel free to write to us at info@archive.org if you have questions about this. Please include the following information in your email:
Reference number: 0.000.000.00
Date: Saturday, 19-Feb-2022 14:47:00 GMT
Thank you
2022/02/21(月) 13:07:58.16
アーカイヴを読み込んで画像が保存される謎
2022/02/21(月) 14:10:03.93
取得からだいぶ時間経過してるのに
「Hrm.
The Wayback Machine has not archived that URL.」
数日後きちんと反映されてるなら良いが・・・
「Hrm.
The Wayback Machine has not archived that URL.」
数日後きちんと反映されてるなら良いが・・・
2022/02/21(月) 17:27:12.56
306の件ようやく反映
2022/02/22(火) 17:36:35.60
画像だけ完全別サーバーにあるせいで
画像が保存されていなくてOutlinksで保存し直し。
Outlinksを使うとリンクされてる別記事を
通常保存してしまうので全てOutlinksし直し。
画像が保存されていなくてOutlinksで保存し直し。
Outlinksを使うとリンクされてる別記事を
通常保存してしまうので全てOutlinksし直し。
2022/02/28(月) 03:24:29.58
自分のスマホだけなのかURL貼り付けられない
めんどくさ
めんどくさ
2022/03/04(金) 01:25:46.71
Your IP address is in our block list. Please email us at "info@archive.org" if you would like to discuss this more.
さっき使ってたVPNのIPアドレスがブロックリスト入りになってた、SPNで保存できない
このIPアドレスでどっかの業者が宣伝スパムでもやったんかな
さっき使ってたVPNのIPアドレスがブロックリスト入りになってた、SPNで保存できない
このIPアドレスでどっかの業者が宣伝スパムでもやったんかな
2022/03/04(金) 17:06:43.00
またThe capture is estimated to start in ** minutes. You may close your browser window and the page will still be saved.か
エラーも出やすいし
今日でも未明はなんともなかったのに・・・
エラーも出やすいし
今日でも未明はなんともなかったのに・・・
2022/03/04(金) 23:30:37.42
とうとうアクセスできなくなった
2022/03/04(金) 23:52:15.28
なんかサーバーに繋がりにくいというか、全然繋がらない
2022/03/04(金) 23:56:22.98
Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
2022/03/05(土) 00:38:01.10
ttps://twitter.com/internetarchive/status/1499762397455679488
また停電だって
https://twitter.com/5chan_nel (5ch newer account)
また停電だって
https://twitter.com/5chan_nel (5ch newer account)
2022/03/05(土) 00:40:44.46
日本時間で午後11時20分ぐらいから止まってる
ttps://analytics0.archive.org/stats/wb.php
ttps://analytics0.archive.org/stats/wb.php
2022/03/05(土) 00:46:59.99
みんな寄付してる?
便利に使ってるからちょっとくらい寄付しようかと思うんだけど
やっぱ30万くらいじゃ少ないのかな?
便利に使ってるからちょっとくらい寄付しようかと思うんだけど
やっぱ30万くらいじゃ少ないのかな?
2022/03/05(土) 00:53:45.12
https://twitter.com/internetarchive/status/1499773785506942977
電気が戻ったのでサービス復旧中
https://twitter.com/5chan_nel (5ch newer account)
電気が戻ったのでサービス復旧中
https://twitter.com/5chan_nel (5ch newer account)
2022/03/05(土) 02:52:58.94
トップにはアクセスできるようになったが、取得はまだまだ・・・
「Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.」
「Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.」
2022/03/05(土) 04:50:41.21
ようやく取得できるように
と思ったら・・・
「Sorry.
This snapshot cannot be displayed due to an internal error.」
と思ったら・・・
「Sorry.
This snapshot cannot be displayed due to an internal error.」
321名無しさん@お腹いっぱい。
2022/03/05(土) 13:26:17.52 クソ
2022/03/05(土) 13:58:09.30
サイバー攻撃でも されているのかと思ったぞ
323名無しさん@お腹いっぱい。
2022/03/05(土) 15:20:25.25 されとるだろ
2022/03/05(土) 22:20:27.17
3/2以降のものは取得されてないことになってるか、残ってても
「Sorry.
This snapshot cannot be displayed due to an internal error.」
特定のサイトだけではなくいろいろなサイトでそんな感じ
「Sorry.
This snapshot cannot be displayed due to an internal error.」
特定のサイトだけではなくいろいろなサイトでそんな感じ
325名無しさん@お腹いっぱい。
2022/03/06(日) 04:14:49.44 恐らくロシアの連中が火消しして回っとるなこれ
2022/03/06(日) 12:31:45.17
IA側の問題だ
21/12/24に取ったものも一時消えてしばらくして復活して今また消えている
ほっとけばそのうち直る
21/12/24に取ったものも一時消えてしばらくして復活して今また消えている
ほっとけばそのうち直る
327名無しさん@お腹いっぱい。
2022/03/06(日) 21:31:43.65 復活確認
2022/03/07(月) 00:07:06.74
アーカイブ内で壊れた画像アイコンしか表示されないのは次の巡回待つしかないの?
でも既に巡回済みの分が連続して壊れてるんだよね。
でも既に巡回済みの分が連続して壊れてるんだよね。
2022/03/07(月) 00:47:28.56
その画像URLをそのままSPNでもう一度保存すればいい
元のサイトがすでに無いか初めから画像が壊れてるならご愁傷様
元のサイトがすでに無いか初めから画像が壊れてるならご愁傷様
2022/03/07(月) 16:37:05.93
時間かかりすぎる
2022/03/07(月) 19:26:29.82
特にpdf絡みはなおさら
時間帯によって増しだったりかなりかかったり
時間帯によって増しだったりかなりかかったり
332名無しさん@お腹いっぱい。
2022/03/08(火) 20:45:44.86 既出かもしれないけどアーカイブ済のURL一覧を出力する方法見つけたから書いとく
https://exposureninja.com/blog/extract-urls-archive-org/
から引用
まず
http://web.archive.org/cdx/search/cdx?url=example.com*&output=txt
にアクセス、example.comのところをアーカイブしたページのトップページURLに変えればいい、*を誤って消さないようにすること
大量のテキストが出るので全選択してコピー
Excel立ち上げてCtrl+Aで全選択して貼り付け
その後「テキストから列へ」を選んでスペースを基準にセルを区切る
あとはセル列のアルファベット文字をクリックしたらその列が全選択になるからURLの列をコピーしてテキストエディタに貼り付けるなりすればいい
注意なのがこれ同じURLでも保存した時間分の数書いてあるから置換ツールで重複した行を消すこと
IAのURLsでは10000個までしか表示できないがこの方法使ってアーカイブされたURLの正確な総数がわかるはず
これに自分が集めたURLリストを付け加えて重複行消す処理を行うと未アーカイブURLだけ割り出せるのでだいぶ楽になる
WEB版のExcelだと貼り付け時に容量オーバーで受け付けてくれないことがあるからその場合はLibreOffice Calcでも使えばいい
LibreOfficeの場合貼り付け後、表全体の全選択を解除し、1回セルAをクリックしてセルAを全選択した後、データ→テキストから列へ を選ぶことでセル分け可能
https://exposureninja.com/blog/extract-urls-archive-org/
から引用
まず
http://web.archive.org/cdx/search/cdx?url=example.com*&output=txt
にアクセス、example.comのところをアーカイブしたページのトップページURLに変えればいい、*を誤って消さないようにすること
大量のテキストが出るので全選択してコピー
Excel立ち上げてCtrl+Aで全選択して貼り付け
その後「テキストから列へ」を選んでスペースを基準にセルを区切る
あとはセル列のアルファベット文字をクリックしたらその列が全選択になるからURLの列をコピーしてテキストエディタに貼り付けるなりすればいい
注意なのがこれ同じURLでも保存した時間分の数書いてあるから置換ツールで重複した行を消すこと
IAのURLsでは10000個までしか表示できないがこの方法使ってアーカイブされたURLの正確な総数がわかるはず
これに自分が集めたURLリストを付け加えて重複行消す処理を行うと未アーカイブURLだけ割り出せるのでだいぶ楽になる
WEB版のExcelだと貼り付け時に容量オーバーで受け付けてくれないことがあるからその場合はLibreOffice Calcでも使えばいい
LibreOfficeの場合貼り付け後、表全体の全選択を解除し、1回セルAをクリックしてセルAを全選択した後、データ→テキストから列へ を選ぶことでセル分け可能
2022/03/09(水) 12:41:29.79
おお便利だね
今まで保存されてるかどうかをページごとに判断するAPIをちまちま使ってたわ
ドキュメント見てもう少し使いやすくしてみた
http://web.archive.org/cdx/search/cdx?url=example.com*&output=txt&fl=original&filter=statuscode:200&filter=mimetype:text/html&collapse=urlkey
・URLのみ表示
・ステータスコードは200のみ
・メディアタイプはtext/htmlのみ
・重複URL除去
あとは必要に応じて末尾にこれを追加すれば日付でフィルタリングできる
&from=yyyyMMddhhmmss&to=yyyyMMddhhmmss
例:&from=2010&to=2011
参考
https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server
今まで保存されてるかどうかをページごとに判断するAPIをちまちま使ってたわ
ドキュメント見てもう少し使いやすくしてみた
http://web.archive.org/cdx/search/cdx?url=example.com*&output=txt&fl=original&filter=statuscode:200&filter=mimetype:text/html&collapse=urlkey
・URLのみ表示
・ステータスコードは200のみ
・メディアタイプはtext/htmlのみ
・重複URL除去
あとは必要に応じて末尾にこれを追加すれば日付でフィルタリングできる
&from=yyyyMMddhhmmss&to=yyyyMMddhhmmss
例:&from=2010&to=2011
参考
https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server
2022/03/09(水) 16:40:50.92
>>331-332
せっかくなんで、前に検索してたら見つけたこんなツールもあるよ。
あるドメイン(もしくはサブドメイン)下で保存済みの10万個までのURLが取れる。
日付範囲は適当に20年前からぐらいにしとけばいい。
ただし最近保存したURLはすぐに反映されない。これはCDXでも同じだと思う。
Download data from archive.org
ttps://share.streamlit.io/antoineeripret/streamlit-archive/main/app.py
ソースコード
https://github.com/antoineeripret/streamlit-archive/blob/main/app.py
簡単なPythonのスクリプトなので、個人的にプログラム動かしてるなら参考になるかも。
せっかくなんで、前に検索してたら見つけたこんなツールもあるよ。
あるドメイン(もしくはサブドメイン)下で保存済みの10万個までのURLが取れる。
日付範囲は適当に20年前からぐらいにしとけばいい。
ただし最近保存したURLはすぐに反映されない。これはCDXでも同じだと思う。
Download data from archive.org
ttps://share.streamlit.io/antoineeripret/streamlit-archive/main/app.py
ソースコード
https://github.com/antoineeripret/streamlit-archive/blob/main/app.py
簡単なPythonのスクリプトなので、個人的にプログラム動かしてるなら参考になるかも。
2022/03/09(水) 16:42:16.69
レス番間違い >>332-333ね。ごめん。
2022/03/10(木) 11:03:07.13
2022/03/10(木) 21:10:40.36
いつの間にかCollection Searchにパワポ検索が追加されてた
338名無しさん@お腹いっぱい。
2022/03/13(日) 13:27:26.17 URL一覧から重複消すにしてもサクラエディタだと並び替えないと消せないからほかのツール使わないといけないっぽいね
このツールだったらソートせずに元の並びのまま重複行消せるから便利
上に書いてあるものが優先されて下のほうにある重複行が消されるから先にcdxをコピペして空白改行してその下にアーカイブ予定のURLリストを貼り付けたtxtを作って実行すればいい
ここからDLできる↓
https://sourceforge.net/projects/removeduplicatelines/
DLできなければここから↓
https://web.archive.org/web/20220313034128/https://priceless-panini-57a29d.netlify.app/RemoveDuplicate_V1.1.zip
それとcdxだと日本語URLのデコードが大文字と小文字混在して保存されてるから一旦サクラエディタで小文字に変換してからやれば全部重複消せるはず
英語のみのURLでも混在してる場合もあるだろうし
Naverまとめみたいに大文字と小文字を区別する特殊なサイトもあるけど大半は区別しないから問題はないはず、IA上でも区別せずに保存されてる
このツールだったらソートせずに元の並びのまま重複行消せるから便利
上に書いてあるものが優先されて下のほうにある重複行が消されるから先にcdxをコピペして空白改行してその下にアーカイブ予定のURLリストを貼り付けたtxtを作って実行すればいい
ここからDLできる↓
https://sourceforge.net/projects/removeduplicatelines/
DLできなければここから↓
https://web.archive.org/web/20220313034128/https://priceless-panini-57a29d.netlify.app/RemoveDuplicate_V1.1.zip
それとcdxだと日本語URLのデコードが大文字と小文字混在して保存されてるから一旦サクラエディタで小文字に変換してからやれば全部重複消せるはず
英語のみのURLでも混在してる場合もあるだろうし
Naverまとめみたいに大文字と小文字を区別する特殊なサイトもあるけど大半は区別しないから問題はないはず、IA上でも区別せずに保存されてる
339名無しさん@お腹いっぱい。
2022/03/13(日) 20:27:38.40 curlでもIAログイン状態に出来る方法はありますか?
2022/03/13(日) 21:43:10.93
341名無しさん@お腹いっぱい。
2022/03/14(月) 00:32:21.41 >>340
すいません、具体的なURLかページ名でお願いします。
すいません、具体的なURLかページ名でお願いします。
2022/03/14(月) 07:14:23.11
昨日あたりからまた時間かかるどころか、
大体が反映されず
何日かして反映されてるなら良いが、
時間かかった挙げ句反映されてなかったら悲しいなぁ
大体が反映されず
何日かして反映されてるなら良いが、
時間かかった挙げ句反映されてなかったら悲しいなぁ
2022/03/14(月) 17:57:32.97
SavePageNowがSavingぐるぐるで終わらないときあるな
一応取れてるみたいだから終わらないっぽいときはページ閉じてるけど
なんかスッキリしない
一応取れてるみたいだから終わらないっぽいときはページ閉じてるけど
なんかスッキリしない
344名無しさん@お腹いっぱい。
2022/03/14(月) 22:14:18.22 >>343
Chromeだったら一旦別のサイトに移動してから戻るボタン押して少し待ったらdoneになるよ
Chromeだったら一旦別のサイトに移動してから戻るボタン押して少し待ったらdoneになるよ
2022/03/15(火) 09:03:53.04
>>343
344と動作的には同じだが「The capture is estimated to start〜」が出てきてないなら
1分ぐらいを目安にそのままページを再読み込みすればいいよ
保存終わってるか途中なら1分前に既に保存しましたってのが出てくるはず、出てこない場合は作業失敗してる
強制的に直近の保存状況を表示させる裏技だけど、こうすれば時間節約できる
待たされてる時はこの方法は使えない
344と動作的には同じだが「The capture is estimated to start〜」が出てきてないなら
1分ぐらいを目安にそのままページを再読み込みすればいいよ
保存終わってるか途中なら1分前に既に保存しましたってのが出てくるはず、出てこない場合は作業失敗してる
強制的に直近の保存状況を表示させる裏技だけど、こうすれば時間節約できる
待たされてる時はこの方法は使えない
346名無しさん@お腹いっぱい。
2022/03/15(火) 21:30:24.29 >>333
これ欠陥あるっぽい
重複消すと違うURLでも同じサイトに繋がってる場合どちらかのURLが消える
URLから&collapse=urlkeyを消して重複除外しなくすると両方とも表示できるからそれでコピペして置換ツールで重複を消すしかないね
https://web.archive.org/cdx/search/cdx?url=example.com*&;output=txt&fl=original&filter=statuscode:200&filter=mimetype:text/html
例えばこのサイトだと
https://web.archive.org/cdx/search/cdx?url=http://sumimarudan.blog7.エフシー2.com*&;output=txt&fl=original&filter=statuscode:200&filter=mimetype:text/html&collapse=urlkey
URLがNGワードっぽいからカタカナを英語に戻してね
.fc2.com/page-4.htmlが表示されず、かわりに.fc2.com:80/page-4.htmlになってる
&collapse=urlkeyを外すとfc2.com/page-4.htmlがちゃんと表示されるが、重複除外してないので同じURLが何個も表示される
普通にブラウザで見る場合URLは.fc2.com/page-4.htmlになるからこれが除外されて同じURLをアーカイブするという2度手間になる
.fc2.com/page-4.htmlと.fc2.com:80/page-4.htmlを両方表示したうえで重複消せたら便利なんだけどね
cdxのgithub見てURLいじってみたりしたけどいまいちうまくいかない
これ欠陥あるっぽい
重複消すと違うURLでも同じサイトに繋がってる場合どちらかのURLが消える
URLから&collapse=urlkeyを消して重複除外しなくすると両方とも表示できるからそれでコピペして置換ツールで重複を消すしかないね
https://web.archive.org/cdx/search/cdx?url=example.com*&;output=txt&fl=original&filter=statuscode:200&filter=mimetype:text/html
例えばこのサイトだと
https://web.archive.org/cdx/search/cdx?url=http://sumimarudan.blog7.エフシー2.com*&;output=txt&fl=original&filter=statuscode:200&filter=mimetype:text/html&collapse=urlkey
URLがNGワードっぽいからカタカナを英語に戻してね
.fc2.com/page-4.htmlが表示されず、かわりに.fc2.com:80/page-4.htmlになってる
&collapse=urlkeyを外すとfc2.com/page-4.htmlがちゃんと表示されるが、重複除外してないので同じURLが何個も表示される
普通にブラウザで見る場合URLは.fc2.com/page-4.htmlになるからこれが除外されて同じURLをアーカイブするという2度手間になる
.fc2.com/page-4.htmlと.fc2.com:80/page-4.htmlを両方表示したうえで重複消せたら便利なんだけどね
cdxのgithub見てURLいじってみたりしたけどいまいちうまくいかない
347名無しさん@お腹いっぱい。
2022/03/15(火) 21:56:50.84 あ、既アーカイブ分を消すだけなら最初に重複を消さなくてもよかったんだ
自分が集めたURLから既アーカイブ分消すときに一緒に消えるし
とはいえ行が10万以上だと容量が大きくなるから重複しないにこしたことないけど
自分が集めたURLから既アーカイブ分消すときに一緒に消えるし
とはいえ行が10万以上だと容量が大きくなるから重複しないにこしたことないけど
2022/03/18(金) 16:56:25.79
イモグラの画像、キャプチャ出来なくなったのか
349名無しさん@お腹いっぱい。
2022/03/18(金) 17:13:54.67 >>348
普通にキャプチャできたけど
普通にキャプチャできたけど
350名無しさん@お腹いっぱい。
2022/03/19(土) 01:26:22.482022/03/22(火) 21:59:33.33
>>350
こういうの探してたから助かる
こういうの探してたから助かる
2022/03/24(木) 22:51:12.01
エロサイトの動画とか直リンをSPNにURL入れたらちゃんと見れんの?
2022/03/25(金) 04:07:23.98
2022/03/25(金) 14:18:59.58
2022/03/25(金) 15:31:35.95
複数の画像を個別に保存する場合
ttps://web.archive.org/save/http〜w.jpg
ttps://web.archive.org/save/http〜c.jpg
みたいに一つずつやらないといけないの?
ttps://web.archive.org/save/http〜w.jpg
ttps://web.archive.org/save/http〜c.jpg
みたいに一つずつやらないといけないの?
2022/03/25(金) 15:57:23.54
>>355
それで大丈夫。混んでなければ1個10秒以下で終わる。
もしくは画像が載ってた元ページのURLをSave Page Nowで保存すれば画像含めて一緒に保存されるはず。
JavaScriptでぐちゃぐちゃになってるページは失敗する可能性あるけど。
それで大丈夫。混んでなければ1個10秒以下で終わる。
もしくは画像が載ってた元ページのURLをSave Page Nowで保存すれば画像含めて一緒に保存されるはず。
JavaScriptでぐちゃぐちゃになってるページは失敗する可能性あるけど。
2022/03/26(土) 10:24:47.02
The Wayback Machine has not archived that URL.
Click here to search for all archived pages under http://
保存してませんじゃねぇ。するんだよ
Click here to search for all archived pages under http://
保存してませんじゃねぇ。するんだよ
2022/03/26(土) 10:59:00.03
Shift-JISのページが文字化けで保存される問題
2022/03/26(土) 11:15:19.65
あ、スクショの方なら文字化け回避できたっぽい
360名無しさん@お腹いっぱい。
2022/03/29(火) 03:17:07.75 アーカイブ入りしたページのうちリダイレクトされるページを除外するオプションねえのか
2022/03/29(火) 19:38:07.81
SPNで保存したときにリンク先をspn-outlinksのbotが数時間後にクロールしないようにするフラグとかってないの?
サーバーに猛アタックしてきて大迷惑かけてる気がする。余計なことしやがって。
サーバーに猛アタックしてきて大迷惑かけてる気がする。余計なことしやがって。
2022/03/30(水) 12:21:15.25
あれ、Job失敗の時もインターバル入るようになってる?
2022/03/30(水) 19:04:30.53
ためになるスレだ
2022/03/31(木) 00:29:00.97
また落ちてる…
ttps://web.archive.org/sry
ttps://i.imgur.com/MC0bu6W.png
ttps://web.archive.org/sry
ttps://i.imgur.com/MC0bu6W.png
365名無しさん@お腹いっぱい。
2022/03/31(木) 05:01:37.02 消されたのを確認して念のため今日また確認したらアーカイブ復活しちゃってるんだがなんで
プロセスの自動化された部分がコースを実行し変更が有効になるまで最大1日かかりますって意味がわからんくなったし
プロセスの自動化された部分がコースを実行し変更が有効になるまで最大1日かかりますって意味がわからんくなったし
366名無しさん@お腹いっぱい。
2022/03/31(木) 06:44:41.09 もしかしてわいが依頼したニュアンスは表示させなくする依頼で停電によってアーカイブ見れるようになってしまった?
2022/03/31(木) 07:15:48.53
>>364
欧文モノスペースなんて今時使ってるの中国人だけだろ
欧文モノスペースなんて今時使ってるの中国人だけだろ
2022/03/31(木) 08:36:20.28
出たよ自分が世界標準な奴
369名無しさん@お腹いっぱい。
2022/03/31(木) 08:52:04.68 どうせまた魚拓が不都合な糞ロシア共が落としてんだろ
ほんましょーもない
ほんましょーもない
2022/03/31(木) 09:48:34.48
>注意:本日午前7時〜7時30分(太平洋時間)、当社の主要データセンター付近でPG&E社による計画停電が実施されます。このため、サービスに支障が出ることが予想されます。ご迷惑をおかけいたしますが、よろしくお願いいたします。
昨夜の切断はこれか…
昨夜の切断はこれか…
2022/03/31(木) 15:56:19.65
IAのある地域、計画停電多すぎね?
2022/03/31(木) 21:03:04.51
IA大好きなのにミクさんの影に隠れてんの納得できん
373名無しさん@お腹いっぱい。
2022/04/01(金) 03:48:17.84 過去スレ見てexpectedがアーカイブできない依頼って意味って思ってdeleteで再依頼したら担当者にブチキレられた
もう除外してますよって言われながら
停電してたらわかるわけない
別なアーカイブ削除依頼は除外されたとおもったら停電後に復活してやがるしどうなってんだかもうめんどいからいっそアーカイブサービス終了しないかな
もう除外してますよって言われながら
停電してたらわかるわけない
別なアーカイブ削除依頼は除外されたとおもったら停電後に復活してやがるしどうなってんだかもうめんどいからいっそアーカイブサービス終了しないかな
374名無しさん@お腹いっぱい。
2022/04/01(金) 03:51:17.86 間違ったexpectedじゃなくてexcluded
375名無しさん@お腹いっぱい。
2022/04/01(金) 03:56:34.44 お、停電してない。This URL has been excluded from the Wayback Machine.って出た。けどやっぱり停電後は除外したはずのものがでちゃう感じ?陰謀論的なやつじゃないよな?ロシア関連。
376名無しさん@お腹いっぱい。
2022/04/01(金) 04:05:16.10 もう暫くはメールスルーされそう
2022/04/01(金) 07:25:14.90
Sorry
This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.
This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.
378名無しさん@お腹いっぱい。
2022/04/01(金) 12:29:02.69 5gbのzipダウンロードするのに5時間とか言われてんだけど重すぎじゃね
他はそんなことないのに
他はそんなことないのに
2022/04/01(金) 14:08:12.38
試しにトレント使ってダウンロードしてみるとか
使ったことないから速度どんだけ出るか知らんけど
使ったことないから速度どんだけ出るか知らんけど
2022/04/02(土) 10:14:31.27
数日前からPDFは時間がかかる
381名無しさん@お腹いっぱい。
2022/04/02(土) 11:11:06.20 スプレッドシートのやつ結果のステータスが書き込まれなくなったんだけど俺だけ?
解決方法わかる人いますか?
解決方法わかる人いますか?
382名無しさん@お腹いっぱい。
2022/04/02(土) 13:43:58.22 twitter保存するとjob failedが繰り返し出る現象何
2022/04/02(土) 14:45:50.01
時間かかるうえに「Internal server error.」が何遍も出るのがなぁ
所要時間はどんどん後ろ倒しだし
「You may close your browser window and the page will still be saved.」とあるが、
こんなんではとても閉じるどころではない
所要時間はどんどん後ろ倒しだし
「You may close your browser window and the page will still be saved.」とあるが、
こんなんではとても閉じるどころではない
2022/04/02(土) 14:52:37.84
てかここ数日保存遅すぎでしょ
エイプリルフールのサイトをいくつか保存できなかった
エイプリルフールのサイトをいくつか保存できなかった
385名無しさん@お腹いっぱい。
2022/04/02(土) 16:49:11.25 6時間待ちでアーカイブ失敗してリトライしたら8時間待ちって
2022/04/02(土) 20:13:46.58
そういうときは後ろに適当に?とか付けて別のURLにすればカウント外れない?
2022/04/02(土) 20:51:05.90
時々 寄付を募っているけど容量と人件費だけでお金が無くなるのだろうか
2022/04/02(土) 21:51:51.36
IAはアメリカのチャリティ登録法人だから検索すれば決算の書類出てくるよ
その書類曰くサンフランシスコの年収1000万円台のサーバーエンジニアなど5人雇えるぐらい金あるんだから予算に問題なんかないよ
一番給料高い日系人のWendy Hanamuraってメディア担当の人で2019年の給料は21万4385ドル
創業者は0ドルで頑張ってるのに寄付してるのがバカバカしくなってくるけどな
でももうちょっとSave Page Nowの保存制限を前みたいに緩和してサーバー増強してほしいよね不安定すぎる
その書類曰くサンフランシスコの年収1000万円台のサーバーエンジニアなど5人雇えるぐらい金あるんだから予算に問題なんかないよ
一番給料高い日系人のWendy Hanamuraってメディア担当の人で2019年の給料は21万4385ドル
創業者は0ドルで頑張ってるのに寄付してるのがバカバカしくなってくるけどな
でももうちょっとSave Page Nowの保存制限を前みたいに緩和してサーバー増強してほしいよね不安定すぎる
2022/04/05(火) 09:24:57.82
久しぶりの不安定期かな
390名無しさん@お腹いっぱい。
2022/04/05(火) 20:16:53.31 Save Page Now servers are temporarily overloaded. Your captures may be delayed.
なんだこれ初めて見たぞ
なんだこれ初めて見たぞ
2022/04/05(火) 23:30:12.79
Save Page Now servers are temporarily overloaded. Your captures may be delayed.
392名無しさん@お腹いっぱい。
2022/04/06(水) 02:44:35.09 過去のサイトの画像って正しく表示されない場合って見るのを諦めたほうがよろしい感じですか?
それとも見る方法があるのでしょうか
それとも見る方法があるのでしょうか
2022/04/06(水) 09:43:35.94
394名無しさん@お腹いっぱい。
2022/04/08(金) 16:08:47.46 ツイッターに編集機能が追加されるらしい
Internet Archiveの出番かな
Internet Archiveの出番かな
2022/04/08(金) 21:28:34.27
ロシア外交官追い出しニュースを見て、ロシア大使館のサイトを保存しようと思ったらtokyo.mid.ruごとブロックされてるんだけど
ブロックする理由あんのこれ?
ブロックする理由あんのこれ?
396名無しさん@お腹いっぱい。
2022/04/09(土) 04:57:08.67 今はだめな時間帯か?
397名無しさん@お腹いっぱい。
2022/04/09(土) 04:57:49.95 >>395
ロシア政府が保存するなと通達すればそうなる
ロシア政府が保存するなと通達すればそうなる
398名無しさん@お腹いっぱい。
2022/04/09(土) 04:59:39.32 >>386
たまに80:とかがドメインにくっついてる奴が謎
たまに80:とかがドメインにくっついてる奴が謎
2022/04/09(土) 13:07:53.26
>>398
あるURLの最古もしくは一番早いスナップショットがポート番号付きのURLでインデックスに登録された場合、
ポート番号付きのまま表示されてるだけなので特に意味はない。
といってもポート番号によって内容が変わるサイトもあるわけだから、違うポート番号を同じURL扱いするのはちょっととは思う。
将来的にはポート番号削ったURLに登録し直してほしいけど、ずっとこのままかもしれないな。
/*/でURLを並び替える時にちゃんと並ばないのは不便だけど。
あるURLの最古もしくは一番早いスナップショットがポート番号付きのURLでインデックスに登録された場合、
ポート番号付きのまま表示されてるだけなので特に意味はない。
といってもポート番号によって内容が変わるサイトもあるわけだから、違うポート番号を同じURL扱いするのはちょっととは思う。
将来的にはポート番号削ったURLに登録し直してほしいけど、ずっとこのままかもしれないな。
/*/でURLを並び替える時にちゃんと並ばないのは不便だけど。
400名無しさん@お腹いっぱい。
2022/04/09(土) 18:28:59.17 twitterのURL検索は前できなかった気がしたけど、今確認したらできるようになってるな。これ使えるね。
2022/04/12(火) 12:22:37.12
Save Page Now servers are temporarily overloaded.
Your captures may be delayed.
Your captures may be delayed.
2022/04/19(火) 09:35:09.69
ここ最近アーカイブされてないTwitterやYouTubeのページ多すぎる。
2022/04/19(火) 12:42:45.35
今でも保存遅いケースが多いぞ。
下記のURLはもう一日以上経ってるのに未だにアーカイブされてなくて見れない。
自分が見る前のデータ放置しやがったな…。
アーカイブしようにもエラーで失敗の続いてんのか?
https://youtu.be/XpgSrULHibg
https://twitter.com/giantsubaru/status/1515525555554492417
https://twitter.com/5chan_nel (5ch newer account)
下記のURLはもう一日以上経ってるのに未だにアーカイブされてなくて見れない。
自分が見る前のデータ放置しやがったな…。
アーカイブしようにもエラーで失敗の続いてんのか?
https://youtu.be/XpgSrULHibg
https://twitter.com/giantsubaru/status/1515525555554492417
https://twitter.com/5chan_nel (5ch newer account)
2022/04/19(火) 19:18:40.19
>>403 ・・・と思ったけどこの日の夜になってやっと更新されたことで対象のURLのデータを見る事が出来たー!
良かった!
良かった!
2022/04/20(水) 21:08:13.94
Hrm.
The Wayback Machine has not archived that URL.
This page is unavailable for archiving right now!
This page is available on the web but its quite busy. Please check again later.
The Wayback Machine has not archived that URL.
This page is unavailable for archiving right now!
This page is available on the web but its quite busy. Please check again later.
2022/04/22(金) 00:08:02.62
hrmってなんて発音するんや
2022/04/22(金) 00:31:29.63
hrmの発音 ( Hard HRM から Soft HRM へ)
https://ja.forvo.com/search/hrm/
https://ja.forvo.com/search/hrm/
2022/04/22(金) 03:13:47.94
かっこよすぎる
2022/04/23(土) 07:09:20.59
https://translate.google.com/?sl=en&tl=ja&text=Hrm.&op=translate
2022/04/23(土) 14:43:44.50
ハーム?
2022/04/25(月) 13:05:09.91
SPN2 public API page docs に記載のある target_username と target_password の引数、
試しに BASIC 認証のページで使ってみたが上手く行かんな。
認証が通らず 401 エラーがアーカイブされてしまう。
ttps://web.archive.org/web/2022*/email.datacempro.com.br/messagelist
試しに BASIC 認証のページで使ってみたが上手く行かんな。
認証が通らず 401 エラーがアーカイブされてしまう。
ttps://web.archive.org/web/2022*/email.datacempro.com.br/messagelist
2022/04/27(水) 18:49:56.15
Save Page Now servers are temporarily overloaded. Your captures may be delayed.
2022/04/30(土) 16:41:25.24
Ghost Archive
ttps://ghostarchive.org/
インスタのアーカイブ取れたり取れなかったりする
ただしエロや薬物系のページは禁止で、ページ容量の制限もあるので、ちょっと信用性の面では低い
ttps://ghostarchive.org/about.html
Momentoに対応してるのはいいけど、選択肢の1個としては使える
ttps://ghostarchive.org/
インスタのアーカイブ取れたり取れなかったりする
ただしエロや薬物系のページは禁止で、ページ容量の制限もあるので、ちょっと信用性の面では低い
ttps://ghostarchive.org/about.html
Momentoに対応してるのはいいけど、選択肢の1個としては使える
2022/05/01(日) 11:28:49.12
todayをIAで取る技使えなくなってるのか
不便だな
不便だな
2022/05/03(火) 16:05:03.01
>>403
短縮URLじゃなくて最終的な転送先のURLで保存したほうがいいと思う。
転送先のURLじゃないとそのページ内までちゃんと保存されない可能性が出てくるので。
YouTubeの動画みたいに後から動画ファイルを保存される特殊な作業が必要になるものは特に。
めんどうなら両方SPNに突っ込んどけばいい。
短縮URLじゃなくて最終的な転送先のURLで保存したほうがいいと思う。
転送先のURLじゃないとそのページ内までちゃんと保存されない可能性が出てくるので。
YouTubeの動画みたいに後から動画ファイルを保存される特殊な作業が必要になるものは特に。
めんどうなら両方SPNに突っ込んどけばいい。
2022/05/05(木) 23:53:11.23
いろいろあるんだな
2022/05/10(火) 15:41:09.33
metaタグやrobot.txtでクローラー除けしてるサイトを残す安定した方法ってある?
自分が知ってるのは「Google翻訳で日本語→日本語で表示してそのURLを保存」くらい。
自分が知ってるのは「Google翻訳で日本語→日本語で表示してそのURLを保存」くらい。
2022/05/10(火) 19:24:45.13
昔はpste.euを使ってコピーサイトを作って、それをarchive todayとかで保存するとかあったけど、pste.euが閉鎖されたから無理だね
2022/05/10(火) 21:26:57.64
web串使うしかないね
後から参照できるように出来るだけ有名どころでURLに元のアドレスが乗っかるところが望ましい
後から参照できるように出来るだけ有名どころでURLに元のアドレスが乗っかるところが望ましい
2022/05/11(水) 01:35:01.48
2022/05/11(水) 04:49:25.53
2022/05/11(水) 20:05:23.57
Archive Teamを利用する方法もある(この方法だとIAのブロックリストも回避可能)
本来意図された使い方じゃないから詳しくは書かないけど
リンク先見れば分かると思う
https://wiki.archiveteam.org/index.php/URLs
本来意図された使い方じゃないから詳しくは書かないけど
リンク先見れば分かると思う
https://wiki.archiveteam.org/index.php/URLs
2022/05/12(木) 20:32:18.74
拒否URL関係まとめ
This URL has been excluded from the Wayback Machine.
https://note.com/
https://gigazine.net/
https://boards.4channel.org/
https://bokete.jp/
https://yoshidakenkou.net/
https://tanteifile.com/
https://motherless.com/
https://www.lancers.jp/
This URL is in our block list
https://finance.yahoo.co.jp/brokers-hikaku/ 以下全て
https://movie.eroterest.net/
https://anime.eroterest.net/
サイトの仕様で取れないもの
https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる
ArchiveTeamのexcludedまとめ
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine
This URL has been excluded from the Wayback Machine.
https://note.com/
https://gigazine.net/
https://boards.4channel.org/
https://bokete.jp/
https://yoshidakenkou.net/
https://tanteifile.com/
https://motherless.com/
https://www.lancers.jp/
This URL is in our block list
https://finance.yahoo.co.jp/brokers-hikaku/ 以下全て
https://movie.eroterest.net/
https://anime.eroterest.net/
サイトの仕様で取れないもの
https://ch.dlsite.com/matome 記事本文が取得不可、todayなら取れる
https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる
ArchiveTeamのexcludedまとめ
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine
2022/05/12(木) 20:53:03.34
niftyのなんちゃら
2022/05/13(金) 00:24:28.61
gigazine駄目なのか
それどっちが原因だろう
それどっちが原因だろう
2022/05/13(金) 05:08:07.05
支援
>>サイトの仕様起因
>https://uso.kkx.one
ユーザースタイルシートのカタログサイト、
Wayback Machineで保存しても白いページが表示されるのみ、
todayなら問題なく取れる
>>サイトの仕様起因
>https://uso.kkx.one
ユーザースタイルシートのカタログサイト、
Wayback Machineで保存しても白いページが表示されるのみ、
todayなら問題なく取れる
2022/05/13(金) 11:59:01.36
【PC】「玄人志向」のサポート掲示板が終了へ、15年の歴史に幕 閉鎖後は過去の投稿も閲覧不可に [あずささん★]
だそうです
だそうです
2022/05/13(金) 23:03:55.15
FirefoxでもGoogle Chromeでも待機中が長くていつまで経っても保存されてない事が多いんだけど、どうしたらいいんだろう
テレビ局とか番組サイトのページなんだけど
テレビ局とか番組サイトのページなんだけど
2022/05/14(土) 00:02:33.03
実際には保存が完了していても、保存中表示が切り替わらずそのままなのは良くある話
2022/05/14(土) 01:55:57.39
エロルが出てなければいいのかな
2022/05/14(土) 02:53:15.43
2022/05/14(土) 03:26:23.22
放置したところで、数分でセッション切れになるだろうから、タブを残したままにしてもあんまり意味ないと思うよ。
2022/05/14(土) 07:38:48.63
ウラルと同じ形式だろう
山脈に非ず
山脈に非ず
434429
2022/05/14(土) 12:11:45.08 そもそも SAVE PAGE ボタンを押して Saving page http:〜 のページに切り替わった後は、
それを閉じても保存に全く影響しないんだけどな。
ぐるぐる表示している間は何をやっているかというと、保存の進行状況を
タイマーで繰り返し表示しているだけ。
単に「保存が成功したか失敗したか、運が良ければ教えてくれる」だけで、
ページを閉じたからと言って保存が中止される訳ではないし、
タイマーが止まって表示が一切更新されなくなることすらある。
どーせギガバイト級のファイルでも 5 分もあれば保存できるのだから、
保存開始後しばらくしたら web.archive.org/web/2/ を付けた URL で
実際に保存できているか試したほうが良いと思うな。
それを閉じても保存に全く影響しないんだけどな。
ぐるぐる表示している間は何をやっているかというと、保存の進行状況を
タイマーで繰り返し表示しているだけ。
単に「保存が成功したか失敗したか、運が良ければ教えてくれる」だけで、
ページを閉じたからと言って保存が中止される訳ではないし、
タイマーが止まって表示が一切更新されなくなることすらある。
どーせギガバイト級のファイルでも 5 分もあれば保存できるのだから、
保存開始後しばらくしたら web.archive.org/web/2/ を付けた URL で
実際に保存できているか試したほうが良いと思うな。
435429
2022/05/14(土) 12:13:07.09 少し専門的な話。
Save Page Now 2 Public API のドキュメント
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit
これと対比させて考えてみればよい。
保存開始のリクエスト方法は Capture request の節に書かれているが
同じ https://web.archive.org/save の URL を使っていて、パラメータの与え方が異なるだけ。
保存のリクエストを出したら、それ以降はユーザ側で制御する必要は無し。
これとは別に、出されたリクエストの進行状況を調べる API が用意されていて、
それは Status request の節で説明されている。
ぐるぐるの表示中も、バックグラウンドでこれを繰り返し呼んでいるだけ。
(で、たまに止まってしまう。ブラウザのタブをバックグラウンドにするとかなりの確率で止まる。)
進行状況を調べる際に誰がいつ出したリクエストかを特定するために
job_id というパラメータが使われているが、これは Save Page Now のページから
リクエストを出した時も、保存中ページの HTML ソースから spn.watchJob の語を頼りに
拾うことができる。spn2- で始まる文字列がそれ。
> spn.watchJob("spn2-be5deb2f51d8cf21858418b09fefeef80e32938c", "/_static/",
この文字列に http://web.archive.org/save/status/ を付けると Status request API の URL となり
JSON 形式のデータが返ってくるが、ブラウザで直接開くだけでも内容は確認できると思う。
> https://web.archive.org/save/status/spn2-be5deb2f51d8cf21858418b09fefeef80e32938c
status の値が pending なら保存中、success なら保存成功、error ならエラー。
それから job_id の有効期限は保存開始から一時間くらい。
上の URL に今アクセスすると duration_sec、counters、timestamp 等
保存したときのデータが色々返ってくるが、今日の午後 1 時過ぎには
重要なデータは空になっているはず。
Save Page Now 2 Public API のドキュメント
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit
これと対比させて考えてみればよい。
保存開始のリクエスト方法は Capture request の節に書かれているが
同じ https://web.archive.org/save の URL を使っていて、パラメータの与え方が異なるだけ。
保存のリクエストを出したら、それ以降はユーザ側で制御する必要は無し。
これとは別に、出されたリクエストの進行状況を調べる API が用意されていて、
それは Status request の節で説明されている。
ぐるぐるの表示中も、バックグラウンドでこれを繰り返し呼んでいるだけ。
(で、たまに止まってしまう。ブラウザのタブをバックグラウンドにするとかなりの確率で止まる。)
進行状況を調べる際に誰がいつ出したリクエストかを特定するために
job_id というパラメータが使われているが、これは Save Page Now のページから
リクエストを出した時も、保存中ページの HTML ソースから spn.watchJob の語を頼りに
拾うことができる。spn2- で始まる文字列がそれ。
> spn.watchJob("spn2-be5deb2f51d8cf21858418b09fefeef80e32938c", "/_static/",
この文字列に http://web.archive.org/save/status/ を付けると Status request API の URL となり
JSON 形式のデータが返ってくるが、ブラウザで直接開くだけでも内容は確認できると思う。
> https://web.archive.org/save/status/spn2-be5deb2f51d8cf21858418b09fefeef80e32938c
status の値が pending なら保存中、success なら保存成功、error ならエラー。
それから job_id の有効期限は保存開始から一時間くらい。
上の URL に今アクセスすると duration_sec、counters、timestamp 等
保存したときのデータが色々返ってくるが、今日の午後 1 時過ぎには
重要なデータは空になっているはず。
2022/05/15(日) 10:01:51.84
resume upload
501 slow down
が何度も出て数値も異常なことになって
アップロードが終わらないんだけどどうすればいいの?
501 slow down
が何度も出て数値も異常なことになって
アップロードが終わらないんだけどどうすればいいの?
2022/05/15(日) 10:48:03.99
>>436
スパムっぽいから間違いならメール送れ的な英文が書いてあるはずだが
何をアップロードしてるのかは知らんけど、Youtube関係ならtubeup使った方がいいぞ
デフォルトのアップローダーは規制されやすい
スパムっぽいから間違いならメール送れ的な英文が書いてあるはずだが
何をアップロードしてるのかは知らんけど、Youtube関係ならtubeup使った方がいいぞ
デフォルトのアップローダーは規制されやすい
438名無しさん@お腹いっぱい。
2022/05/15(日) 14:32:45.73 最近IAへのアップロードが異様に遅くなって困ってる
前は上り1Gbps保ってたけど今はその100分の1くらい
IAにメール送ってもIA側が何かしたわけでもないって返答くるし理由が分からん…
ちなみにVPN通したら速度戻った(今は期限切れたので使えない)
スマホからのアップロードは以前と変わらず速い
それならとUASwitcherを使ったけどダメだった
帯域制限を疑って他サイトにアップロードしてみたけど速度は普通に出る
マジで困ってるから誰か教えてくれ…
前は上り1Gbps保ってたけど今はその100分の1くらい
IAにメール送ってもIA側が何かしたわけでもないって返答くるし理由が分からん…
ちなみにVPN通したら速度戻った(今は期限切れたので使えない)
スマホからのアップロードは以前と変わらず速い
それならとUASwitcherを使ったけどダメだった
帯域制限を疑って他サイトにアップロードしてみたけど速度は普通に出る
マジで困ってるから誰か教えてくれ…
2022/05/17(火) 03:01:44.67
使ってるISPのアップロード制限とかは?
2022/05/17(火) 03:10:16.22
あと去年3月にarchiveteamがニコ動の動画ページ(/watch/sm〜)を片っ端から保存してくれたけど、それ以降は動いてないのね
てっきりずっと動かしてるかと思ってたわ
ttps://archive.org/details/archiveteam_niconico
ttps://wiki.archiveteam.org/index.php/Niconico
動画ファイル自体も保存しないと意味ないんだけどな
てっきりずっと動かしてるかと思ってたわ
ttps://archive.org/details/archiveteam_niconico
ttps://wiki.archiveteam.org/index.php/Niconico
動画ファイル自体も保存しないと意味ないんだけどな
2022/05/17(火) 11:41:37.42
442名無しさん@お腹いっぱい。
2022/05/17(火) 18:12:55.52 >>439
他サイトへのアップロードは速いって言ってるだろ
それとスマホからアップロードした時は何故か速度出るんだよ
もちろん同じWifiに繋いだ状態で
今は仮想マシン通したら速度出たからそうしてるよ 不便だけど
他サイトへのアップロードは速いって言ってるだろ
それとスマホからアップロードした時は何故か速度出るんだよ
もちろん同じWifiに繋いだ状態で
今は仮想マシン通したら速度出たからそうしてるよ 不便だけど
2022/05/17(火) 18:14:51.83
>>439
他サイトへのアップロードは速いって言ってるだろ
それとスマホからアップロードした時は何故か速度出るんだよ
もちろん同じWifiに繋いだ状態で
今は仮想マシン通したら速度出たからそうしてるよ 不便だけど
他サイトへのアップロードは速いって言ってるだろ
それとスマホからアップロードした時は何故か速度出るんだよ
もちろん同じWifiに繋いだ状態で
今は仮想マシン通したら速度出たからそうしてるよ 不便だけど
444名無しさん@お腹いっぱい。
2022/05/17(火) 21:18:18.55 録画した番組をエンコードしてアップしたいんだけど
デフォルト以外でおすすめのアップローダーを教えて
デフォルト以外でおすすめのアップローダーを教えて
2022/05/18(水) 20:56:55.97
1時間前に比べて重い
2022/05/18(水) 21:34:17.24
ようやく解消
2022/05/19(木) 19:46:35.64
いつもの寄付表示
今回は赤色だったり青だったり緑だったり
種類増えてて笑う
今回は赤色だったり青だったり緑だったり
種類増えてて笑う
2022/05/21(土) 13:09:44.07
archive.today壊れてらっしゃる?
449名無しさん@お腹いっぱい。
2022/05/21(土) 15:50:47.29 保存されたJAVAが別の画像(など)を動的に引用してる時に
「オリジナルの画像のアドレス」を呼んでしまってるせいで正しく動作しない(呼ばれてる画像自体はアーカイブにある)やつは
アーカイブ上で何とかならんもんだろうか
「オリジナルの画像のアドレス」を呼んでしまってるせいで正しく動作しない(呼ばれてる画像自体はアーカイブにある)やつは
アーカイブ上で何とかならんもんだろうか
450名無しさん@お腹いっぱい。
2022/05/21(土) 15:53:32.08 >>441
容量もだが権利関係でやばいのが多すぎる気が
容量もだが権利関係でやばいのが多すぎる気が
451名無しさん@お腹いっぱい。
2022/05/21(土) 19:49:16.37 curlでもIAログインモード、cookieのページみても出来ないぞ(IAが対策?)
数万urlは保存したいのだが(特に画像)
数万urlは保存したいのだが(特に画像)
2022/05/22(日) 08:29:18.90
curlで/save/から保存しようとすると「This URL is in our block list and cannot be captured」が出るけど
ウェブブラウザからだとちゃんと保存されるのに遭遇した
ちょっと上で書いてる人もいるけど、UserAgent以外の部分も見るのかなこれは
ウェブブラウザからだとちゃんと保存されるのに遭遇した
ちょっと上で書いてる人もいるけど、UserAgent以外の部分も見るのかなこれは
2022/05/25(水) 00:41:46.06
>>451
Cookieは知らんが、今のSPNの制限内であっても、outlinksを辿って時間かからない単一の画像URLだけなら、
少なくとも1分間で4個のURLの保存できるだろうから、24時間で5760個、数万URLあっても1週間以内に保存終わるはず。
Cookieは知らんが、今のSPNの制限内であっても、outlinksを辿って時間かからない単一の画像URLだけなら、
少なくとも1分間で4個のURLの保存できるだろうから、24時間で5760個、数万URLあっても1週間以内に保存終わるはず。
2022/05/25(水) 23:49:41.59
5次元データストレージって実用化されたら凄そう
割れたら終わりな気もするけど
割れたら終わりな気もするけど
2022/05/27(金) 10:52:55.05
質問です
Internet Archiveにおいて
著作権の扱いはどうなっているのでしょうか?
無断で複製禁止のものをアーカイブした場合
Internet Archive側が著作権侵害となるのでしょうか?
それともアーカイブユーザー側が著作権侵害となるのでしょうか?
ご回答よろしくお願いします
Internet Archiveにおいて
著作権の扱いはどうなっているのでしょうか?
無断で複製禁止のものをアーカイブした場合
Internet Archive側が著作権侵害となるのでしょうか?
それともアーカイブユーザー側が著作権侵害となるのでしょうか?
ご回答よろしくお願いします
2022/05/27(金) 20:01:04.98
アメリカのフェアユースと図書館法と非営利団体ということで守られるので問題ないですが、
「日本人が日本から投稿した」という部分が違法になり得るので、
そこを隠せてすぐに逃げられる形でやれば問題ないです
「日本人が日本から投稿した」という部分が違法になり得るので、
そこを隠せてすぐに逃げられる形でやれば問題ないです
2022/05/27(金) 20:26:08.07
>>456
治外法権はとっくに終わってるので「日本人が」は要らん
治外法権はとっくに終わってるので「日本人が」は要らん
458名無しさん@お腹いっぱい。
2022/05/31(火) 03:41:16.24 他人のツイートを全部保存する方法ってないの?
2022/05/31(火) 08:31:12.07
>>458
このツール使えば全ツイートのURLぶっこ抜ける
ArchiveTeamの人が管理してるから安定性もあるんじゃないかな
https://github.com/JustAnotherArchivist/snscrape
このツール使えば全ツイートのURLぶっこ抜ける
ArchiveTeamの人が管理してるから安定性もあるんじゃないかな
https://github.com/JustAnotherArchivist/snscrape
2022/06/01(水) 11:47:43.48
>>453 その自動化ツールってなんてやつ?
2022/06/01(水) 12:03:28.50
SPNを自動化できるツールとかってある?
2022/06/02(木) 21:01:25.82
「The capture is estimated to start in ** minutes.」
同じサイトでも出たり出なかったり
同じサイトでも出たり出なかったり
2022/06/03(金) 13:04:18.14
ここ何日かjob failedが出るの多すぎ
特に今日はひどい
特に今日はひどい
2022/06/03(金) 18:58:45.24
「The capture is estimated to start in * hours, * minutes.」
昨日よりひどくなってる・・・
昨日よりひどくなってる・・・
2022/06/04(土) 09:49:35.93
ようやく正常に
2022/06/04(土) 23:35:18.33
と思ったらまたか
○時間とかではないだけまだ良いが
○時間とかではないだけまだ良いが
2022/06/06(月) 22:07:55.79
また○時間レベルでかかるようになってしまった
数時間前まではなんともなかったのに・・・
数時間前まではなんともなかったのに・・・
2022/06/06(月) 22:44:35.15
確かにここのところjob failed多いな
2022/06/07(火) 23:09:12.43
「The capture is estimated to start in * minutes. You may close your browser window and the page will still be saved.」
今日は21時台から使ってると30分ぐらいごとに出たり出なかったり波があるようだ
そのまま本当に取得できてる場合と「Internal server error.」と出る場合があるからおちおち閉じるわけにもいかないのがなぁ
今日は21時台から使ってると30分ぐらいごとに出たり出なかったり波があるようだ
そのまま本当に取得できてる場合と「Internal server error.」と出る場合があるからおちおち閉じるわけにもいかないのがなぁ
2022/06/08(水) 02:39:39.28
日付変わってすぐは正常だったのにしばらくしてまた「The capture is estimated to start in * hours, * minutes.」
それにしても今月になってから毎日のように時間かかること多いなぁ
それにしても今月になってから毎日のように時間かかること多いなぁ
2022/06/08(水) 13:00:04.29
月初は時間かかるのが多い印象
2022/06/08(水) 15:33:31.27
>>459
今のWeb版Twitterはゴテゴテ糞思いUIに改悪されまくりやがったのでワシはRSS串経由で取ったりしてる
【Feedly】RSSリーダー総合【Inoreader】
https://mevius.5ch.net/test/read.cgi/esite/1565761448/
今のWeb版Twitterはゴテゴテ糞思いUIに改悪されまくりやがったのでワシはRSS串経由で取ったりしてる
【Feedly】RSSリーダー総合【Inoreader】
https://mevius.5ch.net/test/read.cgi/esite/1565761448/
473名無しさん@お腹いっぱい。
2022/06/11(土) 02:19:49.71 インフォシークとかサービス終了したサイトの終了告知を最優先で表示するのあれなんとかならねえの
2022/06/11(土) 03:02:27.42
>>473
広告除去の拡張機能に自分でルールを追加すれば思いのまま。
広告除去の拡張機能に自分でルールを追加すれば思いのまま。
2022/06/12(日) 00:51:33.91
どういうことなの
2022/06/13(月) 22:24:09.42
木曜あたりからは順調だったのに、結局また何時間単位とか・・・
2022/06/14(火) 09:51:48.01
noteって保存できないの?
2022/06/14(火) 12:37:06.24
>>477
2年前のIPアドレスお漏らし騒動のときに運営がIAにアーカイブ除外申請したからそれ以降保存できなくなってる
2年前のIPアドレスお漏らし騒動のときに運営がIAにアーカイブ除外申請したからそれ以降保存できなくなってる
2022/06/15(水) 20:52:24.39
過疎サイトに突然大量アクセスが来たのですがロボットか誰かがせっせと保存してるのでしょうか…
https://i.imgur.com/Y6wqCQp.jpg
https://i.imgur.com/Y6wqCQp.jpg
2022/06/20(月) 11:28:15.69
既出だったら申し訳ないのですが、archive.orgでツイートやtwitterプロフィール画面をSave Page Nowで保存すると、モバイルサイトでの表示形式で保存されてしまいます。
どうすればPCの表示形式で保存できますか?
どうすればPCの表示形式で保存できますか?
2022/06/23(木) 10:44:42.70
2022/06/23(木) 18:07:01.22
7000億突破したな
2022/06/24(金) 01:27:16.59
俺も5000万ぐらい貢献したかな
2022/06/24(金) 23:15:31.53
調子悪いな
2022/06/25(土) 01:43:20.50
The capture will start in ~5 seconds because we are doing too many captures of www.youtube.com right now. You may close your browser window and the page will still be saved.
初めてこのエラーが出た
5秒以内に保存始まったが
初めてこのエラーが出た
5秒以内に保存始まったが
2022/06/25(土) 10:04:48.83
前から出てたエラーに詳細が追加されたんじゃない?
2022/06/25(土) 21:04:47.20
普通に重いときは5秒どころか20秒ぐらいかかってる気がするんだがw
2022/06/26(日) 17:14:28.40
2022/06/28(火) 03:39:15.68
困ったな
2022/06/29(水) 01:38:37.94
最近YouTubeのURLをSPNで保存すると?v=動画ID&google_abuse=GOOGLE_ABUSE_EXEMPTION〜ってURLに飛ばされてることがある。
SPNのIPアドレスがYouTubeの一時アクセス制限に引っかかってるようで、ちゃんとページが保存されてない場合も。
SPNのIPアドレスがYouTubeの一時アクセス制限に引っかかってるようで、ちゃんとページが保存されてない場合も。
491名無しさん@お腹いっぱい。
2022/06/30(木) 21:27:00.59 https://twitter.com/hangorinnokai/status/1542091743386284032
反五輪の会 NO OLYMPICS 2020
組織委員会、明日ウェブサイト閉鎖!逃げ足早すぎる!!皆さん、資料の保存を急いで!!
#TOKYO2020 OCOG
__
反五輪の会 NO OLYMPICS 2020@hangorinnokai
Jun 29
組織委員会、明日18:00ウェブサイト閉鎖。 tokyo2020.jp/ja/news/news-20…
東京2020組織委員会公式ウェブサイト閉鎖のお知らせ
https://twitter.com/5chan_nel (5ch newer account)
反五輪の会 NO OLYMPICS 2020
組織委員会、明日ウェブサイト閉鎖!逃げ足早すぎる!!皆さん、資料の保存を急いで!!
#TOKYO2020 OCOG
__
反五輪の会 NO OLYMPICS 2020@hangorinnokai
Jun 29
組織委員会、明日18:00ウェブサイト閉鎖。 tokyo2020.jp/ja/news/news-20…
東京2020組織委員会公式ウェブサイト閉鎖のお知らせ
https://twitter.com/5chan_nel (5ch newer account)
2022/07/02(土) 10:35:52.35
>This video is archived but not yet indexed for playback.Please try again tomorrow
ほう
ほう
493名無しさん@お腹いっぱい。
2022/07/02(土) 10:43:22.92 >>474
任意のアドレスを開いた時に一番古いアーカイブを呼ぶように強制できる?
任意のアドレスを開いた時に一番古いアーカイブを呼ぶように強制できる?
2022/07/02(土) 21:15:53.79
>>493
公式 Wayback Machine 拡張機能を入れれば?
「Oldest」ボタンを押せば表示される。
https://i.imgur.com/k9M4bem.jpeg
The Official Wayback Machine Extension
https://chrome.google.com/webstore/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak
https://microsoftedge.microsoft.com/addons/detail/wayback-machine/kjmickeoogghaimmomagaghnogelpcpn
https://addons.mozilla.org/en-US/firefox/addon/wayback-machine_new/
https://apps.apple.com/us/app/wayback-machine/id1472432422
公式 Wayback Machine 拡張機能を入れれば?
「Oldest」ボタンを押せば表示される。
https://i.imgur.com/k9M4bem.jpeg
The Official Wayback Machine Extension
https://chrome.google.com/webstore/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak
https://microsoftedge.microsoft.com/addons/detail/wayback-machine/kjmickeoogghaimmomagaghnogelpcpn
https://addons.mozilla.org/en-US/firefox/addon/wayback-machine_new/
https://apps.apple.com/us/app/wayback-machine/id1472432422
2022/07/04(月) 20:52:32.70
実質中身がなくなってるやつを判別してその直前がわかる機能があればいいのにな
別のページへの転送になっている、あたりを基準にするとか
別のページへの転送になっている、あたりを基準にするとか
2022/07/05(火) 05:46:27.12
見たいのに…
2022/07/05(火) 18:17:21.48
/web/1/
2022/07/05(火) 19:52:58.59
>>495
"Calendar" 表示の "Changes" をポチれば?
"Calendar" 表示の "Changes" をポチれば?
2022/07/06(水) 17:43:53.05
お、なんだそれ
2022/07/10(日) 00:46:22.12
>>480です。とりあえずですが解決方法が見つかりました。
ツイッターのURLにモバイルを入れると、アイコンの画質はガビガビになりますが、レイアウトは見やすく保存できました。
https://mobile.twitter.com/ユーザーネーム
ツイッターのURLにモバイルを入れると、アイコンの画質はガビガビになりますが、レイアウトは見やすく保存できました。
https://mobile.twitter.com/ユーザーネーム
2022/07/11(月) 10:14:42.46
Sorry
Cannot start capture
{
"exception" : "Command # 1 (LLEN spn2-api) of pipeline caused error: OOM command not allowed when used memory > 'maxmemory'.",
"message" : "Cannot start capture",
"status" : "error",
"status_ext" : "error:celery"
}
Cannot start capture
{
"exception" : "Command # 1 (LLEN spn2-api) of pipeline caused error: OOM command not allowed when used memory > 'maxmemory'.",
"message" : "Cannot start capture",
"status" : "error",
"status_ext" : "error:celery"
}
2022/07/11(月) 11:48:38.84
保存できんね
2022/07/11(月) 13:13:04.25
今も無理だ、なんかあったのか?
2022/07/11(月) 13:26:31.68
保存できなかったからこのスレきた
2022/07/11(月) 13:29:13.14
昨日保存できたん?
2022/07/11(月) 15:13:44.90
2022/07/11(月) 16:17:32.15
ようやく回復か
2022/07/13(水) 09:55:00.86
去年あたりから続いてた訴訟、そろそろ決着しそう
日本だと話題になってないけど、海外SNSだと結構議論されてる
Internet Archive(IA)と大手出版社4社の訴訟において、略式判決の要求が提出される
https://current.ndl.go.jp/node/46470
日本だと話題になってないけど、海外SNSだと結構議論されてる
Internet Archive(IA)と大手出版社4社の訴訟において、略式判決の要求が提出される
https://current.ndl.go.jp/node/46470
509名無しさん@お腹いっぱい。
2022/07/14(木) 15:07:51.64 Sorry.
This snapshot cannot be displayed due to an internal error.
どのサイトで試してもこれが出てアーカイブできない
This snapshot cannot be displayed due to an internal error.
どのサイトで試してもこれが出てアーカイブできない
2022/07/14(木) 17:09:48.59
初書き込み失礼します。
私は先日、とあるお方のTwitterの過去の書き込みを分かりやすく見たいと身近な人物に相談したところ総合.ツイログが良いと言われ、
総合.ツイログから拝見させて頂いていたのですがそのときに誤って画面の右の方にある『Internet Archive Save Page Now』と書かれたボタンを押してしまい
WayBack Machineというサイトに登録されてしまったみたいなのです。色々と調べてここでなら相談できそうだと思い質問させて頂きたいのですが、
他者のTwitterのツイログを本人の同意なくWayBack Machineに登録してしまったことって違法になるのでしょうか?
一般的にTwitter等におけるコメント自体には個性がないから著作権は認められないし画像も無い、そんで海外のサービスやから大丈夫、捕まらないと思う。と説明はされたのですが
どうにも特定されて逮捕されそうという不安な気持ちが拭えません。
違法でない場合は良いサービスを知ったのでこれからは全部写真を撮って保存するのではなく登録した方が楽なので消さないで良いかと思うのですが、
違法である場合はどうにかして消したいのです。その場合は自分が登録されたTwitterの所有者でなくても消すことは出来るのでしょうか。
どうかご回答の程、よろしくお願い致します。
私は先日、とあるお方のTwitterの過去の書き込みを分かりやすく見たいと身近な人物に相談したところ総合.ツイログが良いと言われ、
総合.ツイログから拝見させて頂いていたのですがそのときに誤って画面の右の方にある『Internet Archive Save Page Now』と書かれたボタンを押してしまい
WayBack Machineというサイトに登録されてしまったみたいなのです。色々と調べてここでなら相談できそうだと思い質問させて頂きたいのですが、
他者のTwitterのツイログを本人の同意なくWayBack Machineに登録してしまったことって違法になるのでしょうか?
一般的にTwitter等におけるコメント自体には個性がないから著作権は認められないし画像も無い、そんで海外のサービスやから大丈夫、捕まらないと思う。と説明はされたのですが
どうにも特定されて逮捕されそうという不安な気持ちが拭えません。
違法でない場合は良いサービスを知ったのでこれからは全部写真を撮って保存するのではなく登録した方が楽なので消さないで良いかと思うのですが、
違法である場合はどうにかして消したいのです。その場合は自分が登録されたTwitterの所有者でなくても消すことは出来るのでしょうか。
どうかご回答の程、よろしくお願い致します。
2022/07/14(木) 17:09:55.12
ワイもThis snapshot cannot be displayed due to an internal error.で保存できん。
yahooニュースだからかと思ってたけど違うかねえ
https://news.yahoo.co.jp/articles/1574a2aaf9fb8d81a8d930787db29f610fb5d32f?page=1
yahooニュースだからかと思ってたけど違うかねえ
https://news.yahoo.co.jp/articles/1574a2aaf9fb8d81a8d930787db29f610fb5d32f?page=1
2022/07/14(木) 17:20:33.92
2022/07/14(木) 17:49:00.21
>>512さん
返信が遅くなってしまい誠に申し訳ございません。
『ツイッターのアーカイブなんて腐るほど保存されているからタイーホはないと思う。』
そうでしたか。これで安心できました。本当にありがとうございます。
返信が遅くなってしまい誠に申し訳ございません。
『ツイッターのアーカイブなんて腐るほど保存されているからタイーホはないと思う。』
そうでしたか。これで安心できました。本当にありがとうございます。
514名無しさん@お腹いっぱい。
2022/07/15(金) 20:18:27.49 >>509だがどうやらSave outlinksを選択するとThis snapshot cannot be displayed due to an internal error. が出るみたい
なので現状は非会員と同じく一つ一つアーカイブやらなければならない羽目に
なので現状は非会員と同じく一つ一つアーカイブやらなければならない羽目に
2022/07/21(木) 14:45:54.17
503
2022/07/21(木) 19:20:36.03
議員になった赤松健がIAが既にやってるゲームのアーカイブ保存を提唱してるな
2022/07/22(金) 03:29:22.94
そこらへんうまくやっていってほしいね
2022/07/23(土) 11:18:24.80
昨日から画面推移時にクラッシュ頻発する
SPNは問題ない
SPNは問題ない
2022/07/23(土) 18:17:14.65
We're sorry — something's gone wrong.
Our team has been notified.
↑
昨日あたりからこれがよく出るが、
取得済みかどうか調べるときに不便
Our team has been notified.
↑
昨日あたりからこれがよく出るが、
取得済みかどうか調べるときに不便
2022/07/23(土) 21:21:39.91
2022/07/23(土) 23:24:26.82
2022/07/24(日) 19:35:45.02
This page is unavailable for archiving right now!
つべにて
つべにて
2022/07/24(日) 23:42:58.94
>>510
むしろみんなガンガン使ってる
むしろみんなガンガン使ってる
2022/07/25(月) 17:09:30.89
ここに保存されたユーチューブって実際のところ再生できるの
2022/07/25(月) 18:23:51.72
>>524
webページを保存するのとは別にYouTube動画を保存するプロセスが特別に用意されてるっぽい
動画が保存されてアーカイブページに反映されるまでには若干時間がかかるけど、完了すれば再生できるようになる
webページを保存するのとは別にYouTube動画を保存するプロセスが特別に用意されてるっぽい
動画が保存されてアーカイブページに反映されるまでには若干時間がかかるけど、完了すれば再生できるようになる
2022/07/27(水) 04:46:52.44
これまで見れてたサイトが、キャッシュは存在するのに読み込み途中でキャッシュされてないときの画面になるので、おかしいなと思ってここに来てみたのだが、ずっと挙動おかしいのか。
2022/07/27(水) 14:06:07.79
まじか
2022/07/27(水) 22:53:13.53
>>526
逆にNHKラジオのJavaScriptで動的にファイルを読み込んで作成するページが
だめだったけど、過去に「対応したかな?」と保存してみてだめだったページ
が表示されるようになった。表示できていないだけで保存されていた。
ひょっとして、聴き逃しページの配信ファイルの情報を記述したJSONも
保存されていているのかな? と思って調べたら保存されていて、誰かが
ページを保存してくれたおかげで期限が過ぎたやつを下載できた。
逆にNHKラジオのJavaScriptで動的にファイルを読み込んで作成するページが
だめだったけど、過去に「対応したかな?」と保存してみてだめだったページ
が表示されるようになった。表示できていないだけで保存されていた。
ひょっとして、聴き逃しページの配信ファイルの情報を記述したJSONも
保存されていているのかな? と思って調べたら保存されていて、誰かが
ページを保存してくれたおかげで期限が過ぎたやつを下載できた。
2022/07/27(水) 23:13:17.56
redditをアーカイブしようとすると404NotFound出るの俺だけ?
2022/07/30(土) 13:36:46.60
outlinksって何階層まで保存してくれるの?
2022/07/30(土) 15:15:46.73
大量のURLを保存したいんだけどどうすればいい?
2022/07/30(土) 19:49:12.50
Outlinksって一回でリンク70個しか保存してくれないのか…
2万控えてるってのに
2万控えてるってのに
2022/07/31(日) 01:03:56.96
へー70までなんだ
2022/08/01(月) 08:19:55.45
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
こっちもスレあるけど、こことどっちが本スレでどっちに書き込めばいいの?
こっちもスレあるけど、こことどっちが本スレでどっちに書き込めばいいの?
2022/08/01(月) 13:46:00.43
ティーカップがあったはずなんだけど、知らない?
2022/08/01(月) 18:44:49.48
2022/08/01(月) 20:07:00.53
>>536
なるほど。聞いてみてよかった。
なるほど。聞いてみてよかった。
2022/08/02(火) 15:45:38.64
Before you continue to YouTubeが出て再生できない
2022/08/06(土) 12:31:32.23
「いかがでしたか?」問題に「欲しい情報が出ない」問題… Google検索の第一人者が語る、検索で不満が募る“意外な理由”とは
http://asahi.5ch.net/test/read.cgi/newsplus/1659480292/
540名無しさん@お腹いっぱい。
2022/08/11(木) 08:58:16.01 調子悪い?
2022/08/11(木) 09:05:43.02
昨日から「The capture will start in ~** minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.」
PDFの場合は表示されず
PDFの場合は表示されず
2022/08/17(水) 13:50:51.51
昨日遅くからアクセスしづらいことが多い
それとは別件だが、
最近一部のサイトで正常に取得できてないのに、
なぜか取得できてる扱いを受けることが多い
できてるとみなされるものだから取得し直そうとすれば45分待たなければならない
それとは別件だが、
最近一部のサイトで正常に取得できてないのに、
なぜか取得できてる扱いを受けることが多い
できてるとみなされるものだから取得し直そうとすれば45分待たなければならない
2022/08/18(木) 17:24:07.29
ここ数日深夜〜早朝(日本時間)がつながりづらい
と思ったら今もとか・・・
と思ったら今もとか・・・
2022/08/18(木) 19:54:57.84
つながったと思えばそれも束の間でまたつながらず
2022/08/19(金) 17:17:16.09
今日もまたつながりづらいことが多い(5chを含めてほかにはつながる)
新手の規制なのだろうか
新手の規制なのだろうか
2022/08/20(土) 00:59:46.23
Before you continue to YouTube
2022/08/20(土) 01:17:48.76
日付変わってからの傾向
・20分ごとにつながるときが来る
・使えるのは3分程度、それでまたつながらなくなるの繰り返し
話題にならないところを見ると俺環なんだろうが、
なぜIAだけつながらないのかが謎
・20分ごとにつながるときが来る
・使えるのは3分程度、それでまたつながらなくなるの繰り返し
話題にならないところを見ると俺環なんだろうが、
なぜIAだけつながらないのかが謎
2022/08/20(土) 23:47:28.88
>>546
www-ghacks-net.translate.goog/2021/04/01/here-is-the-easiest-way-to-get-rid-of-googles-before-you-continue-to-youtube-prompt/?_x_tr_sl=en&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=sc
↑
これのこと?
プライベートモードではなく通常モードで使うべきということか
で、今は何事もなかったかのような状況
あとは「正常に取得できてないのに取得できてる扱い」がなんとかなれば・・・だが、
まともにつながるだけでも大違いか
www-ghacks-net.translate.goog/2021/04/01/here-is-the-easiest-way-to-get-rid-of-googles-before-you-continue-to-youtube-prompt/?_x_tr_sl=en&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=sc
↑
これのこと?
プライベートモードではなく通常モードで使うべきということか
で、今は何事もなかったかのような状況
あとは「正常に取得できてないのに取得できてる扱い」がなんとかなれば・・・だが、
まともにつながるだけでも大違いか
2022/08/21(日) 12:21:06.05
youtubeのshortの方は後で動画取りに来ない感じなのか
2022/08/23(火) 18:18:21.14
むしろそこが読めん
2022/08/23(火) 19:58:04.41
一昨日昨日とせっかく順調だったのにたった今・・・
2022/08/23(火) 23:29:24.71
togetterって保存できても閲覧できないようになってる?
カレンダーから飛んでも現在のページに戻されてしまう
カレンダーから飛んでも現在のページに戻されてしまう
2022/08/25(木) 05:13:13.00
最近ドメイン指定で/*/を見てるとArchiveteamがサイトマップのXMLファイルURLをいろんなブログで保存してるのを見かけるんだけど
そのサイトマップに載ってるブログ記事のURLの方を保存してほしいな
サイトマップだけじゃ意味ない
そのサイトマップに載ってるブログ記事のURLの方を保存してほしいな
サイトマップだけじゃ意味ない
2022/08/25(木) 10:26:00.53
archive.org
(failed)net::ERR_CONNECTION_TIMED_OUT
(failed)net::ERR_CONNECTION_TIMED_OUT
2022/08/25(木) 11:36:11.20
IA自体が落ちるとか大丈夫なのか
2022/08/25(木) 11:57:50.22
Internet Archiveに保存したデータって100年後も残ってると思う?
本当に永久に残せる気がしなくて悩んでる
本当に永久に残せる気がしなくて悩んでる
2022/08/25(木) 13:45:37.67
復旧まだ?
2022/08/25(木) 13:55:43.16
>>556
デジタル情報を後世に残せる可能性が唯一あるのがInternet Archiveだろうね
ネット規制が年々厳しくなってるから情報を本にまとめて国立国会図書館に納本した方が案外残ってたりするかも?
デジタル情報を後世に残せる可能性が唯一あるのがInternet Archiveだろうね
ネット規制が年々厳しくなってるから情報を本にまとめて国立国会図書館に納本した方が案外残ってたりするかも?
2022/08/25(木) 15:35:07.68
やっぱり落ちてたんだ なんらかの方法でアク禁喰らったかと思ったw
2022/08/25(木) 16:40:22.94
アク禁喰らうほど負荷かけちゃ駄目よ
2022/08/25(木) 16:53:16.25
「Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.」
今日は俺環だけではなかったのか・・・
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.」
今日は俺環だけではなかったのか・・・
2022/08/25(木) 17:22:38.17
10時サーバーが落ちていた
16時サーバーが落ちていた
17時サーバーが復旧してメンテ中になっていた
twitter.com/internetarchive/status/1562637688918142976
2022年8月25日(木)12:07:12 JST
> We are working to resolve the outage affecting
> http://archive.org & @waybackmachine
お前らの行動あるある
archive.ph/foxJV
archive.ph/LMz1C
archive.ph/z1gVl
archive.ph/W61NL
https://twitter.com/5chan_nel (5ch newer account)
16時サーバーが落ちていた
17時サーバーが復旧してメンテ中になっていた
twitter.com/internetarchive/status/1562637688918142976
2022年8月25日(木)12:07:12 JST
> We are working to resolve the outage affecting
> http://archive.org & @waybackmachine
お前らの行動あるある
archive.ph/foxJV
archive.ph/LMz1C
archive.ph/z1gVl
archive.ph/W61NL
https://twitter.com/5chan_nel (5ch newer account)
2022/08/25(木) 17:55:50.65
ほんとに落ちてて草
ここがサ終したらと思うとゾッとするわ
ここがサ終したらと思うとゾッとするわ
564名無しさん@お腹いっぱい。
2022/08/25(木) 18:12:34.132022/08/25(木) 21:27:27.54
直った
2022/09/08(木) 00:46:00.71
kiwifarmsという掲示板住民の嫌がらせ対象となった活動家らがCloudflareに対して抗議
掲示板はCloudflareからのブロックに続き、Wayback Machineのアーカイブ対象からも除外されたことで物議を醸してる
https://i.imgur.com/gzErRBc.jpg
Reddit r/Archiveteam のスレでは賛否両論
https://www.reddit.com/r/Archiveteam/comments/x7xmxy/wayback_machine_deletes_kiwifarms_archive
参考
ITmedia『Cloudflare、フォーラムKiwi Farmsをブロック 「命にかかわる脅威と判断」』
https://www.itmedia.co.jp/news/spv/2209/05/news059.html
掲示板はCloudflareからのブロックに続き、Wayback Machineのアーカイブ対象からも除外されたことで物議を醸してる
https://i.imgur.com/gzErRBc.jpg
Reddit r/Archiveteam のスレでは賛否両論
https://www.reddit.com/r/Archiveteam/comments/x7xmxy/wayback_machine_deletes_kiwifarms_archive
参考
ITmedia『Cloudflare、フォーラムKiwi Farmsをブロック 「命にかかわる脅威と判断」』
https://www.itmedia.co.jp/news/spv/2209/05/news059.html
2022/09/08(木) 01:06:13.64
redditをSPNすると404になるやつ、まだ直ってないのか・・・
568名無しさん@お腹いっぱい。
2022/09/10(土) 16:56:52.81 昨日あたりから調子悪い?
2022/09/11(日) 01:37:35.36
Not Fundになる
2022/09/11(日) 07:29:45.30
404 not found継続中
2022/09/11(日) 12:04:17.42
確かにここ何日か「Internal server error.」とか「Not Found」が頻繁に出てる
2022/09/11(日) 19:52:23.24
エラー出ても2、3回やれば保存が始まるか保存制限に引っ掛かるかのガチャだな
保存できる確率は1/3か1/4
保存できる確率は1/3か1/4
2022/09/11(日) 23:57:16.77
エラーになった後もう一度やると「The same snapshot had been made seconds/minutes ago」が返ってくることがある
保存できてるならちゃんと返してほしいが
保存できてるならちゃんと返してほしいが
2022/09/12(月) 12:47:12.64
本当にできてるならまだ良いが、
できてないのにできてるとみなされて「The same snapshot had been made ** minutes, ** seconds ago. You can make new capture of this URL after 45 minutes.」なんてことも
本当にできてないのに45分待ちはきつい
ちなみに「web.archive.org/web/*/(URL)/*」では本当にできてる場合は緑or青、みなされてるだけの場合は赤or黄で表示
できてないのにできてるとみなされて「The same snapshot had been made ** minutes, ** seconds ago. You can make new capture of this URL after 45 minutes.」なんてことも
本当にできてないのに45分待ちはきつい
ちなみに「web.archive.org/web/*/(URL)/*」では本当にできてる場合は緑or青、みなされてるだけの場合は赤or黄で表示
2022/09/12(月) 23:14:14.97
>>574
> ちなみに「web.archive.org/web/*/(URL)/*」では本当にできてる場合は緑or青、みなされてるだけの場合は赤or黄で表示
嘘はいかんよ。
緑として記録されても、リダイレクトされた先で 403 や 404 (つまり赤) ってこともありうる。
IA の説明通り、HTTP のステータスコードのみで考えるべし。
> ちなみに「web.archive.org/web/*/(URL)/*」では本当にできてる場合は緑or青、みなされてるだけの場合は赤or黄で表示
嘘はいかんよ。
緑として記録されても、リダイレクトされた先で 403 や 404 (つまり赤) ってこともありうる。
IA の説明通り、HTTP のステータスコードのみで考えるべし。
576名無しさん@お腹いっぱい。
2022/09/12(月) 23:54:36.65 直った気がする
2022/09/13(火) 11:03:38.19
某M社からDMCA報告が来たらしく、アップしてた動画が削除された
IAも巡回してるんだな(YouTubeの元動画は放置なのが謎だけど)
MAD動画とかは--metadata=noindex:trueで上げた方がいいかも
IAも巡回してるんだな(YouTubeの元動画は放置なのが謎だけど)
MAD動画とかは--metadata=noindex:trueで上げた方がいいかも
2022/09/15(木) 13:39:05.63
てか最近YouTubeの動画URLが一度&themeRefresh=1が付いたURLにリダイレクトされてもう一度リダイレクトされて元のURLに戻るようになってるんだけど
SPNの動画ファイルの保存までちゃんとできてる?
SPNの動画ファイルの保存までちゃんとできてる?
2022/09/16(金) 16:32:46.10
580sage
2022/09/17(土) 14:17:53.95 最近、ラブライブや仮面ライダー関連のツイッターの返信コメント欄が保存されていないのは>>571と>>572が原因かな?
ttps://twitter.com/bandai_ridertoy/status/1569589209190776834の中の各返信コメント欄URLをインターネットアーカイブで検索しても見つからなかったし。
https://twitter.com/5chan_nel (5ch newer account)
ttps://twitter.com/bandai_ridertoy/status/1569589209190776834の中の各返信コメント欄URLをインターネットアーカイブで検索しても見つからなかったし。
https://twitter.com/5chan_nel (5ch newer account)
2022/09/17(土) 14:20:02.00
最近、各ツイッターのページの返信コメント欄をインターネットアーカイブで探しても過去のデータでは見つからないパターンが多いな。
担当者さぼってんのか?それとも保存する人いなくなったのか?
担当者さぼってんのか?それとも保存する人いなくなったのか?
2022/09/19(月) 01:06:12.59
あらら?インターネットアーカイブが現状では見れなくなっている。
2022/09/20(火) 04:10:17.40
そうなってくるとインターネットアーカイブアーカイブがいるな
2022/09/20(火) 10:26:44.70
2022/09/21(水) 03:41:43.60
それはゲリラか何かなのか
2022/09/26(月) 02:13:39.95
>>581
他人に頼ってないで重要だと思うなら自らSave Page NowにツイートのURL突っ込めんでいけばいいだろ
ArchiveTeamも全てのツイートURLを保存してるわけじゃないし抜けまくりだぞ
他人に頼ってないで重要だと思うなら自らSave Page NowにツイートのURL突っ込めんでいけばいいだろ
ArchiveTeamも全てのツイートURLを保存してるわけじゃないし抜けまくりだぞ
2022/09/26(月) 09:18:40.16
ニコニコ動画で「vipper吹き替え」と言う物が消えるのですが
お暇な方いればそのアーカイブ活動に協力していただきたいです
私がアーカイブしようとしている物は大体アーカイブできていて
あと「タグ」と「コメント」だけです
詳しい事はニコニコ大百科の掲示板にレスしています
https://dic.nicovideo.jp/b/a/vipper%E5%90%B9%E3%81%8D%E6%9B%BF%E3%81%88/31-
https://dic.nicovideo.jp/b/a/vipper%E5%90%B9%E3%81%8D%E6%9B%BF%E3%81%88/61-
(ID: Yv+WglHqgh のレスです)
お暇な方いればそのアーカイブ活動に協力していただきたいです
私がアーカイブしようとしている物は大体アーカイブできていて
あと「タグ」と「コメント」だけです
詳しい事はニコニコ大百科の掲示板にレスしています
https://dic.nicovideo.jp/b/a/vipper%E5%90%B9%E3%81%8D%E6%9B%BF%E3%81%88/31-
https://dic.nicovideo.jp/b/a/vipper%E5%90%B9%E3%81%8D%E6%9B%BF%E3%81%88/61-
(ID: Yv+WglHqgh のレスです)
2022/09/26(月) 11:32:22.44
A screen shot was captured. View screen shot:
SPNでページのスクショ画像が一緒に保存されたりされなかったりする機能が始まってる様子
SPNでページのスクショ画像が一緒に保存されたりされなかったりする機能が始まってる様子
2022/09/26(月) 14:41:39.24
何の意味があるんだろう
当時のレンダリングエンジンの記録?
当時のレンダリングエンジンの記録?
2022/09/26(月) 15:55:53.05
今どきの動的なサイトだとSPNじゃ取れなかったりするが
スクショなら見た目だけでもアーカイブ出来たりする
スクショなら見た目だけでもアーカイブ出来たりする
2022/09/26(月) 23:47:44.20
(´‥∀‥`)ほう
2022/09/28(水) 09:19:48.78
9月20日以降ツイートのアーカイブが自動で取られなくなってる?
めんどくせぇんだよなぁ膨大な数のツイート1つ1つ手動でアーカイブさせんの
めんどくせぇんだよなぁ膨大な数のツイート1つ1つ手動でアーカイブさせんの
2022/10/02(日) 14:01:31.65
Sorry
Job failed
Job failed
2022/10/05(水) 23:56:19.74
「Job failed」今日はやたら出るなぁ
取得したいサイトとの相性の問題かと思ったらあちらこちらでそんな感じ
取得したいサイトとの相性の問題かと思ったらあちらこちらでそんな感じ
2022/10/06(木) 08:09:49.83
>>586 自分が初めて見る前のデータが見たいだけですが…。
仕事中などで見られなかったデータとか。
アクティブチームも最近全然見てないパターン多すぎ。
ちゃんとの人の事考えてるのか?
もう少し早くできないものか。
仕事中などで見られなかったデータとか。
アクティブチームも最近全然見てないパターン多すぎ。
ちゃんとの人の事考えてるのか?
もう少し早くできないものか。
2022/10/06(木) 10:56:37.49
>>595
文句言ってる暇があったら自分で実行すればいいだけでは?
アクティブチームが誰だかは知らんが、ArchiveTeamは誰でも参加できるぞ
https://wiki.archiveteam.org/index.php/ArchiveTeam_Warrior
文句言ってる暇があったら自分で実行すればいいだけでは?
アクティブチームが誰だかは知らんが、ArchiveTeamは誰でも参加できるぞ
https://wiki.archiveteam.org/index.php/ArchiveTeam_Warrior
2022/10/07(金) 08:02:54.16
インターネットアーカイブもすべてのYouTubeのURLを保存してるわけではないと思いますが・・・。
https://www.youtube.com/watch?v=2tI1YCwYzIo
https://www.youtube.com/shorts/Bx__LBTXFDM
https://www.youtube.com/watch?v=MWNnX_HROUQ
これらのページの保存が遅すぎる。
https://www.youtube.com/watch?v=2tI1YCwYzIo
https://www.youtube.com/shorts/Bx__LBTXFDM
https://www.youtube.com/watch?v=MWNnX_HROUQ
これらのページの保存が遅すぎる。
2022/10/07(金) 23:59:11.39
上でも書いてる人いるけど、/shorts/から始まるYoutubeのショート動画って動画ファイルの自動保存対応してないのかな?
watch?v=に置き換えたURLでも見れるので、念の為両方のURLで保存してるけど、ショート動画のファイルだけ保存できていないような・・・
watch?v=に置き換えたURLでも見れるので、念の為両方のURLで保存してるけど、ショート動画のファイルだけ保存できていないような・・・
2022/10/08(土) 15:48:17.11
動画まで保存するとコスト凄そうだな
2022/10/10(月) 01:58:16.83
>>592 最近ツイッターの公開直後のデータがアーカイブされなくなっているのはこれが原因だとしたら納得いく。
アクティブチームが膨大な数のツイート1つ1つ手動でアーカイブさせるのはめんどくさいのはわかるけど・・・。
アクティブチームが膨大な数のツイート1つ1つ手動でアーカイブさせるのはめんどくさいのはわかるけど・・・。
2022/10/10(月) 01:59:45.27
>>592 もしかするとYouTubeの動画の方もアーカイブが自動で取られなくなってるかもしれない。
2022/10/10(月) 03:18:35.79
2022/10/11(火) 03:44:19.25
つべとれてないね
2022/10/11(火) 17:46:02.12
2022/10/16(日) 00:14:47.38
>>604
人に文句言ってないで自分で保存しろ
人に文句言ってないで自分で保存しろ
2022/10/16(日) 10:20:41.68
YouTubeの自動アーカイブって容量的に非現実的に思える
2022/10/16(日) 18:14:42.48
でも本家はそれでやっていっているんでしょう?
2022/10/16(日) 19:05:29.39
やっていってないぞ
クローラーは全ての動画を保存していないし、SPNでも全て保存する訳ではない。(CNNとかのニュースは割と保存される)
それに、インターネットアーカイブの人も「少数の人しか興味がなく、長い動画を、メタデータを付加することなく、ただインターネットアーカイブに突っ込むのはやめてね」(訳)と言っている。
https://www.reddit.com/r/DataHoarder/comments/sq6wbq/please_do_not_mirror_youtube_on_the_internet/
それでも雑談とゲームの動画をすぐに保存してほしいのなら、寄付するといいよ。開発に参加するのもいい。
クローラーは全ての動画を保存していないし、SPNでも全て保存する訳ではない。(CNNとかのニュースは割と保存される)
それに、インターネットアーカイブの人も「少数の人しか興味がなく、長い動画を、メタデータを付加することなく、ただインターネットアーカイブに突っ込むのはやめてね」(訳)と言っている。
https://www.reddit.com/r/DataHoarder/comments/sq6wbq/please_do_not_mirror_youtube_on_the_internet/
それでも雑談とゲームの動画をすぐに保存してほしいのなら、寄付するといいよ。開発に参加するのもいい。
2022/10/17(月) 19:38:48.84
選別はどういう原理なんだろう
2022/10/17(月) 23:52:20.94
アーカイブって著作権引っかかりそうで
手軽にできない
一応引用って形で引っかからないんだろうか
正直ページとしては残しておきたいもの結構あるんだけどなぁ…
手軽にできない
一応引用って形で引っかからないんだろうか
正直ページとしては残しておきたいもの結構あるんだけどなぁ…
2022/10/18(火) 01:15:56.16
>>610
SPNの話ならフェアユースで合法だよ
SPNの話ならフェアユースで合法だよ
612名無しさん@お腹いっぱい。
2022/10/18(火) 13:57:43.00 dtiがサービス終了だって
613名無しさん@お腹いっぱい。
2022/10/21(金) 12:04:03.87 ?
2022/10/23(日) 09:50:10.13
ファボ1万以上のツイートでもアーカイブチームが取りに来なくなってるな
どうしたんだろ?Twitter社からお𠮟りでも受けた?
どうしたんだろ?Twitter社からお𠮟りでも受けた?
2022/10/25(火) 10:08:14.34
みんなSPNの話ばっかりでアイテムのアップロードは使わないの?
2022/10/26(水) 00:05:19.14
ここ1週間何度試しても「Cannot resolve host (URL)」と表示されて取得できないサイトが
前はなんのこともなく取得できてたのに・・・
前はなんのこともなく取得できてたのに・・・
2022/10/30(日) 05:24:56.68
Internal Server Error for https://www.excite.co.jp/world/ (HTTP status=500).
2022/11/01(火) 19:41:42.25
二人くらい垢消しが確定してるユーザーのツイートを一人で手動で片っ端からアーカイブ取ってたけど
量多くて時間はかかるし自分が動かなきゃ誰もやらんから自分がしくじったら一生残せなくなるという罪悪感もあるしで
兎に角ツラい こういう不毛な作業こそ全部ロボットにやらせるべきやろ
なんかいいツールでもないもんかねぇ
量多くて時間はかかるし自分が動かなきゃ誰もやらんから自分がしくじったら一生残せなくなるという罪悪感もあるしで
兎に角ツラい こういう不毛な作業こそ全部ロボットにやらせるべきやろ
なんかいいツールでもないもんかねぇ
2022/11/03(木) 10:45:34.96
>>605 だから仕事や睡眠の関係で早く保存できない場合があるから自分で早く保存しろと言われても・・・。
2022/11/03(木) 10:50:22.06
>>614 ・・・ツイッター社からお叱りを受けたとしたらツイッターのページの自動アーカイブが出来なくなったのも納得がいく。
権利関係かな?
権利関係かな?
2022/11/05(土) 19:47:39.33
archive.stが取れない…
2022/11/06(日) 12:06:34.61
Saving page https://w.atwiki.jp/soulou/sp/
Worker exited prematurely: signal 15 (SIGTERM) Job: 644.
Worker exited prematurely: signal 15 (SIGTERM) Job: 644.
2022/11/06(日) 12:24:09.00
2022/11/09(水) 17:23:42.06
YouTube動画の保存初めてやってみたんだけど
すごい時間かかるうえエラー出て何度やってみても保存できないのも多いし
うまく保存できてもコメント欄はなぜか明らかに違う動画のものだったり文字化けしまくりでめちゃくちゃだった…
あんまり使えないな
すごい時間かかるうえエラー出て何度やってみても保存できないのも多いし
うまく保存できてもコメント欄はなぜか明らかに違う動画のものだったり文字化けしまくりでめちゃくちゃだった…
あんまり使えないな
625名無しさん@お腹いっぱい。
2022/11/10(木) 06:12:44.32 12月までに保存じゃー
https://geolog.mydns.jp/
https://geolog.mydns.jp/
2022/11/12(土) 06:08:18.30
ツイッター保存するとほぼ全てfirst archiveになる
何万もいいねされてバズってるのでもそう
もうツイッターは一切自動保存しないのかな…
何万もいいねされてバズってるのでもそう
もうツイッターは一切自動保存しないのかな…
2022/11/12(土) 11:26:29.99
今週SPNで保存してもfaviconだけしか保存されない例が何回も起きたんだが
24時間後に同じURLを確認するとやっぱり保存できてなかったわ
保存できてるか確認したほうがいいよ
24時間後に同じURLを確認するとやっぱり保存できてなかったわ
保存できてるか確認したほうがいいよ
2022/11/13(日) 16:46:40.56
2022/11/14(月) 13:49:25.52
2022/11/14(月) 20:47:39.81
631名無しさん@お腹いっぱい。
2022/11/14(月) 22:52:15.62 今日は調子が良い気がするようなしないような
2022/11/16(水) 04:29:12.79
5ちゃんのアーカイブもGone.になってしまうの多い
最近ここ調子悪いけど大丈夫なんかね
寄付金のお願いもずっと出てるし
最近ここ調子悪いけど大丈夫なんかね
寄付金のお願いもずっと出てるし
2022/11/16(水) 20:08:56.54
2022/11/16(水) 21:36:23.91
締め付け厳しくなってるのか、
20分ぐらいつながらないことが
20分ぐらいつながらないことが
635名無しさん@お腹いっぱい。
2022/11/17(木) 17:20:37.12 worldstarhiphop.com
200万以上も魚拓が保存されているようだが、excludedと表示される
200万以上も魚拓が保存されているようだが、excludedと表示される
2022/11/18(金) 10:43:43.03
最近重すぎる
2022/11/18(金) 19:58:05.57
今日は「Job failed.」がやたら出るなぁ
あまりやり直すと1分あたり3件までのしばりで引っかかる
前はもう少しできたっけ・・・これも締め付け厳しくなってるような
取得できてるのかも怪しくて確認すると「Fail with status: 503」
あまりやり直すと1分あたり3件までのしばりで引っかかる
前はもう少しできたっけ・・・これも締め付け厳しくなってるような
取得できてるのかも怪しくて確認すると「Fail with status: 503」
2022/11/18(金) 22:06:53.56
システム運用がカツカツなんだろうな
2022/11/19(土) 00:38:40.53
SPNの最新ファイルを見てみると、
18日9時〜14時33分(日本時間18日午後6時〜午後11時33分)の間はファイルが全く追加されてなかったので、
5時間ほど保存できなかったっぽい
この間に保存しようとしたらjob failedエラーだらけだった
今は問題なく保存できるぜ
18日9時〜14時33分(日本時間18日午後6時〜午後11時33分)の間はファイルが全く追加されてなかったので、
5時間ほど保存できなかったっぽい
この間に保存しようとしたらjob failedエラーだらけだった
今は問題なく保存できるぜ
2022/11/22(火) 04:48:34.40
WaybackMachineとなOpenLibraryとか
もっと知られてもいいもんだろこれ
知ってるのと知らないのじゃ全然便利さが違う
そもそもInternetArchiveが知られて無さすぎる
もっと知られてもいいもんだろこれ
知ってるのと知らないのじゃ全然便利さが違う
そもそもInternetArchiveが知られて無さすぎる
2022/11/24(木) 06:21:48.95
そりゃまあ一般人はネットのアーカイブなんてこれっぽっちも
気にしてないからな
気にしてないからな
2022/11/25(金) 01:50:48.75
誰も動かないから自分が動かなきゃいけない
自分がアーカイブ間に合っていれば遺せたのに
こんな使命感持っちまったせいで病んじまったわ
消える前に残すのも大事だが既に消えてしまった物を「消える前に残す」以外の手段で発掘する方法ってないもんかね
自分がアーカイブ間に合っていれば遺せたのに
こんな使命感持っちまったせいで病んじまったわ
消える前に残すのも大事だが既に消えてしまった物を「消える前に残す」以外の手段で発掘する方法ってないもんかね
2022/11/25(金) 08:18:14.39
哲学的じゃの
もうどうにも取り戻せないから「消えてしまった」と言うのだよ
もうどうにも取り戻せないから「消えてしまった」と言うのだよ
2022/11/25(金) 20:11:50.98
大げさだけどなんか人の命みたいだ
でも亡くなった人が自分の生きた証にみたいに一生懸命残してたブログとかが跡形もなく消えてしまってたりすると…悲しい
でも亡くなった人が自分の生きた証にみたいに一生懸命残してたブログとかが跡形もなく消えてしまってたりすると…悲しい
2022/11/26(土) 23:33:08.71
また>>547に近い事態で困ってて別のブラウザでアクセスし直したらつながった
たまにつながらないこともあるが、回復は先に使ってたブラウザより早い
同じ時間帯に使い比べたら片方つながらないのに、もう片方はなんのこともなくつながったり
たまたまか、それともブラウザとの相性の問題か・・・
たまにつながらないこともあるが、回復は先に使ってたブラウザより早い
同じ時間帯に使い比べたら片方つながらないのに、もう片方はなんのこともなくつながったり
たまたまか、それともブラウザとの相性の問題か・・・
2022/11/27(日) 04:04:49.75
>>645
まぁロードバランサが入ってるだろうし、アクセス毎に運試しをやってるようなもんだな
まぁロードバランサが入ってるだろうし、アクセス毎に運試しをやってるようなもんだな
2022/11/27(日) 17:26:01.10
前は重くても繋がってはいたが
最近はアクセスすら出来ないことが多い
最近はアクセスすら出来ないことが多い
2022/11/27(日) 17:46:34.00
本当に繋がんないね
資金繰りヤバいんじゃないかと心配になる
資金繰りヤバいんじゃないかと心配になる
649名無しさん@お腹いっぱい。
2022/11/27(日) 19:23:05.98 archive.todayを代用してください。
2022/11/27(日) 20:58:34.67
結局ローカルでも保存するしかないやん
2022/11/28(月) 02:04:21.68
652名無しさん@お腹いっぱい。
2022/12/01(木) 08:14:56.48 >>639
最新ファイルはどこで見れるか教えていただけませんか・
最新ファイルはどこで見れるか教えていただけませんか・
2022/12/01(木) 08:30:40.22
654名無しさん@お腹いっぱい。
2022/12/01(木) 09:32:56.82 ありがとうございます
2022/12/03(土) 09:15:41.02
テスト
2022/12/03(土) 09:16:59.78
https://www.youtube.com/watch?v=KyCAITT8iSA
https://www.youtube.com/watch?v=tlLo7jypqDI
アクティブチームの皆さん、上記のURLのアーカイブが遅いぞ、もしかしてこの時はW杯で忙しかったのか?
自分は寝てました。
https://www.youtube.com/watch?v=tlLo7jypqDI
アクティブチームの皆さん、上記のURLのアーカイブが遅いぞ、もしかしてこの時はW杯で忙しかったのか?
自分は寝てました。
657名無しさん@お腹いっぱい。
2022/12/04(日) 07:15:29.492022/12/04(日) 10:51:22.42
動画はtubeupで上げれば良くね?
https://github.com/bibanon/tubeup
https://github.com/bibanon/tubeup
2022/12/04(日) 15:29:19.99
>>658 権利が無いから無理です。
2022/12/04(日) 19:31:01.38
もしInternetArchiveが無くなったら
割とひどい文化的な痛手になるんじゃないだろうか
どっか国立のサービスにデータ引き渡すのかな
割とひどい文化的な痛手になるんじゃないだろうか
どっか国立のサービスにデータ引き渡すのかな
2022/12/04(日) 22:22:21.88
YouTubeの動画の再生ページでもアーカイブが自動で取られなくなっている・・・?
2022/12/05(月) 17:04:47.22
>>660
ジオシティーズがなくなった時の損失の比ではなさそうだな…
ジオシティーズがなくなった時の損失の比ではなさそうだな…
2022/12/06(火) 18:59:20.83
ここ最近、公開直後にアーカイブされてないこと多いよな。
運営も最善を尽くすと言っていたが、やはり難しいのか・・・?
と思ってたら対象の下記のURLをアーカイブ保存するのに時間がかかっている。
https://www.youtube.com/watch?v=QVipLYBQ31g
もしかするとシステムのエラーが引っ掛かっているかも・・・。
運営も最善を尽くすと言っていたが、やはり難しいのか・・・?
と思ってたら対象の下記のURLをアーカイブ保存するのに時間がかかっている。
https://www.youtube.com/watch?v=QVipLYBQ31g
もしかするとシステムのエラーが引っ掛かっているかも・・・。
2022/12/07(水) 14:49:59.21
そもそも動画保存はオマケなので
確実にするならローカルに保存すべき
確実にするならローカルに保存すべき
2022/12/07(水) 18:58:22.97
私は動画公開直後のページのデータを求めているのです。
2022/12/07(水) 23:36:49.30
2022/12/08(木) 00:06:43.49
2022/12/09(金) 18:57:23.93
Twitterマスク氏、15億アカウントを削除すると発表 対象は休眠ユーザー
https://asahi.5ch.net/test/read.cgi/newsplus/1670577460/
これ故人のも全部消えてしまうんだろうか
https://asahi.5ch.net/test/read.cgi/newsplus/1670577460/
これ故人のも全部消えてしまうんだろうか
2022/12/10(土) 13:28:20.80
Twitterのフルアーカイブってどうすればいいのでしょうか?
単純にアーカイブしたいアカウントのトップをアーカイブしても
ある程度直近のツイートがアーカイブされるだけで
スクロールした場合などの古いツイートはアーカイブされないのですが…
現状個別にツイート開いてアーカイブするしかないんでしょうか?
単純にアーカイブしたいアカウントのトップをアーカイブしても
ある程度直近のツイートがアーカイブされるだけで
スクロールした場合などの古いツイートはアーカイブされないのですが…
現状個別にツイート開いてアーカイブするしかないんでしょうか?
670名無しさん@お腹いっぱい。
2022/12/10(土) 16:22:21.70 このサイトでアーカイブすればいい
https://archive.md/
https://archive.md/
671名無しさん@お腹いっぱい。
2022/12/10(土) 19:54:05.27 最近waybackmachineでツイートのアーカイブがされにくくなってる。
俺は手動で片っ端から保存してるけど、量が膨大過ぎて到底追いつかん。
俺は手動で片っ端から保存してるけど、量が膨大過ぎて到底追いつかん。
2022/12/12(月) 11:30:16.44
されにくい、じゃなくてされてない
そのせいで今まで通り勝手に録ってくれれば残ってた物が残らなくなって滅茶苦茶腹立つ
そうでなくても勝手に録られてた頃でさえそれ以前の過去は録ってくれない無能だった
人一人の力で1日にアーカイブにブッ込めるのは1000くらいが限界だっての
そのせいで今まで通り勝手に録ってくれれば残ってた物が残らなくなって滅茶苦茶腹立つ
そうでなくても勝手に録られてた頃でさえそれ以前の過去は録ってくれない無能だった
人一人の力で1日にアーカイブにブッ込めるのは1000くらいが限界だっての
2022/12/12(月) 17:23:21.95
そんなにアーカイブをするのは確固たる出典が欲しいウィキペディアン?
674名無しさん@お腹いっぱい。
2022/12/12(月) 19:02:11.51 保存したページ見ようとしたら延々と読み込みが続いて見れないんだがサイト側が保存対策でもしたんだろうか
675名無しさん@お腹いっぱい。
2022/12/12(月) 23:24:17.63 Twitterは保存する人が多すぎで時間かかるわって表示されるね
676名無しさん@お腹いっぱい。
2022/12/13(火) 18:18:36.602022/12/13(火) 18:23:17.04
2022/12/14(水) 00:48:53.31
Nitterも本家ツイートが消えると連動して消えるから結局手間は同じなんだよな…
ちょっとくらい猶予くれたら完璧に録れるのだが
ちょっとくらい猶予くれたら完璧に録れるのだが
2022/12/14(水) 13:53:28.10
680名無しさん@お腹いっぱい。
2022/12/14(水) 16:15:23.92 また取得エンジン不具合か・・・
2022/12/15(木) 10:52:17.55
2022/12/15(木) 14:09:48.67
最近サムネが沢山あるサイトを開くとサムネが表示されない事がある
683名無しさん@お腹いっぱい。
2022/12/17(土) 18:54:58.46 archive todayはwaybackmachineと違って全ツイートが保存できるんでしょうか?
初歩的な質問で、すみません
初歩的な質問で、すみません
2022/12/18(日) 18:14:08.31
>>683
全ツイート保存は無理だけどtodayの方が保存件数多いみたいね
数えてみたらWayBack で保存されるツイートは40件くらいだけど、 today は百数十件保存されてた
全ツイート保存は愚直に1ツイートずつ投げていくしかない
全ツイート保存は無理だけどtodayの方が保存件数多いみたいね
数えてみたらWayBack で保存されるツイートは40件くらいだけど、 today は百数十件保存されてた
全ツイート保存は愚直に1ツイートずつ投げていくしかない
2022/12/19(月) 08:35:36.36
例のWayback拒否ニュースサイトが記事にWaybackのリンクを貼るのはおかしいだろ
2022/12/19(月) 23:05:57.30
>>684
それが数百程度で済むならいいんだが数千、数万超えると自分一人だけの力だと到底取り切れなくなる
生半可な覚悟で挑戦して、中途半端に記録して挫折して、再開するかと思ったら鍵かけられたり最悪ツイ消し垢消し
これで何度苛付かされたか!
指定の垢のツイートをひたすら遡ってツイート1つ1つのURLをWaybackmachineにブチ込んでいく
これやらせるの別に生身の人間じゃなくても十分可能だと思うんだけど
それが数百程度で済むならいいんだが数千、数万超えると自分一人だけの力だと到底取り切れなくなる
生半可な覚悟で挑戦して、中途半端に記録して挫折して、再開するかと思ったら鍵かけられたり最悪ツイ消し垢消し
これで何度苛付かされたか!
指定の垢のツイートをひたすら遡ってツイート1つ1つのURLをWaybackmachineにブチ込んでいく
これやらせるの別に生身の人間じゃなくても十分可能だと思うんだけど
687名無しさん@お腹いっぱい。
2022/12/19(月) 23:45:24.38 todayはIPバレるみたいな話がありましたけど、今もそうなんですか?
2022/12/20(火) 07:55:12.74
689名無しさん@お腹いっぱい。
2022/12/20(火) 17:03:59.682022/12/23(金) 12:23:17.31
過去tweetの確認ですがwayback machineでjsonで保存されているやつは中身を見ることは出来ないんでしょうか
2022/12/24(土) 16:14:40.64
>>690
俺が知ってる限りない
もし元のツイートが現存してるならお手数おかけするが改めて取り直しておいて欲しい
マジで無能だと思うよ 折角取ったのにjsonとかいうよくわからん形式で保存しよってからに
俺が知ってる限りない
もし元のツイートが現存してるならお手数おかけするが改めて取り直しておいて欲しい
マジで無能だと思うよ 折角取ったのにjsonとかいうよくわからん形式で保存しよってからに
2022/12/24(土) 16:56:04.32
>>691
ありがとうございます 承知いたしました
ありがとうございます 承知いたしました
2022/12/25(日) 12:02:04.99
>>690
textがツイート本文なので、そこを変換すれば見れるよ
https://tech-unlimited.com/escape-unicode.html
jsonでも表示形式が違うだけでデータは保存されてる
textがツイート本文なので、そこを変換すれば見れるよ
https://tech-unlimited.com/escape-unicode.html
jsonでも表示形式が違うだけでデータは保存されてる
2022/12/26(月) 12:48:15.60
もうすぐ2023か…
インターネット上の情報がまた一つ年をとるのか…
残していかないとな
インターネット上の情報がまた一つ年をとるのか…
残していかないとな
2022/12/26(月) 14:51:38.79
>>693
見ること出来ました!大変ありがとうございました!
見ること出来ました!大変ありがとうございました!
2022/12/27(火) 16:49:50.40
広告画像のドメインは大半がブロックリストに入ってるけど
個人的にはああいうのも重要だと思うんだけどなぁ
個人的にはああいうのも重要だと思うんだけどなぁ
2023/01/01(日) 12:33:10.80
ゲームアツマールがサービス終了するらしいけど
サイトの構造的にアーカイブは厳しいかな?
サイトの構造的にアーカイブは厳しいかな?
ツイッターはモバイル用サイト(mobile.~)だと正常に保存されないのね
PC用サイトのURLを入力して保存する必要があるからスマホからだと気をつけないとならない
PC用サイトのURLを入力して保存する必要があるからスマホからだと気をつけないとならない
699名無しさん@お腹いっぱい。
2023/01/01(日) 15:17:22.03700名無しさん@お腹いっぱい。
2023/01/03(火) 01:24:57.31 archive todayでインスタ保存できるんやね
今日初めて知った
インスタはウェイバックで保存できないが故に記録が手薄になってるのは禍根を残すと思う
今日初めて知った
インスタはウェイバックで保存できないが故に記録が手薄になってるのは禍根を残すと思う
2023/01/03(火) 05:00:02.49
>>700
Wayback Machineで上手く保存できない所はArchive today使ってるなぁ
例えばboothの商品ページとかArchive today使ってる一方商品画像そのものはWayback Machineで録ってる
結局は最終的に原本が消える前にどこかに残せさえすればいい
Wayback Machineで上手く保存できない所はArchive today使ってるなぁ
例えばboothの商品ページとかArchive today使ってる一方商品画像そのものはWayback Machineで録ってる
結局は最終的に原本が消える前にどこかに残せさえすればいい
2023/01/07(土) 11:52:29.07
中の人曰く去年帯域幅を80Gbpsから140Gbpsに増やしたらしい
twitter.com/textfiles/status/1547365784770543618
だからちょっと早くなってるはず
https://twitter.com/5chan_nel (5ch newer account)
twitter.com/textfiles/status/1547365784770543618
だからちょっと早くなってるはず
https://twitter.com/5chan_nel (5ch newer account)
703名無しさん@お腹いっぱい。
2023/01/08(日) 12:48:26.32 twitterの保存がスムーズになってるな
2023/01/08(日) 20:48:19.82
今InternetArchiveの総データ量って
何PBになってるんだろうか
てかPBって冷静に考えるとクソ多いな
何PBになってるんだろうか
てかPBって冷静に考えるとクソ多いな
2023/01/08(日) 23:56:10.95
2023/01/09(月) 00:42:30.99
2021年12月時点で保存容量は212ペタバイトみたいだね
そのうち57ペタバイトをwaybackが占めているんだと
https://archive.org/web/petabox.php
そこらのサービスと違ってうっかりデータ破損でもした時に
賠償しますでは済まないのが恐ろしいね
人類が将来参照できる史料が一瞬で失われてしまうんだもの
そのうち57ペタバイトをwaybackが占めているんだと
https://archive.org/web/petabox.php
そこらのサービスと違ってうっかりデータ破損でもした時に
賠償しますでは済まないのが恐ろしいね
人類が将来参照できる史料が一瞬で失われてしまうんだもの
2023/01/09(月) 00:46:01.79
保存容量というよりデータ量といった方が正しいか
708名無しさん@お腹いっぱい。
2023/01/09(月) 19:41:49.29 インターネットアーカイブそのもののバックアップが将来的には必要だと思うけどね
2023/01/10(火) 08:41:36.86
There was a delay in registering this snapshot with the Wayback Machine.
The snapshot may not be available right now, please try again later.
→このスナップショットを Wayback Machine に登録するのに遅延がありました。
スナップショットは現在利用できない可能性があります。後でもう一度試してください。
後日忘れたころに取得できてるなら良いが、やり直さなきゃなんない可能性て・・・
The snapshot may not be available right now, please try again later.
→このスナップショットを Wayback Machine に登録するのに遅延がありました。
スナップショットは現在利用できない可能性があります。後でもう一度試してください。
後日忘れたころに取得できてるなら良いが、やり直さなきゃなんない可能性て・・・
2023/01/10(火) 16:06:49.97
スナップショット取得完了後にその保存ページを確認しても、のちに消えている可能性があるということ?
2023/01/10(火) 23:41:52.58
そう、それが心配
せっかく時間かけても消えてたら(取得できてなかったら)悲しい
今は「Job failed.」が出やすい
ようやく取得できたと思ったら今度は・・・
There was a delay in registering this snapshot with the Wayback Machine.
You may be redirected to a previous version right now. This snapshot will be available later.
→このスナップショットを Wayback Machine に登録するのに遅延がありました。
現在、以前のバージョンにリダイレクトされる場合があります。このスナップショットは後で利用可能になります。
本当に可能なら良いが
せっかく時間かけても消えてたら(取得できてなかったら)悲しい
今は「Job failed.」が出やすい
ようやく取得できたと思ったら今度は・・・
There was a delay in registering this snapshot with the Wayback Machine.
You may be redirected to a previous version right now. This snapshot will be available later.
→このスナップショットを Wayback Machine に登録するのに遅延がありました。
現在、以前のバージョンにリダイレクトされる場合があります。このスナップショットは後で利用可能になります。
本当に可能なら良いが
2023/01/10(火) 23:49:16.56
取得できたと思ったら→Doneになったと思ったら(取得できてるのかはまだ確実ではない)
2023/01/19(木) 00:07:06.28
最近のインターネットアーカイブ、この辺の時間ずっと落ちてるな
714名無しさん@お腹いっぱい。
2023/01/19(木) 06:33:50.542023/01/20(金) 18:32:14.50
今日はいつもに増して「Job failed.」が出る
やり直しも1分あたり3件までのしばりで非効率
やり直しも1分あたり3件までのしばりで非効率
2023/01/21(土) 10:48:18.26
皆様におかれましては既知であるとは思われますが、今やっと見付けたので共有いたしまする
Time Travel
timetravel.mementoweb.org
あっちこっちのWeb archiveを串刺しで検索してくれる
Time Travel
timetravel.mementoweb.org
あっちこっちのWeb archiveを串刺しで検索してくれる
717名無しさん@お腹いっぱい。
2023/01/21(土) 15:18:06.87718名無しさん@お腹いっぱい。
2023/01/21(土) 16:19:21.13 某有名人のインスタ調べたけど全くと言っていいほど保存されてなくて笑った。
もう少しインスタやらSNSやらの保存も強化しても良いんじゃないかと思った(まあ口出すなら寄付しろと言われるかもしれんが)
もう少しインスタやらSNSやらの保存も強化しても良いんじゃないかと思った(まあ口出すなら寄付しろと言われるかもしれんが)
719名無しさん@お腹いっぱい。
2023/01/21(土) 21:17:47.90 >>717
> あっちこっちのWeb archiveを串刺しで検索してくれる
> あっちこっちのWeb archiveを串刺しで検索してくれる
2023/01/22(日) 02:50:05.38
Internet Archive にアップロードされた DVD-ROM ディスクイメージから
中のファイルを直接ダウンロードすると、1 ギガバイトあたりでちょん切れる問題
https://archive.org/details/ti-308752-d-0-a-2
ここの TI308752D0A_2.ISO の中の ZZIMAGES/ZZIMAGES/PREINST7.SWM をダウンロードすると、
1485739900 バイトのはずが 1074528256 バイトで終わってしまう。
HTTP の Content-Length ヘッダは送られて来ないので、ダウンローダでの検知は不可能。
元の .iso をダウンロードすれば済む話なんだけどね。
パッケージの中のファイルが見える機能は便利でよく使うけど、こういう制限があるんだなぁ、と。
UDF 以外のファイルシステム (ISO 9660 とか Joliet とか) でも起こるかは未確認。
他のパッケージ形式 (.tar とか .7z とか .zip とか) で起こるかも未確認。
中のファイルを直接ダウンロードすると、1 ギガバイトあたりでちょん切れる問題
https://archive.org/details/ti-308752-d-0-a-2
ここの TI308752D0A_2.ISO の中の ZZIMAGES/ZZIMAGES/PREINST7.SWM をダウンロードすると、
1485739900 バイトのはずが 1074528256 バイトで終わってしまう。
HTTP の Content-Length ヘッダは送られて来ないので、ダウンローダでの検知は不可能。
元の .iso をダウンロードすれば済む話なんだけどね。
パッケージの中のファイルが見える機能は便利でよく使うけど、こういう制限があるんだなぁ、と。
UDF 以外のファイルシステム (ISO 9660 とか Joliet とか) でも起こるかは未確認。
他のパッケージ形式 (.tar とか .7z とか .zip とか) で起こるかも未確認。
2023/01/23(月) 18:48:19.71
PANDORATV
ウェブリブログ
Lobi
1月31日にサービス終了
ウェブリブログ
Lobi
1月31日にサービス終了
2023/01/28(土) 23:14:25.28
>>721
一度に複数のサービスがあと数日とかこんなん一人〜少人数が人力でカバーすんの無理やろ
一度に複数のサービスがあと数日とかこんなん一人〜少人数が人力でカバーすんの無理やろ
2023/01/29(日) 22:55:14.90
重い
724名無しさん@お腹いっぱい。
2023/01/30(月) 15:32:24.15 LINE BLOG サービス終了のお知らせ
https://lineblog.me/official/archives/1062469364.html
https://lineblog.me/official/archives/1062469364.html
2023/01/30(月) 15:46:52.71
それにつながらないことが多くて作業を進めづらいし
2023/01/30(月) 22:39:37.25
>>724
LINE BLOGさえも終わりか…
LINE BLOGさえも終わりか…
2023/01/31(火) 20:50:43.21
ただ今制限を設けております
2023/02/01(水) 19:31:42.08
一時応答しなくなってた
2023/02/02(木) 00:15:32.12
ところでさ、最近Save Page Nowの同時保存制限が3個から4個に変わった?
タブ4個開いて数秒で立て続けに保存ボタン押してもYou have already reachedって出ないんだけど。
5個目は今まで通り出て待たされるが。
タブ4個開いて数秒で立て続けに保存ボタン押してもYou have already reachedって出ないんだけど。
5個目は今まで通り出て待たされるが。
2023/02/03(金) 11:48:23.73
2023/02/04(土) 14:47:54.24
2023/02/04(土) 19:44:00.52
Firefoxユーザーだが今年に入ってから接続エラーばかりでweb.archive.org自体見れない状態が続いてたが、
about:supportにある「起動時キャッシュの消去」をしてみたら見れるようになって解決した。
同じ状況の人がいるなら自己責任で試してみるといいよ。一番上のリフレッシュのボタンは初期化されるから押さないように。
これをやった後でもたまに同じエラーが表示されるが前よりはマシになった。
about:supportにある「起動時キャッシュの消去」をしてみたら見れるようになって解決した。
同じ状況の人がいるなら自己責任で試してみるといいよ。一番上のリフレッシュのボタンは初期化されるから押さないように。
これをやった後でもたまに同じエラーが表示されるが前よりはマシになった。
2023/02/05(日) 19:08:01.22
どうもユーザの新規登録周りがおかしくなってるような。
メアドやパスワードを入れて、認証メールが来るところまでは良いんだけど
ある条件の時、メールに記載された URL を開いても常に Sorry, we're kinda busy になってしまう。
ユーザ名が英数字のみの時は問題なし、かな漢字や絵文字を使うとダメ。
おそらくプロフページの URL が archive.org/details/@user_数字
となるようなケースで問題が起きてるのではないかと。
メアドやパスワードを入れて、認証メールが来るところまでは良いんだけど
ある条件の時、メールに記載された URL を開いても常に Sorry, we're kinda busy になってしまう。
ユーザ名が英数字のみの時は問題なし、かな漢字や絵文字を使うとダメ。
おそらくプロフページの URL が archive.org/details/@user_数字
となるようなケースで問題が起きてるのではないかと。
2023/02/05(日) 21:09:01.70
>>730
問題無いけどなぁ。
GET /save/status/user HTTP/1.1
Accept: application/json
Authorization: LOW xxxxxxxxxxxxxxxx:xxxxxxxxxxxxxxxx
Connection: close
Host: web.archive.org
HTTP/1.1 200 OK
Server: nginx/1.19.5
Date: Sun, 05 Feb 2023 12:06:03 GMT
Content-Type: application/json
Content-Length: 79
Connection: close
x-app-server: wwwb-app53
x-ts: 200
x-tr: 79
X-location: save2stat
X-RL: 0
X-NA: 1
X-Page-Cache: MISS
X-NID: -
Referrer-Policy: no-referrer-when-downgrade
Permissions-Policy: interest-cohort=()
{"available":8,"daily_captures":0,"daily_captures_limit":100000,"processing":0}
問題無いけどなぁ。
GET /save/status/user HTTP/1.1
Accept: application/json
Authorization: LOW xxxxxxxxxxxxxxxx:xxxxxxxxxxxxxxxx
Connection: close
Host: web.archive.org
HTTP/1.1 200 OK
Server: nginx/1.19.5
Date: Sun, 05 Feb 2023 12:06:03 GMT
Content-Type: application/json
Content-Length: 79
Connection: close
x-app-server: wwwb-app53
x-ts: 200
x-tr: 79
X-location: save2stat
X-RL: 0
X-NA: 1
X-Page-Cache: MISS
X-NID: -
Referrer-Policy: no-referrer-when-downgrade
Permissions-Policy: interest-cohort=()
{"available":8,"daily_captures":0,"daily_captures_limit":100000,"processing":0}
2023/02/06(月) 11:45:14.45
2023/02/12(日) 06:52:17.87
リンク先が画像の場合は自動で保存してほしいんだよなぁ。
サムネだけ保存しても意味無いし。
サムネだけ保存しても意味無いし。
2023/02/12(日) 11:00:21.26
>>736
Save outlinks 使えよ
Save outlinks 使えよ
2023/02/12(日) 21:00:12.74
>>736
ChatGPT(人工知能)を学習させといた
https://i.imgur.com/VX6qxTj.png
問: Internet Archive の wayback machine を知っていますか?
答: はい、私は Internet Archive の Wayback Machine について知っています。(以下省略)
問: Wayback Machine の "Save Page Now" で保存したいページ内のリンク先のページも同時に保存する方法を教えてください。
答: Wayback Machine の "Save Page Now" を使用して、ページ内のリンク先のページも同時に保存することはできません。Wayback Machine は、単独のページを保存することしかできません。(以下省略)
問: あなたの回答は、間違っています。Wayback Machine の "Save Page Now" で外部リンクを保存するには、Internet Archive にログインすると使えるようになる "Save outlinks" オプションを使います。
答: 申し訳あります。その通りです。Wayback Machine の "Save Page Now" 機能には、Internet Archive にログインすると使える "Save outlinks" オプションがあります。このオプションを使用することで、ページ内の外部リンクも同時に保存することができます。再度、お詫び申し上げます。ありがとうございました。
ChatGPT(人工知能)を学習させといた
https://i.imgur.com/VX6qxTj.png
問: Internet Archive の wayback machine を知っていますか?
答: はい、私は Internet Archive の Wayback Machine について知っています。(以下省略)
問: Wayback Machine の "Save Page Now" で保存したいページ内のリンク先のページも同時に保存する方法を教えてください。
答: Wayback Machine の "Save Page Now" を使用して、ページ内のリンク先のページも同時に保存することはできません。Wayback Machine は、単独のページを保存することしかできません。(以下省略)
問: あなたの回答は、間違っています。Wayback Machine の "Save Page Now" で外部リンクを保存するには、Internet Archive にログインすると使えるようになる "Save outlinks" オプションを使います。
答: 申し訳あります。その通りです。Wayback Machine の "Save Page Now" 機能には、Internet Archive にログインすると使える "Save outlinks" オプションがあります。このオプションを使用することで、ページ内の外部リンクも同時に保存することができます。再度、お詫び申し上げます。ありがとうございました。
2023/02/13(月) 00:02:24.47
2023/02/13(月) 19:59:01.85
2023/02/13(月) 20:23:37.77
>>740
手で掘れよ、どーせ暇なんだろ?
手で掘れよ、どーせ暇なんだろ?
742名無しさん@お腹いっぱい。
2023/02/15(水) 10:15:39.14 curlでの保存確認が途中から429エラーになる。
743名無しさん@お腹いっぱい。
2023/02/15(水) 18:49:59.88 https://web.archive.org/web/20230215084609/https://fig-memo-r18.site/figurereview/93774/
ベタベタ貼ってるアフィのせいか延々と読み込み繰り返して見れないんだが何か対応策とかないかね
ベタベタ貼ってるアフィのせいか延々と読み込み繰り返して見れないんだが何か対応策とかないかね
2023/02/16(木) 04:32:39.08
>>742
Status: 429 - Too Many Requests
API で User status を調べて available が1以上になるまで待ってから次の処理をする
{"available":8,"daily_captures":58,"daily_captures_limit":100000,"processing":0}
{"available":0,"daily_captures":170,"daily_captures_limit":100000,"processing":24}
Status: 429 - Too Many Requests
API で User status を調べて available が1以上になるまで待ってから次の処理をする
{"available":8,"daily_captures":58,"daily_captures_limit":100000,"processing":0}
{"available":0,"daily_captures":170,"daily_captures_limit":100000,"processing":24}
2023/02/16(木) 06:56:24.96
>>738
Bing の AI Chat が使えるようになたので Wayback Machine について
訊いてみたら、AI が Wayback Machine を使ってユーザーの質問に
答えることができると言っていた
https://i.imgur.com/rZeedlY.png
Bing の AI Chat が使えるようになたので Wayback Machine について
訊いてみたら、AI が Wayback Machine を使ってユーザーの質問に
答えることができると言っていた
https://i.imgur.com/rZeedlY.png
746LBXBB
2023/02/16(木) 13:28:08.07 3日前ぐらいから、Internet Archiveに繋がりにくくなっているんですけど、同じ症状に悩んでる同士いますか?
2023/02/17(金) 07:27:55.83
「The capture will start in ~* hour, ** minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.」
数分単位はここ数日見かけるが、○時間単位とか久々
数分単位はここ数日見かけるが、○時間単位とか久々
748名無しさん@お腹いっぱい。
2023/02/17(金) 12:27:29.15 twitter保存できなくなった?
保存してもツイートが表示されない
自分だけ?
保存してもツイートが表示されない
自分だけ?
2023/02/17(金) 19:10:36.19
>>748
モバイル用URLを突っ込んでない?
モバイル用URLを突っ込んでない?
2023/02/18(土) 08:47:18.37
748とは別だけど、モバイルドメイン関係なく昨日の夜からツイートのURLを保存しようとするとJob failedしか出ないわ
2023/02/18(土) 10:55:10.00
てかツイートを保存しようとするとapi.twitter.comの方にリダイレクトされてちゃんと保存されてないな。
Twitter APIの改悪は関係あるのかこれ。
Twitter APIの改悪は関係あるのかこれ。
2023/02/19(日) 07:27:45.62
753名無しさん@お腹いっぱい。
2023/02/19(日) 13:34:25.72 すまん、748だけど数日経って確認したら保存できてたわ。 保存の仕様が変わってtweetが見れるようになるまで時間がかかることがあるみたい。 直近3200ツイートを同時保存する機能も追加されてる。
2023/02/21(火) 00:31:31.75
755名無しさん@お腹いっぱい。
2023/02/21(火) 21:53:11.17 >>754
save page nowにtwitterのリンク入れると出るよ。
save page nowにtwitterのリンク入れると出るよ。
2023/02/22(水) 03:03:59.75
>>755
あなたは、選ばれし者のようですね。
□ Archive up to 3,200 most recent Tweets from this Twitter profile
こちらでは、twitter_archiver は "display: none" として隠されていました。
https://i.imgur.com/8VuNUdB.gif
|<div id="wm-twitter-archiver" style="display: none;">
| <input type="checkbox" name="twitter_archiver" id="twitter_archiver">
| <label for="twitter_archiver">Archive up to 3,200 most recent Tweets from this Twitter profile</label>
|</div>
あなたは、選ばれし者のようですね。
□ Archive up to 3,200 most recent Tweets from this Twitter profile
こちらでは、twitter_archiver は "display: none" として隠されていました。
https://i.imgur.com/8VuNUdB.gif
|<div id="wm-twitter-archiver" style="display: none;">
| <input type="checkbox" name="twitter_archiver" id="twitter_archiver">
| <label for="twitter_archiver">Archive up to 3,200 most recent Tweets from this Twitter profile</label>
|</div>
2023/02/22(水) 03:56:35.13
https://web.archive.org/_static/js/bundle-spn.js
クッキーを読んでログインユーザだと判定すると
#wm-capture-outlinks や #wm-capture-screenshot 等を非表示解除してるけど、
それとは別の条件で #wm-twitter-archiver の非表示を解除してるなぁ。
クッキーを読んでログインユーザだと判定すると
#wm-capture-outlinks や #wm-capture-screenshot 等を非表示解除してるけど、
それとは別の条件で #wm-twitter-archiver の非表示を解除してるなぁ。
758名無しさん@お腹いっぱい。
2023/02/22(水) 04:37:36.03 >>756
display: none消して、style変更してチェックボックス出現させたら動作してくれたりしない?
display: none消して、style変更してチェックボックス出現させたら動作してくれたりしない?
759名無しさん@お腹いっぱい。
2023/02/22(水) 10:58:16.45 ボタンが表示される条件分かったわ
トップページのSave Page Nowに入力するだけだと表示されない
遷移後のページ( https://web.archive.org/save )で再入力すると表示される
対応URLはTwittetのプロフィールページ
(mobile.twitter.comは非対応)
トップページのSave Page Nowに入力するだけだと表示されない
遷移後のページ( https://web.archive.org/save )で再入力すると表示される
対応URLはTwittetのプロフィールページ
(mobile.twitter.comは非対応)
760名無しさん@お腹いっぱい。
2023/02/22(水) 10:58:31.78 神機能だな
2023/02/24(金) 04:07:00.59
重い重い
![](http://o.5ch.net/20kcs.png)
2023/02/24(金) 04:25:43.53
重いというか、午前1時頃以降に保存しようとした分は保存できてないっぽい。
SPNの復帰まで待つしかないな。
SPNの復帰まで待つしかないな。
2023/02/24(金) 05:25:25.65
2023/02/24(金) 05:47:30.05
と思ったらつながりづらい
これでは二重苦
今のうちに保存しなきゃなんないものが多いときにかぎ・・・いえ、なんでも
これでは二重苦
今のうちに保存しなきゃなんないものが多いときにかぎ・・・いえ、なんでも
2023/02/24(金) 13:49:21.36
3200ツイート保存できるやつ、使ってる人がいたら何日位で完了したか教えてほしい
自分は2日経ったけどまだ完了メールが来ない
自分は2日経ったけどまだ完了メールが来ない
2023/02/24(金) 18:30:54.01
763の件、今は数分〜10数分に落ち着いた
2023/02/26(日) 13:10:11.40
>>765だけど今見たら完了してた
あと下のエラーが出たから、1日に合計1万ツイートが限界っぽい
複数ユーザーをアーカイブしたいときは注意
This host has been already captured 10,000 times today by this user account.
あと下のエラーが出たから、1日に合計1万ツイートが限界っぽい
複数ユーザーをアーカイブしたいときは注意
This host has been already captured 10,000 times today by this user account.
2023/03/01(水) 03:57:25.37
初心者なんですけどアーカイブしたあともとのURLを無くしたら発掘するのは不可能ですか?
もちろん検索機能なんてないですよね
もちろん検索機能なんてないですよね
769名無しさん@お腹いっぱい。
2023/03/01(水) 04:05:45.32 フリーワードで検索できるよ
770名無しさん@お腹いっぱい。
2023/03/01(水) 13:22:58.05 【中居正広】 ワク接種 ⇒ 虫垂炎 ⇒ ターボ癌
://mao.5ch.net/test/read.cgi/cancer/1668137860/l50
://mao.5ch.net/test/read.cgi/cancer/1668137860/l50
![](http://o.5ch.net/20lio.png)
771名無しさん@お腹いっぱい。
2023/03/01(水) 14:11:13.392023/03/01(水) 14:58:25.32
2023/03/01(水) 17:02:04.45
>>771
見せたくない情報ならそもそもネット上に載せるなと言いたいね
見せたくない情報ならそもそもネット上に載せるなと言いたいね
774名無しさん@お腹いっぱい。
2023/03/02(木) 00:05:27.82 ニュース記事とかだったらtwitterに共有された短縮リンクの残骸とかが残ってたりするから、twitterで検索かけたりしてみてみるのもあり。
2023/03/06(月) 23:55:19.29
20数分待ち
また○時間単位まで膨れ上がってしまうのかどうか
また○時間単位まで膨れ上がってしまうのかどうか
2023/03/07(火) 01:01:54.86
残念ながら本当に膨れ上がった
2023/03/07(火) 07:36:38.75
と思ったら今度は>>764
2023/03/09(木) 20:01:49.70
ようやく8000億突破したね
2023/03/10(金) 22:36:33.18
>>778
過去6年分遡って表示されてるページ数確認してみた
毎年約1.2倍ペースで指数関数的に増えてるみたい
https://i.imgur.com/pOsie9N.jpg
※2016年10月に数え方が変わったか何かで大幅に数字が減少してたから2017年から表示してる
過去6年分遡って表示されてるページ数確認してみた
毎年約1.2倍ペースで指数関数的に増えてるみたい
https://i.imgur.com/pOsie9N.jpg
※2016年10月に数え方が変わったか何かで大幅に数字が減少してたから2017年から表示してる
2023/03/10(金) 22:38:45.08
2023/03/14(火) 12:04:02.25
https://web.archive.org/web/20230000000000*/www.tokyo-sports.co.jp/
スポーツ新聞野郎、2月は入院でもしてたのかw
スポーツ新聞野郎、2月は入院でもしてたのかw
2023/03/15(水) 13:50:39.43
2023/03/15(水) 18:29:13.47
また>>775
2023/03/15(水) 21:00:18.98
その後39分待ちをピークに落ち着いた
2023/03/16(木) 08:48:47.33
反応はあるけど落ちてる
![](http://o.5ch.net/20p7u.png)
2023/03/16(木) 10:03:03.66
<a href="http://o.5ch.net/20p7u.png"><img src="http://o.5ch.net/20p7u.png" />
2023/03/16(木) 18:56:40.40
1時間待ち
よりによって取得しなきゃなんないものが多(ry
ただ時間がかかるだけならわからないではない(のちのち無事取得できてるなら良い)
だが待った挙げ句「Job failed」で取得できてないこともあるし、
早く済ませたいからと取得するものがあまり多いと「429 Too Many Requests」が出たり、
最悪つながらなかったり
よりによって取得しなきゃなんないものが多(ry
ただ時間がかかるだけならわからないではない(のちのち無事取得できてるなら良い)
だが待った挙げ句「Job failed」で取得できてないこともあるし、
早く済ませたいからと取得するものがあまり多いと「429 Too Many Requests」が出たり、
最悪つながらなかったり
2023/03/16(木) 20:35:28.47
787の件は落ち着いた
2023/03/16(木) 22:53:47.10
せっかく落ち着いたと思ったらまた20数分待ちか
2023/03/19(日) 00:40:27.17
This host has been already captured 100,845.0 times today. Please try again tomorrow. Please email us at "info@archive.org" if you would like to discuss this more.
みんなでYoutubeの様々なページを10万個保存し続けたらこの制限エラーが出るわけか?
アメリカ時間基準でも1日が始まってから15時間半でこの表示が出たら結構困るんだけど。
SNS系サイトのドメインは制限取っ払って欲しいな。
みんなでYoutubeの様々なページを10万個保存し続けたらこの制限エラーが出るわけか?
アメリカ時間基準でも1日が始まってから15時間半でこの表示が出たら結構困るんだけど。
SNS系サイトのドメインは制限取っ払って欲しいな。
2023/03/19(日) 01:01:44.26
792790
2023/03/19(日) 02:05:20.29 どうも。その書き込みの1つ(>>113)は俺だから覚えてるけど、
YoutubeのURLを保存しようとしてこのエラーが出たのは初めて見かけたので、報告の意味で書いた。
制限取っ払ってほしい状況は1年半前と変わってない。
YoutubeのURLを保存しようとしてこのエラーが出たのは初めて見かけたので、報告の意味で書いた。
制限取っ払ってほしい状況は1年半前と変わってない。
2023/03/19(日) 02:23:57.43
2023/03/22(水) 05:38:12.76
Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.
1回でただけだが
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.
1回でただけだが
2023/03/22(水) 12:15:17.01
40数分待ち
ただし、PDFは除く(過去には逆にPDFが時間かかるということがあったが)
ただし、PDFは除く(過去には逆にPDFが時間かかるということがあったが)
2023/03/22(水) 13:17:49.38
2023/03/22(水) 21:50:02.10
zippyshare閉鎖マジ?
2023/03/23(木) 11:48:24.14
noteてとれないんだっけ
2023/03/23(木) 13:26:31.42
Note.comはSPNで保存できるけど、robots.txtでia_archiveをブロックしてるから保存してるのを見れないって状態。
Noteが閉鎖してrobots.txtが消されて解消するか、IAがrobots.txtを完全無視する方針になったら多分復活するはず。
保存できるならしとくだけしといたほうがいい。Availability APIでも保存されてるスナップショットはないって返ってきちゃうけどね。
何年か前に投稿者のIPアドレスかホスト名が載ってた時のも含めてデータ自体はどこかに残ってる。
Noteが閉鎖してrobots.txtが消されて解消するか、IAがrobots.txtを完全無視する方針になったら多分復活するはず。
保存できるならしとくだけしといたほうがいい。Availability APIでも保存されてるスナップショットはないって返ってきちゃうけどね。
何年か前に投稿者のIPアドレスかホスト名が載ってた時のも含めてデータ自体はどこかに残ってる。
2023/03/23(木) 17:28:19.93
2023/03/23(木) 19:27:09.83
2023/03/23(木) 20:35:30.06
2023/03/25(土) 13:44:06.78
IAがフェアユースに基づくと主張して電子書籍を公開していたことに対して、
出版社が著作権侵害を申し立てた裁判の判決が下された
判決は出版社の主張が認められ、IAの敗訴
IAはこの判決を不服とし控訴すると宣言
https://i.imgur.com/atO3lrP.jpg
【関連記事】
The Fight Continues
http://blog.archive.org/2023/03/25/the-fight-continues/
The Internet Archive has lost its first fight to scan and lend e-books like a library
https://www.theverge.com/2023/3/24/23655804/internet-archive-hatchette-publisher-ebook-library-lawsuit
U.S. judge rules Internet Archive's digital book lending violates copyrights
https://www.reuters.com/legal/us-judge-rules-internet-archives-digital-book-lending-violates-copyrights-2023-03-25/
Judge Decides Against Internet Archive
https://file770.com/judge-decides-against-internet-archive/
出版社が著作権侵害を申し立てた裁判の判決が下された
判決は出版社の主張が認められ、IAの敗訴
IAはこの判決を不服とし控訴すると宣言
https://i.imgur.com/atO3lrP.jpg
【関連記事】
The Fight Continues
http://blog.archive.org/2023/03/25/the-fight-continues/
The Internet Archive has lost its first fight to scan and lend e-books like a library
https://www.theverge.com/2023/3/24/23655804/internet-archive-hatchette-publisher-ebook-library-lawsuit
U.S. judge rules Internet Archive's digital book lending violates copyrights
https://www.reuters.com/legal/us-judge-rules-internet-archives-digital-book-lending-violates-copyrights-2023-03-25/
Judge Decides Against Internet Archive
https://file770.com/judge-decides-against-internet-archive/
2023/03/28(火) 22:14:09.96
doi.orgを保存しようとすると403エラーで保存できないって返ってくるのはちょっとまずいな。
サイト閉鎖したら転送先の論文URLを探すの大変だわ。
サイト閉鎖したら転送先の論文URLを探すの大変だわ。
2023/03/29(水) 00:46:01.00
LinkedIn も Internet Archive をブロック
999 とか変なエラーコード返して来てるw
999 とか変なエラーコード返して来てるw
![](http://o.5ch.net/20s2r.png)
2023/03/29(水) 02:14:03.72
日付が変わってすぐは数分待ちだったのが、1時間待ちに
2023/03/29(水) 19:37:54.81
>>799
ほー 勉強になあるわ
ほー 勉強になあるわ
2023/03/29(水) 19:39:49.22
>>803
同 ps://scan.netsecurity.ne.jp/article/2023/03/28/49118.html
同 ps://scan.netsecurity.ne.jp/article/2023/03/28/49118.html
2023/03/29(水) 23:39:14.48
PDF以外もPDFも数十分待ち
2023/03/30(木) 01:20:09.90
2時間待ち
昨日の比ではない膨れ上がり方・・・
昨日の比ではない膨れ上がり方・・・
2023/03/30(木) 05:23:29.98
今の所1時間45分待ち
午前0時半にボタン押した分が20230329172xxxだから日本時間で午前2時半に保存完了してた
1時間50分後ぐらいだから予定時間通りの遅れ
午前0時半にボタン押した分が20230329172xxxだから日本時間で午前2時半に保存完了してた
1時間50分後ぐらいだから予定時間通りの遅れ
2023/03/30(木) 06:18:00.83
こっちは4時間待ちに
環境によるのか・・・
環境によるのか・・・
2023/03/30(木) 14:24:03.48
昨日からsave待ちメッセージ いったいなんなのよ ということで
The capture will start in ~4 hours, 12 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.
The capture will start in ~4 hours, 12 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.
2023/03/30(木) 14:51:09.40
>>798-799
過去にIAにいくつか保存したnote記事が、note側がIA保存対策したのか、その後IA上に残ってなかった覚えがある。(非公開のままか、本当にキャッシュを削除したのは不明)
saveしたとしても、後にサイト側からの要求でキャッシュ一斉削除される可能性は0ではないんだろうなと。
過去にIAにいくつか保存したnote記事が、note側がIA保存対策したのか、その後IA上に残ってなかった覚えがある。(非公開のままか、本当にキャッシュを削除したのは不明)
saveしたとしても、後にサイト側からの要求でキャッシュ一斉削除される可能性は0ではないんだろうなと。
2023/03/30(木) 15:04:06.33
test
2023/03/30(木) 15:04:44.65
保存してキャッシュがその時は見れてたのに、ある日を境に、
web.archive.org/web/*/ note.com/{.../記事ID}
でいうカレンダーページに、何もキャッシュが残ってなかったっていうことね。
web.archive.org/web/*/ note.com/{.../記事ID}
でいうカレンダーページに、何もキャッシュが残ってなかったっていうことね。
2023/03/30(木) 19:57:54.23
昨日の夕方だか夜からの長時間待ち、まだ落ち着いてないなぁ
環境によるだろうが、こっちは3時間台
環境によるだろうが、こっちは3時間台
2023/03/30(木) 20:55:02.40
>>815-817
そもそもアーカイブされた内容の「削除」って、出来るのか?
サイト別に分けて保存している訳じゃあるまいし
申し出のあったサイトについて、前方一致か何かで非表示にしてるだけだろ
ちなみに例の事件の直後、note から IA へ連絡が行ったようで
全体が excluded になった話は前スレで既出
robots.txt 云々と過去の仕様の話をしてる奴は無視するに限る
そもそもアーカイブされた内容の「削除」って、出来るのか?
サイト別に分けて保存している訳じゃあるまいし
申し出のあったサイトについて、前方一致か何かで非表示にしてるだけだろ
ちなみに例の事件の直後、note から IA へ連絡が行ったようで
全体が excluded になった話は前スレで既出
robots.txt 云々と過去の仕様の話をしてる奴は無視するに限る
2023/03/30(木) 22:07:48.83
1時間待ちだの24分待ちだの今日は長過ぎる・・・何の制限なんだ
2023/03/30(木) 23:17:44.96
2023/03/31(金) 01:41:44.50
ついに5時間台
こりゃ落ち着きそうにない
こりゃ落ち着きそうにない
2023/03/31(金) 08:42:19.81
The capture will start in ~7 hours, 52 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.
珍しい。
珍しい。
2023/03/31(金) 12:29:09.15
やっとオーバーロードの表示出なくなったのはいいんだけど、
ボタン押して保存始まるまで1分ぐらい待たされてる感じがあるのは俺環か気のせい?
何時間も待たされるよりはいいけどさ。
ボタン押して保存始まるまで1分ぐらい待たされてる感じがあるのは俺環か気のせい?
何時間も待たされるよりはいいけどさ。
2023/03/31(金) 12:40:18.39
10分経たずに9時間待ちに戻っちゃった。短い昼休みだったな〜
2023/03/31(金) 20:01:21.74
同じIPアドレスのまま初めの2〜3回目は待ち時間なしで、3〜4回目を保存しようとすると急に30分〜9時間待ちの表示が出る仕様になってる?
昼ぐらいから何度か試したけど、このパターンにハマることがやけに多いんだが。スマホ回線で試しても同じパターン。
このスレでもここ数日は人や環境によって表示される待ち時間がバラバラになってるようだし。
ちょっと時間を空けると同じIPアドレスでも待ち時間なしに戻る。この仮説が正しいとするとひどいイジワルされてる気持ちになるわ。
大量のURLにすぐに保存したい人にとっては作業時間増えてイライラするだろうな。
昼ぐらいから何度か試したけど、このパターンにハマることがやけに多いんだが。スマホ回線で試しても同じパターン。
このスレでもここ数日は人や環境によって表示される待ち時間がバラバラになってるようだし。
ちょっと時間を空けると同じIPアドレスでも待ち時間なしに戻る。この仮説が正しいとするとひどいイジワルされてる気持ちになるわ。
大量のURLにすぐに保存したい人にとっては作業時間増えてイライラするだろうな。
2023/04/01(土) 17:23:00.03
イジワルねえ…
あくまでも無料なんだからさ(無料だからっていう理由も不明だが)。ボランティアみたいなもんだろうからさ。
「すぐに保存したい」っていうのが「IAに投げる自分の作業をすぐに完了させたい」という意味なら、その作業を自動的にする環境を自前で作るしかないような。
あくまでも無料なんだからさ(無料だからっていう理由も不明だが)。ボランティアみたいなもんだろうからさ。
「すぐに保存したい」っていうのが「IAに投げる自分の作業をすぐに完了させたい」という意味なら、その作業を自動的にする環境を自前で作るしかないような。
2023/04/01(土) 19:18:22.71
占有すんなってことかね
2023/04/01(土) 22:42:50.18
826の件は多分昨日だけだったんじゃね?今日は起きてないし
それよりもエイプリルフールのサイトは日付変わる前にできるだけ保存しとけよ
二度と見れなくなるぞ
それよりもエイプリルフールのサイトは日付変わる前にできるだけ保存しとけよ
二度と見れなくなるぞ
2023/04/02(日) 17:09:52.15
ブルーアーカイブとかいうゲームが登場したせいでスレッド検索がしづらくなったな
2023/04/02(日) 23:30:28.00
最後にドット付けて「archive.」で検索すれば一発でこのスレ出てくるよ。
使ってるスレ検索で対応してればだけど。正規表現も対応してたら他のスレも出てくるかも。
使ってるスレ検索で対応してればだけど。正規表現も対応してたら他のスレも出てくるかも。
832memo
2023/04/03(月) 11:15:59.88 Sorry
Please try again in ~32 min. Crawling this host is paused because they notified us that they are overloaded right now.
Please try again in ~32 min. Crawling this host is paused because they notified us that they are overloaded right now.
833名無しさん@お腹いっぱい。
2023/04/03(月) 21:04:58.51 「Archive up to 3,200 most recent Tweets from this Twitter profile」
これ
これ
2023/04/03(月) 21:12:00.39
やべっ誤操作で途中で書き込まれちゃった。
「Archive up to 3,200 most recent Tweets from this Twitter profile」
未ログインでも出てくるこのオプションって、ログインしないと有効にならないの?
未ログインでそのオプション付けても付けなくても41件しか取れてないようだった。
「Archive up to 3,200 most recent Tweets from this Twitter profile」
未ログインでも出てくるこのオプションって、ログインしないと有効にならないの?
未ログインでそのオプション付けても付けなくても41件しか取れてないようだった。
2023/04/04(火) 08:58:54.78
2023/04/04(火) 10:36:57.65
/*/のページだけど1度しか保存されてないURLはリンク先が/*/じゃなくて直接保存されてるスナップショットURLに変わった?
2023/04/04(火) 23:41:19.62
835の件、結局1時間待ちに
先月末の膨れ上がり方よりは増しとはいえ・・・
先月末の膨れ上がり方よりは増しとはいえ・・・
2023/04/05(水) 07:46:24.46
皆さんインスタって何で保存してますか?
evernote良かったんですけど無料版の容量少なすぎる…
WAYBACKもarchive.todayもfreezepageもzoom.itも保存出来ないし…
evernote良かったんですけど無料版の容量少なすぎる…
WAYBACKもarchive.todayもfreezepageもzoom.itも保存出来ないし…
別スレッド(https://mevius.5ch.net/test/read.cgi/internet/1554553882/874)に書き込んだ874だが、
>>838は、私の書き込みではないのであしからず。(マルチポストではない。)
念のため書いとくわ。
>>838は、私の書き込みではないのであしからず。(マルチポストではない。)
念のため書いとくわ。
2023/04/06(木) 15:26:20.14
TwitterのAPIが止まったら最新3200個の選択肢のやつもダメなわけ?
それでもsnscrapeはAPI止まった今でも使えるんだよな。だからツイートURL取り出すだけなら今もできるはず。
それでもsnscrapeはAPI止まった今でも使えるんだよな。だからツイートURL取り出すだけなら今もできるはず。
841名無しさん@お腹いっぱい。
2023/04/07(金) 05:30:57.28842名無しさん@お腹いっぱい。
2023/04/07(金) 08:31:01.98 上の方も書き込んでおられましたが、やはりwaybackは1万URLしか保存できず、古いものから順番に消えていくのでしょうか?
archivestodayも2700個しか見れず、それより古いものは見れないような。
archivestodayも2700個しか見れず、それより古いものは見れないような。
2023/04/07(金) 10:15:52.32
>>842
作文の勉強からやり直せ
作文の勉強からやり直せ
2023/04/07(金) 16:20:44.43
2023/04/07(金) 20:41:57.08
全URL欲しい場合は>>332 に書いてあるWayback CDX Server API 使うのが良さそうだね
データ整形が面倒だけど
https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server#query-result-limits
データ整形が面倒だけど
https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server#query-result-limits
84639
2023/04/08(土) 09:05:42.83 ここ一週間ほど、訳あって非ログイン且つ Tor 経由で作業してるけど
今日初めて、それも 8:50 になってからやっとこのメッセージを見た。
>>39 より保存数の制限は厳しくなってるけど、24 時間で使いきれるかどうかの線なのね。
9:00 まで待ったら保存できたのは言うまでもない。
今日初めて、それも 8:50 になってからやっとこのメッセージを見た。
>>39 より保存数の制限は厳しくなってるけど、24 時間で使いきれるかどうかの線なのね。
9:00 まで待ったら保存できたのは言うまでもない。
![](http://o.5ch.net/20ui0.png)
2023/04/10(月) 12:39:35.47
なろう系の金字塔オーバーロード
2023/04/10(月) 12:43:02.28
薬屋のひとりごとを知らん情弱め
2023/04/11(火) 19:42:57.17
>>826
3〜4回目どころかすぐに30分待ち・・・
3〜4回目どころかすぐに30分待ち・・・
2023/04/12(水) 01:12:07.58
3200ツイートのやつを使おうとしたときに出たエラー
Sorry.
This snapshot cannot be displayed due to an internal error.
Sorry.
This snapshot cannot be displayed due to an internal error.
2023/04/12(水) 05:51:06.28
4時間待ち
今月になってから最もひどい
今月になってから最もひどい
2023/04/12(水) 15:05:08.26
非ログイン状態で3200ツイート取れるの無くなってるな
やっぱバグだったのか
やっぱバグだったのか
2023/04/12(水) 16:52:17.80
俺の環境では表示されるけど。ただし一度も保存に成功した事ない。
「twitter.com/アカウント名」だけでURL最後に/があると表示されない。
「twitter.com/アカウント名」だけでURL最後に/があると表示されない。
2023/04/12(水) 18:15:30.16
851の件は今は3時間台
あれから落ち着いてるのか、一旦落ち着いてからまた膨れ上がってるのか・・・
あれから落ち着いてるのか、一旦落ち着いてからまた膨れ上がってるのか・・・
2023/04/12(水) 22:54:00.64
2023/04/13(木) 01:02:45.12
同時に2つ保存しようとしたらそれぞれ40分と5時間40分待ちになった
826と似た状態がまだ続いてるのか?
ページ削除される時間がわかってるなら都合の悪いURLを長時間待ち状態して保存されないよう時間稼ぎする悪用方法が思いついたわw
826と似た状態がまだ続いてるのか?
ページ削除される時間がわかってるなら都合の悪いURLを長時間待ち状態して保存されないよう時間稼ぎする悪用方法が思いついたわw
2023/04/13(木) 07:11:45.73
2023/04/13(木) 12:36:26.31
2023/04/13(木) 18:06:06.44
>失敗するときは閉じようが閉じまいが失敗してる
それは確かにそうだが・・・
閉じなければ「Job failed」が出てるのかどうかで区別がつくが、
閉じたらどれが取得できててどれが失敗してるのか調べないとなぁ
取得するものが少ないときはそれでも良いが多いときは・・・
それは確かにそうだが・・・
閉じなければ「Job failed」が出てるのかどうかで区別がつくが、
閉じたらどれが取得できててどれが失敗してるのか調べないとなぁ
取得するものが少ないときはそれでも良いが多いときは・・・
2023/04/13(木) 19:39:11.99
ようやく数時間待ちから数十分待ちに
数十分ですら増しに思えてくる状況
数十分ですら増しに思えてくる状況
2023/04/13(木) 23:56:28.81
アーカイブされたWEBページ見ると
管理人プロフィールに電話番号書いてあったり
住所書いてあったりすることあるな…
リンクからアーカイブURL探さないとまともに辿れないから
検索機能が進化しなきゃ今の所問題にはならないんだろうけど
問題になった時アーカイブ大量削除されそうで怖いな
管理人プロフィールに電話番号書いてあったり
住所書いてあったりすることあるな…
リンクからアーカイブURL探さないとまともに辿れないから
検索機能が進化しなきゃ今の所問題にはならないんだろうけど
問題になった時アーカイブ大量削除されそうで怖いな
2023/04/14(金) 01:08:04.96
ネットで匿名で物を売りたいやつは特商法違反なんで警察と消費者庁へ通報どうぞ
2023/04/15(土) 05:41:20.90
めっちゃ見当違いの書き込みだな
2023/04/15(土) 23:11:43.58
We're sorry — something's gone wrong.
Our team has been notified.
保存できない
Our team has been notified.
保存できない
2023/04/19(水) 02:17:11.56
やっぱり非ログイン状態で3200ツイートをやろうとするとこのエラー(>>850)が出るな
バグというか、本来はログインしてない状態で表示しちゃいけないやつかな
バグというか、本来はログインしてない状態で表示しちゃいけないやつかな
2023/04/20(木) 11:08:02.25
この前非ログインで保存かけて2日後に/*/を見てみると、十数個のツイートURLがボタン押した時間以降に短期間で保存されてるのを確認した。
非ログインでエラー出ても一応動いてるっぽいけど、3200ツイートの保存はしてくれなかった。不安定すぐる
非ログインでエラー出ても一応動いてるっぽいけど、3200ツイートの保存はしてくれなかった。不安定すぐる
2023/04/22(土) 06:58:40.51
昨日ぐらいからTwitterのHTMLとJavascriptの仕様が変わったようで、
IA側が対応できてないからちゃんと保存されない模様。
犬の404エラーしか保存されない。
IA側が対応できてないからちゃんと保存されない模様。
犬の404エラーしか保存されない。
2023/04/22(土) 17:51:26.36
ついでにsnscrapeも動かなくなってるな
2023/04/22(土) 23:15:29.71
2023/04/23(日) 09:23:51.94
質問です。
Imgurの規約が変更され
ポルノコンテンツなどが削除される可能性があるため
5ちゃんのスレの画像などをアーカイブしようと考えています
その際、InternetArchive側の規約違反になる可能性はありますか?
アメリカなどはポルノコンテンツに厳しいイメージがあるのですが…
Imgurの規約が変更され
ポルノコンテンツなどが削除される可能性があるため
5ちゃんのスレの画像などをアーカイブしようと考えています
その際、InternetArchive側の規約違反になる可能性はありますか?
アメリカなどはポルノコンテンツに厳しいイメージがあるのですが…
2023/04/23(日) 10:43:26.06
別にならんでしょ
むしろポルノコンテンツ大国では?
児ポとかには厳しいが
むしろポルノコンテンツ大国では?
児ポとかには厳しいが
2023/04/23(日) 14:25:34.24
2023/04/24(月) 07:22:51.76
違反したところで保存したスナップショットが見えなくなるだけだから気にしなくてもいいよ。
気になるなら「俺が保存したぞ〜」と足がつくような記録をネットに残さなきゃいいし。
逆にそういう選別をしてたら時間もったいないと思うけど。
気になるなら「俺が保存したぞ〜」と足がつくような記録をネットに残さなきゃいいし。
逆にそういう選別をしてたら時間もったいないと思うけど。
2023/04/25(火) 00:03:49.91
IAで弾かれるがfoではなんともないっていうパターンは普通なんかな
2023/04/25(火) 09:50:53.63
2023/04/26(水) 05:44:19.35
Hrm.
![](http://o.5ch.net/20yls.png)
2023/04/27(木) 03:02:44.39
Twitter、ログインしないと検索できないの不便過ぎるなぁ・・・
そのうち非ログイン状態では閲覧できないとかやりそうなのが
そのうち非ログイン状態では閲覧できないとかやりそうなのが
2023/04/27(木) 05:37:25.46
>>877
インスタグラムみたいに閉鎖的なサービスに改悪されるのはありそうだな…
インスタグラムみたいに閉鎖的なサービスに改悪されるのはありそうだな…
879名無しさん@お腹いっぱい。
2023/05/03(水) 21:36:51.26 このサイト、ストリートビューのアーカイブって見れる?
アーカイブのデータ自体はいっぱいあるんだけど読込が遅すぎて
アーカイブのデータ自体はいっぱいあるんだけど読込が遅すぎて
2023/05/05(金) 09:00:04.44
テスト
2023/05/05(金) 09:06:07.95
ここ最近ようつべの動画の再生ページがウェイバックマシンに保存されるの遅すぎだろ・・・。
公開から1~4時間後って。
自動アーカイブも全然機能されてないし。
何やってんだよアクティブチームといつもアーカイブを取ってる人は、やる気あんのか?
もしかしてエラーでも引っかかって保存されるのに時間かかってんのか?
公開から1~4時間後って。
自動アーカイブも全然機能されてないし。
何やってんだよアクティブチームといつもアーカイブを取ってる人は、やる気あんのか?
もしかしてエラーでも引っかかって保存されるのに時間かかってんのか?
2023/05/05(金) 10:28:31.41
ここ最近YouTubeの再生ページのアーカイブが自動で取られなくなってる?
もしかしてYouTube側から御叱りを受けたのか?
それともエラーにでも引っかかって早期保存が難しくなっているとか?
みんなめんどくさいのに何故!?
もしかしてYouTube側から御叱りを受けたのか?
それともエラーにでも引っかかって早期保存が難しくなっているとか?
みんなめんどくさいのに何故!?
883名無しさん@お腹いっぱい。
2023/05/06(土) 13:22:01.40 Haasie: imgurの画像をアーカイブするサイト
https://haasie.com
【使い方】
テキストボックスに https://i.imgur.com/* のリンクを改行区切りで入力して Backup をクリック
保存後は https://i.haasie.com/* のリンクから閲覧可能
5月15日に、ポルノ画像・匿名ユーザーが投稿した非アクティブコンテンツが削除されるという報告を受けて開発に至ったとのこと
↓開発者の投稿
https://news.ycombinator.com/item?id=35835971
https://haasie.com
【使い方】
テキストボックスに https://i.imgur.com/* のリンクを改行区切りで入力して Backup をクリック
保存後は https://i.haasie.com/* のリンクから閲覧可能
5月15日に、ポルノ画像・匿名ユーザーが投稿した非アクティブコンテンツが削除されるという報告を受けて開発に至ったとのこと
↓開発者の投稿
https://news.ycombinator.com/item?id=35835971
2023/05/09(火) 00:54:02.23
imgurはアーカイブチームが保存してるっぽい
https://tracker.archiveteam.org/imgur/
https://tracker.archiveteam.org/imgur/
885名無しさん@お腹いっぱい。
2023/05/09(火) 05:01:50.46 >>884
URLリストを持ってる人はIRCに投げれば保存してくれるみたいだね
このサイトでアップロードして
https://transfer.archivete.am/
このIRCチャンネルで保存依頼
https://webirc.hackint.org/#irc://irc.hackint.org/imgone
詳細はarchive teamのwiki参照
https://wiki.archiveteam.org/index.php/Imgur#How_to_help_if_you_have_lists_of_URLs
URLリストを持ってる人はIRCに投げれば保存してくれるみたいだね
このサイトでアップロードして
https://transfer.archivete.am/
このIRCチャンネルで保存依頼
https://webirc.hackint.org/#irc://irc.hackint.org/imgone
詳細はarchive teamのwiki参照
https://wiki.archiveteam.org/index.php/Imgur#How_to_help_if_you_have_lists_of_URLs
2023/05/10(水) 05:12:07.55
IRC覗いてたら、ガチ勢がプロキシ8000個動かして
ブルートフォースでimgurの5文字URL特定しててワロタ
半日で全走査して約3億5千個集まったらしい
ブルートフォースでimgurの5文字URL特定しててワロタ
半日で全走査して約3億5千個集まったらしい
2023/05/10(水) 16:53:16.14
IRCってなんですか?
2023/05/10(水) 21:45:15.69
2023/05/10(水) 23:53:14.82
知識ある人はWarriorをダウンロードすればアーカイブに参加出来て面白いよ
自分も1GB程度imgurのアーカイブに貢献してる
https://wiki.archiveteam.org/index.php/ArchiveTeam_Warrior
自分も1GB程度imgurのアーカイブに貢献してる
https://wiki.archiveteam.org/index.php/ArchiveTeam_Warrior
890名無しさん@お腹いっぱい。
2023/05/11(木) 10:35:00.71 Internet Relay Chat
2023/05/12(金) 01:27:00.00
Twitterのプロフィールページ、SPNだと取れてるのにSPN-outlinksだと取れてないの不思議だな
通常のSPNとoutlinksとで環境が別なのか?
通常のSPNとoutlinksとで環境が別なのか?
892名無しさん@お腹いっぱい。
2023/05/14(日) 15:50:31.49 twitter・google の検索画面とnoteはarchive .todayで保存可能なのか
893名無しさん@お腹いっぱい。
2023/05/16(火) 04:12:02.04 先月からGoogle Spreadsheetからアーカイブのキュー入れられるやつが全く機能してないんだが原因は何なのだろう
https://archive.org/post/2427823/is-wayback-gsheets-very-busy-recently
Outlinks機能が使えて、URLのリストをまとめて保存できる手段なにかないですか?
pythonで試してみたんだけど、うまくいかず。。。
https://pastebin.com/raw/YhuQGPj1
https://archive.org/post/2427823/is-wayback-gsheets-very-busy-recently
Outlinks機能が使えて、URLのリストをまとめて保存できる手段なにかないですか?
pythonで試してみたんだけど、うまくいかず。。。
https://pastebin.com/raw/YhuQGPj1
2023/05/16(火) 18:04:49.90
Python は使ったこと無いけど、/save/ に GET メソッド?
あそこ POST の時しか認証情報見てくれないでしょ。
クッキーも、Authorization: ヘッダで S3 API Keys を送った場合も然り。
認証情報と capture_outlinks=1 を見てもらえるようになったら、
今度は 1 つの URL から outlinks の保存のために並行プロセス数が
20 とか 30 とかに増えてしまうのに、それが 5 秒なんかで終わる訳が無い。
きちんと https://web.archive.org/save/status/user で空きをチェックしなよ。
あそこ POST の時しか認証情報見てくれないでしょ。
クッキーも、Authorization: ヘッダで S3 API Keys を送った場合も然り。
認証情報と capture_outlinks=1 を見てもらえるようになったら、
今度は 1 つの URL から outlinks の保存のために並行プロセス数が
20 とか 30 とかに増えてしまうのに、それが 5 秒なんかで終わる訳が無い。
きちんと https://web.archive.org/save/status/user で空きをチェックしなよ。
2023/05/17(水) 19:48:53.67
1時間待ちとか今月になって初めてか
○時間待ちでないほうが珍しいぐらいの先月だか先々月よりは増しとはいえ・・・
○時間待ちでないほうが珍しいぐらいの先月だか先々月よりは増しとはいえ・・・
2023/05/17(水) 23:34:39.99
2時間待ち
2023/05/17(水) 23:48:40.78
どこをどう頑張っても数分待ちにしかならんw
2023/05/18(木) 07:55:22.17
2023/05/19(金) 23:59:40.14
イーロンがここまで終わってるとは思わなかった
https://twitter.com/elonmusk/status/1659255118196355073
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/elonmusk/status/1659255118196355073
https://twitter.com/5chan_nel (5ch newer account)
2023/05/20(土) 07:54:28.80
PDFファイルのURLを保存させたらその1ページ目しか保存されないのだけど仕様?
なわけないよなぁ
なわけないよなぁ
2023/05/20(土) 14:46:31.42
>>900
閲覧環境によっては、1ページ目しか表示されない場合がある
(iOSとかだとダメっぽいな)
解決策は、閲覧したいページのURLを編集して数字の後ろにid_ をつけ加えると保存されたまんまの状態で表示されるから、これで全ページ閲覧できるようになるよ
↓こんな感じ
https://web.archive.org/web/数字id_/ページURL
閲覧環境によっては、1ページ目しか表示されない場合がある
(iOSとかだとダメっぽいな)
解決策は、閲覧したいページのURLを編集して数字の後ろにid_ をつけ加えると保存されたまんまの状態で表示されるから、これで全ページ閲覧できるようになるよ
↓こんな感じ
https://web.archive.org/web/数字id_/ページURL
2023/05/21(日) 08:54:49.03
903名無しさん@お腹いっぱい。
2023/05/22(月) 06:19:18.94 >>893
https://github.com/overcast07/wayback-machine-spn-scripts
これいいよーs3キーも渡せて
URLリストがあるテキストファイルも渡せる
あと便利なのが再試行機能がある
https://github.com/overcast07/wayback-machine-spn-scripts
これいいよーs3キーも渡せて
URLリストがあるテキストファイルも渡せる
あと便利なのが再試行機能がある
904名無しさん@お腹いっぱい。
2023/05/22(月) 23:11:28.24905名無しさん@お腹いっぱい。
2023/05/23(火) 00:08:11.50 画像類似検索に対応しないのだろうか
906名無しさん@お腹いっぱい。
2023/05/23(火) 00:11:24.51 「リンクと画像の抜き出しツール」のアーカイブから画像のURLを入れると画像が保存されているか確認できる。
907名無しさん@お腹いっぱい。
2023/05/23(火) 00:13:41.17 「URLからタイトルゲット君」というサイトも保存確認できる。
908名無しさん@お腹いっぱい。
2023/05/23(火) 05:22:57.93 >>904
そんなに量がないんだったら無料版Colabで走らせてもいいかもね
そんなに量がないんだったら無料版Colabで走らせてもいいかもね
2023/05/23(火) 20:02:46.33
>>892
3月までtodayでアーカイブしたGoogle検索結果をorgで重バックアップしたり出来たが(アクセス環境により検索ワード化けが生じるため)、4月からエラーで弾かれるようになってしまった。
ヤフオクの出品物もorgから取れなくなったし
3月までtodayでアーカイブしたGoogle検索結果をorgで重バックアップしたり出来たが(アクセス環境により検索ワード化けが生じるため)、4月からエラーで弾かれるようになってしまった。
ヤフオクの出品物もorgから取れなくなったし
2023/05/25(木) 06:53:09.12
302エラーの無限ループってなんか解決法ある
2023/05/25(木) 23:16:17.83
Something went wrong. Try reloading.
ツイッターのアーカイブ閲覧しようとするとこうなるけど、おま環?
ツイッターのアーカイブ閲覧しようとするとこうなるけど、おま環?
912名無しさん@お腹いっぱい。
2023/05/27(土) 13:07:42.53 ふとIAの動画ブラウジングしてたんだけど字幕付きのアニメとか滅茶苦茶うpされて、無法地帯になっててワロタ
アメリカのフェアユースってそんな強いのか
アメリカのフェアユースってそんな強いのか
2023/05/28(日) 00:55:59.95
>>912
いや普通にアウトだし消されてるよ、いたちごっこだけど
IAの人も何が重要なデータか分からなくなるから止めろってツイートしてたりする
基本的にIAのアカウントがアップしたもの以外は信用しない方がいい
いや普通にアウトだし消されてるよ、いたちごっこだけど
IAの人も何が重要なデータか分からなくなるから止めろってツイートしてたりする
基本的にIAのアカウントがアップしたもの以外は信用しない方がいい
2023/05/30(火) 00:40:42.53
502エラーだ
2023/06/07(水) 14:18:47.51
アイテムの方にある動画、一定以上のサイズだとブラウザで再生出来ないっぽいな
自分が見たのは20GB超だけど読み込みがされなかった
curlでダウンロードしてローカルで再生は出来たので、ちゃんとアーカイブはされてるらしい
自分が見たのは20GB超だけど読み込みがされなかった
curlでダウンロードしてローカルで再生は出来たので、ちゃんとアーカイブはされてるらしい
2023/06/07(水) 16:00:32.06
それってエンコード時の設定に依ったりしない?
例えば mp4 なら moov atom をファイル先頭に持ってきていないとか。
例えば mp4 なら moov atom をファイル先頭に持ってきていないとか。
2023/06/11(日) 12:01:40.24
トップページの保存数(Explore more than XXX billion)がたまに十億単位で減るの
何なんだろうか?
何なんだろうか?
2023/06/14(水) 11:09:59.33
詳しいことよく知らなくてTorのブラウザでarchivetoday使おうとしたらTor使ってないときでもarchivetodayにアクセスできなくなった
クッキー消去したらまた使えるようになったけどブラックリスト的なものに載ってないか不安
クッキー消去したらまた使えるようになったけどブラックリスト的なものに載ってないか不安
2023/06/14(水) 13:17:02.82
>>918
まともにTor使ってるなら、生IPとの関連付けが出来ないんだからTor使ってないときにアクセス不可になるはずがない
それすら分からないならtorは使わない方が良いよ、絶対にどこかでやらかす
まともにTor使ってるなら、生IPとの関連付けが出来ないんだからTor使ってないときにアクセス不可になるはずがない
それすら分からないならtorは使わない方が良いよ、絶対にどこかでやらかす
2023/06/14(水) 13:48:21.90
なんでわざわざTorブラウザでarchivetoday使おうとしたの?普通のブラウザでも使えるよ
2023/06/14(水) 14:07:59.22
2023/06/14(水) 15:38:07.85
IP紐づいてなくてもフィンガープリントで同一デバイスだと疑われてる可能性はある
とは言っても、torブラウザでtoday使うとCloudflareにブロックされて要JSの認証要求されるから回避も難しいんだよな
唯一の回避策は、使えそうなweb串探してtor→web串→todayでアクセスするくらいか
フィンガープリント追跡防止の拡張機能とかもあるからそういうのを普段使いしてみるのも対策の一つになるかもね
とは言っても、torブラウザでtoday使うとCloudflareにブロックされて要JSの認証要求されるから回避も難しいんだよな
唯一の回避策は、使えそうなweb串探してtor→web串→todayでアクセスするくらいか
フィンガープリント追跡防止の拡張機能とかもあるからそういうのを普段使いしてみるのも対策の一つになるかもね
2023/06/16(金) 02:07:18.67
今更だけど3200ツイート保存のやつエラーで動かなくなってる
Twitterの仕様が変わった辺りからかな?確認してなかった
Twitterの仕様が変わった辺りからかな?確認してなかった
2023/06/16(金) 14:06:14.26
collections情報死んでるなぁ
2023/06/22(木) 18:22:40.12
IAでTwitter取れなくなってる?
926925
2023/06/23(金) 19:17:09.24 今やったら取れた、何だったんだろう
2023/06/23(金) 19:17:24.81
>>867>>869
Twitterの鍵垢を保存したら犬のエラーが保存されたわ。原因はこれじゃない?
Twitterの鍵垢を保存したら犬のエラーが保存されたわ。原因はこれじゃない?
2023/06/24(土) 10:29:59.86
2023/06/27(火) 20:37:16.58
https://esica.shop/collections/weekly-ranking/products/eset-4660
↑みたいなサイトを保存すると保存直後は画像が表示されてるのに数か月後保存ページにアクセスすると、
一部画像が表示されないって事が多々あるんだけどおま環?
そのページの画像(大きい小さい表示されるの全て)を一括で保存する方法って無いのかな
↑みたいなサイトを保存すると保存直後は画像が表示されてるのに数か月後保存ページにアクセスすると、
一部画像が表示されないって事が多々あるんだけどおま環?
そのページの画像(大きい小さい表示されるの全て)を一括で保存する方法って無いのかな
2023/06/28(水) 09:49:10.92
>>929
数か月後どころか、保存直後も大量の画像が欠落してるんだけど・・・
スクリプトで読み込ませてる画像の一括取得は現状では無理。
ブラウザでアーカイブを表示したときに初めて取得リクエストが発行されるが、
毎分 2 個か 3 個の画像を取得するだけで、あとは 429 Too Many Requests エラーが返ってしまう。
必要な画像を拾い終えるまで、同じアーカイブを数分おきにブラウザで繰り返し表示するしかない。
昨晩ここの画像を全部拾わせてみたので、数か月後にどうなってるか見てみよう。
https://web.archive.org/web/20230627123623/esica.shop/collections/weekly-ranking/products/eset-4160
数か月後どころか、保存直後も大量の画像が欠落してるんだけど・・・
スクリプトで読み込ませてる画像の一括取得は現状では無理。
ブラウザでアーカイブを表示したときに初めて取得リクエストが発行されるが、
毎分 2 個か 3 個の画像を取得するだけで、あとは 429 Too Many Requests エラーが返ってしまう。
必要な画像を拾い終えるまで、同じアーカイブを数分おきにブラウザで繰り返し表示するしかない。
昨晩ここの画像を全部拾わせてみたので、数か月後にどうなってるか見てみよう。
https://web.archive.org/web/20230627123623/esica.shop/collections/weekly-ranking/products/eset-4160
2023/06/29(木) 14:23:51.75
今風のスクリプトマシマシ動的サイトはアーカイブするのが難しいからね
画像だけ欠落するならまだマシで、サイト自体が取れないことも珍しくない
画像だけ欠落するならまだマシで、サイト自体が取れないことも珍しくない
2023/06/30(金) 19:13:53.48
Twitterの投稿、wayback machineはアーカイブできるけどarchive todayはできなくなってない?
2023/06/30(金) 23:57:35.95
2023/07/01(土) 08:31:58.04
save-page-now-outlinksって今動いてないの?
リンク先の保存もやらなきゃいけないじゃんか
リンク先の保存もやらなきゃいけないじゃんか
2023/07/01(土) 23:20:07.49
2023/07/02(日) 15:59:18.82
Pixivのページを保存したいとき、英語ページのURL(en)へ転送されないようにするにはヘッダーに何を指定すればいい?
なんか方法ある?
なんか方法ある?
2023/07/02(日) 17:27:30.52
Pixiv から user_language=ja ってクッキーを食べたことにしておけば、
つまりそれを capture_cookie 引数に与えて Save Page Now すれば
転送はされなくなるけど・・・どこも真っ白だぁ
つまりそれを capture_cookie 引数に与えて Save Page Now すれば
転送はされなくなるけど・・・どこも真っ白だぁ
938名無しさん@お腹いっぱい。
2023/07/02(日) 18:18:54.77 waybackもtodayもtwitter保存できねえ
2023/07/02(日) 19:09:16.35
Twitter自体が現在不調だからね直してもらわないと
2023/07/02(日) 20:01:41.67
仕様やぞ
941名無しさん@お腹いっぱい。
2023/07/03(月) 00:38:46.97 Twitterの仕様変更で
魚拓取れなくなるのかな…
アカウント必須になったら魚拓取れない…
魚拓取れなくなるのかな…
アカウント必須になったら魚拓取れない…
2023/07/05(水) 02:00:10.44
Twitterは仕様変更するわ、IAは保存しても読み込めるまで1日以上かかるわ、インターネットに波乱起きすぎ
2023/07/05(水) 17:06:56.09
やっとTwitter直ったか?
2023/07/06(木) 15:44:51.95
今保存できない?
2023/07/06(木) 16:39:15.39
archive.org/details/save-page-now?sort=-addeddate
日本時間13時21分のファイル以降、SPNの新しいコレクションファイルが増えてないので止まってたっぽいが、今は復帰して保存できるっぽい。
日本時間13時21分のファイル以降、SPNの新しいコレクションファイルが増えてないので止まってたっぽいが、今は復帰して保存できるっぽい。
2023/07/07(金) 16:44:02.26
Twitter、一応取れるようにはなったが単体ツイートしか取れなくなったな
前はリプライも全部保存出来たが不可能になった
あとプロフィールページも保存出来ない
IAの問題ではなく、Twitter側が非ログイン状態での表示を止めたせい
前はリプライも全部保存出来たが不可能になった
あとプロフィールページも保存出来ない
IAの問題ではなく、Twitter側が非ログイン状態での表示を止めたせい
2023/07/10(月) 20:27:23.81
5chもぼちぼちアーカイブしていかないとヤバイ感じか?
2023/07/10(月) 21:07:05.59
5ちゃんのスレも個人的に保存はちょくちょくやってはいるんだけど、すぐ人大杉になって作業が止まるのが難点。
自分の住民やってるスレやその過去スレからでいいので、やっておいた方がいいよ。
自分の住民やってるスレやその過去スレからでいいので、やっておいた方がいいよ。
2023/07/11(火) 00:09:37.44
これはヤバいな
過去ログごと消えたら洒落にならない
過去ログごと消えたら洒落にならない
2023/07/11(火) 00:36:08.07
筑波大吉田光男准教授が公開してる5chスレタイのデータセット
http://open.ceek.jp
http://open.ceek.jp
2023/07/11(火) 06:54:39.48
IAのチームに過去ログ全部クロールして欲しいな。今はなんとか過去ログが見れるけど、明日急に全部見れなくなっても全く不思議じゃないからヒヤヒヤしてる
似たようなサイトでredditって過去ログ保管されてるんだろうか
似たようなサイトでredditって過去ログ保管されてるんだろうか
2023/07/12(水) 22:56:55.39
threadsってアーカイブ出来ないタイプのサイトかぁ・・・
2023/07/12(水) 22:56:57.12
threadsってアーカイブ出来ないタイプのサイトかぁ・・・
2023/07/14(金) 06:06:42.35
埋まるからちとscに貼っとこ
955名無しさん@お腹いっぱい。
2023/07/15(土) 00:51:33.90 「好き嫌い.com」は魚拓サイトで魚拓を取ってもコメント欄だけが保存されない
どうすればコメント欄も保存できるかな?
i.imgur.com/2uPwBGz.png archive.li/6nRmy
どうすればコメント欄も保存できるかな?
i.imgur.com/2uPwBGz.png archive.li/6nRmy
2023/07/15(土) 05:12:26.78
5chを保存しようとクロールしたらクロールが全く意味を成さないわね…なにかいい方法あるだろうか?
2023/07/15(土) 20:07:35.02
Internet ArchiveのFlashエミュレータが改良されてより多くの作品をサポートできるようになった模様
これにより今まで利用できなかった作品がコレクションに加わるとのこと
詳細
https://mastodon.archive.org/@textfiles/110697893762381822q
新たに実行可能になった作品例
https://twitter.com/internetarchive/status/1679948028008955904
https://twitter.com/5chan_nel (5ch newer account)
これにより今まで利用できなかった作品がコレクションに加わるとのこと
詳細
https://mastodon.archive.org/@textfiles/110697893762381822q
新たに実行可能になった作品例
https://twitter.com/internetarchive/status/1679948028008955904
https://twitter.com/5chan_nel (5ch newer account)
2023/07/16(日) 13:40:10.97
これからAI時代になると、IAのデータってますます重要になりそうだな(AIとIAでややこしい)
959名無しさん@お腹いっぱい。
2023/07/17(月) 19:01:14.10 5chの過去ログほとんどアーカイブされてないのか
960名無しさん@お腹いっぱい。
2023/07/18(火) 18:40:50.87 yahooニュースのコメント保存できるようになったな
961名無しさん@お腹いっぱい。
2023/07/19(水) 01:28:09.90962名無しさん@お腹いっぱい。
2023/07/19(水) 08:24:09.27 過去ログ取ろうとしたけど膨大やな
自分の環境だと七時間で2500urlぐらい
自分の環境だと七時間で2500urlぐらい
2023/07/20(木) 17:51:13.77
2023/07/20(木) 17:53:22.93
ここ最近やる気を感じないな、アクティブチームは。
自動アーカイブも全然取れてないし。
自動アーカイブも全然取れてないし。
2023/07/20(木) 22:16:04.23
966名無しさん@お腹いっぱい。
2023/07/20(木) 23:04:52.71 アクティブチームって何だArchive-teamのこと?
2023/07/21(金) 00:44:18.55
URLが.phから.isに変わった?
968名無しさん@お腹いっぱい。
2023/07/21(金) 03:00:05.352023/07/22(土) 00:46:07.17
うーん、ボタンを押しても即座にこれが返ってくる
![](http://o.5ch.net/21i4q.png)
2023/07/22(土) 01:02:42.11
俺もや、ついに規制くらったかと思ったけど
サーバー側の問題か
サーバー側の問題か
2023/07/22(土) 01:16:32.28
どこか特定のサイトを取得する場合の問題かと思ったら別のサイトで試しても>>969
972969
2023/07/22(土) 06:28:15.782023/07/23(日) 01:54:01.56
https://web.archive.org/web/*/mevius.5ch.net/esite/oyster/*
過去ログdatのアーカイブ取ってる人って居ないよなぁ
過去ログdatのアーカイブ取ってる人って居ないよなぁ
2023/07/23(日) 04:07:26.60
過去ログはとってるけど全然追いついてないな
975名無しさん@お腹いっぱい。
2023/07/24(月) 07:55:27.47 放置してたらURL8万行分集めてて、もう飽きたからこれアーカイブしてdatアーカイブやめます
保存されるやつみたら文字化けしてるし意味あるのかなといった感じでもある
普通の過去ログやる方が有意義におもう
保存されるやつみたら文字化けしてるし意味あるのかなといった感じでもある
普通の過去ログやる方が有意義におもう
2023/07/25(火) 22:01:25.69
スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ
2023/07/25(火) 23:00:40.88
Twitchもyoutubeみたいにアーカイブ保存出来るようにならんかなぁ
というかyoutubeと違って一定期間で消えるから、むしろこっちを優先して欲しいまである
というかyoutubeと違って一定期間で消えるから、むしろこっちを優先して欲しいまである
2023/07/26(水) 07:00:14.47
動画ファイルバカでかいししゃーないでしょ
キリないもん、あとtubeupえばupはできると思う
だけどあれ待機時間がすげー長いんだよなぁ
キリないもん、あとtubeupえばupはできると思う
だけどあれ待機時間がすげー長いんだよなぁ
2023/07/26(水) 16:48:33.58
>>976
それなに? スクリプト使ってないから知らない
それなに? スクリプト使ってないから知らない
2023/07/27(木) 08:29:32.45
981名無しさん@お腹いっぱい。
2023/07/27(木) 16:31:17.562023/07/27(木) 18:44:11.66
スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ
983名無しさん@お腹いっぱい。
2023/07/28(金) 05:52:22.75 次スレたのんます
984名無しさん@お腹いっぱい。
2023/07/28(金) 07:03:23.87 Internet Archive総合 (web.archive.org) #5
https://mevius.5ch.net/test/read.cgi/esite/1690495133/
https://mevius.5ch.net/test/read.cgi/esite/1690495133/
985名無しさん@お腹いっぱい。
2023/07/28(金) 16:20:58.19 おつでごわす
2023/07/31(月) 10:21:47.20
立て乙
2023/08/01(火) 08:12:52.33
1週前ぐらいに取得した(ことになってる)はずなのに取得できてないのがいくつも・・・
The snapshot may not be available right now, please try again later.
最近が↑たまに出るが、
それとの関係だろうか・・・
せっかく時間かけて取得したはずができてないのは残念
The snapshot may not be available right now, please try again later.
最近が↑たまに出るが、
それとの関係だろうか・・・
せっかく時間かけて取得したはずができてないのは残念
2023/08/01(火) 08:14:32.08
最近が↑→最近↑が
2023/08/09(水) 21:27:34.47
>>975
エアプ乙w
エアプ乙w
2023/08/09(水) 22:47:57.99
todayの話題はここでいいの?
2023/08/10(木) 05:28:04.06
archive.isはもう3日ほど繋がらないし
Wayback Machineは相変わらずツイッタープロフィールとリプがダメで
リプで繋がってるものも個々でしか取れないから面倒くさい
Wayback Machineは相変わらずツイッタープロフィールとリプがダメで
リプで繋がってるものも個々でしか取れないから面倒くさい
2023/08/10(木) 18:48:05.30
todayは普通に使えるが
おま環では?
おま環では?
2023/08/10(木) 21:07:26.73
archive.today は、まだ Cloudflare の DNS(1.1.1.1) を拒否しているのかな?
2023/08/11(金) 20:59:13.51
>>991
おま環なのかわからないけどtodayは4日前までは普通に繋がってたけど
急に繋がらくなって今も繋がない
このサイトにアクセスできませんarchive.is により途中で接続が切断されましたって出る
chrome・edge・Fire Foxの全部で繋がらないから環境だとしたら何が原因なのかさっぱり
因みにCloudflare の DNS(1.1.1.1)ではないよ
おま環なのかわからないけどtodayは4日前までは普通に繋がってたけど
急に繋がらくなって今も繋がない
このサイトにアクセスできませんarchive.is により途中で接続が切断されましたって出る
chrome・edge・Fire Foxの全部で繋がらないから環境だとしたら何が原因なのかさっぱり
因みにCloudflare の DNS(1.1.1.1)ではないよ
2023/08/11(金) 21:46:49.16
2023/08/11(金) 23:46:35.07
997名無しさん@お腹いっぱい。
2023/08/13(日) 12:11:34.23 あれarchive.org落ちてる?spnエラー吐いてる
998名無しさん@お腹いっぱい。
2023/08/13(日) 12:18:35.35 直ってた
2023/08/13(日) 13:16:40.27
>>997-998
ここ数日 web.archive.org への接続自体がエラーとなるケースが増えてると思うよ。
ここ数日 web.archive.org への接続自体がエラーとなるケースが増えてると思うよ。
1000名無しさん@お腹いっぱい。
2023/08/13(日) 13:17:17.00 次スレ
Internet Archive総合 (web.archive.org) #5
https://mevius.5ch.net/test/read.cgi/esite/1690495133/
他所のアーカイブの話題はこちら
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
Internet Archive総合 (web.archive.org) #5
https://mevius.5ch.net/test/read.cgi/esite/1690495133/
他所のアーカイブの話題はこちら
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 730日 9時間 39分 0秒
新しいスレッドを立ててください。
life time: 730日 9時間 39分 0秒
10021002
Over 1000Thread 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 【SNS】「性的でキモい」 マルちゃん【赤いきつね】アニメCMが炎上 ★8 [煮卵★]
- 【名目GDP】600兆円突破も2025年にはインドに抜かれ5位転落見通し「企業から家計への分配に遅れ」 [七波羅探題★]
- 「既婚・未婚男女別の幸福度」ダントツで低いのは未婚男性 [七波羅探題★]
- 日テレ社長、「女性アナ会食同席は間違っていない」「人脈作り知識を得る良い機会」強調、社内調査は不適切なし ★2 [muffin★]
- 【キラキラネーム】「太郎(マイケル)」は不可 戸籍名の読み仮名に指針―法務省 [Ailuropoda melanoleuca★]
- 【芸能】テレビ朝日 令和ロマン・くるま、とろサーモン・久保田の出演見合わせを発表 [冬月記者★]
- 【動画】 年金受給者男性(75)「食事は半額パン。洗濯は手洗いで節約しています」 こんな国に誰がしたんだよマジ [434776867]
- 🏡👊👊👊😅👊👊👊🏡
- 久々にボトルガム買おうかとおもったら1500円~2000円するんだが
- 今からラーメン食べに行っていいか?
- 【石破速報】兵庫と東京の選管を参考人として国会招致へ [931948549]
- 【悲報】 「ドラゴンクエスト ユア・ストーリー」の主人公名を巡ってスクエニと小説作者で争っていた裁判、作者側の敗訴で終結 [875588627]