ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/
・関連スレ
Internet Archive総合 (web,archive,org) #2
https://mevius.5ch.net/test/read.cgi/esite/1690495133/
ウェブ魚拓 Part3
https://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
https://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
https://mevius.5ch.net/test/read.cgi/blog/1554380939/
・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
探検
【保存・記録】ウェブアーカイブ総合 Page.02
2023/11/21(火) 07:23:34.80ID:QN4SUfby0
2998
2023/11/22(水) 11:01:01.11ID:QZxCudHS0 勝手に次スレ立てたなら、前スレのURLぐらい貼れよ
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
4998
2023/11/22(水) 11:30:01.04ID:QZxCudHS0 前スレで、残り書き込めれるレス数が少ないのに悪口で埋めるのかよ。阿保らしい
2023/11/22(水) 12:17:26.13ID:DuzB/ozg0
>>2
うるせえよ死ねゴミ
うるせえよ死ねゴミ
2023/11/22(水) 12:58:35.19ID:gLGwnryk0
次スレどうする云々は早めに議論始めないと大抵こうなるんだよね。
5CH自体、人減ったからそういうのを仕切れる人も減った。
5CH自体、人減ったからそういうのを仕切れる人も減った。
2023/11/22(水) 13:08:04.66ID:R+bORu+V0
2023/11/22(水) 20:45:03.42ID:RBjZhLtj0
例のスレを私物化してるというかひたすら日記帳にしてた句読点空改行マンは正直叩かれても仕方ないかと
2023/11/23(木) 16:21:52.04ID:M5PJ+4vU0
2023/11/29(水) 19:55:45.97ID:Bv4X1MKX0
今さらだがtok2の無料プラン6月に死んでたのね
2023/11/29(水) 20:05:03.99ID:hfZzT9ef0
長期で見たらどのアーカイバが飛ぶかわからない砂上の楼閣感がある
2023/11/30(木) 15:45:33.23ID:CeXtDLxF0
信用度で言ったら
インターネットアーカイブ>>>>>>>>>today>その他
って感じだしな
特に運営元が分からない奴はいつ飛んでもおかしくない
インターネットアーカイブ>>>>>>>>>today>その他
って感じだしな
特に運営元が分からない奴はいつ飛んでもおかしくない
2023/12/01(金) 20:55:06.14ID:/RlTQaSn0
.orgで連続で弾かれた内部的な仕様変更だろうか
"Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again."
"Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again."
2023/12/01(金) 21:02:28.18ID:/RlTQaSn0
Windows版FireFox、Chrome、BraveとSafariで同じ症状
2023/12/01(金) 23:14:24.37ID:WQmdyjUL0
IAのスレでもその話題出てるけどIAの不具合ぽい
2023/12/06(水) 10:23:22.54ID:9VVxiS460
archive.is
日本時間今朝10時7分にサーバ証明書期限切れ、更新されてない
日本時間今朝10時7分にサーバ証明書期限切れ、更新されてない
17192.168.0.774
2023/12/12(火) 19:22:42.21ID:hW2qVqPj0 archive todayで気軽にアーカイブ化できるようなショートカットとかないですか?
2023/12/13(水) 12:39:45.28ID:pBChJXnH0
公式にブックマークレットあったはずだけど使えなくなったのか?
19192.168.0.774
2023/12/18(月) 14:32:47.54ID:rr5iksGZ0 ブックマークレット見当たらないんだけどどこにある?
2023/12/18(月) 22:09:24.58ID:VHkEpDN70
>>19
確かにそんなものがあったなぁ。
https://web.archive.org/web/20191022034909/archive.is/
archive.today で定期的にアーカイブさせるスクリプトを動かしていたことがあるけど、
ブックマークレットが行っていたような「保存したい URL を付けて送信するだけ」という方法が
何年か前に受け付けられなくなり、http://archive.is/ のトップページでトークン (submitid) を
得ることを要求するようになった。
ブックマークレットが掲載されなくなったのはその頃。
確かにそんなものがあったなぁ。
https://web.archive.org/web/20191022034909/archive.is/
archive.today で定期的にアーカイブさせるスクリプトを動かしていたことがあるけど、
ブックマークレットが行っていたような「保存したい URL を付けて送信するだけ」という方法が
何年か前に受け付けられなくなり、http://archive.is/ のトップページでトークン (submitid) を
得ることを要求するようになった。
ブックマークレットが掲載されなくなったのはその頃。
2023/12/18(月) 23:02:56.83ID:SRfhFfWq0
今も一応第三者が作ってGithubに上げてるブックマークレットならちゃんと今見てるページのワンポチ魚拓取得出来るよ
トップページ一回経由するやつ
トップページ一回経由するやつ
22192.168.0.774
2023/12/19(火) 14:10:59.19ID:be8ZnnnO0 >>21
ま?探してくるわ
ま?探してくるわ
23192.168.0.774
2023/12/28(木) 15:22:56.59ID:aVvZh5OJ0 archive.today
今朝、運良く取得できたけど、welcome to nginx病・・・
しかも一度出ると再アクセスしても接続がタイムアウトして繋がらなくなる・・・
回避方法あったら教えて
今朝、運良く取得できたけど、welcome to nginx病・・・
しかも一度出ると再アクセスしても接続がタイムアウトして繋がらなくなる・・・
回避方法あったら教えて
2023/12/28(木) 15:53:07.15ID:eQrjkTct0
>>23
見た感じ archive.today の応答がかなり悪くなってるみたいだけど
archive.is とか archive.md とか archive.li とか、リダイレクトの生じない名前なら
サクサク返って来るんだよね
見た感じ archive.today の応答がかなり悪くなってるみたいだけど
archive.is とか archive.md とか archive.li とか、リダイレクトの生じない名前なら
サクサク返って来るんだよね
25192.168.0.774
2023/12/29(金) 16:14:00.57ID:mcUEm1710 今日もarchive.todayでWelcome to nginx!になって取得できない・・・
取得するコツってないの?
取得するコツってないの?
2023/12/29(金) 16:24:41.89ID:56/eqjqc0
>>25
あるよw
あるよw
2023/12/29(金) 16:30:00.41ID:QoMdPNgl0
2023/12/29(金) 16:44:03.51ID:QoMdPNgl0
>>7
関連スレの「#2」の部分は直さなかったのかw #5なのに
関連スレの「#2」の部分は直さなかったのかw #5なのに
2023/12/29(金) 16:53:00.74ID:QoMdPNgl0
まあ、>>5 >7 >8はもう居ないだろうけど。
2023/12/29(金) 21:39:19.78ID:BeXMuX5W0
スレを日記帳にしてた連投句読点おじさん帰ってきちゃったじゃん…
2024/01/02(火) 12:32:26.24ID:W/dfs4mD0
質問です
このサイトをそのままの形で落としたいのですが
https://goodsmileshop.com/ja/
HTTrackでやったら、商品ページまで落とせず終わったり商品の画像が表示されません
そこでwgetで
wget -m -p -E -k -np をつけてやってみました。コマンドはよく分かりませんがネットでサイトそのまま再現
で検索したらこのコマンドを使えと記載がありました
まだ終わってませんがindexを覗いてみたら、カテゴリページを延々とダウンロードしてるようで
商品ページはまだで、途中ですがやっぱり画像が表示されてません
またいつまで経っても終わりません
画像が表示されないのは、表示方法にjavascriptとかを使っているからなんでしょうか
放置してダウンロードが終了すれば、きちんと表示されるんでしょうか
このサイトをそのままの形で落としたいのですが
https://goodsmileshop.com/ja/
HTTrackでやったら、商品ページまで落とせず終わったり商品の画像が表示されません
そこでwgetで
wget -m -p -E -k -np をつけてやってみました。コマンドはよく分かりませんがネットでサイトそのまま再現
で検索したらこのコマンドを使えと記載がありました
まだ終わってませんがindexを覗いてみたら、カテゴリページを延々とダウンロードしてるようで
商品ページはまだで、途中ですがやっぱり画像が表示されてません
またいつまで経っても終わりません
画像が表示されないのは、表示方法にjavascriptとかを使っているからなんでしょうか
放置してダウンロードが終了すれば、きちんと表示されるんでしょうか
2024/01/02(火) 16:22:32.88ID:lNtBlc7t0
2024/01/02(火) 19:16:28.75ID:W/dfs4mD0
wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
って書かれてたんで来ちゃいました。すみません
wgetの使い方に詳しい方がいる板ってどのあたりなんでしょうかね
って書かれてたんで来ちゃいました。すみません
wgetの使い方に詳しい方がいる板ってどのあたりなんでしょうかね
34192.168.0.774
2024/01/09(火) 19:48:58.47ID:p24Ans9E02024/01/22(月) 15:30:21.91ID:YHuj1Ww20
スラド終了のお知らせ
https://srad.jp/story/24/01/22/0311225/
https://srad.jp/story/24/01/22/0311225/
36192.168.0.774
2024/01/22(月) 15:33:31.38ID:BqifyO/10 スラドの保存を依頼しに来たが、既に書かれてた
1月いっぱいで閉鎖との事なので、技術を持ってる方がいたらWayback Machineへの保存をお願いします
1月いっぱいで閉鎖との事なので、技術を持ってる方がいたらWayback Machineへの保存をお願いします
37192.168.0.774
2024/02/01(木) 03:41:51.12ID:uruf4q6/0 >>31
亀レスだけど、落とそうとしてるファイルが多すぎる&サイトにJavaScriptが使われてる、の両方では
でかいサイトをwgetでまともにクロールするなら1週間くらい置いといた方がいい
あと最近のサイトは大概JavaScriptを多用してるから、Heritrixを使った方が楽かもしれん
参考にしたというのは多分このサイトだな
https://tex2e.github.io/blog/shell/wget-entire-website
あと>>32は間違ってる、ローカルアーカイブもれっきとしたWebアーカイブの一種だよ
>>1にもちゃんとwgetも含むと書いてあるし
亀レスだけど、落とそうとしてるファイルが多すぎる&サイトにJavaScriptが使われてる、の両方では
でかいサイトをwgetでまともにクロールするなら1週間くらい置いといた方がいい
あと最近のサイトは大概JavaScriptを多用してるから、Heritrixを使った方が楽かもしれん
参考にしたというのは多分このサイトだな
https://tex2e.github.io/blog/shell/wget-entire-website
あと>>32は間違ってる、ローカルアーカイブもれっきとしたWebアーカイブの一種だよ
>>1にもちゃんとwgetも含むと書いてあるし
2024/02/04(日) 23:33:32.14ID:wTdVULUN0
採択
2024/02/20(火) 12:53:52.46ID:cyS+ObVG0
『OKMusic』サービス終了のお知らせ
https://okmusic.jp/news/548328
<終了までのスケジュール>
・2024年3月31日(日)午後11時59分
記事更新を終了
・2024年4月1日(月)午前11時59分
会員機能の提供を終了
※以降会員登録、ログインできません
・2024年5月以降(予定)
サイトの公開を終了
※終了日時に関しては、このページにて改めて告知させていただきます
https://okmusic.jp/news/548328
<終了までのスケジュール>
・2024年3月31日(日)午後11時59分
記事更新を終了
・2024年4月1日(月)午前11時59分
会員機能の提供を終了
※以降会員登録、ログインできません
・2024年5月以降(予定)
サイトの公開を終了
※終了日時に関しては、このページにて改めて告知させていただきます
2024/02/25(日) 02:04:04.75ID:cjUiDYTX0
自作ツールの話だけど、DLしたデータを保存するファイル形式って何かいいのある?
例えば https://example.com/blog/article?mode=view&page=10 とかのURLを保存する時、
リクエストしたURL、レスポンスヘッダー、日時等のメタデータ、もちろんレスポンス本文 を保存したい。
もちろんレスポンス本文はバイナリの場合もある。
wgetだとローカルに example.com フォルダの中に blogフォルダの中に article_mode=view&page=10 というファイルを作る(半角の?はファイル名で使えないので置換される)
みたいなのがベタだと思うけど、それだとまずURL文字列の情報が失われてるし、レスポンスヘッダも消えてる。
それに1URLが1ファイルに保存されるから1サイトまるごとだとファイル数が多すぎて取り回しがしにくくなる。
warcファイルでいいやと思ったけど、一般的にはマイナーでエコシステムが力不足な事があるし
じゃあsqlteに自分でテーブルやカラムを作ってやればいいけど独自規格は後々困りそうだし…。
どうすればいいんすかね。
例えば https://example.com/blog/article?mode=view&page=10 とかのURLを保存する時、
リクエストしたURL、レスポンスヘッダー、日時等のメタデータ、もちろんレスポンス本文 を保存したい。
もちろんレスポンス本文はバイナリの場合もある。
wgetだとローカルに example.com フォルダの中に blogフォルダの中に article_mode=view&page=10 というファイルを作る(半角の?はファイル名で使えないので置換される)
みたいなのがベタだと思うけど、それだとまずURL文字列の情報が失われてるし、レスポンスヘッダも消えてる。
それに1URLが1ファイルに保存されるから1サイトまるごとだとファイル数が多すぎて取り回しがしにくくなる。
warcファイルでいいやと思ったけど、一般的にはマイナーでエコシステムが力不足な事があるし
じゃあsqlteに自分でテーブルやカラムを作ってやればいいけど独自規格は後々困りそうだし…。
どうすればいいんすかね。
2024/02/25(日) 15:52:11.05ID:6fhfw2DW0
warcで良いだろ
今後どれだけ時を経てもエコシステムが充足することはないから考慮する必要もない
今後どれだけ時を経てもエコシステムが充足することはないから考慮する必要もない
2024/02/25(日) 19:29:29.32ID:cjUiDYTX0
うーん、それもそうか…
2024/02/26(月) 21:52:37.14ID:badvTVSb0
warcは腐ってもISO規格で標準化されてて、マイナーな業界とはいえ世界中の専門機関で使われてる訳だしな
下手に自作するよりはずっと良い
下手に自作するよりはずっと良い
2024/02/26(月) 21:58:07.39ID:badvTVSb0
エコシステムが不足してるなら自分が貢献できるよう頑張ろう、位のガッツがあった方が良いよ(実際に貢献できるかは別として)
何しろマイナーな技術分野で先駆者が少ないから、それくらいの意気込みがないと現実的にやっていられない
何しろマイナーな技術分野で先駆者が少ないから、それくらいの意気込みがないと現実的にやっていられない
2024/02/27(火) 00:51:18.39ID:o1ZUbZhQ0
流行ると後から来たお客様にオワコンにされる流れ多すぎるのが悪い
先駆者利益も大きなお客様に乗っ取られた後の利益と比べたらリスクとリターン見合ってないし
先駆者利益も大きなお客様に乗っ取られた後の利益と比べたらリスクとリターン見合ってないし
2024/02/27(火) 12:09:56.51ID:ncN5iY7H0
オープンソースかつアーカイブ界隈でそれ気にする必要ある?
47192.168.0.774
2024/03/12(火) 13:39:21.51ID:DaYLFx9E0 どなたかArchiveTeamに連絡お願いします
>> このたび、ODN「ホームページサービス」につきましては、ご利用者の減少に伴い、2023年6月30日(金)に新規受付を終了し、
>> 2024年3月31日(日)をもちましてサービスを終了させていただくこととなりましたので、ご案内申し上げます。
https://www.odn.ne.jp/odn_info/20230413.html
>> このたび、ODN「ホームページサービス」につきましては、ご利用者の減少に伴い、2023年6月30日(金)に新規受付を終了し、
>> 2024年3月31日(日)をもちましてサービスを終了させていただくこととなりましたので、ご案内申し上げます。
https://www.odn.ne.jp/odn_info/20230413.html
48192.168.0.774
2024/03/12(火) 14:00:43.70ID:kcrHEzLE0 個人サイトなんだけど、todayが消してくれないのどうにかならんかな。
2024/03/12(火) 14:24:31.31ID:XJRNS97w0
>>48
残されて困るようなものを公開したお前が悪い
残されて困るようなものを公開したお前が悪い
2024/03/12(火) 20:00:28.00ID:rAwzeJQ40
長期的には.orgや.todayが潰される可能性も
2024/03/12(火) 21:27:17.34ID:XJRNS97w0
.org は無いと思うが .today はわからんな
2024/03/14(木) 17:05:30.27ID:4OkU93Wi0
.todayが重宝されてる一番の理由って日本語どころか.todayが運営してる国の言葉で正式な削除依頼を出しても突っぱねられて消えない事だからなあ
それこそ生半可な弁護士雇っても無理で某春○ちゃんの後任弁護士が英語と現地法律ガチった結果ようやく削除依頼が通ったみたいな記事書いてた気がする
それこそ生半可な弁護士雇っても無理で某春○ちゃんの後任弁護士が英語と現地法律ガチった結果ようやく削除依頼が通ったみたいな記事書いてた気がする
2024/03/14(木) 21:27:55.19ID:iPr/ZwFh0
スクリプト爆撃対策できない5ch自体もそろそろやばそうだ
2024/03/27(水) 10:00:12.13ID:VvChnD9t0
過去の悪行をアーカイブされてる変態新聞がAI児ポに絡めてアーカイバを悪に仕立てる構図
2024/03/27(水) 10:47:01.22ID:/iyhPo8d0
archive.is
Loading.
↓
Not Found (yet?)
All site
Loading.
↓
Not Found (yet?)
All site
2024/03/27(水) 16:16:54.74ID:VvChnD9t0
.todayで俺もなった
2024/04/02(火) 01:43:49.44ID:1ckoJKH40
2024/4/1、長年Google検索トップに鎮座していた
【文字数カウント】がODNホームページサービス終了に伴い消滅
SNSでは突然の別れに惜しむ声が絶えない
このツールは2002年から存在していた模様
https://i.imgur.com/i3wHZKp.jpg
http://www1.odn.ne.jp/megukuma/count.htm
【文字数カウント】サイト閉鎖 ユーザー「一番使いやすかった」「ありがとうございました」
https://www.itmedia.co.jp/news/spv/2404/01/news121.html
【文字数カウント】がODNホームページサービス終了に伴い消滅
SNSでは突然の別れに惜しむ声が絶えない
このツールは2002年から存在していた模様
https://i.imgur.com/i3wHZKp.jpg
http://www1.odn.ne.jp/megukuma/count.htm
【文字数カウント】サイト閉鎖 ユーザー「一番使いやすかった」「ありがとうございました」
https://www.itmedia.co.jp/news/spv/2404/01/news121.html
2024/04/17(水) 05:00:01.19ID:LoOXS4eE0
archive.is can no longer save Twitter from around April.
example:
https://twitter.com/ifc_srh/status/1776527766412018126
https://twitter.com/thejimwatkins
example:
https://twitter.com/ifc_srh/status/1776527766412018126
https://twitter.com/thejimwatkins
5958
2024/04/17(水) 05:44:01.19ID:LoOXS4eE02024/04/18(木) 16:23:26.26ID:31KqVUKw0
.todayでXの保存ができなくなったか
ユーザーごとに魚拓を検索できたから重宝してたんだが
ユーザーごとに魚拓を検索できたから重宝してたんだが
2024/04/19(金) 04:12:56.08ID:f+QDn1hh0
画像とかクリックして別タブで開かずそのページでポップアップみたいな感じで開くやつは
archive.org、arhive.isどちらでもアーカイブとってもクリックにその箇所が反応しないな
archive.org、arhive.isどちらでもアーカイブとってもクリックにその箇所が反応しないな
2024/04/19(金) 04:29:19.53ID:Cp941s2b0
>>61
archive.org の場合はサイト次第
archive.org の場合はサイト次第
2024/04/19(金) 18:52:53.74ID:f+QDn1hh0
>>62
そうなの
MEN'S NON-NOのサイトだが画像をクリックすると、それとともに取材相手への質問が表示されるやつ
先にアーカイブとられてたやつは画像が表示されてなかったから改めてアーカイブしたら
画像表示自体はしたがクリックに無反応
そうなの
MEN'S NON-NOのサイトだが画像をクリックすると、それとともに取材相手への質問が表示されるやつ
先にアーカイブとられてたやつは画像が表示されてなかったから改めてアーカイブしたら
画像表示自体はしたがクリックに無反応
2024/05/21(火) 04:10:22.18ID:DF8dIwsI0
10年前のWebページの38%が消失──Pew Research Center調べ
https://www.itmedia.co.jp/news/spv/2405/20/news080.html
10年前のWebページの38%が消失 お前らの黒歴史も消えてるか? [156193805]
https://hayabusa9.5ch.net/test/read.cgi/news/1716177970/
https://www.itmedia.co.jp/news/spv/2405/20/news080.html
10年前のWebページの38%が消失 お前らの黒歴史も消えてるか? [156193805]
https://hayabusa9.5ch.net/test/read.cgi/news/1716177970/
2024/07/19(金) 09:07:24.27ID:i35vHi650
Sage
2024/07/19(金) 09:07:54.89ID:i35vHi650
され
67192.168.0.774
2024/07/23(火) 06:21:08.52ID:AJUrRvmc0 vectorのホームページサービス終了
数々の古のフリーソフトの公式が発掘限界点の向こう側へ
数々の古のフリーソフトの公式が発掘限界点の向こう側へ
68192.168.0.774
2024/07/23(火) 23:34:22.60ID:pbqcCg1q0既にじゃなくて年末までか。アーカイブするしかない
《 【Webサービス】個人ホームページの歴史がまたひとつ……Vector、ホームページサービスを12月20日に終了【やじうまWatch】
http://egg.5ch.net/test/read.cgi/bizplus/1721272428/ 》
69192.168.0.774
2024/08/01(木) 18:20:00.66ID:uP7HLm9x0 どなたかお願いします
「アキバ総研」終了へ 22年の歴史に幕 記事は閲覧不能に - ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2408/01/news124.html
「アキバ総研」終了へ 22年の歴史に幕 記事は閲覧不能に - ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2408/01/news124.html
2024/08/13(火) 23:42:47.60ID:kQKQkOMh0
2024/08/14(水) 07:08:42.42ID:kxlIVPRz0
2023/12/01 更新期限を過ぎたか何かによりドメイン廃止
2024/05/31 一時凍結期間終了
https://whois-history.whoisxmlapi.com/lookup-report/Wo5Q3gZ7Rd
2024/05/31 一時凍結期間終了
https://whois-history.whoisxmlapi.com/lookup-report/Wo5Q3gZ7Rd
72192.168.0.774
2024/08/20(火) 19:19:05.46ID:zsZWoPkr0 なんだろうとTwitter見に行くもそれらしい緊急状況は無し
Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
2024/08/23(金) 23:31:59.23ID:MmaR55x80
「牛」と呼ばれてるアーカイブサイトってどこだと思います?
探してるんだけど判らぬ……
探してるんだけど判らぬ……
2024/08/24(土) 00:45:46.66ID:099fHmdK0
ソフトウェア配布サイトの事なら Tucows なんだろうけどな・・・
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
https://www.tucows.com/retired
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
https://www.tucows.com/retired
2024/08/26(月) 02:21:11.31ID:B7Mket0T0
大手4社の資料保存活動とは? キーマンたちが現状を報告した「ゲーム開発過去資料の保存の最前線を語ろう!」レポート[CEDEC 2024]
https://www.4gamer.net/games/999/G999905/20240824019/
https://www.4gamer.net/games/999/G999905/20240824019/
2024/08/27(火) 11:11:58.32ID:ZJNuTxHU0
最近のサイトデザインでは折り畳みメニュー表示が増えてて実際に.orgと.todayの2つで試してみないと分からなかったりする
2024/09/05(木) 13:55:10.35ID:8y13Nyfk0
ニューヨーク 4日 ロイター] - 米連邦控訴裁判所は、非営利団体インターネット・アーカイブが著作権保護された作品を違法にスキャンし、許可なく無料でオンライン上に公開していると訴えた大手書籍出版社4社の訴えを支持した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー&サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の 「大規模な 」コピーと配布は 「公正な利用 」には当たらないとの見解を示した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー&サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の 「大規模な 」コピーと配布は 「公正な利用 」には当たらないとの見解を示した。
2024/10/05(土) 23:37:38.68ID:sir44IIK0
ぷららのホームページサービスが来年の4月1日で終了するみたい
https://www.docomo.ne.jp/info/notice/page/240627_01.html
https://www.docomo.ne.jp/info/notice/page/240627_01.html
2024/10/08(火) 02:12:46.98ID:bySj2odM0
無料か無料に近い形で提供されるホームページサービスは遠からず全部消えるのかなぁ
2024/10/09(水) 21:54:07.89ID:pVxYkPnH0
Tor、I2P、Freenetみたいな中央サーバーを持たない、
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル
2024/10/10(木) 08:25:31.73ID:O0Wa5OT40
Internet Archiveがハッキング被害、3,100万人分の個人情報流出
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
https://www.bleepingcomputer.com/news/security/internet-archive-hacked-data-breach-impacts-31-million-users/
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
https://www.bleepingcomputer.com/news/security/internet-archive-hacked-data-breach-impacts-31-million-users/
82192.168.0.774
2024/10/10(木) 11:25:28.61ID:mRA5njFO0 始まりがあるものには、すべて終わりがある
2024/10/11(金) 10:59:00.08ID:+0ZVN28A0
努力次第で終わりは遅延できる
2024/10/11(金) 14:43:21.46ID:4/k0xNoP0
Googleというビッグブラザーのキャッシュ代替になったことで標的にされやすくなったんだよ
2024/10/19(土) 01:14:25.80ID:yNdJY+Db0
>>80
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ
(現在のところ)価値が無い情報をどう保存させるかが問題
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ
(現在のところ)価値が無い情報をどう保存させるかが問題
2024/10/19(土) 18:29:44.21ID:7gZrEMne0
2024/10/20(日) 01:29:10.31ID:YC/XYbnS0
IPFSだ、IPFSしかない
2024/10/20(日) 17:28:03.78ID:jErutBf90
よく勘違いされるけどIPFSってアーカイブには向いて無いよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ
89あめ ◆P0jSlC5fJs
2024/10/20(日) 19:38:03.16ID:vNuKrZxb0 それはそう、arweaveみたいなものではない
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ
2024/10/23(水) 01:58:39.75ID:TBBqAAjr0
分散型はとりあえず業界の標準が決まってくれないとより良いものが出るたびにデータを投げ捨てることになりかねないな
2024/10/23(水) 13:52:50.47ID:TBBqAAjr0
分散型ストレージのautonomiは10月29日に一般公開予定
https://docs.autonomi.com/learn
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね
https://docs.autonomi.com/learn
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね
2024/10/23(水) 14:44:11.43ID:p8DuKr1h0
>>91
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に1回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが(これはこれでどうかと思うが)
autonomiはどういう理屈なんだろ
というかこの手のプロジェクトって何で1回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に1回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが(これはこれでどうかと思うが)
autonomiはどういう理屈なんだろ
というかこの手のプロジェクトって何で1回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが
2024/10/23(水) 14:56:52.25ID:TBBqAAjr0
>>92
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜?」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか?というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない?
あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜?」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか?というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない?
あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・
2024/10/28(月) 05:32:04.83ID:yhg3dtvQ0
ベクターHPが12月20日で終了
95192.168.0.774
2024/11/14(木) 11:40:47.87ID:e5vP7i/90 mangazも閉鎖で絶版本が無間地獄に帰るね
2024/12/01(日) 22:45:19.04ID:tuRpdWYB0
>>78
訂正 サービス終了は来年3月31日だった
訂正 サービス終了は来年3月31日だった
2024/12/27(金) 13:26:37.17ID:fYcmXIUr0
goo IDが2017年以降ログインなしで削除
ブログが消されるかどうかは知らん
ブログが消されるかどうかは知らん
2024/12/28(土) 10:08:50.49ID:xIi08uhi0
>>97
ID削除のソース
https://login.mail.goo.ne.jp/id/common/custom_content?newsid=ucaeywpp3ds
ブログ削除のソース
https://blog.goo.ne.jp/staffblog/e/57385bcaa324c9153f93a03375d70336
10年代前半で更新止まったブログは全削除されそうだな
ID削除のソース
https://login.mail.goo.ne.jp/id/common/custom_content?newsid=ucaeywpp3ds
ブログ削除のソース
https://blog.goo.ne.jp/staffblog/e/57385bcaa324c9153f93a03375d70336
10年代前半で更新止まったブログは全削除されそうだな
2024/12/30(月) 13:37:58.45ID:mp0Tkkna0
削除するぞメール来たってえきねっと退会スパムみたいなもんかと思って放置されるだろうな
100192.168.0.774
2025/01/17(金) 00:03:32.08ID:0d/D0Jtj0 ニコニコ春画29日終了
2025/02/08(土) 19:45:26.63ID:wXhKO+uW0
最近は魚拓回避意図か知らんがクリックしないと表示されない系が増えてきてるけどこれ録れないよね?
coinloan.tech
coinloan.tech
2025/02/22(土) 00:01:37.07ID:1+yNfjxb0
【オウム真理教問題デジタルアーカイブ】
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
https://www.moj.go.jp/psia/aumarchive/index.html
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
https://www.moj.go.jp/psia/aumarchive/index.html
2025/02/26(水) 17:48:15.08ID:zrJmYLce0
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由
https://news.careerconnection.jp/entame/134251/
https://news.careerconnection.jp/entame/134251/
2025/03/03(月) 18:32:56.97ID:l3vle4lQ0
Internet Archive総合 (web.archive.org) #6
https://mevius.5ch.net/test/read.cgi/esite/1733289042
https://mevius.5ch.net/test/read.cgi/esite/1733289042
105192.168.0.774
2025/03/04(火) 14:13:18.85ID:pZipXde+0 「ぷらら」の個人向けホームページが3月末に終了 古参ネットユーザー「歴史が消えていく」 - ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2503/04/news125.html
https://www.itmedia.co.jp/news/articles/2503/04/news125.html
2025/03/10(月) 03:58:04.00ID:AUECZsGf0
Internet Archive総合 (web.archive.org) #6
https://mevius.5ch.net/test/read.cgi/esite/1733289042
https://mevius.5ch.net/test/read.cgi/esite/1733289042
2025/03/16(日) 07:33:18.12ID:kKDe6Rv/0
108192.168.0.774
2025/03/31(月) 15:37:25.63ID:Y56lREV80 このスレでよく名前が挙がるArchive Teamについて
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
https://t[.]co/SgvHmY6hPA
ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
https://clavis.info/wiki/running_archiveteam_warrior
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
https://t[.]co/SgvHmY6hPA
ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
https://clavis.info/wiki/running_archiveteam_warrior
2025/04/01(火) 03:44:11.98ID:3bUxAbnt0
ss-blogは何故かまだ生きてるな
不可視化の処理が完了するまでタイムラグがあるのか?
不可視化の処理が完了するまでタイムラグがあるのか?
2025/04/04(金) 09:30:39.65ID:Ap+qSSew0
>>103
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
https://greta.5ch.net/test/read.cgi/poverty/1651208035/
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
https://greta.5ch.net/test/read.cgi/poverty/1651208035/
2025/04/04(金) 22:16:45.45ID:d/O8B0Nf0
http://www.fc2web.com/
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。
悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。
悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか
2025/04/07(月) 11:32:10.86ID:rkOq5lFK0
Pocketとかの代替でkarakeep(Hoarder)というのを使ってて見つけたんだけど、
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
https://github.com/Y2Z/monolith
ローカル保存におすすめ
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
https://github.com/Y2Z/monolith
ローカル保存におすすめ
113192.168.0.774
2025/04/07(月) 22:58:04.30ID:G0iokGQw0 こんなのあったのか
114192.168.0.774
2025/04/12(土) 02:39:17.31ID:xmRuIA6s0 「みんなFC2WEBばっかり目が行ってるけど、実際は55 STREET、Easter、Finito Web、http://OJIJI.net、http://Zero-yen.com、http://k-free.net、GOOSIDE、KATOWEB(→KTNET)、http://ZERO-CITY.com、K-Serverも2025年6月30日に終わることになっている。 注意するんだ。」
https://x.com/n121mt/status/1907388961032708487
https://x.com/n121mt/status/1907388961032708487
2025/04/15(火) 02:45:02.64ID:5qeSSvyR0
WARC で保存できる Webrecorder もいいぞ
https://chromewebstore.google.com/detail/webrecorder-archivewebpag/fpeoodllldobpkbkabpblcfaogecpndd
https://chromewebstore.google.com/detail/webrecorder-archivewebpag/fpeoodllldobpkbkabpblcfaogecpndd
2025/04/19(土) 10:37:20.38ID:em1R2zGM0
「ゲームのアーカイブ」をテーマに研究者、保存団体、社長などが一堂に会すシンポジウムが開催。ヨーロッパの博物館はゲーセンの雰囲気を再現、マイナー作品を移植するには“ドサクサに紛れてコッソリ入れ込む”──など気になるトピック多数
https://news.denfaminicogamer.jp/kikakuthetower/2504152e
https://news.denfaminicogamer.jp/kikakuthetower/2504152e
2025/05/06(火) 15:07:47.60ID:K61FRbpu0
archive.todayが最近不調な件
・先月中ごろから一部のサイトが取得できない
・数日前から「Not Found (yet?)」が多い
・先月中ごろから一部のサイトが取得できない
・数日前から「Not Found (yet?)」が多い
2025/05/07(水) 06:37:54.86ID:6n/1y+tk0
Not Found (yet?)はarchive.today本体が調子悪い時も取得先が調子悪い時もarchive.todayが取得先から弾かれてるだけの時も出るから本体に濡れ衣着せてしまいがちではある
特にXのセンシティブ設定されてる画像ポスト&アカウント自体が強制センシティブ設定食らってる人のポストは今のarchive.todayの仕様だとNot Found (yet?)にほぼ全部なるから、
あれ?と思ったらghost archive等の別の魚拓サイトを毎回試すようにしてる
特にXのセンシティブ設定されてる画像ポスト&アカウント自体が強制センシティブ設定食らってる人のポストは今のarchive.todayの仕様だとNot Found (yet?)にほぼ全部なるから、
あれ?と思ったらghost archive等の別の魚拓サイトを毎回試すようにしてる
2025/05/07(水) 10:41:30.46ID:BeikZYi90
Googleキャッシュの廃止以来、国内大学のレポジトリに多く上がってるPDF論文がHTML形式でアーカイブ出来なくなり悔しい…。
2025/05/07(水) 11:04:11.83ID:R8dy5vO80
>>117-118
Xの魚拓取ってると場合によっては(yet?)が出まくってarchive.todayがまた死にかけてる!となりがちだなw
あと保存してる最中にちょうどアカウント主が鍵かけちゃって(yet?)のページがお出しされる悲しいパターン
Xの魚拓取ってると場合によっては(yet?)が出まくってarchive.todayがまた死にかけてる!となりがちだなw
あと保存してる最中にちょうどアカウント主が鍵かけちゃって(yet?)のページがお出しされる悲しいパターン
2025/05/21(水) 19:36:28.43ID:gBGNftSt0
117だが、前者の原因はIAスレ(6スレ目)のとある書き込みにあった
道理で取得できないわけか
IAだけでは心もとなくて使ってたのに、まさかそういう上限があったとは・・・
Ghostarchive、そこもそういう仕様でなければ良いが、果たして・・・
道理で取得できないわけか
IAだけでは心もとなくて使ってたのに、まさかそういう上限があったとは・・・
Ghostarchive、そこもそういう仕様でなければ良いが、果たして・・・
2025/06/07(土) 08:49:11.47ID:aN87fLV/0
https://www.maple.town/
こんなサイトを発見
1986年からある電子掲示板のほぼ全てのログが保管されてる貴重なサイト
IDとパスワードで保護されている為archive.orgにはほとんどアーカイブされていない
しかしIDもパスワードもトップページに書かれてるので
target_username=<XXX>
target_password=<YYY>
でアーカイブ可能
今のうちにアーカイブしておこう
こんなサイトを発見
1986年からある電子掲示板のほぼ全てのログが保管されてる貴重なサイト
IDとパスワードで保護されている為archive.orgにはほとんどアーカイブされていない
しかしIDもパスワードもトップページに書かれてるので
target_username=<XXX>
target_password=<YYY>
でアーカイブ可能
今のうちにアーカイブしておこう
2025/06/07(土) 13:52:53.08ID:S9o9v/wR0
>>122
手を抜いて capture_outlinks=on も追加してしまうと、outlinks として飛んだ先では
target_username も target_password も使用されないのは盲点だった
せめて同じドメインなら認証情報も使い回してくれよw
手を抜いて capture_outlinks=on も追加してしまうと、outlinks として飛んだ先では
target_username も target_password も使用されないのは盲点だった
せめて同じドメインなら認証情報も使い回してくれよw
2025/06/09(月) 05:38:35.19ID:g/YpZEvX0
UAの設定なんかも外部リンクには適用されないんだよな(´・ω・`)
ただcapture_allとかskip_first_archiveなんかは適用されたり
おかしなところがいくつかあったので一応
https://www.maple.town/bbs/11/ ここはリストとレス番に若干ズレがあれどちゃんと見れる
https://www.maple.town/bbs/130/ ここは前ページに遡れないなと思ったら
どうやら古いレスは消える板らしい https://www.maple.town/bbs/130/1
でも連番でレス自体は見れるようです
ただcapture_allとかskip_first_archiveなんかは適用されたり
おかしなところがいくつかあったので一応
https://www.maple.town/bbs/11/ ここはリストとレス番に若干ズレがあれどちゃんと見れる
https://www.maple.town/bbs/130/ ここは前ページに遡れないなと思ったら
どうやら古いレスは消える板らしい https://www.maple.town/bbs/130/1
でも連番でレス自体は見れるようです
2025/06/19(木) 18:59:11.21ID:lJyJlJ5s0
Ghostarchive、今朝から取得できてんだかできてないんだか
検索では取得できてることになってるが、それを見ようとすると
「An unexpected error occured: QuotaExceededError」
archive.today同様上限(同じドメインは5000件まで。Ghostarchiveではもっと少ないようだ)に引っかかったのか、それともたまたま・・・
IAだけでは心もとなくて複数のアーカイブサイトで取得するようにしてるが、結局IAしか勝たんてか
検索では取得できてることになってるが、それを見ようとすると
「An unexpected error occured: QuotaExceededError」
archive.today同様上限(同じドメインは5000件まで。Ghostarchiveではもっと少ないようだ)に引っかかったのか、それともたまたま・・・
IAだけでは心もとなくて複数のアーカイブサイトで取得するようにしてるが、結局IAしか勝たんてか
2025/06/19(木) 19:34:49.02ID:lJyJlJ5s0
訂正
archive.todayでは上限5000件までだが、もしGhostarchiveで上限があるとしたら(5000件も取得してないゆえに)それより少ないことに
archive.todayでは上限5000件までだが、もしGhostarchiveで上限があるとしたら(5000件も取得してないゆえに)それより少ないことに
2025/06/29(日) 18:30:52.23ID:V9QrwJqA0
125-126の件、別のブラウザで試したら取得できた
上限の問題ではないのならarchive.todayより増しなんだろうが、惜しむらくは検索が200件までしか表示されないのとブラウザによっては安定しないところか
ちなみにarchive.todayの検索はたしか3000件、IAの検索は10000件
上限の問題ではないのならarchive.todayより増しなんだろうが、惜しむらくは検索が200件までしか表示されないのとブラウザによっては安定しないところか
ちなみにarchive.todayの検索はたしか3000件、IAの検索は10000件
2025/08/17(日) 15:49:16.40ID:EQLJjoS80
Sage
2025/08/17(日) 15:49:24.24ID:EQLJjoS80
Sag
2025/08/18(月) 21:12:47.94ID:ilmx9LNo0
閉鎖の続くブログはオワコンなのか 惜しむ声、でも保存議論は進まず:朝日新聞
https://www.asahi.com/articles/AST8F2SJ2T8FULFA00FM.html
https://www.asahi.com/articles/AST8F2SJ2T8FULFA00FM.html
2025/10/07(火) 22:06:40.64ID:Y5oIV8NM0
Ghostarchive、昨日から取得できず
Archiving error
There was an issue trying to archive your webpage or video. Usually, webpages that are bigger than 50 megabytes, or videos longer than 15 minutes, may fail to archive.
You can try to archive the page again, and if it still doesn't work, report it by clicking here and we will try to rectify the issue.
↑
普段はこれが出ても一遍か二遍かやり直せば取得できるのに、何遍やり直してもこれが出る
1年前のIAのあの一件ほど長引かなければ良いが・・・
Archiving error
There was an issue trying to archive your webpage or video. Usually, webpages that are bigger than 50 megabytes, or videos longer than 15 minutes, may fail to archive.
You can try to archive the page again, and if it still doesn't work, report it by clicking here and we will try to rectify the issue.
↑
普段はこれが出ても一遍か二遍かやり直せば取得できるのに、何遍やり直してもこれが出る
1年前のIAのあの一件ほど長引かなければ良いが・・・
2025/10/10(金) 15:51:57.48ID:GY4PACd70
なぜかXだけは取得できる
道理でここ数日の記録があるわけか
ttps://ghostarchive.org/search?term=https%3A%2F%2Fx.com
道理でここ数日の記録があるわけか
ttps://ghostarchive.org/search?term=https%3A%2F%2Fx.com
2025/10/21(火) 23:36:19.14ID:OMBGwnIl0
131の件は10/11遅くに解消
その後、別の日に20分程度間隔でつながらないようなことがあったが
向こうの問題か、それともこっちがなんらかの規制に引っかかったのか・・・
その後、別の日に20分程度間隔でつながらないようなことがあったが
向こうの問題か、それともこっちがなんらかの規制に引っかかったのか・・・
2025/10/23(木) 02:58:51.49ID:SSQtUAlc0
アーカイブ閲覧かつ取得ができるサイト
・Internet Archive(Wayback Machine)
・ウェブ魚拓
・archive.today
・GhostArchive
以外にArquivo.ptというのがあるのか
ttps://arquivo.pt
ttps://arquivo.pt/services/archivepagenow
IA+Ghostのようにアクセスしづらいことがあるとか、魚拓のように24時間に○件までしか取得できないとか、todayのように同じドメインのURLは○件までしか取得できないとか
そういうことがなければArquivo.ptという手があるが、今年絡みのアーカイブが見あたらないのが引っかかる
後日反映される仕組みのようだが、↑ということがあるとなると反映には何か月かかかるんだろうな
・Internet Archive(Wayback Machine)
・ウェブ魚拓
・archive.today
・GhostArchive
以外にArquivo.ptというのがあるのか
ttps://arquivo.pt
ttps://arquivo.pt/services/archivepagenow
IA+Ghostのようにアクセスしづらいことがあるとか、魚拓のように24時間に○件までしか取得できないとか、todayのように同じドメインのURLは○件までしか取得できないとか
そういうことがなければArquivo.ptという手があるが、今年絡みのアーカイブが見あたらないのが引っかかる
後日反映される仕組みのようだが、↑ということがあるとなると反映には何か月かかかるんだろうな
2025/10/30(木) 03:54:39.42ID:Ra9guvLU0
403 ERROR
The request could not be satisfied.
Request blocked. We can't connect to the server for this app or website at this time. There might be too much traffic or a configuration error. Try again later, or contact the app or website owner.
If you provide content to customers through CloudFront, you can find steps to troubleshoot and help prevent this error by reviewing the CloudFront documentation.
Generated by cloudfront (CloudFront)
Request ID: ○○(←そのとき次第)
一部だけならGhost Archive側の問題ではなく取得するサイト側の問題だろうか
The request could not be satisfied.
Request blocked. We can't connect to the server for this app or website at this time. There might be too much traffic or a configuration error. Try again later, or contact the app or website owner.
If you provide content to customers through CloudFront, you can find steps to troubleshoot and help prevent this error by reviewing the CloudFront documentation.
Generated by cloudfront (CloudFront)
Request ID: ○○(←そのとき次第)
一部だけならGhost Archive側の問題ではなく取得するサイト側の問題だろうか
2025/10/30(木) 03:59:40.77ID:Ra9guvLU0
135補足、というかこれを先に書くべきだったもの
「Ghost Archive、先ほどから一部のサイトでのことだが、取得するとこれが出る」
「Ghost Archive、先ほどから一部のサイトでのことだが、取得するとこれが出る」
137192.168.0.774
2025/11/04(火) 21:17:38.95ID:ZRIG0CTs0 fandomというサイト、どうあがいてもwebpでしか保存できなくなった・・・
138192.168.0.774
2025/11/04(火) 21:19:09.85ID:ZRIG0CTs0 >>137
IEモードで表示すれば元のファイルで保存できたが、それも塞がれた・・・
IEモードで表示すれば元のファイルで保存できたが、それも塞がれた・・・
2025/11/04(火) 21:20:22.76ID:ZRIG0CTs0
2025/11/07(金) 13:14:51.24ID:AAADdqGF0
.todayはドメインレジストラTucowsにFBIが照会
2025/11/07(金) 13:30:38.48ID:fDrIFf260
FBIがウェブ魚拓サービス「archive.today」の所有者の身元を捜索中
https://gigazine.net/news/20251107-archive-today-fbi/
https://gigazine.net/news/20251107-archive-today-fbi/
142192.168.0.774
2025/11/07(金) 16:00:28.00ID:BMrvEZBj0 結局わからなさそう
143192.168.0.774
2025/11/10(月) 00:31:58.96ID:PVnHVZaQ0 ボランティア有志が「Warrior」というソフトを使ってInternet Archiveにgooブログを保存しているんだけど、
日本国外からのアクセスが制限されててアーカイブ速度がだいぶ落ちてる
このスレを見ててWarriorを動かしてない民がいたらどうか手元でWarriorを動かしてほしい。頼む
やり方は以下の記事に書いてある。かなり簡単に導入できる。
ArchiveTeam Warriorで知識を守る(やり方) (※マウス操作による導入方法の解説)
https://clavis.info/wiki/running_archiveteam_warrior
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう (※Dockerによる導入方法の解説。エンジニア向け)
https://stepney141.hatena;blog.com/entry/2025/02/17/182148 (規制回避。「; 」は消すこと)
日本国外からのアクセスが制限されててアーカイブ速度がだいぶ落ちてる
このスレを見ててWarriorを動かしてない民がいたらどうか手元でWarriorを動かしてほしい。頼む
やり方は以下の記事に書いてある。かなり簡単に導入できる。
ArchiveTeam Warriorで知識を守る(やり方) (※マウス操作による導入方法の解説)
https://clavis.info/wiki/running_archiveteam_warrior
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう (※Dockerによる導入方法の解説。エンジニア向け)
https://stepney141.hatena;blog.com/entry/2025/02/17/182148 (規制回避。「; 」は消すこと)
2025/11/12(水) 09:19:53.30ID:7zma6hJs0
archive.today、アクセスできないが、まさか>>141の絡みか
2025/11/12(水) 10:04:18.40ID:7zma6hJs0
144の件、先ほど復旧
2025/11/16(日) 04:29:30.01ID:HtyLo8zV0
Archive.todayへの疑わしい圧力に関する調査(AdGuard DNS)
https://adguard-dns.io/en/blog/archive-today-adguard-dns-block-demand.html
https://adguard-dns.io/en/blog/archive-today-adguard-dns-block-demand.html
147192.168.0.774
2025/11/19(水) 11:50:06.81ID:Gld0MY4Z0 【お知らせ】ご利用のない無料ブログの削除について│てぃーだ スタッフブログ
https://staff.ti-da.net/e13030131.html
https://staff.ti-da.net/e13030131.html
2025/11/20(木) 17:07:32.40ID:Erso1Nji0
Gooブログも結局、完全アーカイブ化は無理だったみたいだな。
某右翼政治アカウントの投稿記事はだいぶ取りそびれになってる。
レスを投稿する
ニュース
- 【工作員】「X」のアカウント所在地公開機能が暴いた世論操作の実態 MAGA支持著名アカウントの多くが米国外から運営 日本にも波及 ★2 [ごまカンパチ★]
- 【大阪】日本一高い観覧車が落雷で緊急停止 約20人乗客が閉じ込められ9時間にわたり救助活動 [七波羅探題★]
- 【・(ェ)・】「くまちゃんがいた」散歩中の2歳園児が発見 クリ林に1頭のクマ…保育士「ワンちゃんだね…」と声かけて移動 [Ailuropoda melanoleuca★]
- 【大阪】「もっとこっち来てよ」女子高校生を電車内に連れ込み 小学校教諭再逮捕「話をしたかっただけ [七波羅探題★]
- 【芸能】安達祐実 44歳の最新姿「ぇーーーーー!!!」「声出た」「なんなの」「まって」「ワオ」 [湛然★]
- ラピダス、第2工場建設でも見えぬ顧客 技術開発も難題山積 [蚤の市★]
- 🖐( -᷄ὢ)これから>>2の>>3なんで……
- 小田原城行ってみようかな
- 【悲報】日本の田舎、もう住める場所じゃないと話題に
- えっ?肉離れって菜食主義の事じゃないの?俺ずっと
- 【悲報】『たぬかな』ファンのホビット、絶望「こうして36歳年収650万円身長155cmの底辺独身男性が残りましたとさ…どうすればいいんだよ [257926174]
- 独身でアラフォーだと急激に犯罪者率が高くなる不思議
