ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/
・関連スレ
Internet Archive総合 (web,archive,org) #2
https://mevius.5ch.net/test/read.cgi/esite/1690495133/
ウェブ魚拓 Part3
https://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
https://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
https://mevius.5ch.net/test/read.cgi/blog/1554380939/
・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
探検
【保存・記録】ウェブアーカイブ総合 Page.02
2023/11/21(火) 07:23:34.80ID:QN4SUfby0
2998
2023/11/22(水) 11:01:01.11ID:QZxCudHS0 勝手に次スレ立てたなら、前スレのURLぐらい貼れよ
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
4998
2023/11/22(水) 11:30:01.04ID:QZxCudHS0 前スレで、残り書き込めれるレス数が少ないのに悪口で埋めるのかよ。阿保らしい
2023/11/22(水) 12:17:26.13ID:DuzB/ozg0
>>2
うるせえよ死ねゴミ
うるせえよ死ねゴミ
2023/11/22(水) 12:58:35.19ID:gLGwnryk0
次スレどうする云々は早めに議論始めないと大抵こうなるんだよね。
5CH自体、人減ったからそういうのを仕切れる人も減った。
5CH自体、人減ったからそういうのを仕切れる人も減った。
2023/11/22(水) 13:08:04.66ID:R+bORu+V0
2023/11/22(水) 20:45:03.42ID:RBjZhLtj0
例のスレを私物化してるというかひたすら日記帳にしてた句読点空改行マンは正直叩かれても仕方ないかと
2023/11/23(木) 16:21:52.04ID:M5PJ+4vU0
2023/11/29(水) 19:55:45.97ID:Bv4X1MKX0
今さらだがtok2の無料プラン6月に死んでたのね
2023/11/29(水) 20:05:03.99ID:hfZzT9ef0
長期で見たらどのアーカイバが飛ぶかわからない砂上の楼閣感がある
2023/11/30(木) 15:45:33.23ID:CeXtDLxF0
信用度で言ったら
インターネットアーカイブ>>>>>>>>>today>その他
って感じだしな
特に運営元が分からない奴はいつ飛んでもおかしくない
インターネットアーカイブ>>>>>>>>>today>その他
って感じだしな
特に運営元が分からない奴はいつ飛んでもおかしくない
2023/12/01(金) 20:55:06.14ID:/RlTQaSn0
.orgで連続で弾かれた内部的な仕様変更だろうか
"Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again."
"Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again."
2023/12/01(金) 21:02:28.18ID:/RlTQaSn0
Windows版FireFox、Chrome、BraveとSafariで同じ症状
2023/12/01(金) 23:14:24.37ID:WQmdyjUL0
IAのスレでもその話題出てるけどIAの不具合ぽい
2023/12/06(水) 10:23:22.54ID:9VVxiS460
archive.is
日本時間今朝10時7分にサーバ証明書期限切れ、更新されてない
日本時間今朝10時7分にサーバ証明書期限切れ、更新されてない
17192.168.0.774
2023/12/12(火) 19:22:42.21ID:hW2qVqPj0 archive todayで気軽にアーカイブ化できるようなショートカットとかないですか?
2023/12/13(水) 12:39:45.28ID:pBChJXnH0
公式にブックマークレットあったはずだけど使えなくなったのか?
19192.168.0.774
2023/12/18(月) 14:32:47.54ID:rr5iksGZ0 ブックマークレット見当たらないんだけどどこにある?
2023/12/18(月) 22:09:24.58ID:VHkEpDN70
>>19
確かにそんなものがあったなぁ。
https://web.archive.org/web/20191022034909/archive.is/
archive.today で定期的にアーカイブさせるスクリプトを動かしていたことがあるけど、
ブックマークレットが行っていたような「保存したい URL を付けて送信するだけ」という方法が
何年か前に受け付けられなくなり、http://archive.is/ のトップページでトークン (submitid) を
得ることを要求するようになった。
ブックマークレットが掲載されなくなったのはその頃。
確かにそんなものがあったなぁ。
https://web.archive.org/web/20191022034909/archive.is/
archive.today で定期的にアーカイブさせるスクリプトを動かしていたことがあるけど、
ブックマークレットが行っていたような「保存したい URL を付けて送信するだけ」という方法が
何年か前に受け付けられなくなり、http://archive.is/ のトップページでトークン (submitid) を
得ることを要求するようになった。
ブックマークレットが掲載されなくなったのはその頃。
2023/12/18(月) 23:02:56.83ID:SRfhFfWq0
今も一応第三者が作ってGithubに上げてるブックマークレットならちゃんと今見てるページのワンポチ魚拓取得出来るよ
トップページ一回経由するやつ
トップページ一回経由するやつ
22192.168.0.774
2023/12/19(火) 14:10:59.19ID:be8ZnnnO0 >>21
ま?探してくるわ
ま?探してくるわ
23192.168.0.774
2023/12/28(木) 15:22:56.59ID:aVvZh5OJ0 archive.today
今朝、運良く取得できたけど、welcome to nginx病・・・
しかも一度出ると再アクセスしても接続がタイムアウトして繋がらなくなる・・・
回避方法あったら教えて
今朝、運良く取得できたけど、welcome to nginx病・・・
しかも一度出ると再アクセスしても接続がタイムアウトして繋がらなくなる・・・
回避方法あったら教えて
2023/12/28(木) 15:53:07.15ID:eQrjkTct0
>>23
見た感じ archive.today の応答がかなり悪くなってるみたいだけど
archive.is とか archive.md とか archive.li とか、リダイレクトの生じない名前なら
サクサク返って来るんだよね
見た感じ archive.today の応答がかなり悪くなってるみたいだけど
archive.is とか archive.md とか archive.li とか、リダイレクトの生じない名前なら
サクサク返って来るんだよね
25192.168.0.774
2023/12/29(金) 16:14:00.57ID:mcUEm1710 今日もarchive.todayでWelcome to nginx!になって取得できない・・・
取得するコツってないの?
取得するコツってないの?
2023/12/29(金) 16:24:41.89ID:56/eqjqc0
>>25
あるよw
あるよw
2023/12/29(金) 16:30:00.41ID:QoMdPNgl0
2023/12/29(金) 16:44:03.51ID:QoMdPNgl0
>>7
関連スレの「#2」の部分は直さなかったのかw #5なのに
関連スレの「#2」の部分は直さなかったのかw #5なのに
2023/12/29(金) 16:53:00.74ID:QoMdPNgl0
まあ、>>5 >7 >8はもう居ないだろうけど。
2023/12/29(金) 21:39:19.78ID:BeXMuX5W0
スレを日記帳にしてた連投句読点おじさん帰ってきちゃったじゃん…
2024/01/02(火) 12:32:26.24ID:W/dfs4mD0
質問です
このサイトをそのままの形で落としたいのですが
https://goodsmileshop.com/ja/
HTTrackでやったら、商品ページまで落とせず終わったり商品の画像が表示されません
そこでwgetで
wget -m -p -E -k -np をつけてやってみました。コマンドはよく分かりませんがネットでサイトそのまま再現
で検索したらこのコマンドを使えと記載がありました
まだ終わってませんがindexを覗いてみたら、カテゴリページを延々とダウンロードしてるようで
商品ページはまだで、途中ですがやっぱり画像が表示されてません
またいつまで経っても終わりません
画像が表示されないのは、表示方法にjavascriptとかを使っているからなんでしょうか
放置してダウンロードが終了すれば、きちんと表示されるんでしょうか
このサイトをそのままの形で落としたいのですが
https://goodsmileshop.com/ja/
HTTrackでやったら、商品ページまで落とせず終わったり商品の画像が表示されません
そこでwgetで
wget -m -p -E -k -np をつけてやってみました。コマンドはよく分かりませんがネットでサイトそのまま再現
で検索したらこのコマンドを使えと記載がありました
まだ終わってませんがindexを覗いてみたら、カテゴリページを延々とダウンロードしてるようで
商品ページはまだで、途中ですがやっぱり画像が表示されてません
またいつまで経っても終わりません
画像が表示されないのは、表示方法にjavascriptとかを使っているからなんでしょうか
放置してダウンロードが終了すれば、きちんと表示されるんでしょうか
2024/01/02(火) 16:22:32.88ID:lNtBlc7t0
2024/01/02(火) 19:16:28.75ID:W/dfs4mD0
wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
って書かれてたんで来ちゃいました。すみません
wgetの使い方に詳しい方がいる板ってどのあたりなんでしょうかね
って書かれてたんで来ちゃいました。すみません
wgetの使い方に詳しい方がいる板ってどのあたりなんでしょうかね
34192.168.0.774
2024/01/09(火) 19:48:58.47ID:p24Ans9E02024/01/22(月) 15:30:21.91ID:YHuj1Ww20
スラド終了のお知らせ
https://srad.jp/story/24/01/22/0311225/
https://srad.jp/story/24/01/22/0311225/
36192.168.0.774
2024/01/22(月) 15:33:31.38ID:BqifyO/10 スラドの保存を依頼しに来たが、既に書かれてた
1月いっぱいで閉鎖との事なので、技術を持ってる方がいたらWayback Machineへの保存をお願いします
1月いっぱいで閉鎖との事なので、技術を持ってる方がいたらWayback Machineへの保存をお願いします
37192.168.0.774
2024/02/01(木) 03:41:51.12ID:uruf4q6/0 >>31
亀レスだけど、落とそうとしてるファイルが多すぎる&サイトにJavaScriptが使われてる、の両方では
でかいサイトをwgetでまともにクロールするなら1週間くらい置いといた方がいい
あと最近のサイトは大概JavaScriptを多用してるから、Heritrixを使った方が楽かもしれん
参考にしたというのは多分このサイトだな
https://tex2e.github.io/blog/shell/wget-entire-website
あと>>32は間違ってる、ローカルアーカイブもれっきとしたWebアーカイブの一種だよ
>>1にもちゃんとwgetも含むと書いてあるし
亀レスだけど、落とそうとしてるファイルが多すぎる&サイトにJavaScriptが使われてる、の両方では
でかいサイトをwgetでまともにクロールするなら1週間くらい置いといた方がいい
あと最近のサイトは大概JavaScriptを多用してるから、Heritrixを使った方が楽かもしれん
参考にしたというのは多分このサイトだな
https://tex2e.github.io/blog/shell/wget-entire-website
あと>>32は間違ってる、ローカルアーカイブもれっきとしたWebアーカイブの一種だよ
>>1にもちゃんとwgetも含むと書いてあるし
2024/02/04(日) 23:33:32.14ID:wTdVULUN0
採択
2024/02/20(火) 12:53:52.46ID:cyS+ObVG0
『OKMusic』サービス終了のお知らせ
https://okmusic.jp/news/548328
<終了までのスケジュール>
・2024年3月31日(日)午後11時59分
記事更新を終了
・2024年4月1日(月)午前11時59分
会員機能の提供を終了
※以降会員登録、ログインできません
・2024年5月以降(予定)
サイトの公開を終了
※終了日時に関しては、このページにて改めて告知させていただきます
https://okmusic.jp/news/548328
<終了までのスケジュール>
・2024年3月31日(日)午後11時59分
記事更新を終了
・2024年4月1日(月)午前11時59分
会員機能の提供を終了
※以降会員登録、ログインできません
・2024年5月以降(予定)
サイトの公開を終了
※終了日時に関しては、このページにて改めて告知させていただきます
2024/02/25(日) 02:04:04.75ID:cjUiDYTX0
自作ツールの話だけど、DLしたデータを保存するファイル形式って何かいいのある?
例えば https://example.com/blog/article?mode=view&page=10 とかのURLを保存する時、
リクエストしたURL、レスポンスヘッダー、日時等のメタデータ、もちろんレスポンス本文 を保存したい。
もちろんレスポンス本文はバイナリの場合もある。
wgetだとローカルに example.com フォルダの中に blogフォルダの中に article_mode=view&page=10 というファイルを作る(半角の?はファイル名で使えないので置換される)
みたいなのがベタだと思うけど、それだとまずURL文字列の情報が失われてるし、レスポンスヘッダも消えてる。
それに1URLが1ファイルに保存されるから1サイトまるごとだとファイル数が多すぎて取り回しがしにくくなる。
warcファイルでいいやと思ったけど、一般的にはマイナーでエコシステムが力不足な事があるし
じゃあsqlteに自分でテーブルやカラムを作ってやればいいけど独自規格は後々困りそうだし…。
どうすればいいんすかね。
例えば https://example.com/blog/article?mode=view&page=10 とかのURLを保存する時、
リクエストしたURL、レスポンスヘッダー、日時等のメタデータ、もちろんレスポンス本文 を保存したい。
もちろんレスポンス本文はバイナリの場合もある。
wgetだとローカルに example.com フォルダの中に blogフォルダの中に article_mode=view&page=10 というファイルを作る(半角の?はファイル名で使えないので置換される)
みたいなのがベタだと思うけど、それだとまずURL文字列の情報が失われてるし、レスポンスヘッダも消えてる。
それに1URLが1ファイルに保存されるから1サイトまるごとだとファイル数が多すぎて取り回しがしにくくなる。
warcファイルでいいやと思ったけど、一般的にはマイナーでエコシステムが力不足な事があるし
じゃあsqlteに自分でテーブルやカラムを作ってやればいいけど独自規格は後々困りそうだし…。
どうすればいいんすかね。
2024/02/25(日) 15:52:11.05ID:6fhfw2DW0
warcで良いだろ
今後どれだけ時を経てもエコシステムが充足することはないから考慮する必要もない
今後どれだけ時を経てもエコシステムが充足することはないから考慮する必要もない
2024/02/25(日) 19:29:29.32ID:cjUiDYTX0
うーん、それもそうか…
2024/02/26(月) 21:52:37.14ID:badvTVSb0
warcは腐ってもISO規格で標準化されてて、マイナーな業界とはいえ世界中の専門機関で使われてる訳だしな
下手に自作するよりはずっと良い
下手に自作するよりはずっと良い
2024/02/26(月) 21:58:07.39ID:badvTVSb0
エコシステムが不足してるなら自分が貢献できるよう頑張ろう、位のガッツがあった方が良いよ(実際に貢献できるかは別として)
何しろマイナーな技術分野で先駆者が少ないから、それくらいの意気込みがないと現実的にやっていられない
何しろマイナーな技術分野で先駆者が少ないから、それくらいの意気込みがないと現実的にやっていられない
2024/02/27(火) 00:51:18.39ID:o1ZUbZhQ0
流行ると後から来たお客様にオワコンにされる流れ多すぎるのが悪い
先駆者利益も大きなお客様に乗っ取られた後の利益と比べたらリスクとリターン見合ってないし
先駆者利益も大きなお客様に乗っ取られた後の利益と比べたらリスクとリターン見合ってないし
2024/02/27(火) 12:09:56.51ID:ncN5iY7H0
オープンソースかつアーカイブ界隈でそれ気にする必要ある?
47192.168.0.774
2024/03/12(火) 13:39:21.51ID:DaYLFx9E0 どなたかArchiveTeamに連絡お願いします
>> このたび、ODN「ホームページサービス」につきましては、ご利用者の減少に伴い、2023年6月30日(金)に新規受付を終了し、
>> 2024年3月31日(日)をもちましてサービスを終了させていただくこととなりましたので、ご案内申し上げます。
https://www.odn.ne.jp/odn_info/20230413.html
>> このたび、ODN「ホームページサービス」につきましては、ご利用者の減少に伴い、2023年6月30日(金)に新規受付を終了し、
>> 2024年3月31日(日)をもちましてサービスを終了させていただくこととなりましたので、ご案内申し上げます。
https://www.odn.ne.jp/odn_info/20230413.html
48192.168.0.774
2024/03/12(火) 14:00:43.70ID:kcrHEzLE0 個人サイトなんだけど、todayが消してくれないのどうにかならんかな。
2024/03/12(火) 14:24:31.31ID:XJRNS97w0
>>48
残されて困るようなものを公開したお前が悪い
残されて困るようなものを公開したお前が悪い
2024/03/12(火) 20:00:28.00ID:rAwzeJQ40
長期的には.orgや.todayが潰される可能性も
2024/03/12(火) 21:27:17.34ID:XJRNS97w0
.org は無いと思うが .today はわからんな
2024/03/14(木) 17:05:30.27ID:4OkU93Wi0
.todayが重宝されてる一番の理由って日本語どころか.todayが運営してる国の言葉で正式な削除依頼を出しても突っぱねられて消えない事だからなあ
それこそ生半可な弁護士雇っても無理で某春○ちゃんの後任弁護士が英語と現地法律ガチった結果ようやく削除依頼が通ったみたいな記事書いてた気がする
それこそ生半可な弁護士雇っても無理で某春○ちゃんの後任弁護士が英語と現地法律ガチった結果ようやく削除依頼が通ったみたいな記事書いてた気がする
2024/03/14(木) 21:27:55.19ID:iPr/ZwFh0
スクリプト爆撃対策できない5ch自体もそろそろやばそうだ
2024/03/27(水) 10:00:12.13ID:VvChnD9t0
過去の悪行をアーカイブされてる変態新聞がAI児ポに絡めてアーカイバを悪に仕立てる構図
2024/03/27(水) 10:47:01.22ID:/iyhPo8d0
archive.is
Loading.
↓
Not Found (yet?)
All site
Loading.
↓
Not Found (yet?)
All site
2024/03/27(水) 16:16:54.74ID:VvChnD9t0
.todayで俺もなった
2024/04/02(火) 01:43:49.44ID:1ckoJKH40
2024/4/1、長年Google検索トップに鎮座していた
【文字数カウント】がODNホームページサービス終了に伴い消滅
SNSでは突然の別れに惜しむ声が絶えない
このツールは2002年から存在していた模様
https://i.imgur.com/i3wHZKp.jpg
http://www1.odn.ne.jp/megukuma/count.htm
【文字数カウント】サイト閉鎖 ユーザー「一番使いやすかった」「ありがとうございました」
https://www.itmedia.co.jp/news/spv/2404/01/news121.html
【文字数カウント】がODNホームページサービス終了に伴い消滅
SNSでは突然の別れに惜しむ声が絶えない
このツールは2002年から存在していた模様
https://i.imgur.com/i3wHZKp.jpg
http://www1.odn.ne.jp/megukuma/count.htm
【文字数カウント】サイト閉鎖 ユーザー「一番使いやすかった」「ありがとうございました」
https://www.itmedia.co.jp/news/spv/2404/01/news121.html
2024/04/17(水) 05:00:01.19ID:LoOXS4eE0
archive.is can no longer save Twitter from around April.
example:
https://twitter.com/ifc_srh/status/1776527766412018126
https://twitter.com/thejimwatkins
example:
https://twitter.com/ifc_srh/status/1776527766412018126
https://twitter.com/thejimwatkins
5958
2024/04/17(水) 05:44:01.19ID:LoOXS4eE02024/04/18(木) 16:23:26.26ID:31KqVUKw0
.todayでXの保存ができなくなったか
ユーザーごとに魚拓を検索できたから重宝してたんだが
ユーザーごとに魚拓を検索できたから重宝してたんだが
2024/04/19(金) 04:12:56.08ID:f+QDn1hh0
画像とかクリックして別タブで開かずそのページでポップアップみたいな感じで開くやつは
archive.org、arhive.isどちらでもアーカイブとってもクリックにその箇所が反応しないな
archive.org、arhive.isどちらでもアーカイブとってもクリックにその箇所が反応しないな
2024/04/19(金) 04:29:19.53ID:Cp941s2b0
>>61
archive.org の場合はサイト次第
archive.org の場合はサイト次第
2024/04/19(金) 18:52:53.74ID:f+QDn1hh0
>>62
そうなの
MEN'S NON-NOのサイトだが画像をクリックすると、それとともに取材相手への質問が表示されるやつ
先にアーカイブとられてたやつは画像が表示されてなかったから改めてアーカイブしたら
画像表示自体はしたがクリックに無反応
そうなの
MEN'S NON-NOのサイトだが画像をクリックすると、それとともに取材相手への質問が表示されるやつ
先にアーカイブとられてたやつは画像が表示されてなかったから改めてアーカイブしたら
画像表示自体はしたがクリックに無反応
2024/05/21(火) 04:10:22.18ID:DF8dIwsI0
10年前のWebページの38%が消失──Pew Research Center調べ
https://www.itmedia.co.jp/news/spv/2405/20/news080.html
10年前のWebページの38%が消失 お前らの黒歴史も消えてるか? [156193805]
https://hayabusa9.5ch.net/test/read.cgi/news/1716177970/
https://www.itmedia.co.jp/news/spv/2405/20/news080.html
10年前のWebページの38%が消失 お前らの黒歴史も消えてるか? [156193805]
https://hayabusa9.5ch.net/test/read.cgi/news/1716177970/
2024/07/19(金) 09:07:24.27ID:i35vHi650
Sage
2024/07/19(金) 09:07:54.89ID:i35vHi650
され
67192.168.0.774
2024/07/23(火) 06:21:08.52ID:AJUrRvmc0 vectorのホームページサービス終了
数々の古のフリーソフトの公式が発掘限界点の向こう側へ
数々の古のフリーソフトの公式が発掘限界点の向こう側へ
68192.168.0.774
2024/07/23(火) 23:34:22.60ID:pbqcCg1q0既にじゃなくて年末までか。アーカイブするしかない
《 【Webサービス】個人ホームページの歴史がまたひとつ……Vector、ホームページサービスを12月20日に終了【やじうまWatch】
http://egg.5ch.net/test/read.cgi/bizplus/1721272428/ 》
69192.168.0.774
2024/08/01(木) 18:20:00.66ID:uP7HLm9x0 どなたかお願いします
「アキバ総研」終了へ 22年の歴史に幕 記事は閲覧不能に - ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2408/01/news124.html
「アキバ総研」終了へ 22年の歴史に幕 記事は閲覧不能に - ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2408/01/news124.html
2024/08/13(火) 23:42:47.60ID:kQKQkOMh0
2024/08/14(水) 07:08:42.42ID:kxlIVPRz0
2023/12/01 更新期限を過ぎたか何かによりドメイン廃止
2024/05/31 一時凍結期間終了
https://whois-history.whoisxmlapi.com/lookup-report/Wo5Q3gZ7Rd
2024/05/31 一時凍結期間終了
https://whois-history.whoisxmlapi.com/lookup-report/Wo5Q3gZ7Rd

72192.168.0.774
2024/08/20(火) 19:19:05.46ID:zsZWoPkr0 なんだろうとTwitter見に行くもそれらしい緊急状況は無し
Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
2024/08/23(金) 23:31:59.23ID:MmaR55x80
「牛」と呼ばれてるアーカイブサイトってどこだと思います?
探してるんだけど判らぬ……
探してるんだけど判らぬ……
2024/08/24(土) 00:45:46.66ID:099fHmdK0
ソフトウェア配布サイトの事なら Tucows なんだろうけどな・・・
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
https://www.tucows.com/retired
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
https://www.tucows.com/retired
2024/08/26(月) 02:21:11.31ID:B7Mket0T0
大手4社の資料保存活動とは? キーマンたちが現状を報告した「ゲーム開発過去資料の保存の最前線を語ろう!」レポート[CEDEC 2024]
https://www.4gamer.net/games/999/G999905/20240824019/
https://www.4gamer.net/games/999/G999905/20240824019/
2024/08/27(火) 11:11:58.32ID:ZJNuTxHU0
最近のサイトデザインでは折り畳みメニュー表示が増えてて実際に.orgと.todayの2つで試してみないと分からなかったりする
2024/09/05(木) 13:55:10.35ID:8y13Nyfk0
ニューヨーク 4日 ロイター] - 米連邦控訴裁判所は、非営利団体インターネット・アーカイブが著作権保護された作品を違法にスキャンし、許可なく無料でオンライン上に公開していると訴えた大手書籍出版社4社の訴えを支持した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー&サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の 「大規模な 」コピーと配布は 「公正な利用 」には当たらないとの見解を示した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー&サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の 「大規模な 」コピーと配布は 「公正な利用 」には当たらないとの見解を示した。
2024/10/05(土) 23:37:38.68ID:sir44IIK0
ぷららのホームページサービスが来年の4月1日で終了するみたい
https://www.docomo.ne.jp/info/notice/page/240627_01.html
https://www.docomo.ne.jp/info/notice/page/240627_01.html
2024/10/08(火) 02:12:46.98ID:bySj2odM0
無料か無料に近い形で提供されるホームページサービスは遠からず全部消えるのかなぁ
2024/10/09(水) 21:54:07.89ID:pVxYkPnH0
Tor、I2P、Freenetみたいな中央サーバーを持たない、
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル
2024/10/10(木) 08:25:31.73ID:O0Wa5OT40
Internet Archiveがハッキング被害、3,100万人分の個人情報流出
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
https://www.bleepingcomputer.com/news/security/internet-archive-hacked-data-breach-impacts-31-million-users/
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
https://www.bleepingcomputer.com/news/security/internet-archive-hacked-data-breach-impacts-31-million-users/
82192.168.0.774
2024/10/10(木) 11:25:28.61ID:mRA5njFO0 始まりがあるものには、すべて終わりがある
2024/10/11(金) 10:59:00.08ID:+0ZVN28A0
努力次第で終わりは遅延できる
2024/10/11(金) 14:43:21.46ID:4/k0xNoP0
Googleというビッグブラザーのキャッシュ代替になったことで標的にされやすくなったんだよ
2024/10/19(土) 01:14:25.80ID:yNdJY+Db0
>>80
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ
(現在のところ)価値が無い情報をどう保存させるかが問題
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ
(現在のところ)価値が無い情報をどう保存させるかが問題
2024/10/19(土) 18:29:44.21ID:7gZrEMne0
2024/10/20(日) 01:29:10.31ID:YC/XYbnS0
IPFSだ、IPFSしかない
2024/10/20(日) 17:28:03.78ID:jErutBf90
よく勘違いされるけどIPFSってアーカイブには向いて無いよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ
89あめ ◆P0jSlC5fJs
2024/10/20(日) 19:38:03.16ID:vNuKrZxb0 それはそう、arweaveみたいなものではない
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ
2024/10/23(水) 01:58:39.75ID:TBBqAAjr0
分散型はとりあえず業界の標準が決まってくれないとより良いものが出るたびにデータを投げ捨てることになりかねないな
2024/10/23(水) 13:52:50.47ID:TBBqAAjr0
分散型ストレージのautonomiは10月29日に一般公開予定
https://docs.autonomi.com/learn
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね
https://docs.autonomi.com/learn
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね
2024/10/23(水) 14:44:11.43ID:p8DuKr1h0
>>91
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に1回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが(これはこれでどうかと思うが)
autonomiはどういう理屈なんだろ
というかこの手のプロジェクトって何で1回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に1回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが(これはこれでどうかと思うが)
autonomiはどういう理屈なんだろ
というかこの手のプロジェクトって何で1回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが
2024/10/23(水) 14:56:52.25ID:TBBqAAjr0
>>92
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜?」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか?というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない?
あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜?」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか?というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない?
あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・
2024/10/28(月) 05:32:04.83ID:yhg3dtvQ0
ベクターHPが12月20日で終了
95192.168.0.774
2024/11/14(木) 11:40:47.87ID:e5vP7i/90 mangazも閉鎖で絶版本が無間地獄に帰るね
2024/12/01(日) 22:45:19.04ID:tuRpdWYB0
>>78
訂正 サービス終了は来年3月31日だった
訂正 サービス終了は来年3月31日だった
2024/12/27(金) 13:26:37.17ID:fYcmXIUr0
goo IDが2017年以降ログインなしで削除
ブログが消されるかどうかは知らん
ブログが消されるかどうかは知らん
2024/12/28(土) 10:08:50.49ID:xIi08uhi0
>>97
ID削除のソース
https://login.mail.goo.ne.jp/id/common/custom_content?newsid=ucaeywpp3ds
ブログ削除のソース
https://blog.goo.ne.jp/staffblog/e/57385bcaa324c9153f93a03375d70336
10年代前半で更新止まったブログは全削除されそうだな
ID削除のソース
https://login.mail.goo.ne.jp/id/common/custom_content?newsid=ucaeywpp3ds
ブログ削除のソース
https://blog.goo.ne.jp/staffblog/e/57385bcaa324c9153f93a03375d70336
10年代前半で更新止まったブログは全削除されそうだな
2024/12/30(月) 13:37:58.45ID:mp0Tkkna0
削除するぞメール来たってえきねっと退会スパムみたいなもんかと思って放置されるだろうな
100192.168.0.774
2025/01/17(金) 00:03:32.08ID:0d/D0Jtj0 ニコニコ春画29日終了
2025/02/08(土) 19:45:26.63ID:wXhKO+uW0
最近は魚拓回避意図か知らんがクリックしないと表示されない系が増えてきてるけどこれ録れないよね?
coinloan.tech
coinloan.tech
2025/02/22(土) 00:01:37.07ID:1+yNfjxb0
【オウム真理教問題デジタルアーカイブ】
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
https://www.moj.go.jp/psia/aumarchive/index.html
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
https://www.moj.go.jp/psia/aumarchive/index.html
2025/02/26(水) 17:48:15.08ID:zrJmYLce0
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由
https://news.careerconnection.jp/entame/134251/
https://news.careerconnection.jp/entame/134251/
2025/03/03(月) 18:32:56.97ID:l3vle4lQ0
Internet Archive総合 (web.archive.org) #6
https://mevius.5ch.net/test/read.cgi/esite/1733289042
https://mevius.5ch.net/test/read.cgi/esite/1733289042
105192.168.0.774
2025/03/04(火) 14:13:18.85ID:pZipXde+0 「ぷらら」の個人向けホームページが3月末に終了 古参ネットユーザー「歴史が消えていく」 - ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2503/04/news125.html
https://www.itmedia.co.jp/news/articles/2503/04/news125.html
2025/03/10(月) 03:58:04.00ID:AUECZsGf0
Internet Archive総合 (web.archive.org) #6
https://mevius.5ch.net/test/read.cgi/esite/1733289042
https://mevius.5ch.net/test/read.cgi/esite/1733289042
2025/03/16(日) 07:33:18.12ID:kKDe6Rv/0
108192.168.0.774
2025/03/31(月) 15:37:25.63ID:Y56lREV80 このスレでよく名前が挙がるArchive Teamについて
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
https://t[.]co/SgvHmY6hPA
ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
https://clavis.info/wiki/running_archiveteam_warrior
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
https://t[.]co/SgvHmY6hPA
ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
https://clavis.info/wiki/running_archiveteam_warrior
2025/04/01(火) 03:44:11.98ID:3bUxAbnt0
ss-blogは何故かまだ生きてるな
不可視化の処理が完了するまでタイムラグがあるのか?
不可視化の処理が完了するまでタイムラグがあるのか?
2025/04/04(金) 09:30:39.65ID:Ap+qSSew0
>>103
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
https://greta.5ch.net/test/read.cgi/poverty/1651208035/
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
https://greta.5ch.net/test/read.cgi/poverty/1651208035/
2025/04/04(金) 22:16:45.45ID:d/O8B0Nf0
http://www.fc2web.com/
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。
悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。
悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか
2025/04/07(月) 11:32:10.86ID:rkOq5lFK0
Pocketとかの代替でkarakeep(Hoarder)というのを使ってて見つけたんだけど、
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
https://github.com/Y2Z/monolith
ローカル保存におすすめ
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
https://github.com/Y2Z/monolith
ローカル保存におすすめ
113192.168.0.774
2025/04/07(月) 22:58:04.30ID:G0iokGQw0 こんなのあったのか
114192.168.0.774
2025/04/12(土) 02:39:17.31ID:xmRuIA6s0 「みんなFC2WEBばっかり目が行ってるけど、実際は55 STREET、Easter、Finito Web、http://OJIJI.net、http://Zero-yen.com、http://k-free.net、GOOSIDE、KATOWEB(→KTNET)、http://ZERO-CITY.com、K-Serverも2025年6月30日に終わることになっている。 注意するんだ。」
https://x.com/n121mt/status/1907388961032708487
https://x.com/n121mt/status/1907388961032708487
2025/04/15(火) 02:45:02.64ID:5qeSSvyR0
WARC で保存できる Webrecorder もいいぞ
https://chromewebstore.google.com/detail/webrecorder-archivewebpag/fpeoodllldobpkbkabpblcfaogecpndd
https://chromewebstore.google.com/detail/webrecorder-archivewebpag/fpeoodllldobpkbkabpblcfaogecpndd
2025/04/19(土) 10:37:20.38ID:em1R2zGM0
「ゲームのアーカイブ」をテーマに研究者、保存団体、社長などが一堂に会すシンポジウムが開催。ヨーロッパの博物館はゲーセンの雰囲気を再現、マイナー作品を移植するには“ドサクサに紛れてコッソリ入れ込む”──など気になるトピック多数
https://news.denfaminicogamer.jp/kikakuthetower/2504152e
https://news.denfaminicogamer.jp/kikakuthetower/2504152e
レスを投稿する
ニュース
- 【文春】永野芽郁(25)が田中圭(40)と二股不倫!〈2夜スクープ撮〉★33 [Ailuropoda melanoleuca★]
- 【埼玉】20代女性、腕を切断…運転する軽トラが横転、地面とドアに挟まれて 最大積載量350キロのはずが…1300キロ 切断した箇所は右肘 [ぐれ★]
- ダイハツ、新車99万円で装備満載「軽セダン」がスゴい! 4人乗りで「超・低燃費」車 画像あり [お断り★]
- 自転車交通違反「青切符」来年4月スタート「逆走、歩道を走る」「スマホ・イヤホン等のながら運転」★4 [七波羅探題★]
- 日産、過去最大の最終赤字7500億円の見通し…25年3月期… ★2 [BFU★]
- 「どんどん買われちゃう」外国人の土地取得に国民民主・榛葉氏が危機感 政府実態把握せず ★2 [少考さん★]
- パレスチナに共感してイスラム教に入信する日本人が増加 [377482965]
- 【実況】博衣こよりのえちえちholoRust夜の部🧪★4
- 【悲報】一流愛国雑誌Hanada・WiLL最新号、絶賛内ゲバ中の日本保/守党を煽り散らかす [126042664]
- 【悲報】大阪万博にコスプレイヤーが乱入、「作品の私物化やめて!原作者にとっては非常に迷惑な行為です」と批判が殺到 [339712612]
- Switch2当たったケンモメン集合 ★2 [838847604]
- 大阪万博、下水が溢れ出す・・・💩🤮 [931948549]