ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/
・関連スレ
Internet Archive総合 (web,archive,org) #2
https://mevius.5ch.net/test/read.cgi/esite/1690495133/
ウェブ魚拓 Part3
https://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
https://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
https://mevius.5ch.net/test/read.cgi/blog/1554380939/
・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
【保存・記録】ウェブアーカイブ総合 Page.02
2023/11/21(火) 07:23:34.80ID:QN4SUfby0
2024/08/13(火) 23:42:47.60ID:kQKQkOMh0
2024/08/14(水) 07:08:42.42ID:kxlIVPRz0
2023/12/01 更新期限を過ぎたか何かによりドメイン廃止
2024/05/31 一時凍結期間終了
https://whois-history.whoisxmlapi.com/lookup-report/Wo5Q3gZ7Rd
2024/05/31 一時凍結期間終了
https://whois-history.whoisxmlapi.com/lookup-report/Wo5Q3gZ7Rd

72192.168.0.774
2024/08/20(火) 19:19:05.46ID:zsZWoPkr0 なんだろうとTwitter見に行くもそれらしい緊急状況は無し
Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
2024/08/23(金) 23:31:59.23ID:MmaR55x80
「牛」と呼ばれてるアーカイブサイトってどこだと思います?
探してるんだけど判らぬ……
探してるんだけど判らぬ……
2024/08/24(土) 00:45:46.66ID:099fHmdK0
ソフトウェア配布サイトの事なら Tucows なんだろうけどな・・・
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
https://www.tucows.com/retired
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
https://www.tucows.com/retired
2024/08/26(月) 02:21:11.31ID:B7Mket0T0
大手4社の資料保存活動とは? キーマンたちが現状を報告した「ゲーム開発過去資料の保存の最前線を語ろう!」レポート[CEDEC 2024]
https://www.4gamer.net/games/999/G999905/20240824019/
https://www.4gamer.net/games/999/G999905/20240824019/
2024/08/27(火) 11:11:58.32ID:ZJNuTxHU0
最近のサイトデザインでは折り畳みメニュー表示が増えてて実際に.orgと.todayの2つで試してみないと分からなかったりする
2024/09/05(木) 13:55:10.35ID:8y13Nyfk0
ニューヨーク 4日 ロイター] - 米連邦控訴裁判所は、非営利団体インターネット・アーカイブが著作権保護された作品を違法にスキャンし、許可なく無料でオンライン上に公開していると訴えた大手書籍出版社4社の訴えを支持した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー&サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の 「大規模な 」コピーと配布は 「公正な利用 」には当たらないとの見解を示した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー&サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の 「大規模な 」コピーと配布は 「公正な利用 」には当たらないとの見解を示した。
2024/10/05(土) 23:37:38.68ID:sir44IIK0
ぷららのホームページサービスが来年の4月1日で終了するみたい
https://www.docomo.ne.jp/info/notice/page/240627_01.html
https://www.docomo.ne.jp/info/notice/page/240627_01.html
2024/10/08(火) 02:12:46.98ID:bySj2odM0
無料か無料に近い形で提供されるホームページサービスは遠からず全部消えるのかなぁ
2024/10/09(水) 21:54:07.89ID:pVxYkPnH0
Tor、I2P、Freenetみたいな中央サーバーを持たない、
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル
2024/10/10(木) 08:25:31.73ID:O0Wa5OT40
Internet Archiveがハッキング被害、3,100万人分の個人情報流出
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
https://www.bleepingcomputer.com/news/security/internet-archive-hacked-data-breach-impacts-31-million-users/
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
https://www.bleepingcomputer.com/news/security/internet-archive-hacked-data-breach-impacts-31-million-users/
82192.168.0.774
2024/10/10(木) 11:25:28.61ID:mRA5njFO0 始まりがあるものには、すべて終わりがある
2024/10/11(金) 10:59:00.08ID:+0ZVN28A0
努力次第で終わりは遅延できる
2024/10/11(金) 14:43:21.46ID:4/k0xNoP0
Googleというビッグブラザーのキャッシュ代替になったことで標的にされやすくなったんだよ
2024/10/19(土) 01:14:25.80ID:yNdJY+Db0
>>80
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ
(現在のところ)価値が無い情報をどう保存させるかが問題
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ
(現在のところ)価値が無い情報をどう保存させるかが問題
2024/10/19(土) 18:29:44.21ID:7gZrEMne0
2024/10/20(日) 01:29:10.31ID:YC/XYbnS0
IPFSだ、IPFSしかない
2024/10/20(日) 17:28:03.78ID:jErutBf90
よく勘違いされるけどIPFSってアーカイブには向いて無いよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ
89あめ ◆P0jSlC5fJs
2024/10/20(日) 19:38:03.16ID:vNuKrZxb0 それはそう、arweaveみたいなものではない
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ
2024/10/23(水) 01:58:39.75ID:TBBqAAjr0
分散型はとりあえず業界の標準が決まってくれないとより良いものが出るたびにデータを投げ捨てることになりかねないな
2024/10/23(水) 13:52:50.47ID:TBBqAAjr0
分散型ストレージのautonomiは10月29日に一般公開予定
https://docs.autonomi.com/learn
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね
https://docs.autonomi.com/learn
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね
2024/10/23(水) 14:44:11.43ID:p8DuKr1h0
>>91
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に1回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが(これはこれでどうかと思うが)
autonomiはどういう理屈なんだろ
というかこの手のプロジェクトって何で1回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に1回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが(これはこれでどうかと思うが)
autonomiはどういう理屈なんだろ
というかこの手のプロジェクトって何で1回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが
2024/10/23(水) 14:56:52.25ID:TBBqAAjr0
>>92
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜?」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか?というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない?
あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜?」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか?というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない?
あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・
2024/10/28(月) 05:32:04.83ID:yhg3dtvQ0
ベクターHPが12月20日で終了
95192.168.0.774
2024/11/14(木) 11:40:47.87ID:e5vP7i/90 mangazも閉鎖で絶版本が無間地獄に帰るね
2024/12/01(日) 22:45:19.04ID:tuRpdWYB0
>>78
訂正 サービス終了は来年3月31日だった
訂正 サービス終了は来年3月31日だった
2024/12/27(金) 13:26:37.17ID:fYcmXIUr0
goo IDが2017年以降ログインなしで削除
ブログが消されるかどうかは知らん
ブログが消されるかどうかは知らん
2024/12/28(土) 10:08:50.49ID:xIi08uhi0
>>97
ID削除のソース
https://login.mail.goo.ne.jp/id/common/custom_content?newsid=ucaeywpp3ds
ブログ削除のソース
https://blog.goo.ne.jp/staffblog/e/57385bcaa324c9153f93a03375d70336
10年代前半で更新止まったブログは全削除されそうだな
ID削除のソース
https://login.mail.goo.ne.jp/id/common/custom_content?newsid=ucaeywpp3ds
ブログ削除のソース
https://blog.goo.ne.jp/staffblog/e/57385bcaa324c9153f93a03375d70336
10年代前半で更新止まったブログは全削除されそうだな
2024/12/30(月) 13:37:58.45ID:mp0Tkkna0
削除するぞメール来たってえきねっと退会スパムみたいなもんかと思って放置されるだろうな
100192.168.0.774
2025/01/17(金) 00:03:32.08ID:0d/D0Jtj0 ニコニコ春画29日終了
2025/02/08(土) 19:45:26.63ID:wXhKO+uW0
最近は魚拓回避意図か知らんがクリックしないと表示されない系が増えてきてるけどこれ録れないよね?
coinloan.tech
coinloan.tech
2025/02/22(土) 00:01:37.07ID:1+yNfjxb0
【オウム真理教問題デジタルアーカイブ】
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
https://www.moj.go.jp/psia/aumarchive/index.html
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
https://www.moj.go.jp/psia/aumarchive/index.html
2025/02/26(水) 17:48:15.08ID:zrJmYLce0
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由
https://news.careerconnection.jp/entame/134251/
https://news.careerconnection.jp/entame/134251/
2025/03/03(月) 18:32:56.97ID:l3vle4lQ0
Internet Archive総合 (web.archive.org) #6
https://mevius.5ch.net/test/read.cgi/esite/1733289042
https://mevius.5ch.net/test/read.cgi/esite/1733289042
105192.168.0.774
2025/03/04(火) 14:13:18.85ID:pZipXde+0 「ぷらら」の個人向けホームページが3月末に終了 古参ネットユーザー「歴史が消えていく」 - ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2503/04/news125.html
https://www.itmedia.co.jp/news/articles/2503/04/news125.html
2025/03/10(月) 03:58:04.00ID:AUECZsGf0
Internet Archive総合 (web.archive.org) #6
https://mevius.5ch.net/test/read.cgi/esite/1733289042
https://mevius.5ch.net/test/read.cgi/esite/1733289042
2025/03/16(日) 07:33:18.12ID:kKDe6Rv/0
108192.168.0.774
2025/03/31(月) 15:37:25.63ID:Y56lREV80 このスレでよく名前が挙がるArchive Teamについて
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
https://t[.]co/SgvHmY6hPA
ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
https://clavis.info/wiki/running_archiveteam_warrior
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
https://t[.]co/SgvHmY6hPA
ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
https://clavis.info/wiki/running_archiveteam_warrior
2025/04/01(火) 03:44:11.98ID:3bUxAbnt0
ss-blogは何故かまだ生きてるな
不可視化の処理が完了するまでタイムラグがあるのか?
不可視化の処理が完了するまでタイムラグがあるのか?
2025/04/04(金) 09:30:39.65ID:Ap+qSSew0
>>103
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
https://greta.5ch.net/test/read.cgi/poverty/1651208035/
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
https://greta.5ch.net/test/read.cgi/poverty/1651208035/
2025/04/04(金) 22:16:45.45ID:d/O8B0Nf0
http://www.fc2web.com/
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。
悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。
悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか
2025/04/07(月) 11:32:10.86ID:rkOq5lFK0
Pocketとかの代替でkarakeep(Hoarder)というのを使ってて見つけたんだけど、
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
https://github.com/Y2Z/monolith
ローカル保存におすすめ
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
https://github.com/Y2Z/monolith
ローカル保存におすすめ
113192.168.0.774
2025/04/07(月) 22:58:04.30ID:G0iokGQw0 こんなのあったのか
114192.168.0.774
2025/04/12(土) 02:39:17.31ID:xmRuIA6s0 「みんなFC2WEBばっかり目が行ってるけど、実際は55 STREET、Easter、Finito Web、http://OJIJI.net、http://Zero-yen.com、http://k-free.net、GOOSIDE、KATOWEB(→KTNET)、http://ZERO-CITY.com、K-Serverも2025年6月30日に終わることになっている。 注意するんだ。」
https://x.com/n121mt/status/1907388961032708487
https://x.com/n121mt/status/1907388961032708487
2025/04/15(火) 02:45:02.64ID:5qeSSvyR0
WARC で保存できる Webrecorder もいいぞ
https://chromewebstore.google.com/detail/webrecorder-archivewebpag/fpeoodllldobpkbkabpblcfaogecpndd
https://chromewebstore.google.com/detail/webrecorder-archivewebpag/fpeoodllldobpkbkabpblcfaogecpndd
2025/04/19(土) 10:37:20.38ID:em1R2zGM0
「ゲームのアーカイブ」をテーマに研究者、保存団体、社長などが一堂に会すシンポジウムが開催。ヨーロッパの博物館はゲーセンの雰囲気を再現、マイナー作品を移植するには“ドサクサに紛れてコッソリ入れ込む”──など気になるトピック多数
https://news.denfaminicogamer.jp/kikakuthetower/2504152e
https://news.denfaminicogamer.jp/kikakuthetower/2504152e
2025/05/06(火) 15:07:47.60ID:K61FRbpu0
archive.todayが最近不調な件
・先月中ごろから一部のサイトが取得できない
・数日前から「Not Found (yet?)」が多い
・先月中ごろから一部のサイトが取得できない
・数日前から「Not Found (yet?)」が多い
2025/05/07(水) 06:37:54.86ID:6n/1y+tk0
Not Found (yet?)はarchive.today本体が調子悪い時も取得先が調子悪い時もarchive.todayが取得先から弾かれてるだけの時も出るから本体に濡れ衣着せてしまいがちではある
特にXのセンシティブ設定されてる画像ポスト&アカウント自体が強制センシティブ設定食らってる人のポストは今のarchive.todayの仕様だとNot Found (yet?)にほぼ全部なるから、
あれ?と思ったらghost archive等の別の魚拓サイトを毎回試すようにしてる
特にXのセンシティブ設定されてる画像ポスト&アカウント自体が強制センシティブ設定食らってる人のポストは今のarchive.todayの仕様だとNot Found (yet?)にほぼ全部なるから、
あれ?と思ったらghost archive等の別の魚拓サイトを毎回試すようにしてる
2025/05/07(水) 10:41:30.46ID:BeikZYi90
Googleキャッシュの廃止以来、国内大学のレポジトリに多く上がってるPDF論文がHTML形式でアーカイブ出来なくなり悔しい…。
2025/05/07(水) 11:04:11.83ID:R8dy5vO80
>>117-118
Xの魚拓取ってると場合によっては(yet?)が出まくってarchive.todayがまた死にかけてる!となりがちだなw
あと保存してる最中にちょうどアカウント主が鍵かけちゃって(yet?)のページがお出しされる悲しいパターン
Xの魚拓取ってると場合によっては(yet?)が出まくってarchive.todayがまた死にかけてる!となりがちだなw
あと保存してる最中にちょうどアカウント主が鍵かけちゃって(yet?)のページがお出しされる悲しいパターン
レスを投稿する