【保存・記録】ウェブアーカイブ総合 Page.02

**192.168.0.774** · 2023/11/21(火) 07:23:34.80

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク（Rock54回避のためピリオドをカンマに変更）
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web,archive,org) #2
https://mevius.5ch.net/test/read.cgi/esite/1690495133/
ウェブ魚拓 Part3
https://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
https://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
https://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

**192.168.0.774** · 2024/08/13(火) 23:42:47.60

すでに消えていたけど
http://www.galstown.ne.jp
WaybackMachineで見る限り、消滅の予告は無かったから、ドメインとかレン鯖の期限切れかもしれない

**192.168.0.774** · 2024/08/14(水) 07:08:42.42

2023/12/01 更新期限を過ぎたか何かによりドメイン廃止
2024/05/31 一時凍結期間終了
https://whois-history.whoisxmlapi.com/lookup-report/Wo5Q3gZ7Rd

**192.168.0.774** · 2024/08/20(火) 19:19:05.46

なんだろうとTwitter見に行くもそれらしい緊急状況は無し

Temporarily Offline
Internet Archive services are temporarily offline.

Please check our Twitter feed for the latest information.

We apologize for the inconvenience.

**192.168.0.774** · 2024/08/23(金) 23:31:59.23

「牛」と呼ばれてるアーカイブサイトってどこだと思います？
探してるんだけど判らぬ……

**192.168.0.774** · 2024/08/24(土) 00:45:46.66

ソフトウェア配布サイトの事なら Tucows なんだろうけどな・・・
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
https://www.tucows.com/retired

**192.168.0.774** · 2024/08/26(月) 02:21:11.31

大手4社の資料保存活動とは？　キーマンたちが現状を報告した「ゲーム開発過去資料の保存の最前線を語ろう！」レポート［CEDEC 2024］
https://www.4gamer.net/games/999/G999905/20240824019/

**192.168.0.774** · 2024/08/27(火) 11:11:58.32

最近のサイトデザインでは折り畳みメニュー表示が増えてて実際に.orgと.todayの2つで試してみないと分からなかったりする

**192.168.0.774** · 2024/09/05(木) 13:55:10.35

ニューヨーク 4日ロイター］ - 米連邦控訴裁判所は、非営利団体インターネット・アーカイブが著作権保護された作品を違法にスキャンし、許可なく無料でオンライン上に公開していると訴えた大手書籍出版社4社の訴えを支持した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー＆サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の「大規模な」コピーと配布は「公正な利用」には当たらないとの見解を示した。

**192.168.0.774** · 2024/10/05(土) 23:37:38.68

ぷららのホームページサービスが来年の4月1日で終了するみたい
https://www.docomo.ne.jp/info/notice/page/240627_01.html

**192.168.0.774** · 2024/10/08(火) 02:12:46.98

無料か無料に近い形で提供されるホームページサービスは遠からず全部消えるのかなぁ

**192.168.0.774** · 2024/10/09(水) 21:54:07.89

Tor、I2P、Freenetみたいな中央サーバーを持たない、
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル

**192.168.0.774** · 2024/10/10(木) 08:25:31.73

Internet Archiveがハッキング被害、3,100万人分の個人情報流出
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
https://www.bleepingcomputer.com/news/security/internet-archive-hacked-data-breach-impacts-31-million-users/

**192.168.0.774** · 2024/10/10(木) 11:25:28.61

始まりがあるものには、すべて終わりがある

**192.168.0.774** · 2024/10/11(金) 10:59:00.08

努力次第で終わりは遅延できる

**192.168.0.774** · 2024/10/11(金) 14:43:21.46

Googleというビッグブラザーのキャッシュ代替になったことで標的にされやすくなったんだよ

**192.168.0.774** · 2024/10/19(土) 01:14:25.80

>>80
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ

（現在のところ）価値が無い情報をどう保存させるかが問題

**192.168.0.774** · 2024/10/19(土) 18:29:44.21

>>85
価値が無い情報も保存される仕組みを悪用して、
価値がある情報を悪意で埋めるのが荒らしの手口なんだけどなｗ

**192.168.0.774** · 2024/10/20(日) 01:29:10.31

IPFSだ、IPFSしかない

**192.168.0.774** · 2024/10/20(日) 17:28:03.78

よく勘違いされるけどIPFSってアーカイブには向いて無いよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ

あめ ◆P0jSlC5fJs · 2024/10/20(日) 19:38:03.16

それはそう、arweaveみたいなものではない
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ

**192.168.0.774** · 2024/10/23(水) 01:58:39.75

分散型はとりあえず業界の標準が決まってくれないとより良いものが出るたびにデータを投げ捨てることになりかねないな

**192.168.0.774** · 2024/10/23(水) 13:52:50.47

分散型ストレージのautonomiは10月29日に一般公開予定
https://docs.autonomi.com/learn
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね

**192.168.0.774** · 2024/10/23(水) 14:44:11.43

>>91
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に１回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが（これはこれでどうかと思うが）
autonomiはどういう理屈なんだろ

というかこの手のプロジェクトって何で１回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが

**192.168.0.774** · 2024/10/23(水) 14:56:52.25

>>92
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜？」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか？というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない？

あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・

**192.168.0.774** · 2024/10/28(月) 05:32:04.83

ベクターHPが12月20日で終了

**192.168.0.774** · 2024/11/14(木) 11:40:47.87

mangazも閉鎖で絶版本が無間地獄に帰るね

**192.168.0.774** · 2024/12/01(日) 22:45:19.04

>>78
訂正　サービス終了は来年3月31日だった

**192.168.0.774** · 2024/12/27(金) 13:26:37.17

goo IDが2017年以降ログインなしで削除
ブログが消されるかどうかは知らん

**192.168.0.774** · 2024/12/28(土) 10:08:50.49

>>97
ID削除のソース
https://login.mail.goo.ne.jp/id/common/custom_content?newsid=ucaeywpp3ds
ブログ削除のソース
https://blog.goo.ne.jp/staffblog/e/57385bcaa324c9153f93a03375d70336

10年代前半で更新止まったブログは全削除されそうだな

**192.168.0.774** · 2024/12/30(月) 13:37:58.45

削除するぞメール来たってえきねっと退会スパムみたいなもんかと思って放置されるだろうな

**192.168.0.774** · 2025/01/17(金) 00:03:32.08

ニコニコ春画29日終了

**192.168.0.774** · 2025/02/08(土) 19:45:26.63

最近は魚拓回避意図か知らんがクリックしないと表示されない系が増えてきてるけどこれ録れないよね？
coinloan.tech

**192.168.0.774** · 2025/02/22(土) 00:01:37.07

【オウム真理教問題デジタルアーカイブ】
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
https://www.moj.go.jp/psia/aumarchive/index.html

**192.168.0.774** · 2025/02/26(水) 17:48:15.08

「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由
https://news.careerconnection.jp/entame/134251/

**192.168.0.774** · 2025/03/03(月) 18:32:56.97

Internet Archive総合 (web.archive.org) #6
https://mevius.5ch.net/test/read.cgi/esite/1733289042

**192.168.0.774** · 2025/03/04(火) 14:13:18.85

「ぷらら」の個人向けホームページが3月末に終了　古参ネットユーザー「歴史が消えていく」 - ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2503/04/news125.html

**192.168.0.774** · 2025/03/10(月) 03:58:04.00

Internet Archive総合 (web.archive.org) #6
https://mevius.5ch.net/test/read.cgi/esite/1733289042

**192.168.0.774** · 2025/03/16(日) 07:33:18.12

OSCHINA、スラドと OSDN の受け入れ先募集を打ち切ってサービス終了へ
https://srad.jp/story/25/03/14/1844223/

スラド、継続不能になった模様

**192.168.0.774** · 2025/03/31(月) 15:37:25.63

このスレでよく名前が挙がるArchive Teamについて

ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
https://t[.]co/SgvHmY6hPA

ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
https://clavis.info/wiki/running_archiveteam_warrior

**192.168.0.774** · 2025/04/01(火) 03:44:11.98

ss-blogは何故かまだ生きてるな
不可視化の処理が完了するまでタイムラグがあるのか？

**192.168.0.774** · 2025/04/04(金) 09:30:39.65

>>103
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
https://greta.5ch.net/test/read.cgi/poverty/1651208035/

**192.168.0.774** · 2025/04/04(金) 22:16:45.45

http://www.fc2web.com/
＞FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。

悪名高き？FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか

**192.168.0.774** · 2025/04/07(月) 11:32:10.86

Pocketとかの代替でkarakeep(Hoarder)というのを使ってて見つけたんだけど、
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
https://github.com/Y2Z/monolith
ローカル保存におすすめ

**192.168.0.774** · 2025/04/07(月) 22:58:04.30

こんなのあったのか

**192.168.0.774** · 2025/04/12(土) 02:39:17.31

「みんなFC2WEBばっかり目が行ってるけど、実際は55 STREET、Easter、Finito Web、http://OJIJI.net、http://Zero-yen.com、http://k-free.net、GOOSIDE、KATOWEB（→KTNET）、http://ZERO-CITY.com、K-Serverも2025年6月30日に終わることになっている。　注意するんだ。」
https://x.com/n121mt/status/1907388961032708487

**192.168.0.774** · 2025/04/15(火) 02:45:02.64

WARC で保存できる Webrecorder もいいぞ
https://chromewebstore.google.com/detail/webrecorder-archivewebpag/fpeoodllldobpkbkabpblcfaogecpndd

**192.168.0.774** · 2025/04/19(土) 10:37:20.38

「ゲームのアーカイブ」をテーマに研究者、保存団体、社長などが一堂に会すシンポジウムが開催。ヨーロッパの博物館はゲーセンの雰囲気を再現、マイナー作品を移植するには“ドサクサに紛れてコッソリ入れ込む”──など気になるトピック多数
https://news.denfaminicogamer.jp/kikakuthetower/2504152e

**192.168.0.774** · 2025/05/06(火) 15:07:47.60

archive.todayが最近不調な件
・先月中ごろから一部のサイトが取得できない
・数日前から「Not Found (yet?)」が多い

**192.168.0.774** · 2025/05/07(水) 06:37:54.86

Not Found (yet?)はarchive.today本体が調子悪い時も取得先が調子悪い時もarchive.todayが取得先から弾かれてるだけの時も出るから本体に濡れ衣着せてしまいがちではある
特にXのセンシティブ設定されてる画像ポスト＆アカウント自体が強制センシティブ設定食らってる人のポストは今のarchive.todayの仕様だとNot Found (yet?)にほぼ全部なるから、
あれ？と思ったらghost archive等の別の魚拓サイトを毎回試すようにしてる

**192.168.0.774** · 2025/05/07(水) 10:41:30.46

Googleキャッシュの廃止以来、国内大学のレポジトリに多く上がってるPDF論文がHTML形式でアーカイブ出来なくなり悔しい…。
　

**192.168.0.774** · 2025/05/07(水) 11:04:11.83

>>117-118
Xの魚拓取ってると場合によっては(yet？)が出まくってarchive.todayがまた死にかけてる！となりがちだなw
あと保存してる最中にちょうどアカウント主が鍵かけちゃって(yet？)のページがお出しされる悲しいパターン