【保存・記録】ウェブアーカイブ総合 Page.01
■ このスレッドは過去ログ倉庫に格納されています
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/
・関連スレ
Internet Archive総合 (web,archive,org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/
・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう >>776
「SNSはネット掲示板に代わるもの」というには心もとないのになぁ
ネット掲示板は影響力とか肩書きとか関係なしに交流とか情報発信ができるが、SNSはそうはいかない
ひたすらひとりごとしてるだけならまだしも、誰かしらに見てもらいたい書き込みだと不便 SNSはネタになりそうな作話で大量のレスポンスを釣って、
「バズったので~」って宣伝するいいね乞食がマジでキモ過ぎて無理
有名人が実名晒して宣伝してたBlogを、誰でも簡単に見てもらえるようにした仕組みだけど、
企業広告じゃない拙劣で低俗な「広告」が溢れすぎてて話にならない
動画もニートが金儲けのために必死でアップしてるだけだし
掲示板は個人ユーザーが書き込んでも原則利益に繋がらない仕組みなのが健全
ステマはあるけど >>796
そもそもSNSって中華とかにある言論統制あるじゃん
ビッグネームに否定的なレスすると、粗探し通報されまくってアカ停止
片面提示大好きの愚民向け 昔のネットはよかったなぁ
今と違って消費・消耗するような場ではなかった
懐古主義とか嫌いなはずなのに、こんなふうにノスタルジーに浸るようになるとは どなたかアーカイブお願いします
「玄人志向」のサポート掲示板が終了へ、15年の歴史に幕 閉鎖後は過去の投稿も閲覧不可に
https://www.itmedia.co.jp/news/articles/2205/11/news124.html >>799
Archive Teamに相談してみては?
少なくとも俺は大規模アーカイブするソフトとか使ってなく、webアーカイブという概念への貢献度の低い一利用者にすぎないため特に貢献できない… >>799
12日に誰かがSPNでたくさんのページを保存してる
抜けてるのだけやればいいよ こういうのって企業は平気と閉鎖するけど、ブランド戦略としては悪手じゃないのか
掲示板じゃないけど、何十年も前の自社製品の取説とか公開し続けてる企業ってすごい好印象だわ >>794
当時はブログパーツがたくさんあって、これが良かったんだがなあ…。しくしく。 元記事(Taiwan News)はInternet Archiveでも保存されてるのに何故Ghost Archiveを紹介したんだろうか gigazineはInternet Archive弾いてるし、嫌いなんじゃね
知らんけど 今年だけで既に9本の記事にWayback MachineのURL貼ってるな、GIGAZINEさんは。
右手でアーカイブURLを貼りながら、左手ではブルースター・ケールに中指突き立てて削除要請という絵面。 >>808
最近まではアーカイブ出来てたんだけどね
noteみたいに特に何かあったわけでもないのに不思議だ 正直最近のGigazineは政治的偏りが出てきてるように思うから外的な圧力があるのか保存されると都合が悪いのかってところだろう IAにアーカイブしないでウェブ魚拓使ってる人って何が目的なのか気になる
消される確率や開示リスクを考えたら何もメリットないと思うんだけど 魚拓って検索するとそれが最初に出てくるからな
それしか知らないんだろう 山上のツイート消えちゃったのか
ツイッターってWayback Machineで取れるんだっけ? 今更だけど、teacup.の掲示板をSaveする際、掲示板の2ページ以降のURLの末尾に;や/を入れないと、「次のページ》」などのリンクが繋がらなくなるので、Tipsポイント。
例:
「8038.teacup.com/muhihi/bbs?page=2&」でURLを指定してSaveすると
「8038.teacup.com/muhihi/bbs?page=2」で保存されて、閲覧時3ページ目以降のリンクが切れるので、
「8038.teacup.com/muhihi/bbs?page=2&;」と指定する必要がある。 teacup.の掲示板やブログが、NAVERまとめやGeoCitiesの時みたいに有志によって保存されんのね…。
無念あとは頼む (他力本願) どなたかよろしくお願いいたします...
> 京都大学オープンコースウェア(OCW)の閉鎖について
> 京都大学高等教育研究開発推進センターは2022年9月末に廃止されることになりました。京都大学オープンコースウェア(OCW)も、残念ながら9月中旬以降にサイトを閉鎖することになりました。2005年以来、京都大学OCWをご利用いただき誠にありがとうございました。
https://ocw.kyoto-u.ac.jp/news/6/ ライセンスはCC BY-NC-SAなので、アーカイブ及び再配布は認められるようです
https://ocw.kyoto-u.ac.jp/guideline/#ref 現状だと5ch-ranking.comが取得してるものはそれをアーカイブすることで一応可能だが
ここがキャッシュしてないスレがお手上げ状態 .ph/ で保存したつもりのエラーページが破棄されてるのか出てこなくなった ghostはノロノロ待たせてエラー吐くようになった。
成仏かなー。 [CEDEC 2022]「復刻できないあのゲームを、合法的にプレイできるようにするために、今できること」レポート。キーワードは裁定制度と納本制度
https://www.4gamer.net/games/999/G999905/20220826060/
[CEDEC 2022]スクウェア・エニックスの過去資産サルベージプロジェクトの“今”が語られた「実践!資料保存活動の現場編」聴講レポート
https://www.4gamer.net/games/999/G999905/20220826086/
[CEDEC 2022]ゲームは大きな財産。ゲーム展示や開発資料の活用方法を,多様な見地から俯瞰する
https://www.4gamer.net/games/999/G999905/20220826043/ この運動をしてる人らの興味関心がそうなのか、古いゲームにしか目を向けられてないが、
ソシャゲも頼むわ
雨後の筍のごとく出てくるのにサ終で何も残らないんよ >>826
ブラウザゲーで公開されてるファイルの一部はたまにアーカイブに送ってるが
flashゲーみたいに動作する状態での保存はできんからな
JAVAのですら内部で呼び出すファイルのアドレスが書き換わってしまうためにそのままでは動かん ソシャゲがソシャゲであるためにはサーバ側の処理が不可欠
サービスが終了してるならもう何も出来ない そのサーバー側の処理も含めてどうにかスタンドアローン化するか、
それが非現実的な場合は動作する状態でなくても、
静的な状態でも良いから何かしらのアーカイブ化をしてほしいわけだ 海外だとオフライン版とか勝手に作られてるし、
単にスキルないだけ 1万人より100万人、100万人よりも1億人というふうにファンの裾野が広ければ上位個体が発生するし、野良サーバーも生まれ、語り部サーバーになる。 そんなにURがヤバイ性能だったら3周年まで実装するのは待てとあれほど・・・。
なぜ周年前に実装した?
前年の8月のフェス限やパーティ限もそうだったし。 >>833の書き込みは間違いでした。
失礼しました。 NY市の「9/11トリビュート・ミュージアム」が恒久的に閉鎖 コロナ禍の財政難で
https://www.cnn.co.jp/amp/article/35192027.html
>発表によれば展示品や記録映像の大半は、ニューヨーク州オルバニーにあるニューヨーク州博物館に移される。
>ただミュージアムのウェブサイト自体は今後もオンライン上で存続する。↓
https://911tributemuseum.org アトラスがサ終した『真・女神転生』MMOを復活させたファンを提訴…「取り返しのつかない損害を与えている」と主張
https://www.gamespark.jp/article/2022/09/27/122858.html teacup.掲示板 何とかしてでも自動でクロールしてIAに保存すればよかったと思ってる。
そんな技術自分には無いけど後悔してる。 こんなのあったんか・・・見たかったとこはリンク切れのアーカイブやった残念 >>839
インターネットアーカイブにはデータ渡してあるのかな ヤフーニュースだとコメント欄部分の数行ダイジェストは閲覧都度ライブで取りに行ってるみたいだな。👍👎の数を見るとわかる .orgでカレンダー日付にポインタ当てて保存時刻を選ぶ奴が出てくるまでのグールグール♪がクソ長くて苛々することがある。 >>843
前は早かったんだけどな
段々遅くなってる気がする .phのqueue待ちで最後の最後に変な表示でエラーとか最悪 >>754
12/1からウェブリブログも終了するからURL収集して後悔のないようにしないと .ghostは長く待たされた挙句に保存も出来ないフェイクサイトになり果てた模様 来週Twitterの凍結垢の復活祭が巻き起こりそう
収拾つかなくなって再凍結のパターンを想定すると千載一遇のアーカイブチャンスかも
https://twitter.com/elonmusk/status/1595869526469533701
https://twitter.com/5chan_nel (5ch newer account) todayは今モルドバ鯖がメインか。
twitter直撮りは待たされるけどインスタンス系は200queueごぼう抜きですぐ終わる謎の現象。 このサイトにアクセスできませんweb.archive.org で接続が拒否されました。
次をお試しください
接続を確認する
プロキシとファイアウォールを確認する
ERR_CONNECTION_REFUSED .org、カレンダー画面にも表示されるのに保存されてない謎の症状。 恩赦の余波
The capture will start in ~* minute, ** seconds because we are doing too many captures of twitter.com right now. You may close your browser window and the page will still be saved. ニコニコミュニティの掲示板のレスをすべてアーカイブする方法を教えてほしい
なんかdatで取れたような気がする Twitter公式やGoogleウェブの日本語検索結果ページを直接取ると文字化けしちまうからArchive.isに取ったやつを複取りしてたが常時取得エラーになってしまった。 ここって個人運営だけどメディアに紹介されてるような有名サイトの終了の情報貼るのは駄目ですか? >>860
若干訂正
「個人運営だけどメディアに紹介されてるような有名サイト」です とりあえずIAで保存実行してみたけどすでにやってあったみたいだね
ブログ記事は個別保存していかないとだめかな? 世界的には結構アーカイブサイトは変動してるんだな。
元サイトによって尻切れトンボになったりの対策・使い分けで複数使ってるけど。
なんかツイッターの凍結アカはアーカイブ無視して現在情報参照させられてる気がするんだが気のせいか? 3年くらい?前からIAのIPが@wikiにスパム扱いされてるみたいで
アーカイブ取ろうとしても専用ページにジャンプさせられるから取れないな ghostはクソだな
nginx error!
The page you are looking for is temporarily unavailable. Please try again later.
Website Administrator
Something has triggered an error on your website. This is the default error page for nginx that is distributed with Fedora. It is located /usr/share/nginx/html/50x.html
You should customize this error page for your own site or edit the error_page directive in the nginx configuration file /etc/nginx/nginx.conf.
[ Powered by nginx ] [ Powered by Fedora ] IAの保存ツイートは"Something went wrong. Try reloading."に置換されてるのか IAさん、フェアユース認められず敗訴
storage.courtlistener.com/recap/gov.uscourts.nysd.537900/gov.uscourts.nysd.537900.188.0.pdf
UNITED STATES DISTRICT COURT SOUTHERN DISTRICT OF NEW YORK
The plaintiffs in this action, four book publishers, allege that the defendant, an organization whose professed mission is to provide universal access to all knowledge, infringed the plaintiffs’ copyrights in 127 books (the “Works in Suit”) by scanning print copies of the Works in Suit and lending the digital copies to users of the defendant’s website without the plaintiffs’ permission.
The defendant contends that it is not liable for copyright infringement because it makes fair use of the Works in Suit. See 17 U.S.C. § 107. The parties now crossmove for summary judgment. For the following reasons, the plaintiffs’ motion for summary judgment is granted, and the defendant’s motion for summary judgment is denied.
ユナイテッド・ステーツ・ディー・コート ニューヨーク州南部地区
本訴訟の原告である書籍出版社4社は、あらゆる知識への普遍的なアクセスを提供することを使命とする団体である被告が、原告の許可なく訴訟作品の印刷物をスキャンしてデジタルコピーを被告のウェブサイトの利用者に貸し出すことにより、127冊の書籍(「訴訟作品」)に関する原告の著作権を侵害したと主張するものである。
被告は、訴訟著作物を公正に利用しているため、著作権侵害の責任を負わないと主張している。合衆国法典第17編第107条を参照。現在、両当事者は略式判決を求めて交差している。以下の理由により、原告の略式判決申立は認められ、被告の略式判決申立は却下される。 >>870
緊急図書館は正直やり過ぎだったな
あれのせいで目を付けられた 順番待ち長すぎてツイート魚拓はSwwTr(Something went wrong. Try reloading.)多い Instagramのユーザーページ(www.instagram.com/{ユーザー名}/)見れなくなってる。投稿記事は見れるが。
ページが見つかりません • Instagram
このページはご利用いただけません。
リンクに問題があるか、ページが削除された可能性があります。Instagramに戻る Instagramのユーザーページって、IAもarchive.isもウェブ魚拓もキャッシュ取れないよね…?
キャッシュ取れるアーカイブサイトってある?
IAは、ログイン画面にリダイレクトされたり、「Please try again in ~600 min. Crawling this host is paused because they notified us that they are overloaded right now.」
archive.isは、Not Found (yet?) 投稿記事(/p/*)は取れたり取れなかったり。
ウェブ魚拓は、robots.txtブロック 英語wikiのList of Web archiving initiativesでも参照してインスタ保存出来てるところを探すしかないかな 混雑で遅延になるくらいなら寄付額で優先度振り分けすればいいのになー、使い物にならんよ
アーカイブサイト運営が忖度で混雑を放置してないかね 際どい内容を発表するときはアーカイブが混雑している時間帯にすれば良いってことになるな .todayはpdfが間抜けな尻切れトンボになって分散保存にもならない todayはpdfは対応してないって言ってた気がする 【悲報】imgur(いむがー)、ガチのマジで逝く。5月からエロ画像を全て削除、また未登録者の全ての画像を削除、投稿禁止へ
http://greta.5ch.net/test/read.cgi/poverty/1681970989/ サービス終了難民の類にグロや児ポが含まれてればアーカイブ運営に削除要請来たり閉鎖の危機は予想できる所 Haasie: imgurの画像をアーカイブするサイト
https://haasie.com
【使い方】
テキストボックスに https://i.imgur.com/* のリンクを改行区切りで入力して Backup をクリック
保存後は https://i.haasie.com/* のリンクから閲覧可能
5月15日に、ポルノ画像・匿名ユーザーが投稿した非アクティブコンテンツが削除されるという報告を受けて開発に至ったとのこと
↓開発者の投稿
https://news.ycombinator.com/item?id=35835971 >>887
中国のqqとかいうやつと同じ事してて草
イーロン・マスクはチャイニーズだった!?
↓ポルトガルのサービスらしいけどココはWebページの保存が出来るわけじゃないのかね?
https://arquivo.pt/ 保存はできるけど特定国から集中するとポリシー変更、削除、閲覧ブロックはあり得る
》Termos e Condições
》O Arquivo.pt é um serviço disponibilizado em www.arquivo.pt, da responsabilidade e gestão da FCT| FCCN cujo objetivo é o arquivo periódico de conteúdos portugueses disponibilizados publicamente na Internet e posterior disponibilização ao público através de um sistema de pesquisa integrado.
(deepl翻訳)ご利用条件
Arquivo.ptは、FCT|FCCNの責任と管理のもと、www.arquivo.pt、インターネット上で公開されているポルトガル語のコンテンツを定期的にアーカイブし、統合検索システムを通じて一般に提供することを目的としたサービスです。
》Caso a FCT|FCCN tenha conhecimento de que está a armazenar conteúdos cuja ilicitude for manifesta, procederá nos termos do Decreto-Lei n.º 7/2004 de 7 de janeiro, impossibilitando o acesso aos mesmos.
(deepl翻訳)FCT|FCCNが、不正な性質が明らかなコンテンツを保存していることを知った場合、1月7日の法令第7/2004号の条項に従って手続きを行い、これらのコンテンツへのアクセスを不可能にするものとします。 >>888
キンペーと共依存なの知らんのか?
あいつが目指してるのは中国的な支配構造だぞ >>893
odnのホームページのホスト名はこの2つっぽいな
www1.odn.ne.jp
www2.odn.ne.jp ■ このスレッドは過去ログ倉庫に格納されています