【和塩】geocitiesスレ9【ジオシティーズ】
■ このスレッドは過去ログ倉庫に格納されています
ちょっと時間が足りないね
残ってるのはあまり有名ではないページばかりだけど
archiveteam の bot を使えば子ページを含めて自動保存できて, しかも Internet Archive への適用も可能だから、
はじめからこれ使えばよかった
残った方法は, 直接 Yahoo Japan にデータの提供をお願いするぐらいしかないかも
31日にはページが非公開になるだけでデータ自体の削除は来年だから >>692
>残った方法は, 直接 Yahoo Japan にデータの提供をお願いするぐらいしかないかも
>31日にはページが非公開になるだけでデータ自体の削除は来年だから
うむ
国会議員とか、うごいてくれねーかなぁ >>691
archive.fo/fJQ6X これとか俺がトップページ入れただけで全部保存された
他に誰も保存してなかったから間違いない
でもアーカイブチームのボットとやらを最初から使った方がよかったのかもしれん >>695
invalidで弾かれる奴は全部保存済みだ
4桁の数字がついてるだろ
安心してくれ >>696
いやこのBerkeley-Laboっていう街区?がリスト検索しても引っ掛からなかったもんで… いま archiveteam の方で収集が進んでるから, ここに全てをかけるしかない
もし internet archive に保存されてないページがあれば手動でもどんどん保存するべき
消えるよりまし >>698
この形式で始まるページは全部 Internet Archive に保存されてるから大丈夫だよ
http://www.geocities.co.jp/[単語]/[数字]/
どこからもリンクされてないページならまだ保存されていない可能性が高いから,
手動で Internet Archive へ登録したほうがいいかも >>698
ちなみにBerkeley はCollegeLife の旧名なので、
見つからない場合はCollegeLife でアクセス可能なはずです >>701
確認しました、ありがとうございます
ついでに移転も確認できました >>697
アーカイブトゥデイに親ページ読ませたらサイトが全部見られるし
ソフトのダウンロードもできた
インターネットアーカイブだと全部のページいちいち読ませる必要があるし
少なくとも俺にはソフトを保存させることもできなかった
子ページが保存できるってこういう意味じゃないのか
ただ俺もネットについてはほとんど知識ないから俺なんかよりもっと詳しい人の
言うこと聞いた方がいいかもしれない list.txtに記載されているURLはWayback Machineに登録した。あとは任せた。 >>703
リンク先が geocities になってるから, archive.today は現在のページだけ保存する感じだね
もしリンク先も保存されてたらドメイン名が archive.* のままページ移動できる
あと Internet Archive は zip とかのファイルも保存できるよ
結局, Internet Archive と archive.today の使い勝手は同じみたい >>704
すごい
そのアーカイブはもう Wayback Machine のウェブサイト上で見れる状態? >>705
マジか気がつかなかった
本当に申し訳ない >>701
諸々の作業が落ち着いたら、街区の旧名一覧をGeoLogのページに貼っといた方がいいかと
そのことで混乱してる人も多いみたいだから >>706
通信エラーで保存されなかったページがあるかもしれないけど
list.txtに載っているページなら基本見られるよ
子ページまでは量的に厳しかったから思い入れのあるサイトとかは各自で保存してね >>709
量的にってことはアーカイブには保存したの?
あと海外のチームってのに送ったりできないの? マジで心にぽっかり穴開きそう
ジオロスっていうのかな ここの URL 一覧を元に Internet Archive への自動保存が進んでるけど
1日で間に合えばいいな
https://geo.98nx.jp/ 皆同じリスト使ってたら皆同じとこからダウンロード始めるから下の方保存しきれないんじゃねって思ったけどそんな事無い? >>715
ダウンロードしてる人そんなに多くないから大丈夫そう
あと複数人が同時にアーカイブする意味は殆どないから、アーカイブ済みの URL は無視したほうがいいのはある
障害に備えたいならアーカイブが終わってから別サーバに複製したほうがいい
Internet Archive 自体でも複数箇所に複製してるけどね >>715
誰かが下の方に絞ってダウンロードすればいいんじゃないか
どなたかお願いします アーカイブデータをBitTorrentで共有しよう(提案)
http://www.ceena.net/ あと 200時間、一週間以上はかかりそう
10台並列ならなんとか間に合いそう 「https://web.archive.org/save/保存したいページのURL」のHTMLデータを取得すれば保存したいページがWayback Machineに保存されるよ
つまりスクリプト組めばまとめて保存できる >>724
wget でも JavaScript 切ったブラウザでも無理だった
JavaScript の動作が必須みたい >>724
ごめん出来てた
反映がだいぶ遅くて気づかなかった
これで使ったらいけそう >>443 >>480 >>534 >>535 >>536
ttps://twitter.com/technetiummm/status/1112096995982733312
> ジオシティーズからお引っ越し完了!今日でサービス終了ですよ〜; #geocities
> 5:59 - 2019年3月31日
ttps://twitter.com/technetiummm/status/1112098612496863232
> ちなみに2005年に終了した旧ジオシティーズで作ったページで
> 現ジオシティーズに移行する手続きを行わなかったページについては、
> 問合せを行ったところ1ページずつブラウザから保存してください
> とのご回答を頂きましたのでそのようにしました #geocities
> 6:05 - 2019年3月31日
https://twitter.com/5chan_nel (5ch newer account) >>136 >>343 >>344 >>395
サイトの移行がグーグル検索に反映されない - Google Product Forums
ウェブマスター ヘルプ フォーラム
サイトの移行がグーグル検索に反映されない 2018/11/06
ttps://productforums.google.com/forum/#!topic/webmaster-ja/L8irL7o4_zg >>732
大丈夫だと思うけど時間がないからアーカイブも合わせてやってほしい
>>724
天才かよ >>717
気軽にscrapbook xで保存したら、htmlファイルだけで7千個超の260MBもあったわ >>717
[取得設定]−[HTMLのMETAタグを読まない]チェックを入れればいけます、大体1時間で完了
カウントが70000くらいまで上がって「これ終わらないんじゃないか?」と一瞬思うけど
終盤5分間で残90%をギュイーンと消化する感じなので焦らずに >>737
入れ替わりにナージャとか旧漫画が消えてました
上書きはやめた方が良さそうです 最終日ということでlist.txtの登録サイトは今日いっぱい増え続けるだろうから、アーカイブ勢の方々は下の方のURLの増え具合に特に注意してほしい WaybackMachineのネットワークプロトコルエラー出やすくなってきた気がする list.txt の旧ジオ分は時々見に行ってアーカイブしてます サービス終了10年くらい延期してくれないかなぁ(願望 >>747
願望で現実逃避してる暇はないぞ
ひたすら保存し続けろ はてなブックマークで和ジオに絞り込んで人気サイトでソートすると一杯見つかるな
ここから重要サイトを絞り込もう
(といっても規制で貼れねえ)
例
青空文庫で読める日本古典SF
http://www.geocities.jp/tamiyagi2/sf.html https://onl.jp/U6zTPsC
はれるかな
はてなブックマークの和ジオの上位サイト
世界史講義みたいに移転してるのが多いが みなさ〜ん!
タイムリミットはあと6時間ですよ〜!! アクセスするだけでいいならwget --spider -i リストの方がいいのかな? >>756
それでアーカイブできたよ
>>755
見た感じすでにアーカイブ済みのやつが結構あるね
https://web.archive.org/web/*/http://www.geocities.jp/nemu183/*
https://web.archive.org/web/*/http://music.geocities.jp/tseirproodni2/* >>757
そんなの出せたんか・・・
コマンドで被り除外できそうだけどURL自動取得の方法とかわからんからとりあえず--spider使ってアーカイブ進めてみる なんかほんと
平成とともに
いろいろ終わっちまうなぁ・・・涙 やばいもうあまり時間なかったw
ちょうど0時で終わるのかいな 自分のホームページのデータ保存そるだけなら1年余裕があるのよね? https://web.archive.org/web/20090330195332/http://www.geocities.jp/genei629/itadakimono.index.html 俺の廃墟HPのデータ全部保存し終わった
歴史が1つ終わるな(´・ω・`) archive.today タイムアウトでなかなか出ない 何年前だっけ?大変動があったような。それでジオに作ってたサイトを放棄した覚えがある 和塩の規約改定を一方的に行われて怒った人がインフォシークへ民族大移動だっけ?
当時、長持ちするサイトが思い付かずズルズル22年間も続けてしまった 忍者ホームページで文字化けしたので
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
UTF-8に変更したらうまくいった
古すぎてパスを忘れた人とかもソースだけでも保存急げー!
>>775
インフォシーク懐かしい。ライコスもあったなー >>778
そのはず
>>779
list.txtに急いで登録するんだ あれ?もしかしてこれInvalid URL何しても返すようになった? >>781
トップページは総当たりで取り込んでるから登録不用。ツリー下の個別htmは登録できる(はず >>783
いや単純に一時的にエラーは居てたみたい
数字ページはたしかにいらないのは思い出したんだけど
Already Exists!かえしてたから >>761
ここのブックマークもっと前に知りたかった・・・
一つ一つWgetにぶち込んでるけどとても終わりそうにない
この中で幾つGeoLogさんが拾っていることやら・・ >>786
結構拾ってるし無くなってるページもある
上位ブクマだとgeologがもってなかったのはタモリのつぎはぎラジオくらいだった >>779
数字じゃないサイトは全部ぶちこんだlogさんに >>786
とおもったけどけっこうぬけもでてきたわこわい >>786
昨年11月に一斉アーカイブを行ったらしくwaybackで拾える(自分の所は ■ このスレッドは過去ログ倉庫に格納されています