【和塩】geocitiesスレ9【ジオシティーズ】
■ このスレッドは過去ログ倉庫に格納されています
>>537
少し前に某有名漫画家が、自分の過去作品についての細かいデータがまとめてあるサイトがあって、
その過去作品について確認する時にいつもそこを利用していて役に立っている!
みたいに書いてて、そのまとめてあるサイトがジオシティーズだった >>538
そのサイトのアドレスはこのスレに書き込んでおいた?
書いておけば誰かがリストに追加してくれるから書いとけ 昔の何かのデータをディープな趣味と情熱でまとめたサイトって、ほとんどがジオシティーズだよね。
ほったらかししてるサイトを見ると、「あの頃の情熱はどうした!」と思ってしまう。
まぁ自分も趣味のデータサイト放置して10年後の今、慌てて移行してるんだけどw infoseek iswebにもあった記憶
俺は動画に情熱うつしちゃったなぁ… Infoseekの保管サイトは閉鎖とかしてるよね
InternetArchivesに全部アップとかするべき アーカイブで出てきた昔のサイトの復元を試みています。
当時のジオシティーズの画像が消えてしまってるのでどこかにないでしょうか?
2000年頃の最初の書き込んだだけで表示されるHTMLもいじってない状態のページです。
一番上のウェルカム画像、「ゲストブックを読む」と「ゲストブックを書く」と「日記帳」
項目ごとのワンポイント画像だと思われる画像も表示されません。
メールやランキングアイコンは確保できました。 >>539
確認してみたらGeoLog Projectさんの方に保存されていました
とりあえず安心です ダウンロード作業ご苦労さまです、ま、ヒマな年金ジジイだけでしょうけど
オイラもそうなんで、・・・汗 >>546
ありがとうございます
それじゃないんです
今やっと出てきたんですがこういうのです
http://web.archive.org/web/20000823014824/http://www.geocities.co.jp/help/levelup/levelup1.html
これは画像がピンクのくまですが自分のところは木?植物の画像です
最初に何種類か選べたのかカテゴリごとに画像違ったのかどうなんでしょう
>>547
アラフォーもいますよ 何種類かテンプレあってそこから選ぶ仕様だったと思う
割と最近まで残ってたはずだからアーカイブされてる中にもあるかも なんか、夏休みの宿題を終わり間際になって片付けようとしているみたいでワロタw
もうちょっと早く手をつけておけww 今更wgetでURLのリストを使うことを覚えたが便利だなこれ
htmlに直接リンクが貼られて無くて取得できなかったファイルのうち連番のもの、別ファイルの同名のものが簡単に取得できるわ
今まで個別にcdで移動してwgetで取得とか言うアホなことやってたから無駄に時間食ってしまった >>552
wgetは地味だけど便利機能がたくさんあるから一度マニュアル読んどけ >>552
たまにループっぽい挙動してたりcon.htmlに引っかかって止まったりするから
こまめにに進捗確認しとくと良いよ >>551
GeoLog Projectさんや、活動停止したらしいけどProject Pigeonholeさんなど、早くから動いてた人もいるにはいるのよ
皆がもっと早くから手をつけてたら良かったんだが >>547
俺はジオシティーズとの関わりが全くない学生だけど
無数の貴重なサイトが消えてしまうと聞いて参加してるぞw
残り時間あと僅かだけどみんなでラストスパートかけて頑張ろうぜ >>553
一応読んだんだけど当初は作業内容の関係でリストをここまで活用できるとは思ってなくて・・・
>>554
Linuxで実行してるからcon.htmlの方は大丈夫
落としに行ってるのはほとんどのサイトで複垢やってるジャンルだしswfが外部データ読み込みに行くせいで個別にDLが必要だから、
サイトごとにURL確認して一旦htmlとswf落とした後に足りないファイルを落としに行って最後に動作チェックという作業を繰り返しやってる関係で異常にもすぐ気づくし >>528
保存容量的には今の時代2、3000円程度
データへのアクセスを減らすことに価値はあるけど削除するのはほぼ意味ない セキュリティ対策って、ファイル関連でどんだけあるのかな。
CGIとか止めてる場合。 【重要】プレミアム特典の廃止について
https://blogs.yahoo.co.jp/yjchiebukuro_staff/72749191.html
知恵ノートに続き、任意とはいえ回答済み知恵袋も削除できるのこと。
ヤフーはどんどん縮小の方向に向かっているんどえは? そんなの今言うことじゃないし
管理人がいちいちリンクなおさないといけないのか? >>566
落ち着け、対処できるのはGeoLog管理人しかいないんだからしょうがない
ソースを見たけどGeoLog内の相対リンクの記述がおかしいみたい
URLの抜けてるところを補ったらちゃんとアーカイブが表示されたし、とりあえずは保留のままでいいんじゃないかな 既に5TB位クロール出来たけど
これローカルで検索できるようにしないと一生見ないだろうな >>570
お疲れ、相当集めたな
死蔵するのはもったいないし、できればGeoLogのように公開してほしい 自分の手元には保存したが、ネットで話題が出た時リンクを出せないのは痛いな…
管理者がわからないサイトで管理者に本の全文掲載許可が出て本の内容がアップロードされてたので、再掲載ができない
著者は生きてるかもわからんし、医学部の闇の問題だしなぁ… >>572
そういうのはウェブ魚拓かInternetArchivesに手動で保存させとけばいい >>572
「アーカイブの内容は全て元サイトの作成者に帰属します」とか何とか書いて逃げ道を作っとけ
万が一削除依頼が来たら非公開設定にしとけばええんや >>570
linuxのnamazuって全文検索エンジンって
まだ使えるのかね >>572
書籍を出版するのに伴って、それ以前はインターネット上に文章公開していたものを
取り下げた、閉鎖した、というならそれは
文章を読みたいなら本を買ってね、という著者の意志表示でもあって
URLリンクを出すのははばかられる、というのはあるかもしれない
けれども、出版して、著者自身も出版社も公認で書籍内容を全文公開していたなら
それは別に、今後もURLリンクを提示して問題ないのでは >>583
街区(アドレスに4桁の番号が入ってる奴)は
番号総当たり(1000-9999)でクロール済み。
ここで募集してるのは、番号のついていない奴。
番号なしはアドレスを知らないと見つけられないので。 身内のサイト番地だけど検索避けの設定してたからか登録できちゃったわ >>583
Invalid URLメッセージが出たのは既に総当たりクロール済みだから。
>>185にその辺りの説明があれば良かったんだけどね。 index3.htmlみたいに離れ小島みたいに隠しページ風に作ってあって
トップページからでは行けないサイトもあったけどそういうのは保存されてないんだろうな
一応保管のサイトにアドレス登録?はしたのでサクセス!みたいな言葉は出たけど >>589
そういうのはまさに185に登録すべきものであります! >>565,566,568,569
ごめんなさい、相対リンク変換スクリプトに食わせたときにどこかのパラメータを間違ったようで、
ドメイン部分が欠損したリンクができてます。
新ジオ分は問題ないはずですが、旧ジオ分の一部で発生していることは確認してます。
追々直しますので勘弁してください。 >>591
保存してもらってるだけでありがたいので
あんま気にしないでくださいw 一応Internet Archiveも動いてるようだけど、全部保存出来るのだろうか Internet Archive は信頼性高いからここにも保存したほうがいいのかも。 結局>>185のリストのサイトは誰が保存してるの? >>599
情報再掲サンキュー
その人にもここに何か状況報告とかしてほしいね スレチかもしれないけど
geocitiesをarchive.orgに保存する時ってトップページだけじゃなくてリンク先のページごと(URLごと)に保存していかないといけないんだよね?
一度にできるよ 途中送信失礼
リンク先も一度に出来るようなやり方とかないの? リスト登録ってもしかしてトップページだけとか子ページだけとかじゃ駄目なのか。全部手動登録? >>602
たぶんない
>>604
トップページからリンクさえ貼ってあれば子ページは辿れるからそこまでしなくてもいいと思う 逆に言うとどのページからもリンクされてない孤立ページは全部手動登録しないとダメ >>605 >>606
ありがとう。てことはWayBackMachineの方が手間が多いんだね。 ArchiveTeamは自前サーバーで集めたデータをInternet Archiveに提供してる
大抵のジオシティーズサイト(全部ではない)に2018年以降に取られたInternet Archiveのアーカイブがあるのはおそらくこのため アーカイブデータをBitTorrentで共有しよう(提案)
http://www.ceena.net/ >>608
じゃあ ArchiveTeam に抜けてる URL を送ってクロールしてもらったほうがいいのかな
31 日までにもう一度クロールする予定みだいだね 調べたら Archive-It で代理クロールの依頼ができて Wayback Machine にも適用されるみたい
手動でやるなら拡張機能を使って手間を省くらいしかないかも 無知ですみません
co.jpの方のサイトで登録されてなさそうなのがあったのでhttps://geo.98nx.jp/に登録しようと思ったんですが
index.htmlだと登録できないんですか?
「index.htmlが存在しないサイトはhtmlのURLを入力してください。」とあるからindex.htmlだと登録できると思ったんですが >>604
ジオシティーズのそのアカウントのディレクトリ・フォルダ内部で
リンクになっていない、どこからも孤立しているWebページに関しては
そのページごとにリスト登録しないと分からないだろう co.jpでindex.htmlがあるサイトだと番号総当たりで浚えるから必要ないのか
失礼しました>>613はスルーしてください
index.htmlがないサイトだけ登録しておきます >>613
geo.98nx.jp のフォームにURLを放り込んで
geo.98nx.jp 側でそのURLにつき実在を確認できれば、 Success! になる
index.htmlが存在しないサイトなら、別の
ジオシティーズ jp/xxxxx/xxxxx.html などの実在するURLを放り込む必要がある
それがたとえば top.html などでインデックス代わりになっていれば
配下の個別ページにリンクが通じていれば、それでいいだろう
ジオシティーズ jp/xxxxx/ 以下のディレクトリ、フォルダに
バラバラに孤立して複数Webページが存在するなら、それら全部のURLを
フォームに放り込んだほうがいいだろう
バラバラに孤立して複数Webページが存在するうちのひとつだけを登録しても
FTPアクセスするわけじゃないから、他の孤立したページまでは自動では拾えないだろう
登録しても、それをもとにクロールしてデータをアーカイブするのはまた別の作業なので
登録しただけで確実にアーカイブされるとはいえない、早めに登録したほうがいい >>615
それは分からない
たとえば、サイト全部のデータ中身を残したままで
サイト移転で index.html をまっさらにしてリダイレクトをかけている場合など >>616
index.htmlが存在するサイトでもInvalid URLになるので、旧urlのco.jpのサイトはindex.htmlじゃ登録できないみたいです
>>617
そういうサイトの場合はリンクが残ってるページがある場合はそこを登録しておこうと思います >>619
index.htmlとindex.htmが分離してる系多いよね
自分は昨日気付いたんだけど、185に登録できないからどうすればいいか頭抱えてる このレスの増え方…夏休みの宿題ギリギリにやる人多すぎだろw >>621
皆が7月からコツコツやるタイプなら良かったんだけど、まあ今更言っても仕方ないやね >>621
確定申告と相まって2度夏休みを迎えた気分だったw >>621
正直、海外の人がほぼやってくれてるから後は Internet Archive にまだ乗ってないやつを探すだけだよ >>619
とりあえずWayback Machineに全部保存してこい アーカイブ作業して下さっている方本当にありがとうございます、お疲れ様です
>>597
こことかですね
http://ifs.nog.cc/
ヤジ研にあった古い世界地図のアーカイブもあって嬉しかったです
http://ifs.nog.cc/keropero888.hp.infoseek.co.jp/ >>626
インターネット・アーカイブへの保存は去年の段階で完了してます
geocities終了以前から消えそうなサイトをアーカイブに保存する作業を一昨年から進めてましたんで >>628
凄いですね
夏休みの宿題範囲を見越して一学期からやってた人がいたとは >>627
そのサイトInternet Archiveで96回保存されてて笑ってしまった
https://web.archive.org/web/*/keropero888.hp.infoseek.co.jp/
今回のもそうだけど消えてほしくないサイトはどんどんInternet Archiveで保存しよう
世界一信頼性が高くて、裁判で使える証拠にもなるから >>610
ファイルサイズすごいことになりそうだけど
自分もそれが理想かも >>629
biglobe系サイトは最近までアーカイブから除外されてたんですが
最近はアクセスできるようになったので進めてます
でも、あそこアクセスできるようになったりできなくなったりで安定しないんで
見たいサイトを探るなら今のうちにやったほうがいいと思いますよ 保管するのもそうだけど
管理人に直接移転をオススメするのもやった方が良いよ
Infoseekの時は掲示板に書き込んだら気付いて移転してくれたサイトとかある 最終日までできるだけ検索と保存がんばりましょう
自分は昔のようになかなか集中力が続きませんがw >>185にトップページ保存してsuccess出て、子ページ東麓してもsuccessが出た
子ページって自動登録されてないの? >>635
ミスった
東麓じゃなくて登録というか保存 ■ このスレッドは過去ログ倉庫に格納されています