【和塩】geocitiesスレ9【ジオシティーズ】
■ このスレッドは過去ログ倉庫に格納されています
>>453,458
不親切ですみません
URL(≒ファイル)の一覧、あった方が良いのは分かってるんですが、
全htmlファイルの一覧のため、インデックス付きSQLiteでGBオーダーになっていて…
>>462
そのURLの方(185さん)とは連絡を取って作業を進めてます
>>456
新ジオ分もindexあった方が良いですね
185さんのリスト分はほとんど入ってないですが、indexつくっておきます
>>463
Project Pigeonhole さんは作業を中止されてます 自分も番地はアーカイブした
通りごとにwgetのバッチ作ってあとはひたすら回収
2週間で約4TBにもなったけどこの中にindex.htmlが無くて
アクセスできないのが沢山あるのか・・・ ご無沙汰してます
GeoLog Projectさんからもご説明がありましたが、私の個人的な都合でアーカイブに時間を割けられない状況にあるため作業を中止しています
リストに登録済みのURLは他の方がやられているとGeoLog Projectさんからお聞きしています swfが外部ファイル読み込みに行ってるサイトがwgetで保存しきれなくてつらい
ブラウザのキャッシュからディレクトリ構造そのままでコピーできれば楽なのに >>464
お手数かけます。
アドレスはこのスレじゃなくて
https://geo.98nx.jp/
のリストに投げましたので、時間があればカバーよろですw >>465
私の分は街区分で4TBもない(1TB弱)んですが…
私の方で何か抜けているのか、465さんの方に何かが入っているのか? >>455
10月の捕獲なので1月に加筆した「移転先は〜」が取り込まれてない問題。(新サイトを辿れない)
今、再捕獲すれば「移転先は〜」を取り込めるが…
「(自動転送)」、「1行だけ残して自動ジャンプ」、「閉鎖しました」を取り込んでしまう危険性もある
悩ましいところ >>470
今あるアーカイブとは分けて全サイトを走査し直すしかないのでは
>>464,466
お疲れ様です
「リストに登録済みのURLは他の方がやられているとGeoLog Projectさんからお聞きしています」とあるけど、その他の方とやらはGeoLog 氏やPigeonhole氏とは別にサイトを作ってたりするのかな >>471
全くお聞きしてないので私にはちょっと分からないですね
もしかしたらGeoLog Projectさんが御存知かもしれないです GeoLogさん、イルカの夢でさようならというホラーサイトは保存していますか?
以前かなり話題になったサイトですので、まだ保存していないのであればお願いしたいです!
私の方でページを探索して見つけたのは以下の29ページです。
https://pastebin.com/raw/hCMYzqqz ttp://book.geocities.jp/hebihara_0320/k834.htm このサイトトップページ終了してて
ttp://book.geocities.jp/hebihara_0320/k のあと連番で続いてるみたいで
ない番号もあるけど ttp://book.geocities.jp/hebihara_0320/k8.htm から /k856.htm まである
Project Pigeonhole さん対応お願いします 再度募集
どなたか >>443 分からんですか
id と pass はあるのにログインできないとは… >>480
運営にメールして訊いてみては
仮にFTPがダメならアーカイブ取るしかないかも
何の参考にもならん回答ですまん >>480
wgetの使い方覚えてDLした方が早いだろう
windowsならバッチファイルに
"C:\Program Files\wget\bin\wget.exe" -r -l 20 -nc -w 0 -I /XXXX/ http://www.geocities.jp/XXXX/
てな感じで書いて実行 ちなみに俺も昔のIDとPASSでログインしようと思って諦めた。
wgetで辿れない隠しページなら、サポートに聞くしかないね。 残り一週間ないしあまり居ないと思うけどWindows環境で
Wgetを使ってアーカイブしようと思っている人へのメモ
con.htmlというファイルをwgetが見つけた場合、
システムで予約されている特殊な名前のファイル名なので
Windows側で保存できずWgetがそこで止まってしまう
なので問題なく保存できるLinux環境でアーカイブするか併用をオススメする あとwindowsだと大文字小文字が一緒だから
index.html と INDEX.HTMLが上書きされてしまう。
今はあんまないと思うけど、古いサイトには結構あった GeoLog Project様へ
旧ジオのEpicureanTable街区は保存されてますか?
公開ページに見当たらなかったもので・・・・ >>473
返信サンクスです
その人のアーカイブサイトのURL知りたいけどこのスレ見てるのかな
>>487-488
GeoLog Project氏がwindowsを使ってませんように... >>490
GeoLogの公開ページざっと見てきたがEpicureanTableはFoodpiaにリダイレクトされてた >>475
一部しか入ってなかったので対象に入れておきます
>>487
concon問題ってまだあるんでしたっけ?
>>490
EpicureanTable はFoodpia の旧名とのことなので、
URL直打ちすればFoodpia にリダイレクトします
Colosseum => Athlete とかも同じです
>>491
残念、アーカイブはWindowsでした
ただ、ツールはwgetではなくhttrackを使っていて、index-2.htmみたいな
連番ファイルが生成されているページが多数あったので、確認はしてないですが
同一扱いになるファイル名を自動でリネームしているように見えます
該当する適当なページがあれば、データの状態を確認できますが… しかしテンプレ・ブログとかの、味けのなさといったらないね。
ホームページだと壁紙からみんな違うからなぁ。 山田太郎とかいう参議院議員
オタクの味方だとか言われてるけど
この件はまったくノーコメントだよね とりあえず移転候補にあったXREAで移転操作したけど
ページが表示されない
?ドメインウェブの設定がまだ反映されていない。(反映には数時間〜24時間かかることがあります)
そういうもの?
>ドメインウェブの設定が見つかりません
>
>考えられる原因
>?ドメインウェブの設定がまだ行われていない。
>?ドメインウェブの設定がまだ反映されていない。(反映には数時間〜24時間かかることがあります)
>?ドメインウェブ・DNSの設定が誤っている。
>?アカウントが存在しない、契約が終了している、削除されている。 >>480
基本的にFTP接続する時は、YahooのデフォルトIDとパスワードで入ればOK
スパム対策用のデフォ以外のIDではFTP接続できないから、もし別名ログインの
設定をしているのならば、一回解除しないとFTP接続は跳ねられる。
これでログインできなかったら、また書いて >>497
ページが表示されないと一言で言っても、原因はいくつかある。
XREAにドメインのフォルダ作って中にファイルを入れた?
稀に新規ドメインウェブを取っても、DNSで名前は通っているけど、
ドメインフォルダが作られていない時がある。
そういう時は、自分でフォルダを作るべし。 >>494
遺跡みたいになってる個人サイトを掘り返して見てると
ただ管理人の好きなものが書いてあるだけのプロフィールのページでも
みんなデザインが違ってておもしろいんだよね
日頃こういうことしてますとか、私はこういう趣味がありますとか
ちゃんと書いてあったりして、ただそれだけなんだけどそれがまたおもしろい ブログ、mixi、Facebook、Twitterって具合に参加ハードルが下がったぶん表現の自由度は下がってしまったからなぁ
あとは周りに合わせる気質の人が多いから人が増えるほど突飛なのは出にくくなるかも…? >>500
FTPで移行処理を行って4時間くらいしてメール案内がさっき届きHPも表示できるようになってた
単純にQAのこれだったのか
>ドメインウェブの設定がまだ反映されていない。(反映には数時間〜24時間かかることがあります)
それとも
VALUE-DOMAINに別ブラウザからログインできなくて
向こうから送られてきた確認パスではなく任意のパスワードを再登録することで
ドメイン登録が完了した事になりHPが反映されたのか
>ドメインウェブの設定がまだ行われていない。
これに該当していたのだろうか
どっちが原因だったかわからないがまぁ表示できるようになって解決 httrackで自分で個人的にとあるジオのサイトを保存してみたんだけど
frameというかframesetを使ってメニュー表示してあるところでトップページしか保存できなかった
サイトマップがあったからそっちから、保存したらサイト全部保存できたみたい
たぶんやり方が悪いんだろうけど 上のほうで出ているサイトはできればUTF-8にというやつ
テキストファイルを全てUTF-8に保存し直さないとダメなのに
わからない人はHTML内の文字コード宣言だけ変えちゃうんだよね
そりゃ文字化けするよ >>506
文字コードは色々とややこしいからね
詳しくない人なら「文字コード指定を書き換えるだけじゃなくてUTF-8で保存し直さないとダメなんだよ」と言われても理解できなさそう
ジオシティーズはそういう詳しくない人の受け皿になってたところがあるし尚更 複数ファイルの文字コードを一括で変換してくれるフリーソフトを使った方が楽かもしれないね >>497
XXXX.shop
みたいなURLでアクセスしてない?
XXXX.xrea.g3.com
みたいなURLでアクセスしないとだめよ 移転する時に移転先のこと調べないの?
ファイルマネージャーってファイルをアップロードするためのものだから
エディタのような機能はついていないところの方が多いのに
エディタはあるはずと思い込んでいる人が結構いるんだよね
たとえあってもCKEditorとかTinyMCEとか国産のものは無いから
UTF-8でHTML5のテキストファイル以外だとぐちゃぐちゃになりそう >>445 >>455 >>456
GeoLog Project での使い方(例)ですが、例示されている以外のもので
アーカイブを呼び出すのに
/geocities.jp/ 〜 ではダメで、
/www.geocities.jp/ 〜 としなければならないものがあります。
アーカイブでなく原本・元本で、 www. を抜いてアクセスしても、 www. ありにリダイレクト。
この点、 www. 抜きでリクエストして 404 not found というだけでもうアーカイブ不存在だと思い込み
しないように、GeoLog Project での使い方(例)にパターンを追加したほうがいいように思います。 >>511
www抜きでもアクセスできるように設定してみました >>509
>>504で書いた通り表示されるようになってた。chrome、edgeは表示
ただIE(もう廃止され系ブラウザだが)の方はあいかわらず
この表示ではある
>ドメインウェブの設定が見つかりません
>
>考えられる原因
>・ドメインウェブの設定がまだ行われていない。
>・ドメインウェブの設定がまだ反映されていない。(反映には数時間〜24時間かかることがあります)
>・ドメインウェブ・DNSの設定が誤っている。
>・アカウントが存在しない、契約が終了している、削除されている。 >>513
ありがとうございます。大変にお手数をおかけして恐れ入ります。
GeoLog Project 使い方説明では
「旧GeoCitiesのURL(ドメイン含む)を入力してください。」という文章なので、
これは www. は抜き取ってURLを入力する必要があるのかな、とも感じたところでした。
/geocities.jp/ 〜 でアーカイブに行き当たらない場合は /www.geocities.jp/ 〜 も試してみてください
みたいな一文を添えてくださるだけでもよかったのですけれど。
ちなみに、ウェイバックマシン web.archive.org の場合は
www. あり・無しのどちらでも、そのままアーカイブ存在あり閲覧までいくことができるようです。 >>513
乙です
Yahoo IDがURLに入る方のジオシティーズではwww.geocities.jpとwww.geocities.co.jpの互換性があるようなので、そちらも対応をお願いします >>513 GeoLog Project ◆RJRIJK3wcLw8 さま
>>515 >>516 に関して、
実際にアーカイブWebサイトの内部挙動、表示までの処理をどう実現するかは
後々のことに回してかまわないと思います。
それよりも今はともかくサルベージ収集にリソースを割いてお願いします。 >>517 追加
ただ、実際にはアーカイブ済みであるのにもかかわらず
第三者としてアーカイブされていないと受け取ってしまう早とちりを避けるためには
アーカイブのトップページにおいて
geocities 日本版本家のURLの揺らぎ、といった感じで
一言添えてあればいいのかな、と思うのが今のところです。 今夜もひたすらサイト検索と保存
GeoLog Projectさんやその他の方々も今日もお疲れ様です 色んな人がバラバラにデータを集めてると見るのが面倒だし、どこかで各々のデータを一元管理する(もしくは共同管理体制を敷く)のはどうだろう
他の人の言う通り細かい話を詰めるのは4月以降でいいと思うけど GeoLogって個人鯖使ってるって書いてあるけど
どんだけデカい鯖なんだ?
100TBじゃ足りないんじゃないのか? >>522
>>469
>私の分は街区分で4TBもない(1TB弱)んですが…
サイト数自体はそれなりにあるとは言え、無料版なら100MBまでしか使えないからね
新ジオの分まで含めたら2, 3TBに増えそうな気がするがさすがに100TBなんて容量にはなり得ないよ 番号付き(街区)全部集めたけど、700-800GB程度。
だから非街区含めても1TBちょっと程度だと思う。
個人のHDDも一杯にならない程度の容量。
その程度も維持させないのがハゲバンク。 HDDだけポンと置いときゃいいなら楽だろうけどそうもいかないでしょ
ボランティアのアーカイブありきにも思える全削除は酷いと思うけど 最初は忍者でアカウント作ったんだけど、ffftpを使っても3MBを超えるファイルを上げることが出来ないのに気付き、即行で退会。
その後xreaでアカウントを作り、先日移転が完了。xreaはファイルのアップロードやテキストエディタが少しジオに似てるかも。 適当に思いつきで検索で保存してるけどほんとサイトの容量が軽いよね
シンプルなHTMLで画像データも大きくないしテキストが主だからサイトが軽いw
でもサイトに書かれてある内容が昨今のサイトより濃かったりして
シンプルなのによくまとめてあるもんだなと感心した >>524
その程度の容量に対して昨今のセキュリティ対応のコストが見合わないと判断したんだろ
まともにやろうとするとサーバー側だけじゃなくコンテンツ側の対応が必要だし
消息不明な故人サイトの対応なんて誰がやるんだよって なんと、geoの転送設定を使ったらgoogle検索結果から漏れのページが消えてしまった >>527
いい意味で金にならないからこそ作れたんだよな…
稼げるようになったことで特化した組織(たぶん)のページが目立ってしまうようになったと思う ダンおにのサイト、半分以上はswf置いてあるページでdos.txt,data,txt,option.txt,head.txt辺りのダウンロードを試行するようにしとけばなんとかなるんだが自動化出来ないもんかな
似たようなのだとオワタツジンはbgm.mp3とdata.txt、あとたまにura.txt
これないと使い物にならないデータが溜まるだけなのよ >>499
日本の geocities の id を取ったときは Yahoo ID なんてものはこの世に存在してなくて
Yahoo ID を今から取ったとしてどうやって geocities の id を認識させるのか
という話なのねん 「ジオシティーズの新規開設、プランの購入は2019年1月10日で終了しました。 」
とあるから、今からだと不可能なんじゃない >>537
少し前に某有名漫画家が、自分の過去作品についての細かいデータがまとめてあるサイトがあって、
その過去作品について確認する時にいつもそこを利用していて役に立っている!
みたいに書いてて、そのまとめてあるサイトがジオシティーズだった >>538
そのサイトのアドレスはこのスレに書き込んでおいた?
書いておけば誰かがリストに追加してくれるから書いとけ 昔の何かのデータをディープな趣味と情熱でまとめたサイトって、ほとんどがジオシティーズだよね。
ほったらかししてるサイトを見ると、「あの頃の情熱はどうした!」と思ってしまう。
まぁ自分も趣味のデータサイト放置して10年後の今、慌てて移行してるんだけどw infoseek iswebにもあった記憶
俺は動画に情熱うつしちゃったなぁ… Infoseekの保管サイトは閉鎖とかしてるよね
InternetArchivesに全部アップとかするべき アーカイブで出てきた昔のサイトの復元を試みています。
当時のジオシティーズの画像が消えてしまってるのでどこかにないでしょうか?
2000年頃の最初の書き込んだだけで表示されるHTMLもいじってない状態のページです。
一番上のウェルカム画像、「ゲストブックを読む」と「ゲストブックを書く」と「日記帳」
項目ごとのワンポイント画像だと思われる画像も表示されません。
メールやランキングアイコンは確保できました。 >>539
確認してみたらGeoLog Projectさんの方に保存されていました
とりあえず安心です ダウンロード作業ご苦労さまです、ま、ヒマな年金ジジイだけでしょうけど
オイラもそうなんで、・・・汗 >>546
ありがとうございます
それじゃないんです
今やっと出てきたんですがこういうのです
http://web.archive.org/web/20000823014824/http://www.geocities.co.jp/help/levelup/levelup1.html
これは画像がピンクのくまですが自分のところは木?植物の画像です
最初に何種類か選べたのかカテゴリごとに画像違ったのかどうなんでしょう
>>547
アラフォーもいますよ 何種類かテンプレあってそこから選ぶ仕様だったと思う
割と最近まで残ってたはずだからアーカイブされてる中にもあるかも なんか、夏休みの宿題を終わり間際になって片付けようとしているみたいでワロタw
もうちょっと早く手をつけておけww 今更wgetでURLのリストを使うことを覚えたが便利だなこれ
htmlに直接リンクが貼られて無くて取得できなかったファイルのうち連番のもの、別ファイルの同名のものが簡単に取得できるわ
今まで個別にcdで移動してwgetで取得とか言うアホなことやってたから無駄に時間食ってしまった >>552
wgetは地味だけど便利機能がたくさんあるから一度マニュアル読んどけ >>552
たまにループっぽい挙動してたりcon.htmlに引っかかって止まったりするから
こまめにに進捗確認しとくと良いよ >>551
GeoLog Projectさんや、活動停止したらしいけどProject Pigeonholeさんなど、早くから動いてた人もいるにはいるのよ
皆がもっと早くから手をつけてたら良かったんだが >>547
俺はジオシティーズとの関わりが全くない学生だけど
無数の貴重なサイトが消えてしまうと聞いて参加してるぞw
残り時間あと僅かだけどみんなでラストスパートかけて頑張ろうぜ >>553
一応読んだんだけど当初は作業内容の関係でリストをここまで活用できるとは思ってなくて・・・
>>554
Linuxで実行してるからcon.htmlの方は大丈夫
落としに行ってるのはほとんどのサイトで複垢やってるジャンルだしswfが外部データ読み込みに行くせいで個別にDLが必要だから、
サイトごとにURL確認して一旦htmlとswf落とした後に足りないファイルを落としに行って最後に動作チェックという作業を繰り返しやってる関係で異常にもすぐ気づくし >>528
保存容量的には今の時代2、3000円程度
データへのアクセスを減らすことに価値はあるけど削除するのはほぼ意味ない セキュリティ対策って、ファイル関連でどんだけあるのかな。
CGIとか止めてる場合。 【重要】プレミアム特典の廃止について
https://blogs.yahoo.co.jp/yjchiebukuro_staff/72749191.html
知恵ノートに続き、任意とはいえ回答済み知恵袋も削除できるのこと。
ヤフーはどんどん縮小の方向に向かっているんどえは? ■ このスレッドは過去ログ倉庫に格納されています