【和塩】geocitiesスレ9【ジオシティーズ】
■ このスレッドは過去ログ倉庫に格納されています
結局登録完了メール着てない件はVDの一覧に載ってれば問題ないっぽい
削除もされないと返信着た。一応再送してもらったけど 再掲
827名無しさん@お腹いっぱい。2018/11/03(土) 23:08:50.030
geocities.jp/ニックネーム 形式のURLのサイトのうち、
管理者不明でこのままだと消えてしまいそうなサイトを知っている人は、ぜひそのURLを教えて下さい
旧ジオはコミュニティ名+4ケタの番地だから機械的に全ページをリストアップして保存することが可能なんですが、
ニックネーム形式だとそういう訳にもいかず、保存するページを探すのが非常にやりづらいのです
情報提供をお待ちしております ジオシティーズから、fc2ホームページにサイト移動させたんだが、
サイトをIEで表示したら、
セキュリティで保護されているコンテンツのみ表示されます
って警告文が出るんだが、なぜ? そのままの意味だ
ホームページがhttpsだが外部リンクでhttpのもの呼んでるんだろ自分が設定したしないに関わらず
でIEはhttpshttp混合表示しない設定になってるだけ >>827
教えるフォームとかないし。
とりあえず>>160 >>160
少なくともGeoLog側のアーカイブ対象には入ってなかったので、一応入れておきます
>>167
前スレ827/今スレ164はピジョンホール計画さんですかね
フォーム無くてもここに書いてあればとりあえず拾えると思います https://web.archive.org/web/20110310042218/http://pages.yahoo.co.jp:80/
https://web.archive.org/web/*/http://pages.yahoo.co.jp:80/nhp/*
ページディレクトリっていつまであったんだっけ?最後までやってれば良かったのにな
internet archiveでも歯抜けあるっぽいし 【Netowl】ネットオウル Part2
https://mevius.5ch.net/test/read.cgi/hosting/1530286321/120-
120名無しさん@お腹いっぱい。2018/12/25(火) 12:39:35.940
【Netowl】ネットオウル
とも
スターサーバー
とも呼ぶ、
というのが分かりにくい。
1つの鯖に2つの名称があるなんて分かりにくい。
それとも、NTT回線を使ってOCNでネットをやる、とか、そういう意味なの?
121名無しさん@お腹いっぱい。2018/12/25(火) 12:59:11.970
ネットオウル株式会社
レンタルサーバー名「スターサーバー」
122名無しさん@お腹いっぱい。2018/12/26(水) 10:21:16.080
会社名をサーバー名だと思う人がいるなんて
ついでにnetowlがやってる鯖はスターサーバーだけじゃなくてな
123名無しさん@お腹いっぱい。2018/12/26(水) 10:35:26.660
デジロックのXREAとCoreServer
アズポケットのmixhost
会社名とサービス名が違うのなんていくらでもある、というかむしろ普通じゃん
124名無しさん@お腹いっぱい。2019/01/06(日) 06:22:02.600
isweb aaacafe geocitiesらを追って、更新は止まってるが有用なサイトがまたしても消えていくのか。。。 ジオ消滅の今、プロバをヤフーにする理由がなくなった。
ヤフーより安くて早いプロバはありますか GeoLogさんと同様、ジオシティーズの保存を個人でやっているものです
GeoLogさんのサイトでも触れられていたかと思いますが、基本的に私が新ジオ、GeoLogさんが旧ジオをそれぞれメインに保存することになろうかと思います
>>164は私ではないですが、前スレ827は私です
このスレにレスをして頂ければこちらで拾いますので、良ければぜひ情報提供にご協力をお願いします
情報提供フォームを作る予定はなかったのですが、あった方が良いということであれば公開します >>168
参考までにお聞きしたいんですが、アーカイブした旧ジオのデータの総容量はどのくらいでしたか? >>174
旧ジオのみだと700GB程度、ジオ以外のファイル/新ジオのファイルも含めると1TB程度です。
旧ジオの機械的に辿れないもの(index.htmlの無いやつとか)は
まだ入っていない(見つかる限り集める予定)ので、それを入れると旧ジオ分はもう少し増えると思います
そちらはどんな感じでしょうか? >>175
今まではURL収集作業をメインに行っていましたので、まだ保存作業自体は手付かずの状態です。
現在までに収集したのは6500個ほどです。
これらのサイトに貼られているgeocities.jpのサイトへのリンクを再帰的に辿り、無制限に保存することも可能なのですが、
アーカイブ作業に利用しているVPSのディスク容量(200GB)を上回ってしまう可能性が高く、
収集したURLのみに絞って保存するか再帰的にリンクを辿って保存するか決め兼ねている状況です。 >>173
もう登録されてるかもだけど
オカルト板のまとめ
『身』まとめサイト
1st.geocities.jp/mii_matome/
「自己責任」考察サイト(仮)
www.geocities.jp/zikosekininkei/
ググったついでに出てきたまとめサイト適当に
www.geocities.jp/vodafone801sa/
www.geocities.jp/gokiboku/
www.geocities.jp/chie_ref/sagi/
www.geocities.jp/newyougo_matome/
www.geocities.jp/defrag_g/
www.geocities.jp/r_s_53/
milky.geocities.jp/alal801/
geocities.jp/+資料でググると結構あるね
更新されてなさげなら何でも補完して大丈夫なら
上からコピペしてくるけど >>178
情報ありがとうございます
『身』と「自己責任」とナイジェリア詐欺は登録済みでしたが、それ以外はまだでした アーカイブがんばってください
Googleでsite:○○○.geocities.jpで引っかかったURL収集するとかどうでしょう
あとはレンタルサーバー同居人検索でサブドメインごとに探すとか(あまりたくさん出てこないですが)
自分でもできたらいいんですがスクレイピングは勉強中で・・・ >>176
容量だけの問題であれば、収まらなくて諦めるくらいなら
声かけていただければ、該当のURLを当方で収集します
せっかく集めたURLが無駄になるのはもったいないと思うので
>>180
私が新ジオのURLを収集したのがまさにGoogleです。。。
ただ300件までしか出てこないんですよね >>181
やっぱり既出ですよね
しっかり読めてなくてすいません ケータイ(ガラケーのこと)専用サイトってもう絶滅したの? GeoCitiesのアドレス収集のページ作ってみたんだけど需要あるかな。
リストをtxtでダウンロードできて、フォームやwgetとかでURLを投げてくれればリストに追加される。
ttps://geo.98nx.jp/ 平素はネットオウルをご利用いただき、誠にありがとうございます。
この度『スターサーバーフリー』『ウェブクロウ』において、
無料プランを継続してご利用いただく場合に、
3か月ごとの更新手続きを義務化いたします。
これまではお客様による特別な操作を行うことなく
無料レンタルサーバーを継続してご利用いただくことが可能でしたが、
今後は、ご利用期限を更新するため
メンバー管理ツールから「更新」ボタンをクリックしていただく必要があります。
このたびの対応は、不要なサーバーアカウントのご利用を抑制し、
より高品質なサービスを提供することを目的とするものです。
お客様にはご不便をおかけし申し訳ございませんが、
何とぞご理解くださいますようお願いいたします。
悲劇やな・・・ GCPの無料インスタンスに乗り換えるという手もあるにはある
広告完全なしにはなる GCPはVPSだから管理スキルないと踏み台にされたり危険だけど
同じGoogleのサービスでも、Firebase Hostingなら楽だし転送量10GBだよ
ただ、GitHub Pages等と同じで、CLI操作が基本なので向かない人が多いだろうね
従来型FTPベースの広告なし無料では、XREAが現状ベストだと思う
XFREEは3ヶ月以上FTPかファイルマネージャにログインしてないと広告が出る
スターサーバー無料プランは3ヶ月以内ごとにコンパネログインして契約更新ボタン押さないと消される >>173
http://www.geocities.jp/f_tamakoku/
古ゲー玉国、未追加でしたらお願いします。
サイトについて補足しておくと
http://www.rr.iij4u.or.jp/~fuk/
昔はこのアドレスだったのですが移転後が先述のgeocitiesで
さらにアメブロに拠点移して以降活動自体は止まってる状態です。 Peeep.us
http://www.peeep.us/
魚拓系サイトの一種のこれってもう消滅したの? >>194
追加しました
>>185
わざわざありがとうございます、今後はそちらもチェックすることにします
一応お断りしておきますが、移転が確認されたものはリストには追加しませんのでご了承下さい
移転先が不明なもの、移転の予定がないものを優先してリストに追加します >>196
185です。
勢いで作ったので何らか不具合があるかもしれません。
index.htmlがないサイトを考慮してを指定しても追加されるようになってます。
その分冗長なリストになってしまいますが取りこぼすよりはマシかと思ったのでそうしました。
基本的に追記してくのですが、たまに整理のためにソートする事があるので、list.txtを使う時をソートしてから使うのが良いです。
何らかお役に立てれば。 >>198-199
もしかして私でしょうか?
>>198 さんのURLは >>185 さんの一覧に全てありました
>>199 さんのURLは無かったので185さんの一覧に入れました >>197
個人的には、実はソートしないほうが追加分が見やすかったり… >>197
185です。
ですよねぇー。
極力ソートしないようにはします。
ただバグって重複が酷い状態になったら悪しからず。 日本語版Wikipediaの外部リンクをまとめたSQLファイルを検索してみたところ、geocities.jpのサイトが全部で10675個ありました
これらの中からまだ生きているものを抽出して保存する予定です 185さんのページに追加していただいている皆様、
ぜひ、街区分(www.geocities.co.jp) の方もよろしくです。 >>204
あー番地の方は対応させてないです。。。
>>203
こちらでもSQL確認しました。リスト追加こっちでもやってみます。 >>205
orz
予定もないのであれば、街区用はこちらで何か用意します >>205
list.txtのURLがいつの間にか38000個近くにまで増えていてちょっと驚きました
SQLからの追加はもう完了した感じでしょうか? >>206
番地対応させました!
indexが存在しないページを想定してるので
ttp://www.geocities.co.jp/SiliconValley-Oakland/1000/aaa.html
という形式で登録可能です。
(トップページは機械的に追えるし登録するほどでもないと思ったのでそれはdenyされます)
>>207
wikipediaのSQL分とGoogle検索や >>169 からかき集めてます。
ただ中には
ttp://geocities.jp/XXX
ttp://geocities.jp/XXX/aaa.html
みたいにトップページとその他のhtmlへのリンクが重複で登録されているのもあるのでサイト数でカウントするともう少し少ないと思います。 現時点でlist.txtには26868のサイトが登録された。
(HTMLへのURLもあるからそれは除外。単純行数だと46112)
wikiのSQLも追加したし、InternetArchiveのページディレクトリもある程度は追加したけどGoogle検索で
site:geocities.jp + ふと思いついたキーワード
をやればやるほど新しいサイトが見つかる。
一体どんだけサイト抱えてるんだろう。 >>211
https://oretopia.net/blog/2018/1002a/
ここのサイトの推計によれば新ジオは4,759,300件、旧ジオは1,539,000件ほどだとか
分かっていたことではありましたが、新ジオ全部保存するのは厳しそうですね... >>212
この数字はhtmlとかの直リンも含んでいると思いますけどね
当方でも街区分を自力で検索してますが、同じサイトの別htmlが個別に引っかかるので、
サイト単位にすると結構減ると思います
・・・それでもものすごい数なのは間違いないですが。 趣味というものは金を儲けるのではなく
金をかけるものなんですよ
(仕事=趣味という人を除く) 今更知りましたが、www.geocities.jp のページは、末尾.co.jp でもアクセスできるんですね。
ものすごい量の重複アーカイブが発生していそう・・・ HTTrackのマニュアルを読んでみましたが、なかなか高機能ですねこれ
こちらではwgetを使っていますがHTTrackに乗り換えるかも...
GeoLogさんはどのようなオプションを付けて保存されているんですか? >>220
初期のころはGUI版のデフォルト+αで、あとは問題が発覚するたびに
設定を弄っていったので、統一的なものはないです
私が使いこなせてないだけだと思いますが、
いろいろ曲者なので過度な期待はしない方がいいです
使うのであれば、事前に入念な動作チェックをお勧めします >>221
ありがとうございます
こちらの回線速度の問題もありますがwgetの保存速度が今ひとつでして、同時接続数の設定が可能なHTTrackに目を引かれたという訳です
wgetもオプションの種類が豊富でHTTrackとは別の方向性の柔軟さがあるので、乗り換えするかどうかはもう少し考えてみます
>>211
登録済みでハネられたものも多数あると思いますが、とりあえず手持ちの6962個のURLをlist.txtに追加しておきました(単純行数は52,448)
蛇足ですが、「geocities.jp」でTwitter内検索をかけると結構な数のURLがヒットします
URLを含むツイートは毎日増え続けるので定期的に検索する必要がありますし、botが自動投稿するリンク切れURLといったノイズの除去がやや面倒ではありますが、
手っ取り早くそれなりの数のサイトを見つけられるのでぜひお試し下さい HP更新したら急に表示しなくなったんだけど…障害でもないよね…?
ソフト側(Bind)の設定も弄ってないし接続テストも問題ないんだけど… >>222
追加ありがとうございます。
twitterの検索は盲点でした。結構みんなつぶやいてるんですね。
早速実装して10分枚に検索しながら追加するようにしてみました。
(ただAPI取得が面倒だったので無理やりとあるWebから拾ってる感じですが) 最近になって移転先が貼られ始めたんで今になって確認すると移転先があったり 並列ダウンロードはaria2でも出来ますよ
自分もお気に入りページだけでもやらねば >>222
httrack もそれほど速くはないです(内部的に制限がかけてあります、外せるようですが試してません)
httrack の仕様なのか、発生条件がよく分からないのですが、
拡張子が勝手に.htm から .htmlに変わっているケースが非常に多く、
URLの同一性が維持できていないことが最近分かって、ちょっと頭を抱えています
今は一律置き換えてしまってますが、.htm のままのファイルもあるので、おいおい何か考えないと… >>228
aria2も検討してみたんですが、再帰的ダウンロード(リンクを自動で辿って保存してくれる機能)がないのが痛いですね
wgetの後継として開発されている並列ダウンロード可能なwget2というのがあり、これが実用に足るものかどうか現在調べ中です
(まだ開発途上なので保存に影響するようなバグがあったりするかもしれず、その場合は大人しくwgetを使うつもりです) >>229
そうなんですか...HTTrackもそこまで便利ではないんですね
wget2とwgetで同じサイトをダウンロードして、重篤なエラーが出ないかテストしてみるつもりでいますが、
安定性の面で遥かに勝っているwgetに早くも気持ちが傾いてきています
個人的にどうにかしたいのが、JavaScriptで動的に読まれるリンク・Flashから読み込まれるリンクですね...
これらはwgetでもHTTrackでも読み込めないようなので、別のツールを使う(あるいは作る)などする必要がありそうです
>>227
Twitterで毎日のように「ジオシティーズ終わるの今知ったわ、移転しなきゃ」みたいなつぶやきを目にしますね
最近になって移転を表明してるサイトもlist.txtに含まれてたりして(確認してない) >>231
list.txtは移転の有無は確認してないです。
404じゃなければ追加されます。
なので閉鎖してるサイトもindex.htmlが生きてれば登録されちゃうのですが、個々のサイトを目視していくのも現実的じゃないので、そういう仕様にしてます。 wget再帰は正攻法
URI取得はweb-archiveを利用する手もありそう。
ttps://web.archive.org/web/20050116054806/http://pages.yahoo.co.jp/ >>235
うへ、マジだ
広告なしで使いたかったら 更新手続き FTPかファイルマネージャ 両方やらなきゃいけないのか
うーんこの この3か月で消えるサービス群も、アーカイブされずに消えるページが相当多そうですね。。。 スターサーバーにしてもXFREEにしてもジオシティーズからの移転先としてはあまりよろしくないですね
結局XREAかー >>237
ジオシティーズが閉鎖したら、次は三ヶ月で消えるサービス群のURLの収集を始めた方が良さそうですね... xreaのコントロールパネルが容認できないので、忍者かfc2しかない。
tok2はなんかやだ。 >>240
siliconvalley1000.web.fc2.com (例:オール小文字+数字4桁の単純変更
住所登録やSMSを使うのは面倒なので fc2で済ませた。アドレスもwebだけで綺麗な方 >>200
頭のhを抜いたり、あまつさえwから始めるのがウザいってんだよ
頭にhを抜く必要性を理解できないバカの巣窟かここは GeoCities消えるんで放置してたコンテンツ移動先さがしにここにきたが
Xreaら忍者で選べばええんやね?
2005年に作ったやつで10年以上放置してたやつなんでHTMLだけで全然OKなんだが 無料で放置しても消されなくて広告なしはXREAだけやでー 広告はどうでもいいんだ
放置しとけるなら、今でも需要があるのでサイトだけ残しておいてやりたいだけなんだ サービスが終わらなさそうという観点から見ればFC2が一番安全な気がする 多少めんどくさくてもいいならgithub pagesも有りといえばあり GitHubはMicrosoftの傘下に入ったし利用者も全世界中に大量にいるので、ある意味FC2より安全かも
CGIは動かせないのが欠点ではあるけど(JSは動く) GitHub Pages、PHPも動かんやん・・・Gitクライアントのハードル結構高いと思うわ
誰かサルでもわかる説明書いてやー >>255
GitHub Pagesは静的なページ(HTML, CSS, JSのみのページ)しか動かせない仕様
PHPでCGIをバリバリ動かしたい人には向かない >>24
これ自分だ
もう2月
何もできてない。。。 >>260
Netlify使いましょう!
ブラウザでフォルダごとドラッグ&ドロップするだけ! そういえばGAE/PHPって乗り換え先に出てきそうなもんだけど ■ このスレッドは過去ログ倉庫に格納されています