X



【和塩】geocitiesスレ9【ジオシティーズ】
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。
垢版 |
2018/12/04(火) 17:23:54.950
2019年3月末で終了するgeocitiesは果たして良い鯖だったのか?
みんなでマターリ語りましょう

Yahoo!ジオシティーズからのお知らせ
http://geocities.yahoo.co.jp/v/info/index.html
拡張版ジオシティーズ
http://geocities.yahoo.co.jp/
全サービス(ジオプラス(有料)を含む)
http://geocities.yahoo.co.jp/services
旧ジオシティーズ
http://www.geocities.co.jp/ (新ジオに転送)
サービス終了のお知らせ - Yahoo!ジオシティーズ
https://info-geocities.yahoo.co.jp/close/index.html

前スレ
【和塩】geocitiesスレ8【ジオシティーズ】
https://mevius.5ch.net/test/read.cgi/hosting/1247739072/

関連スレ
【Yahoo!】ジオログ【ジオシティーズ 】
http://pc11.2ch.net/test/read.cgi/blog/1099695255/
Yahoo!メール 11通目
http://pc11.2ch.net/test/read.cgi/esite/1236083806/
▼▲▼米塩が・・▼▲▼
http://pc11.2ch.net/test/read.cgi/hosting/1015764845/

規約違反サイトや痛いサイト晒しは板違い。ネットwatch板で。http://pc11.2ch.net/net/
0579名無しさん@お腹いっぱい。
垢版 |
2019/03/28(木) 17:59:11.630
>>572
書籍を出版するのに伴って、それ以前はインターネット上に文章公開していたものを
取り下げた、閉鎖した、というならそれは
文章を読みたいなら本を買ってね、という著者の意志表示でもあって
URLリンクを出すのははばかられる、というのはあるかもしれない
けれども、出版して、著者自身も出版社も公認で書籍内容を全文公開していたなら
それは別に、今後もURLリンクを提示して問題ないのでは
0584名無しさん@お腹いっぱい。
垢版 |
2019/03/28(木) 20:04:15.910
>>583
街区(アドレスに4桁の番号が入ってる奴)は
番号総当たり(1000-9999)でクロール済み。

ここで募集してるのは、番号のついていない奴。
番号なしはアドレスを知らないと見つけられないので。
0588名無しさん@お腹いっぱい。
垢版 |
2019/03/28(木) 20:42:46.960
>>445 >>586
こういう感じのものでしょうか

https://thaliana.mydns.jp/GeoLog/www.geocities.co.jp/MotorCity-Circuit/
(not found) http://www.geocities.co.jp/MotorCity-Circuit/9781/

https://www.google.com/search?q=%22geocities.co.jp/MotorCity-Circuit/9781%22
グーグルでも全部は拾えていないようで、URL最後部HTMLファイルの数字を変えて直に手打ちでも
しかしNGワード規制で当地にURL貼れず、>>185 のリストに入れてみます
0589名無しさん@お腹いっぱい。
垢版 |
2019/03/28(木) 21:11:15.520
index3.htmlみたいに離れ小島みたいに隠しページ風に作ってあって
トップページからでは行けないサイトもあったけどそういうのは保存されてないんだろうな
一応保管のサイトにアドレス登録?はしたのでサクセス!みたいな言葉は出たけど
0591GeoLog Project ◆RJRIJK3wcLw8
垢版 |
2019/03/28(木) 21:36:34.850
>>565,566,568,569
ごめんなさい、相対リンク変換スクリプトに食わせたときにどこかのパラメータを間違ったようで、
ドメイン部分が欠損したリンクができてます。
新ジオ分は問題ないはずですが、旧ジオ分の一部で発生していることは確認してます。

追々直しますので勘弁してください。
0594名無しさん@お腹いっぱい。
垢版 |
2019/03/28(木) 22:34:30.790
>>592
http://www.geocities.jp/ahya_nico/seikan.html
http://www.geocities.jp/ahya_nico/seikan.mld
http://www.geocities.jp/ahya_nico/seikan.mmf
http://www.geocities.jp/ahya_nico/awake.mld
http://www.geocities.jp/ahya_nico/awake.mmf
http://www.geocities.jp/ahya_nico/awake_voda.mmf
http://www.geocities.jp/ahya_nico/rosin.mld
http://www.geocities.jp/ahya_nico/rosin.mmf
http://www.geocities.jp/ahya_nico/ff4main.mld
http://www.geocities.jp/ahya_nico/ff4main.mmf
http://www.geocities.jp/ahya_nico/ff4main_voda.mmf

>>185 に登録しておきました
0596名無しさん@お腹いっぱい。
垢版 |
2019/03/28(木) 23:02:14.500
Internet Archive は信頼性高いからここにも保存したほうがいいのかも。
0600598
垢版 |
2019/03/29(金) 00:12:09.720
>>599
情報再掲サンキュー
その人にもここに何か状況報告とかしてほしいね
0601名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 02:48:21.240
スレチかもしれないけど
geocitiesをarchive.orgに保存する時ってトップページだけじゃなくてリンク先のページごと(URLごと)に保存していかないといけないんだよね?
一度にできるよ
0602名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 02:51:19.420
途中送信失礼
リンク先も一度に出来るようなやり方とかないの?
0603名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 05:12:59.350
登録お願いします!!
https://pastebin.com/raw/17hLpsN5
https://gist.githubusercontent.com/DoomTay/12a146e35fcee745b764ba3ae3c7545f/raw/863a021e43e0c93cb6f8943725a2ef5d1a699477/geocities-danbooru.txt
https://archive.org/download/archiveteam_archivebot_go_20181007210002/urls-transfer.sh-geocities-patch.txt-inf-20181007-195532-31ges-urls.txt
https://archive.org/download/archiveteam_archivebot_go_20181021150002/urls-transfer.sh-geocities-misssp.txt-inf-20181007-102152-3ntkw-urls.txt
https://transfer.sh/uPLU4/biscrapes.txt
https://etc.sanqui.net/archiveteam/geocities.jp_various.txt
https://web.archive.org/web/20181004152609/https://transfer.sh/QYWEG/geocities-dns-data
https://anonfile.com/z1z62ak8ba/records_zip
https://www.google.com/search?q=site:*.geocities.jp
0608名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 10:02:28.970
ArchiveTeamは自前サーバーで集めたデータをInternet Archiveに提供してる
大抵のジオシティーズサイト(全部ではない)に2018年以降に取られたInternet Archiveのアーカイブがあるのはおそらくこのため
0609名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 10:03:16.040
>>605
ありがとう
0611名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 10:52:51.810
>>608
じゃあ ArchiveTeam に抜けてる URL を送ってクロールしてもらったほうがいいのかな
31 日までにもう一度クロールする予定みだいだね
0612名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 11:05:36.550
調べたら Archive-It で代理クロールの依頼ができて Wayback Machine にも適用されるみたい
手動でやるなら拡張機能を使って手間を省くらいしかないかも
0613名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 12:01:05.580
無知ですみません
co.jpの方のサイトで登録されてなさそうなのがあったのでhttps://geo.98nx.jp/に登録しようと思ったんですが
index.htmlだと登録できないんですか?
「index.htmlが存在しないサイトはhtmlのURLを入力してください。」とあるからindex.htmlだと登録できると思ったんですが
0614名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 12:13:19.300
>>604
ジオシティーズのそのアカウントのディレクトリ・フォルダ内部で
リンクになっていない、どこからも孤立しているWebページに関しては
そのページごとにリスト登録しないと分からないだろう
0615名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 12:32:30.360
co.jpでindex.htmlがあるサイトだと番号総当たりで浚えるから必要ないのか
失礼しました>>613はスルーしてください
index.htmlがないサイトだけ登録しておきます
0616名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 12:40:12.770
>>613
geo.98nx.jp のフォームにURLを放り込んで
geo.98nx.jp 側でそのURLにつき実在を確認できれば、 Success! になる
index.htmlが存在しないサイトなら、別の
ジオシティーズ jp/xxxxx/xxxxx.html などの実在するURLを放り込む必要がある
それがたとえば top.html などでインデックス代わりになっていれば
配下の個別ページにリンクが通じていれば、それでいいだろう
ジオシティーズ jp/xxxxx/ 以下のディレクトリ、フォルダに
バラバラに孤立して複数Webページが存在するなら、それら全部のURLを
フォームに放り込んだほうがいいだろう
バラバラに孤立して複数Webページが存在するうちのひとつだけを登録しても
FTPアクセスするわけじゃないから、他の孤立したページまでは自動では拾えないだろう
登録しても、それをもとにクロールしてデータをアーカイブするのはまた別の作業なので
登録しただけで確実にアーカイブされるとはいえない、早めに登録したほうがいい
0617名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 12:43:59.000
>>615
それは分からない
たとえば、サイト全部のデータ中身を残したままで
サイト移転で index.html をまっさらにしてリダイレクトをかけている場合など
0618名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 12:46:10.200
>>616
index.htmlが存在するサイトでもInvalid URLになるので、旧urlのco.jpのサイトはindex.htmlじゃ登録できないみたいです
>>617
そういうサイトの場合はリンクが残ってるページがある場合はそこを登録しておこうと思います
0619名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 12:50:03.680
http://www.geocities.co.jp/Playtown-Dice/8321/というサイトなんですが

http://www.geocities.co.jp/Playtown-Dice/8321/index.html
http://www.geocities.co.jp/Playtown-Dice/8321/index.htm

上記のhtmページとhtmlページが別内容な上に
内部でhttp://www.geocities.co.jp/Technopolis-Mars/2552/(こちらは小説内容の保存だけで基本的にリンクなし)と合体しているという複雑怪奇なページなんです
正常に登録するにはTechnopolis-Mars/2552/のページを手動登録しないとダメですかね?
0620名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 13:49:07.520
>>619
index.htmlとindex.htmが分離してる系多いよね
自分は昨日気付いたんだけど、185に登録できないからどうすればいいか頭抱えてる
0625名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 15:04:54.860
>>621
正直、海外の人がほぼやってくれてるから後は Internet Archive にまだ乗ってないやつを探すだけだよ
0628名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 15:31:48.810
>>626
インターネット・アーカイブへの保存は去年の段階で完了してます
geocities終了以前から消えそうなサイトをアーカイブに保存する作業を一昨年から進めてましたんで
0632名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 15:45:52.030
>>629
biglobe系サイトは最近までアーカイブから除外されてたんですが
最近はアクセスできるようになったので進めてます
でも、あそこアクセスできるようになったりできなくなったりで安定しないんで
見たいサイトを探るなら今のうちにやったほうがいいと思いますよ
0633名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 15:52:35.260
保管するのもそうだけど
管理人に直接移転をオススメするのもやった方が良いよ
Infoseekの時は掲示板に書き込んだら気付いて移転してくれたサイトとかある
0634名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 16:45:00.800
最終日までできるだけ検索と保存がんばりましょう
自分は昔のようになかなか集中力が続きませんがw
0635名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 17:35:34.230
>>185にトップページ保存してsuccess出て、子ページ東麓してもsuccessが出た
子ページって自動登録されてないの?
0636名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 17:36:29.530
>>635
ミスった
東麓じゃなくて登録というか保存
0637名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 17:42:55.990
>>635
トップページからリンクで辿れる子ページは、わざわざ登録する必要が無い。
登録しようとするとsuccessが出るが、無駄な行為。 (むしろリストが肥大化して迷惑)

トップページからリンクで辿れない、隠しページは個別に登録する必要がある。
登録するとsuccessがでるが、これは有用な行為。
0638名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 17:45:20.520
なお
隠しページ1からリンクで辿れが、(トップから辿れない)隠しページ2の場合
隠しページ1だけ登録すればいい。

隠しページ1からスタートして隠しページ2をクロールするので。
0639名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 17:48:42.860
>>637
子ページでも重要な場合は入力したほうがいいと思う
全て回りきれる保証はないからね
0640名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 17:53:45.830
>>673 >>679
どっちやねん
とりあえずトップは保存しておく
0642名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 17:59:54.570
アドレスはジオじゃないのにドメインがジオだから結局消えるページもあるらしい
見てもわからんから多分俺じゃ逃すだろうけど
0644名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 18:03:03.120
保存するときに被りのチェックはするだろうし
そこまで迷惑にはならないと思うけど
0646名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 19:23:41.560
>>643
なんでわざわざww
>>645
ページ見たけどよくわからんかった
でもすごいな集まったんだ
0647名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 19:31:52.470
>>646
容量足りなくて資料ページだけ別サービスのページとか知り合いのところであったわ
もちろん規約違反だけどサービス終了まで問題なく使えてた
0648名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 20:08:07.790
>>647
なるほど
0650GeoLog Project ◆RJRIJK3wcLw8
垢版 |
2019/03/29(金) 20:55:27.000
>>649
中身ただのテキストですね
IPアドレスとドメインの対応を調べて、Geocitiesでホストされているページを探した感じですかね
0651名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 21:02:26.140
>>633
10年ぐらい機能してないと思い込んでいたメールフォームというかmeilto経由で
「続けて下さい」と送ってくる人がいた昨年10月頃
0653名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 21:52:39.890
固定されたツイート
吉田一郎 @no_saitama
3月31日のgeocities閉鎖後も、私のHPは引き続きこちらで公開しています。
さいたま市議会議員 吉田一郎
https://web.archive.org/web/20190326062513/http://www.geocities.co.jp/WallStreet-Stock/9297/
世界飛び地領土研究会
https://web.archive.org/web/20190326061531/http://www.geocities.co.jp/SilkRoad-Lake/2917/
野次馬的アジア研究中心
https://web.archive.org/web/20190326061750/http://www.geocities.co.jp/SilkRoad/9613/
午前1:52 ・ 2019年3月29日 ・ Twitter Web Client
https://twitter.com/no_saitama/status/1111310186470244352
https://twitter.com/5chan_nel (5ch newer account)
0654名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 22:07:56.630
>>653
それを公開していると言えるのだろうか?
0656名無しさん@お腹いっぱい。
垢版 |
2019/03/29(金) 22:46:34.680
>>653更新できないwww
0659名無しさん@お腹いっぱい。
垢版 |
2019/03/30(土) 00:34:04.690
最終日まで取り込みが続きそうだから転送設定は行ってない
31日の23時55分頃に設定しようと思いつつ忘れるか入力に手こずって失敗しそう…
0660名無しさん@お腹いっぱい。
垢版 |
2019/03/30(土) 01:13:04.020
そういえば4月以降の計画ってあるの?
外部リンク先のアーカイブとか
ファイルだけアップローダのサイトとかそこそこありそうだし・・・
0664名無しさん@お腹いっぱい。
垢版 |
2019/03/30(土) 07:58:04.260
スレチだけどさ
国会図書館とかにさ
希望者は自分のwebページ保存してもらえるようにならんかね
google consoleみたいに所有者だけアップロードする仕組みにして

自分が死んだ後も残したい資料、あるんだよね
0669名無しさん@お腹いっぱい。
垢版 |
2019/03/30(土) 10:44:36.770
>>667
多分そういうツールの使い方が分からない人か、抜けてるURLを補完しようという純粋なボランティア精神かのどっちか
トラブルでもない限り、ここに書くより185に自分で登録する方が早いんだけどな
0670名無しさん@お腹いっぱい。
垢版 |
2019/03/30(土) 10:46:05.370
俺もちょくちょく保存を開始しているけど、いったい全体のサイトの数ってどのくらいなんだろうな
保存しに行ったら移転したって出るとちょっとほっとするけど、
有るサイトでは3月31日で終わります今までありがとうって文を残して更新してるのは切なくなった
0671名無しさん@お腹いっぱい。
垢版 |
2019/03/30(土) 10:55:35.910
Internet Archive への保存は簡単だよ
ここにアクセスしてSave Page NowにURL入れて送信するだけ
https://archive.org/web/

おそらく一生保存されるし, 信頼性高いからおすすめ
ページを見たいときは BROWSE HISTORY に URL を入れるだけ
0672名無しさん@お腹いっぱい。
垢版 |
2019/03/30(土) 10:57:52.350
ありがと
取り合えず全部ぶち込んでおくわ
けど完全に保存されるかね? そのサイトで削除されたサイト見てたらページによっては見れなくなったりしない?ネットにあまり詳しくないんだ
0674名無しさん@お腹いっぱい。
垢版 |
2019/03/30(土) 11:05:07.680
>>672
ログインが必要なページ以外はいけるよ
0675名無しさん@お腹いっぱい。
垢版 |
2019/03/30(土) 11:15:16.510
>>672
Save Page Nowの場合、基本的にリンクは辿ってくれないという弱点がある
だからトップページだけじゃなく子ページも全部登録する必要がある
673が紹介してる拡張機能で時短するのがオススメ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況