【和塩】geocitiesスレ9【ジオシティーズ】
■ このスレッドは過去ログ倉庫に格納されています
>>566
落ち着け、対処できるのはGeoLog管理人しかいないんだからしょうがない
ソースを見たけどGeoLog内の相対リンクの記述がおかしいみたい
URLの抜けてるところを補ったらちゃんとアーカイブが表示されたし、とりあえずは保留のままでいいんじゃないかな 既に5TB位クロール出来たけど
これローカルで検索できるようにしないと一生見ないだろうな >>570
お疲れ、相当集めたな
死蔵するのはもったいないし、できればGeoLogのように公開してほしい 自分の手元には保存したが、ネットで話題が出た時リンクを出せないのは痛いな…
管理者がわからないサイトで管理者に本の全文掲載許可が出て本の内容がアップロードされてたので、再掲載ができない
著者は生きてるかもわからんし、医学部の闇の問題だしなぁ… >>572
そういうのはウェブ魚拓かInternetArchivesに手動で保存させとけばいい >>572
「アーカイブの内容は全て元サイトの作成者に帰属します」とか何とか書いて逃げ道を作っとけ
万が一削除依頼が来たら非公開設定にしとけばええんや >>570
linuxのnamazuって全文検索エンジンって
まだ使えるのかね >>572
書籍を出版するのに伴って、それ以前はインターネット上に文章公開していたものを
取り下げた、閉鎖した、というならそれは
文章を読みたいなら本を買ってね、という著者の意志表示でもあって
URLリンクを出すのははばかられる、というのはあるかもしれない
けれども、出版して、著者自身も出版社も公認で書籍内容を全文公開していたなら
それは別に、今後もURLリンクを提示して問題ないのでは >>583
街区(アドレスに4桁の番号が入ってる奴)は
番号総当たり(1000-9999)でクロール済み。
ここで募集してるのは、番号のついていない奴。
番号なしはアドレスを知らないと見つけられないので。 身内のサイト番地だけど検索避けの設定してたからか登録できちゃったわ >>583
Invalid URLメッセージが出たのは既に総当たりクロール済みだから。
>>185にその辺りの説明があれば良かったんだけどね。 index3.htmlみたいに離れ小島みたいに隠しページ風に作ってあって
トップページからでは行けないサイトもあったけどそういうのは保存されてないんだろうな
一応保管のサイトにアドレス登録?はしたのでサクセス!みたいな言葉は出たけど >>589
そういうのはまさに185に登録すべきものであります! >>565,566,568,569
ごめんなさい、相対リンク変換スクリプトに食わせたときにどこかのパラメータを間違ったようで、
ドメイン部分が欠損したリンクができてます。
新ジオ分は問題ないはずですが、旧ジオ分の一部で発生していることは確認してます。
追々直しますので勘弁してください。 >>591
保存してもらってるだけでありがたいので
あんま気にしないでくださいw 一応Internet Archiveも動いてるようだけど、全部保存出来るのだろうか Internet Archive は信頼性高いからここにも保存したほうがいいのかも。 結局>>185のリストのサイトは誰が保存してるの? >>599
情報再掲サンキュー
その人にもここに何か状況報告とかしてほしいね スレチかもしれないけど
geocitiesをarchive.orgに保存する時ってトップページだけじゃなくてリンク先のページごと(URLごと)に保存していかないといけないんだよね?
一度にできるよ 途中送信失礼
リンク先も一度に出来るようなやり方とかないの? リスト登録ってもしかしてトップページだけとか子ページだけとかじゃ駄目なのか。全部手動登録? >>602
たぶんない
>>604
トップページからリンクさえ貼ってあれば子ページは辿れるからそこまでしなくてもいいと思う 逆に言うとどのページからもリンクされてない孤立ページは全部手動登録しないとダメ >>605 >>606
ありがとう。てことはWayBackMachineの方が手間が多いんだね。 ArchiveTeamは自前サーバーで集めたデータをInternet Archiveに提供してる
大抵のジオシティーズサイト(全部ではない)に2018年以降に取られたInternet Archiveのアーカイブがあるのはおそらくこのため アーカイブデータをBitTorrentで共有しよう(提案)
http://www.ceena.net/ >>608
じゃあ ArchiveTeam に抜けてる URL を送ってクロールしてもらったほうがいいのかな
31 日までにもう一度クロールする予定みだいだね 調べたら Archive-It で代理クロールの依頼ができて Wayback Machine にも適用されるみたい
手動でやるなら拡張機能を使って手間を省くらいしかないかも 無知ですみません
co.jpの方のサイトで登録されてなさそうなのがあったのでhttps://geo.98nx.jp/に登録しようと思ったんですが
index.htmlだと登録できないんですか?
「index.htmlが存在しないサイトはhtmlのURLを入力してください。」とあるからindex.htmlだと登録できると思ったんですが >>604
ジオシティーズのそのアカウントのディレクトリ・フォルダ内部で
リンクになっていない、どこからも孤立しているWebページに関しては
そのページごとにリスト登録しないと分からないだろう co.jpでindex.htmlがあるサイトだと番号総当たりで浚えるから必要ないのか
失礼しました>>613はスルーしてください
index.htmlがないサイトだけ登録しておきます >>613
geo.98nx.jp のフォームにURLを放り込んで
geo.98nx.jp 側でそのURLにつき実在を確認できれば、 Success! になる
index.htmlが存在しないサイトなら、別の
ジオシティーズ jp/xxxxx/xxxxx.html などの実在するURLを放り込む必要がある
それがたとえば top.html などでインデックス代わりになっていれば
配下の個別ページにリンクが通じていれば、それでいいだろう
ジオシティーズ jp/xxxxx/ 以下のディレクトリ、フォルダに
バラバラに孤立して複数Webページが存在するなら、それら全部のURLを
フォームに放り込んだほうがいいだろう
バラバラに孤立して複数Webページが存在するうちのひとつだけを登録しても
FTPアクセスするわけじゃないから、他の孤立したページまでは自動では拾えないだろう
登録しても、それをもとにクロールしてデータをアーカイブするのはまた別の作業なので
登録しただけで確実にアーカイブされるとはいえない、早めに登録したほうがいい >>615
それは分からない
たとえば、サイト全部のデータ中身を残したままで
サイト移転で index.html をまっさらにしてリダイレクトをかけている場合など >>616
index.htmlが存在するサイトでもInvalid URLになるので、旧urlのco.jpのサイトはindex.htmlじゃ登録できないみたいです
>>617
そういうサイトの場合はリンクが残ってるページがある場合はそこを登録しておこうと思います >>619
index.htmlとindex.htmが分離してる系多いよね
自分は昨日気付いたんだけど、185に登録できないからどうすればいいか頭抱えてる このレスの増え方…夏休みの宿題ギリギリにやる人多すぎだろw >>621
皆が7月からコツコツやるタイプなら良かったんだけど、まあ今更言っても仕方ないやね >>621
確定申告と相まって2度夏休みを迎えた気分だったw >>621
正直、海外の人がほぼやってくれてるから後は Internet Archive にまだ乗ってないやつを探すだけだよ >>619
とりあえずWayback Machineに全部保存してこい アーカイブ作業して下さっている方本当にありがとうございます、お疲れ様です
>>597
こことかですね
http://ifs.nog.cc/
ヤジ研にあった古い世界地図のアーカイブもあって嬉しかったです
http://ifs.nog.cc/keropero888.hp.infoseek.co.jp/ >>626
インターネット・アーカイブへの保存は去年の段階で完了してます
geocities終了以前から消えそうなサイトをアーカイブに保存する作業を一昨年から進めてましたんで >>628
凄いですね
夏休みの宿題範囲を見越して一学期からやってた人がいたとは >>627
そのサイトInternet Archiveで96回保存されてて笑ってしまった
https://web.archive.org/web/*/keropero888.hp.infoseek.co.jp/
今回のもそうだけど消えてほしくないサイトはどんどんInternet Archiveで保存しよう
世界一信頼性が高くて、裁判で使える証拠にもなるから >>610
ファイルサイズすごいことになりそうだけど
自分もそれが理想かも >>629
biglobe系サイトは最近までアーカイブから除外されてたんですが
最近はアクセスできるようになったので進めてます
でも、あそこアクセスできるようになったりできなくなったりで安定しないんで
見たいサイトを探るなら今のうちにやったほうがいいと思いますよ 保管するのもそうだけど
管理人に直接移転をオススメするのもやった方が良いよ
Infoseekの時は掲示板に書き込んだら気付いて移転してくれたサイトとかある 最終日までできるだけ検索と保存がんばりましょう
自分は昔のようになかなか集中力が続きませんがw >>185にトップページ保存してsuccess出て、子ページ東麓してもsuccessが出た
子ページって自動登録されてないの? >>635
ミスった
東麓じゃなくて登録というか保存 >>635
トップページからリンクで辿れる子ページは、わざわざ登録する必要が無い。
登録しようとするとsuccessが出るが、無駄な行為。 (むしろリストが肥大化して迷惑)
トップページからリンクで辿れない、隠しページは個別に登録する必要がある。
登録するとsuccessがでるが、これは有用な行為。 なお
隠しページ1からリンクで辿れが、(トップから辿れない)隠しページ2の場合
隠しページ1だけ登録すればいい。
隠しページ1からスタートして隠しページ2をクロールするので。 >>637
子ページでも重要な場合は入力したほうがいいと思う
全て回りきれる保証はないからね >>673 >>679
どっちやねん
とりあえずトップは保存しておく アドレスはジオじゃないのにドメインがジオだから結局消えるページもあるらしい
見てもわからんから多分俺じゃ逃すだろうけど >>642
フレーム内に他ドメインのページ表示してるページ
昔は良くあったからなw 保存するときに被りのチェックはするだろうし
そこまで迷惑にはならないと思うけど >>642
これで全部だよ
だいぶ移行が進んでるみたいだけど
https://web.archive.org/web/20181004152609/https://transfer.sh/QYWEG/geocities-dns-data >>643
なんでわざわざww
>>645
ページ見たけどよくわからんかった
でもすごいな集まったんだ >>646
容量足りなくて資料ページだけ別サービスのページとか知り合いのところであったわ
もちろん規約違反だけどサービス終了まで問題なく使えてた >>645
geocities-dns-data (140 KB)
という拡張子不明のファイルが自動で落ちてくるのですが >>649
中身ただのテキストですね
IPアドレスとドメインの対応を調べて、Geocitiesでホストされているページを探した感じですかね >>633
10年ぐらい機能してないと思い込んでいたメールフォームというかmeilto経由で
「続けて下さい」と送ってくる人がいた昨年10月頃 >>647
和塩(初期)は容量が少なすぎて何カ所かに分散してる人を思いだした 固定されたツイート
吉田一郎 @no_saitama
3月31日のgeocities閉鎖後も、私のHPは引き続きこちらで公開しています。
さいたま市議会議員 吉田一郎
https://web.archive.org/web/20190326062513/http://www.geocities.co.jp/WallStreet-Stock/9297/
世界飛び地領土研究会
https://web.archive.org/web/20190326061531/http://www.geocities.co.jp/SilkRoad-Lake/2917/
野次馬的アジア研究中心
https://web.archive.org/web/20190326061750/http://www.geocities.co.jp/SilkRoad/9613/
午前1:52 ・ 2019年3月29日 ・ Twitter Web Client
https://twitter.com/no_saitama/status/1111310186470244352
https://twitter.com/5chan_nel (5ch newer account) >>653
それを公開していると言えるのだろうか? 最終日まで取り込みが続きそうだから転送設定は行ってない
31日の23時55分頃に設定しようと思いつつ忘れるか入力に手こずって失敗しそう… そういえば4月以降の計画ってあるの?
外部リンク先のアーカイブとか
ファイルだけアップローダのサイトとかそこそこありそうだし・・・ スレチだけどさ
国会図書館とかにさ
希望者は自分のwebページ保存してもらえるようにならんかね
google consoleみたいに所有者だけアップロードする仕組みにして
自分が死んだ後も残したい資料、あるんだよね >>665
まだ生きている内部のページを教えてくれ ■ このスレッドは過去ログ倉庫に格納されています