新ジオのURLを手動収集する過程で気づいたことだが、
index.htmlが見れなくても、深い階層のディレクトリにあるページは普通に閲覧できるサイトがかなり多い(URLの自動収集が困難)
そして独自ドメインのジオシティーズサイトも地味に多い(URLにgeocitiesが入ってないのでGoogle検索やはてブから見つけられない場合がある)
当初考えていたよりも生きているページを見つけにくくて閉口してる