ちょうど10年分、6000近い記事をいまからどうやってアーカイブすりゃいいのか見当つかん。
Yahooブログって複数画像あると別ページ扱いになるから一括取得できない
1つの記事で数回アーカイブする必要がある。面倒ったらない。
Web魚拓は消える消される廃業リスクあるから、Wayback Machineしか信用できないし。
アクセス過多で弾かれるし。同じ記事でも複数のURLで表示できるから
どのURLで取得すると補完率が良いのとか、テクニックを知りたくてここにきたけど、みんな地道にやってるだけなんだな。
静的なサイトなら数GBあっても数時間でコンプできるけど、ブログは読み込むファイル多すぎて
ローカル保存でさえアナライズに時間がかかる。