Internet Archive総合 (web.archive.org) #2 ©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
リンク先がなにもない真っさらなページだった時ってもう諦めたほうがいいですか? たしかに2/19にとったやつが消えてますね
前もこんなこと1週間くらい続いたけど戻ったときがあったので様子見ですかね アーカイブのサイトが何だかおかしいね
当サイトは昨日「Sorry,we are busy」なんていう
初めて見た表示が出た
ウェブ魚拓は今日の午前中重かった
Archive isは断続的にキレる
一体全体どうなってるのか yahoo!ブログまでサービス終了だ
どんどん老舗が消えていくなあ ネットのデータは儚い Yahoo!ブログ消えるのにYahoo!系はなぜかInternet Archiveで保存しても全部トップページに転送されちゃうから保存できないんだよな… 何だか重くなってるぞ
20分くらい前にはアクセス不能になっていたし 2日前くらいからarchive.orgの再生時画面が小さくなってしまって辛い
全画面だと作業が出来ないしなあ >>379
このトップページ転送本当どうにかならんのかな。 >>383
何なんだろうなこれ
自前でHeritrix回すとどんな感じになるんだろう
Yahooブログアーカイブ活動の本スレ
http://mevius.5ch.net/test/read.cgi/blog/1554380939/ 魚拓もInternet Archiveも引っ掛からないスレタイって >>388
サンクス。
adblockの詳細設定のマイフィルターリストに「*/yjsecure.js」を登録してadblock有効で転送されなくなった。 http://mevius.5ch.net/test/read.cgi/internet/1554553882/78-79
/save/ を知ってて /web/2/ を知らないとは。
あと保存の際に http:// や https:// を無条件に外すのも考え物。
HTTP から HTTPS へリダイレクトするサイトだと、そのリダイレクトも
保存回数に計上されてしまう。 >>392
そのブックマークレットを作った人間ではないけど、Wayback Machine初心者の自分に/web/2/が何なのか教えて下さい
あと保存回数の計上が増えると何か問題があるの? /save/知ってるのはgeocitiesのスレの方で多用されてたからじゃないかな >>395
これ
/web/2/は初めて聞いたけどその二つは言うほど特別な知識ではないと思うよ >>398
っぽいですね。
https://i.imgur.com/gZyzB5u.png
ただ、アーカイビングとインデクシングはそれぞれ独立しているみたいなので、
後者だけでデータの欠落が発生しているという可能性もあると思います。 全ページ内全文検索はまだ?
なんか問題でもあるのか? 昔やってたけどすぐ立ち消えたからきつかったんじゃね Scheduled Maintenance
先ほどからこの表示
長くなりそうか? >>406
機械翻訳使ったのかどうか知らんが、文章の意味を読み取れて無いだけやんか。 >>406
米国政府のサイトと米軍のサイト限定って書いてあるな
そこまで強調して書いてある訳ではないとは言えもうちょっと慎重に読もう
しかし、robots.txtが邪魔なら全サイトで無視しちゃば良いのにな
どうせ法的拘束力はないんだし 過去分リストが今日から(?)マイナーチェンジしている件 自動的に最新ログの年に飛ばない気がする。2019年。 数分前から「HTTP ERROR 400」と出て使えない 手動で1ページ1カテゴリーづつ保存するの面倒くさいんですけど、
自動巡回で指定のサイトやブログをhttps://web.archive.org/に保存出来る方法なんて無いですよね?
毎日毎日徹夜で保存して疲れた…保存しても保存してもキリがない… >>413
>毎日毎日徹夜で保存して疲れた…
>保存しても保存してもキリがない…
アーカイブサイト全般のユーザーの
最大の悩みでもあるな
一度やり始めたら強迫観念が出てきて
毎日やらねばならなくなる
しかも誰もがやっているわけじゃなさそうだから
自分が休んでも他の人が補完してくれる保証はないしね やろうと思えばプログラム組んで出来るよ、ネット探せば色々見つかる
さっきWebアーカイブ総合スレに投稿されたやつを転載
0175 py ◆o3kzHb/in8w0 2019/05/14 19:06:58
https://u1.getuploader.com/irvn/download/1657
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14
web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■
動作試験環境:windows10pro Irvine1.3.1 IAヘビーユーザーが多いであろうここの住人なら、
自動化手段を発見済みかスクリプト自作してる人がいるだろうと思ってたが、案外そういう訳でもないのかな >>414-416
ありがとうございます。
勇気出して聞いてよかった…頑張る archive.orgにファイルアップロードしてる人っている? 重宝していた攻略サイトが消えてしまった・・
アーカイブされていたのに何故?何が原因でまるごと
消えてしまったんだ? archive.orgにファイルアップロードしてる人っている? ベータ版の新しいSave Page Nowを使ってみたかったからユーザー登録してみた
思いのほかあっさり登録できて少し驚いた 今、サーバーエラー出てる
503 Service Unavailable
No server is available to handle this request. スマホからSave Page Nowを使ってTwitterをアーカイブしようとすると必ずエラーを吐いてくる
PCではそんなことになった経験がないんだけど何がおかしいんだろう
あと、これはスマホもPCも関係ないんだが、
Internet Archiveの場合ツイートがjsonと解釈さ
れてしまう場合が多い
Archive.todayやmegalodonは普通のHTMLコンテンツと解釈してくれるんだが、IAだと何でjsonになってしまうんだろう エラー入りました(この表示は初めてだ)
500 Internal Server Error
nginx/1.10.3 (Ubuntu) にしてもこうまで長時間の「メンテナンス」はいつ以来か 最近400errorみたいな表示が多かったのは前兆だったのか・・・? >>424
> ベータ版の新しいSave Page Now
初耳 なんか保存済みページをIA開いて記事とかの2ページ目から3ページ目に移動しようとすると2ページ目に移動する(移動できてない)。
なんかちょっとおかしい。 そのサイト
スクリプトでページ切り替えてるんでねーの? imgur直リンがSavePageNow出来なくなった。 Twitterをアーカイブすると必ず表示が崩れる人がいるんだが
あれって何なんだろうか 最近保存してないけどツイッターいつもUIが謎の外国語になってたわ >>451
それ多分IAが経由してるサーバーの国の言語で表示されてるんだと思う これarchive.vnだと保存できない奴も保存出来るから便利 これが示すのはInternet Archive Wayback Machineのことだろ。 https://web.archive.org/web/20190727084527/https://toyokeizai.net/articles/-/293979?page=2
東洋経済の記事で未保存記事を1ページ目を保存して、1ページ目のアーカイブから2ページ目のリンクを開くと
保存されていないから当然保存用のリンクが表示されるけど、2ページ目のアーカイブから3ページ目のリンクを
クリックすると2ページ目のアーカイブが再度表示される。
以前だったら連続で保存できたのにできなくなって直接SavePageNowに打ち込むしかなくなったっぽい。 https://toyokeizai.net/articles/-/293789
https://toyokeizai.net/articles/-/294305
この 2 つを Internet Archive の入力欄に突っ込んでやってみたけど、
どちらも先頭から最後のページまで、"This page is available on the web!" を経て保存できたけどなぁ。
https://web.archive.org/web/20190727093955/https://toyokeizai.net/articles/-/293789
https://web.archive.org/web/20190727094921/https://toyokeizai.net/articles/-/294305
どうもこちらでは現象が再現できない。 >>462
もう一回試してみたけど、また同じ症状になった。page=2が再表示。駄目やん
Firefoxアプデ放置してたのが原因かと思って、他のタブ閉じたりしてしばらくたったところで
アプデ前にもう一回挑戦したら、何故かpage=3も保存できた。あれ?できた。どうなってるんだ? archive.todayまったく繋がらないけど同じ状況の人いませんか? >>427
Heritrixの仕様か何かなのかな?
自前でHeritrix動かしたことないから断言は出来ないけど ■ このスレッドは過去ログ倉庫に格納されています