Internet Archive総合 (web.archive.org) #3
レス数が950を超えています。1000を超えると書き込みができなくなります。
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php
インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
------------------
Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック
Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。
前スレッド
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/ >>862
自分もよく分かってないけど今も保存されてるっぽいよ
昨日の動画が保存されてたから
http://web.archive.org/web/20210509030617/https://www.youtube.com/watch?v=ZxjaW7zGTbA またサーバーが落ちたのか繋がらないな
archive.orgの方は接続出来るみたいだが… ttps://archive.org/stats/
日本時間で14時20分すぎから鯖落ち中らしい web.archive.org までは到達できている。また内部のネットワーク障碍か。
なんか今日はIAの調子やたらいいな
これまで表示されなかったスクショなんかもちゃんと取れてるし Youtubeは少なくとも今年1月にとった分は動画まで保存できてたから、時間が経てば取れると思う。 waybackmachine使っただけで訴えられた事例とかあるの? 429エラーでもこれはお手上げ
Cannot get status of 16進数(32桁)というのが出る 保存日時の情報は記録されているけれど、外部リンク調査日時の記録はされていないんだろうな。
これも記録してあればいいのに。 なんではてなブログアーカイブするとfacebookなんちゃらになるんだ ツイッターも意味不明な表示になったがちゃんと正式urlでアーカイブされてた サイト内のzip落としたらUAが表示される某サイトで
二度Sorry出したら二度ともUAが表示されていたから保存されてはいるようだ Cannot save Internet Archive URLs!
今日はこのエラー連発で1時間後にやり直したらできたり不安定すぎる
保存できなかった理由も書いてない Twitterで特定のアカウントだけexcludedってあるんだな
本人が申請したっぽいけど ハイパーリンクの情報は当然持ってるとして各ファイルの被リンク情報はなくてもやっていけるんだろうかと少々心配になる
ビッグデータとして利用する客が考えればいいことか知らんが そもそも今のIAはとにかく情報を溜め込むことだけ考えてそれをどう活用するかは今後次第って感じじゃないかなあ
現状のsaveだけでもサーバー不安定になるレベルで常にやってるし(それでも全然間に合ってなさそうなのが怖いが) URLで検索してアーカイブ一覧を表示しようとすると次のエラーが出るのだけど
混雑で検索エンジンが止まってるだけかな
The search engine encountered the following error: invalid or no response from Elasticsearch >>507
ページ全体は無理だが画像などバラのパーツは個別に保存が可能だったりすることもある
ザル運営のブラウザゲームなどはありがち Cannot fetch the target URL due to system overload.
ナニコレ >>888
> due to system overload
そういうことだろ >>888
https://translate.google.co.jp/?sl=auto&tl=ja&text=Cannot%20fetch%20the%20target%20URL%20due%20to%20system%20overload.%20&op=translate&hl=ja 最近データベースの入れ替えでもしてるの?
Explore more than X billion web pages saved over time
のXが一瞬半分になったり変動がすごい This snapshot cannot be displayed due to an internal error. system overloadが出ても/*/の後にURLつけると保存できてることがあるので、
一応確認してみるのおすすめ http://homepage2.nifty.com/
が
This URL has been excluded from the Wayback Machine.
になってるのはなんでだろう?ジオシティーズみたいな普通のホームページサービスだったみたいだけど >>899
> ジオシティーズみたいな普通のホームページサービスだったみたいだけど
ワロタ ジオシティーズやトクトクは普通だけどフリーティケットシアターは普通じゃない的な /*/はFail with status: 498 No Reason Phrase なるべく円高米ドル安の時に寄付したほうがいいんだろうな。 batchのページ開いてもトップに飛ばされてしまうようになった swfのあるページの取得厳しいんだっけ
Cannot fetch the target URL due to system overload.がでる
todayのほうで試したらプロセスが空白で進行せず
megarodonは見かけ上はとれてるがソースからswfの現物アドレスを消して保存してるっぽい
ファイル固有の問題だろうか
デバッガでは開けるんだが swfってただのファイルじゃないの
どうしてそんなことが起こるのですか We only allow new captures of the same URL every 45 minutes. 激遅の/save/で行けたりしない?>swf
保存できても表示が更新されないので本当に保存されているか未確認だけど ファイル1個だけなら画像の確認とかやらないから拡張子関係なく超高速で保存できるはずだけど Cannot fetch the target URL due to system overload.
出すぎ >>910
個別のswfのアドレス投げ込んだら保存できたからひとまずはいいことにする
開くときは開けるアドレスを知ってないとあかんね
デバッガだと「swfを置いてるページ」では開けないんでarchiveのソースに書かれてる現物のアドレスを掘り出してデバッガに渡すまでしないと開かない
(開けるのは確認できた)
>>911
なんかアナウンスされてたよね archiveのswf全部を勝手にブラウザ上で再生してくれるようなものを期待しちゃうけど
そこまでするのは結構大変なはず 3Gガラケーの本体自体にフラッシュの再生機能付いててアーカイブ含め見れるが画面が小さいのがあかんな
ガラケー向けの時計フラッシュまちうけフラッシュは本体が壊れない限り確実に永遠に見れるけどペリーのピアノ講師ネタとか永遠に失われそう SPNを保存されたかの確認に使うというわけ分からん状況になってる。
誰かが過去に保存したであろう複数ページの記事が途中歯抜けで保存されているのを見かけた。保存失敗か?
元の記事はもう見れないから補完してあげることもできなかった。 「Ruffle」というchrome拡張機能使えばFlash見れるよ Sorry
You have already reached the limit of active sessions
↑
先週からエラー出まくり >>920
おまいさんのやり方が悪いだけ。先月の制限強化に引っ掛かってるんだろ。
https://docs.google.com/document/d/19RJsRncGUw2qHqGGg9lqYZYf7KKXMDL1Mro5o1Qw6QI/edit
> 2021-05-23
> Anonymous users have lower concurrent captures limit (limit=3) compared to authenticated users (limit=5).
制限値を超えないよう、保存開始のタイミングを調整するしか無い。
アカウントを作ってログインすれば従前の制限値に戻る上、空きセッション数を API で
得られるようになるので、自動的に空きを待ってから保存するようなシステムも
組めるようになる。
https://web.archive.org/save/status/user (ログインしていなければ 503 エラー)
Change Log に記載は無いが、ログイン済みユーザの制限値は 6 に緩和されている模様。
("available":6)
なんかリファラー変更ができなくなったっぽいんだけど俺環? ブラウザが (IA のヘッドレスブラウザも含めて) リファラを送らなくなったとか
そういう話じゃ無くて? マジか。じゃ もうリファラ必要なサイトは保存できなくなったのか 金ローの画像はどういう仕組みなんだろう
https://kinro.ntv.co.jp/lineup/20210611
保存ができてるのかできてないのかがようわからん
/*/上の階層/*/ってファイルサイズは見れんよね API を使うとクッキーも送れるけど、ハイジャック耐性の無いユルいサイトしか使い道が無いな。
http://web.archive.org/web/20210610001000/taruo.net/e/
ちなみに force_get を 0 (または省略) にしておかないと capture_cookie を指定しても無視される。 そうそう、IA のアーカイブはサーバのレスポンスヘッダが丸ごと保存されていることに留意。
つまり Set-Cookie でクッキーが返されていた場合、それも保存されているという事。
ログイン管理にクッキーを利用しているサイトで、アーカイブのデータを利用して
誰かに勝手にログインされるという事も起こりうる。 また繋がらなくなった?
保存しようとしても503やら404の画面になるんだけど… 最近、頻繁に使うようになったけど、今繋がらないみたいだね。
だいたいどれくらいで復帰するんだろうか?
1日2日はかかるかな? 親切な表示が出るようになってる
You may close your browser window and the page will still be saved. 向こうで計画停電が起こるみたいだから、こっちの時刻で16日の0時30分からしばらくサービス停止するらしい。
https://i.imgur.com/upjcBi3.png
https://www.jisakeisan.com/?y=2021&m=6&d=15&hh=8&mm=30&t1=pdt&t2=jst >>939
Due to a planned power outage, our services will be reduced on Tuesday, June 15th, starting at 8:30am PDT until the work is complete. We apologize for the inconvenience.
この程度の英文すら機械翻訳使わなきゃ読めない低能 人は上から目線で間違いを訂正するときに性行為より快感を感じるらしい The capture is estimated to start in 120 minutes. You may close your browser window and the page will still be saved.
うっかりログインし忘れるとこれだわw 523分待ちだったわ 撮ってくれるんならまあいいけど >>899
members.jcom.home.ne.jpも This URL has been excluded from the Wayback Machine.になるね 1085分、てかアカウントでログインして保存しようとしてもこの表示出るじゃん
アカウント作った意味ないわ 待ち時間が一度表示されてしまうと、その後ログインして
同じURLの再保存を試みても待ち時間が延びるだけ。 まだログインしないと待ち時間が出る状態なの?
ご愁傷様w 今は直ってるな
というか別に待ち時間があっても後で保存されるんだから良くね? 伊是名夏子のブログのアーカイブを見ようとすると
6月初めぐらいからThis URL has been excluded〜が出るようになってるんだけど、
非表示化か削除依頼出したみたいだねこれ。 archive.is 自体が消えてしまったりしないの? という話が。 Cannot get status of spn2-2afbf2c51be876410f7a78331b331ea74cd21c67-5a282757 >>953
ログインしてても普通に待ち時間表示出るけど、時間帯によって変わったりするの? >>952
>>57
問題なのは関連付けされてる場合はログインしている時のメールアドレスやユーザ名、ログイン関係なくハッシュ化したIPアドレスやUserAgent部分がWARCファイルの名前フィールド部分に保存される可能性がある。
気になるなら保存するときだけUserAgentやIPアドレス変えたり保存するページごとに別ければいい。 レス数が950を超えています。1000を超えると書き込みができなくなります。