X



Internet Archive総合 (web.archive.org) #3
レス数が950を超えています。1000を超えると書き込みができなくなります。
0001名無しさん@お腹いっぱい。
垢版 |
2020/04/02(木) 02:08:09.83
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
  ------------------


Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう

A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック


Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される

A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。


前スレッド
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
0869名無しさん@お腹いっぱい。
垢版 |
2021/05/11(火) 15:27:21.28
Youtubeは少なくとも今年1月にとった分は動画まで保存できてたから、時間が経てば取れると思う。
0871名無しさん@お腹いっぱい。
垢版 |
2021/05/14(金) 18:54:25.52
waybackmachine使っただけで訴えられた事例とかあるの?
0876名無しさん@お腹いっぱい。
垢版 |
2021/05/17(月) 10:22:21.67
Cannot get status of 16進数(32桁)というのが出る
0877名無しさん@お腹いっぱい。
垢版 |
2021/05/18(火) 16:27:53.74
保存日時の情報は記録されているけれど、外部リンク調査日時の記録はされていないんだろうな。
これも記録してあればいいのに。
0880名無しさん@お腹いっぱい。
垢版 |
2021/05/19(水) 23:05:23.86
サイト内のzip落としたらUAが表示される某サイトで
二度Sorry出したら二度ともUAが表示されていたから保存されてはいるようだ
0881名無しさん@お腹いっぱい。
垢版 |
2021/05/20(木) 17:13:05.62
Cannot save Internet Archive URLs!
今日はこのエラー連発で1時間後にやり直したらできたり不安定すぎる
保存できなかった理由も書いてない
0883名無しさん@お腹いっぱい。
垢版 |
2021/05/22(土) 13:44:06.50
ハイパーリンクの情報は当然持ってるとして各ファイルの被リンク情報はなくてもやっていけるんだろうかと少々心配になる
ビッグデータとして利用する客が考えればいいことか知らんが
0884名無しさん@お腹いっぱい。
垢版 |
2021/05/23(日) 07:32:01.41
そもそも今のIAはとにかく情報を溜め込むことだけ考えてそれをどう活用するかは今後次第って感じじゃないかなあ
現状のsaveだけでもサーバー不安定になるレベルで常にやってるし(それでも全然間に合ってなさそうなのが怖いが)
0885名無しさん@お腹いっぱい。
垢版 |
2021/05/23(日) 22:01:09.82
URLで検索してアーカイブ一覧を表示しようとすると次のエラーが出るのだけど
混雑で検索エンジンが止まってるだけかな

The search engine encountered the following error: invalid or no response from Elasticsearch
0887名無しさん@お腹いっぱい。
垢版 |
2021/05/25(火) 04:48:03.82
>>507
ページ全体は無理だが画像などバラのパーツは個別に保存が可能だったりすることもある
ザル運営のブラウザゲームなどはありがち
0891名無しさん@お腹いっぱい。
垢版 |
2021/05/25(火) 23:05:34.28
オーバーロードはなろう系で唯一お薦めできる作品
0892名無しさん@お腹いっぱい。
垢版 |
2021/05/26(水) 03:28:24.76
最近データベースの入れ替えでもしてるの?
Explore more than X billion web pages saved over time
のXが一瞬半分になったり変動がすごい
0894名無しさん@お腹いっぱい。
垢版 |
2021/05/26(水) 18:10:11.99
This snapshot cannot be displayed due to an internal error.
0895名無しさん@お腹いっぱい。
垢版 |
2021/05/26(水) 21:05:39.01
回復したかな
0906名無しさん@お腹いっぱい。
垢版 |
2021/06/01(火) 03:49:59.92
swfのあるページの取得厳しいんだっけ
Cannot fetch the target URL due to system overload.がでる

todayのほうで試したらプロセスが空白で進行せず
megarodonは見かけ上はとれてるがソースからswfの現物アドレスを消して保存してるっぽい

ファイル固有の問題だろうか
デバッガでは開けるんだが
0910名無しさん@お腹いっぱい。
垢版 |
2021/06/01(火) 13:20:35.24
激遅の/save/で行けたりしない?>swf
保存できても表示が更新されないので本当に保存されているか未確認だけど
0915名無しさん@お腹いっぱい。
垢版 |
2021/06/02(水) 04:57:26.97
>>910
個別のswfのアドレス投げ込んだら保存できたからひとまずはいいことにする
開くときは開けるアドレスを知ってないとあかんね
デバッガだと「swfを置いてるページ」では開けないんでarchiveのソースに書かれてる現物のアドレスを掘り出してデバッガに渡すまでしないと開かない
(開けるのは確認できた)

>>911
なんかアナウンスされてたよね archiveのswf全部を勝手にブラウザ上で再生してくれるようなものを期待しちゃうけど
そこまでするのは結構大変なはず
0916名無しさん@お腹いっぱい。
垢版 |
2021/06/02(水) 08:47:16.75
3Gガラケーの本体自体にフラッシュの再生機能付いててアーカイブ含め見れるが画面が小さいのがあかんな
ガラケー向けの時計フラッシュまちうけフラッシュは本体が壊れない限り確実に永遠に見れるけどペリーのピアノ講師ネタとか永遠に失われそう
0917名無しさん@お腹いっぱい。
垢版 |
2021/06/02(水) 14:33:51.58
SPNを保存されたかの確認に使うというわけ分からん状況になってる。
誰かが過去に保存したであろう複数ページの記事が途中歯抜けで保存されているのを見かけた。保存失敗か?
元の記事はもう見れないから補完してあげることもできなかった。
0918名無しさん@お腹いっぱい。
垢版 |
2021/06/02(水) 14:54:32.98
twitterの保存だけやけに時間かかるんだけど
0919名無しさん@お腹いっぱい。
垢版 |
2021/06/09(水) 00:42:55.87
「Ruffle」というchrome拡張機能使えばFlash見れるよ
0920名無しさん@お腹いっぱい。
垢版 |
2021/06/09(水) 01:11:29.08
Sorry
You have already reached the limit of active sessions

先週からエラー出まくり
0921名無しさん@お腹いっぱい。
垢版 |
2021/06/09(水) 06:03:50.69
>>920
おまいさんのやり方が悪いだけ。先月の制限強化に引っ掛かってるんだろ。
https://docs.google.com/document/d/19RJsRncGUw2qHqGGg9lqYZYf7KKXMDL1Mro5o1Qw6QI/edit
> 2021-05-23
> Anonymous users have lower concurrent captures limit (limit=3) compared to authenticated users (limit=5).

制限値を超えないよう、保存開始のタイミングを調整するしか無い。
アカウントを作ってログインすれば従前の制限値に戻る上、空きセッション数を API で
得られるようになるので、自動的に空きを待ってから保存するようなシステムも
組めるようになる。
https://web.archive.org/save/status/user (ログインしていなければ 503 エラー)

Change Log に記載は無いが、ログイン済みユーザの制限値は 6 に緩和されている模様。
("available":6)
0923名無しさん@お腹いっぱい。
垢版 |
2021/06/09(水) 16:25:44.73
ブラウザが (IA のヘッドレスブラウザも含めて) リファラを送らなくなったとか
そういう話じゃ無くて?
0925名無しさん@お腹いっぱい。
垢版 |
2021/06/09(水) 18:29:55.92
制限するぐらいなら、有料化しろよ
0928名無しさん@お腹いっぱい。
垢版 |
2021/06/10(木) 09:46:43.59
そうそう、IA のアーカイブはサーバのレスポンスヘッダが丸ごと保存されていることに留意。
つまり Set-Cookie でクッキーが返されていた場合、それも保存されているという事。
ログイン管理にクッキーを利用しているサイトで、アーカイブのデータを利用して
誰かに勝手にログインされるという事も起こりうる。
0933名無しさん@お腹いっぱい。
垢版 |
2021/06/12(土) 23:14:58.67
最近、頻繁に使うようになったけど、今繋がらないみたいだね。
だいたいどれくらいで復帰するんだろうか?
1日2日はかかるかな?
0940名無しさん@お腹いっぱい。
垢版 |
2021/06/15(火) 09:25:17.87
>>939
Due to a planned power outage, our services will be reduced on Tuesday, June 15th, starting at 8:30am PDT until the work is complete. We apologize for the inconvenience.

この程度の英文すら機械翻訳使わなきゃ読めない低能
0943イモー虫
垢版 |
2021/06/18(金) 20:45:23.13
読み込み機能は機能しているのか
0944名無しさん@お腹いっぱい。
垢版 |
2021/06/19(土) 14:06:16.43
The capture is estimated to start in 120 minutes. You may close your browser window and the page will still be saved.

うっかりログインし忘れるとこれだわw
0949名無しさん@お腹いっぱい。
垢版 |
2021/06/20(日) 00:40:25.87
1085分、てかアカウントでログインして保存しようとしてもこの表示出るじゃん
アカウント作った意味ないわ
0950名無しさん@お腹いっぱい。
垢版 |
2021/06/20(日) 01:26:26.34
待ち時間が一度表示されてしまうと、その後ログインして
同じURLの再保存を試みても待ち時間が延びるだけ。
0952名無しさん@お腹いっぱい。
垢版 |
2021/06/20(日) 12:42:15.80
保存は匿名で出来るんですか?
0955名無しさん@お腹いっぱい。
垢版 |
2021/06/21(月) 02:12:27.28
伊是名夏子のブログのアーカイブを見ようとすると
6月初めぐらいからThis URL has been excluded〜が出るようになってるんだけど、
非表示化か削除依頼出したみたいだねこれ。
0956名無しさん@お腹いっぱい。
垢版 |
2021/06/21(月) 10:45:02.62
アーカイブのアーカイブが必要になりそう
0962名無しさん@お腹いっぱい。
垢版 |
2021/06/27(日) 13:37:52.83
>>952
>>57

問題なのは関連付けされてる場合はログインしている時のメールアドレスやユーザ名、ログイン関係なくハッシュ化したIPアドレスやUserAgent部分がWARCファイルの名前フィールド部分に保存される可能性がある。
気になるなら保存するときだけUserAgentやIPアドレス変えたり保存するページごとに別ければいい。
レス数が950を超えています。1000を超えると書き込みができなくなります。

ニューススポーツなんでも実況