X



Internet Archive総合 (web.archive.org) #2 ©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0247名無しさん@お腹いっぱい。
垢版 |
2018/05/31(木) 10:37:12.73
>>246
日本語でおk。

「Wayback Machine に保存されているファイルの一覧」は出力できても、
「元サーバには置いてあっても Wayback Machine では保存しなかったファイルの一覧」なんか
出力できるわけ無いわ。
0249名無しさん@お腹いっぱい。
垢版 |
2018/06/01(金) 09:35:59.56
>>247
ありがとうございました
0250名無しさん@お腹いっぱい。
垢版 |
2018/06/23(土) 22:07:00.35
このアーカイブてデータをSSDに全部入れ替えたら
アクセスすごい速くなるんだろうな、金額や手間を
考えたら途方もない話だろうけど
0251名無しさん@お腹いっぱい。
垢版 |
2018/06/24(日) 21:17:52.37
ストレージの速度も大事なんだろうけれど
データベース系はメモリが足らないとダメなんだろうなって気がする
それこそカネがかかる話だけれどもね
0252名無しさん@お腹いっぱい。
垢版 |
2018/07/05(木) 01:48:27.48
ここ数日 /save/ で保存を試みても失敗することが多くなった。
数回ないし十数回リロードすれば通るけど、本当に鬱陶しい。
0253名無しさん@お腹いっぱい。
垢版 |
2018/07/07(土) 04:58:10.52
>>252
右に同じ。

しかも、
>数回ないし十数回リロードすれば通るけど

これがまた結構時間をロスする。
意外とこのサイトの重要性は高まっているので、
ここが機能しなかったら本当に困る。
0254名無しさん@お腹いっぱい。
垢版 |
2018/07/07(土) 05:50:54.11
というか基本的な話だが、
同じサイトを複数回取る場合(頻繁にトップページが変わる、新聞社の公式とか)、
Internet Archiveは『10分程度』、間(あいだ)を置かなきゃダメなんだよね。

「Wayback Exception」でタイムロスがあっては尚更困るんだが。
0256名無しさん@お腹いっぱい。
垢版 |
2018/07/07(土) 15:39:37.64
もちろん他のところも利用してるけど、
1日20回限定だったり、サイトの方から拒否しちゃったりでねえ…

それにしてはここ数日、
InternetArchiveにアクセスが集中しすぎているのか?
0259名無しさん@お腹いっぱい。
垢版 |
2018/07/07(土) 19:14:44.12
午後から本当に「Sorry」ばかりでガチで不調

一時期のウェブ魚拓もそうだったが
不可解な画像を多量にアーカイブするような
平たく言えば「荒らし」が出てきてるのか?
0262名無しさん@お腹いっぱい。
垢版 |
2018/07/12(木) 17:50:11.87
保守
0264名無しさん@お腹いっぱい。
垢版 |
2018/07/24(火) 06:42:47.65
これが無くなるとかなり困るな
0266名無しさん@お腹いっぱい。
垢版 |
2018/07/25(水) 10:07:04.60
いっそグーグルが買収してその脅威のメカニズムで
ウェイバックをワード検索できたり、負荷を軽くしたりプログラムを再構成してくれないかな
0267名無しさん@お腹いっぱい。
垢版 |
2018/07/25(水) 10:39:55.70
>>266
「他人の著作物を勝手に保存してそのまま勝手に再公開する」という
インターネット・アーカイブがやっている行為について訴訟が起こされたけど、
非営利組織であることが米国著作権法のフェアユース規定を適用できるかどうかの
鍵となっていたはず。
買収で営利組織の傘下に入ると、おそらくそこが崩れて
保管されているアーカイブの殆どが違法コピーに成り下がる。
0268名無しさん@お腹いっぱい。
垢版 |
2018/07/29(日) 21:16:40.87
0276名無しさん@お腹いっぱい。
垢版 |
2018/10/02(火) 18:31:41.89
頼れるのがInternet Archiveしかいない…!
0277名無しさん@お腹いっぱい。
垢版 |
2018/10/02(火) 21:28:33.03
ジオシティーズ消滅でだいぶ貴重なデータが失われるな
黒歴史サイトが消える〜って喜んでるのも居るがそんなもんより損失が大きいのが
アーカイブされりゃいいけどニフティなんかアーカイブで見れないサイト多い惨状
他では誰も扱っていないすんげーマニアックなデータを蓄積したサイトとか 勿体無い
0281279
垢版 |
2018/10/11(木) 02:20:55.03
>>279 の件は直ったようだ。
0284名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 11:22:22.45
全ページ検索はまだ?
でもモラル上厳しいか
0286名無しさん@お腹いっぱい。
垢版 |
2018/10/21(日) 18:07:24.21
ジオシティーズ削除までに出来る限りアーカイブしとかんとなあ
アーカイブされてそうで意外とされてなかったりする>ジオ
0290名無しさん@お腹いっぱい。
垢版 |
2018/10/22(月) 12:41:35.09
実質、魚拓やArchive isと比べたら、アーカイブサイトでは一番順調なところなのに。
何で数日前以降のものが消えるかね!?

管理者は気がついてるのか!?
0291214
垢版 |
2018/10/22(月) 12:43:48.87
>>288-289
ウチはどうだろう、と思って見てみたら・・・今月 6 日以降の分が全く保存されていない。
ttp://i.imgur.com/cEWjNjz.png
どうも原因はサーバ不調とは別のよう。参考にならず申し訳ない。

>>220 で紹介した手順のまま何も変えていないのだが、明らかにおかしいので
通信内容を追ってみたところ、こちらが送った HEAD リクエストに対して 404 応答を返している。
試しに GET リクエストに切り替えてみると、きちんと 200 応答が返る。多分保存できている。
(以前は途中でリダイレクトがあったはずだが・・・どうだったっけ?)
おそらく仕様が変更されて、HEAD リクエストは使えなくなった、という事だと思う。

以下余談。
>>214 の 3 つのスクショと同じ URL、同じ年のカレンダーを再度見てみた。
ttp://i.imgur.com/71H5nOH.png
ttp://i.imgur.com/8aO7RgA.png
ttp://i.imgur.com/dUdgy82.png
>>214 の時点では歯抜けになっていた 10 月分が、かなり埋まっている。
0295名無しさん@お腹いっぱい。
垢版 |
2018/10/23(火) 18:24:41.33
ここ数日はりきってgeocitiesのアーカイブ保存してたのに消えてるじゃん...最悪
非表示じゃなくてアーカイブごと消滅したってこと?あまり詳しくないからわからんが
0298名無しさん@お腹いっぱい。
垢版 |
2018/10/26(金) 07:00:40.48
どうやら復旧した模様 過去の分も含めてリンクが表示されるようになった
どこかにアナウンスとか上がっているだろうか?
0301名無しさん@お腹いっぱい。
垢版 |
2018/11/01(木) 01:59:51.46
ジオ全盛の頃って累積アクセス数でキリ番踏んだら報告するよう書いてる人結構いたなあ
報告めんどくて毎回スルーしてたら後で踏み逃げ常習者として晒されてたりした
懐かしくて確認してみたらアーカイブ取得されてて(ノ∀`)アチャー
0304名無しさん@お腹いっぱい。
垢版 |
2018/11/09(金) 09:26:29.80
ぺージを見すぎるとエラーになる?
0305名無しさん@お腹いっぱい。
垢版 |
2018/11/09(金) 09:27:20.70
全ページ検索はまだ実現しないんですか?
0308名無しさん@お腹いっぱい。
垢版 |
2018/11/09(金) 15:20:03.04
Wayback Machine does not have this page archived.
見たかったページさようなら
0309名無しさん@お腹いっぱい。
垢版 |
2018/11/13(火) 10:50:38.41
また消えてるページがある!?

昨日(11月12日)頻繁に「再読み込み」を促す画面が何度も出ていたが…。
0311名無しさん@お腹いっぱい。
垢版 |
2018/11/13(火) 20:29:41.27
最近、google chromeでアーカイブを見ようとすると
「The Wayback Machine is an initiative of the Internet Archive, a 501(c)(3) non-profit, building a digital library of Internet sites and other cultural artifacts in digital form.
Other projects include Open Library & archive-it.org.

Your use of the Wayback Machine is subject to the Internet Archive's Terms of Use.」
ってのが出てきて、先に進めない
別のブラウザだと普通に見えるのに
0315名無しさん@お腹いっぱい。
垢版 |
2018/12/08(土) 10:29:30.08
あとAtwikiも魚拓とろうとするとスパム扱いされてできない
0321名無しさん@お腹いっぱい。
垢版 |
2018/12/11(火) 19:58:30.15
ふむふむ
http://web.archive.org/web/20181211102115/www26.atwiki.jp/gcmatome/pages/1017.html
Mozilla/6.0 (Macintosh; Intel Mac OS X 10.13; rv:60.0) Gecko/20100101 Firefox/60.0

>>320
/save/ を叩いた時なんだけど、もし点数方式で判定するなら
◎ IP は archive.org の取得用サーバ群の中の何れか一つが使われる。
米国の IP であること、また名前に www が入っていることは加点対象になる可能性あり。
同じ IP からの繰り返しアクセスも加点対象になる可能性あり。
◎ User-Agent を含め、リクエストヘッダはクライアントのものがそのまま転送される。
古いブラウザを使っていると加点対象になる可能性あり。
◎ さらに Via: HTTP/1.0 web.archive.org (Wayback Save Page) が追加される。
これは間違いなく加点対象。

この辺が総合的に判断されて弾かれているのだろう。
保存に成功することもあるので、Wayback Machine だからと言って一律に判断しているのでは無いと思う。
0325名無しさん@お腹いっぱい。
垢版 |
2018/12/13(木) 12:44:14.27
先週くらいから、上のほうに寄付金募集のバナーが出るようになったな。

しかもIEだと、右上の「×」をクリックしても、どうしたわけかバナーが消えない。

この募集は本気だな。
0334名無しさん@お腹いっぱい。
垢版 |
2018/12/24(月) 16:33:59.12
221 名前:名無しさん@お腹いっぱい。[] 投稿日:2018/12/22(土) 16:36:12.78

こういう海外サービスを発見した。
まだちょこっとしか試していないが。

Archive.st
https://archive.st

Time Travel
(ブラウザから「このサイトはやばいかもしれない」
という警告が出たが、おそるおそる行ってみると
特にまずいことはなかった)
http://timetravel.mementoweb.org
0337名無しさん@お腹いっぱい。
垢版 |
2019/01/01(火) 06:17:17.53
12月30日に取った分が消えてる!?
0339名無しさん@お腹いっぱい。
垢版 |
2019/01/02(水) 16:26:04.27
保守
0342名無しさん@お腹いっぱい。
垢版 |
2019/01/03(木) 10:14:56.81
以前のいつかと同じく、18年12月29日深夜から現在に至るまで取得したアーカイブの消失が起きている
注意されたし
0343 ◆P0jSlC5fJs
垢版 |
2019/01/09(水) 13:23:55.37
名前上がらないけどWebrecorderとかInterPlanetary Waybackとか知ってる?
いいぞ〜これ
0344名無しさん@お腹いっぱい。
垢版 |
2019/01/09(水) 17:39:45.59
>>343

クラウド保存でなくローカル保存?
0346名無しさん@お腹いっぱい。
垢版 |
2019/01/10(木) 15:23:06.86
>>343
使い方がよくわからん。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況