X

Internet Archive総合 (web.archive.org) #5

■ このスレッドは過去ログ倉庫に格納されています
1名無しさん@お腹いっぱい。
垢版 |
2023/07/28(金) 06:58:53.37
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
http://archive.org/

インターネット・アーカイブ - Wikipedia
http://ja.wikipedia.org/wiki/InternetArchive
 ------------------
Twitter
https://twitter.com/internetarchive/

関連スレ
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/


前スレッド
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/
https://twitter.com/5chan_nel (5ch newer account)
2024/06/19(水) 03:18:53.35
>>448
別にその方面に限ったことではない

>>456
後で無事取得できてるならまだ良いが、取得できてなかったら悲惨
2024/06/19(水) 06:13:43.42
無くなる前にアーカイブ
過去ログ見れなくなる前にやっとけばよかったんだがね
https://i.imgur.com/jiMjBYa.jpeg

無くなったら無くなったでURLがわからないと辿れないから
過去ログβが無くなったら辿るのが困難になるのが困るな
一周回ってリンク集の需要が高まるかもしれない
2024/06/19(水) 16:14:18.56
獣姦する女・・・(;`・д・´)
2024/06/20(木) 02:48:05.92
もうずっと不調
461名無しさん@お腹いっぱい。
垢版 |
2024/06/21(金) 20:47:09.19
Twitterのプロフィールまではいけるんだが、そこから画像欄とかいいね欄が見られないのは仕様?
Something went wrong. Try reloading.のエラーが出て不便
2024/06/21(金) 23:28:06.31
502 Bad Gateway
2024/06/22(土) 00:35:46.03
>>461
そもそもログインしないと見れなくね?
2024/06/23(日) 16:16:15.54
ここもかぁ
2024/06/24(月) 10:17:35.84
見たいWebページが「404エラー」になっていたとき、元のページ内容を見る方法はないの?
https://otona-life.com/book/235219/
2024/06/25(火) 23:46:25.84
ファイルの形式による一日の保存回数制限。
2024/06/27(木) 21:46:14.73
また不調か
2024/06/29(土) 14:49:22.21
10分前から
「Sorry
Cannot start capture」
10分ぐらい前までなんてことなかったのに突然
2024/06/29(土) 15:21:10.49
自作のスクリプトはこんなこと言ってたな。
API が返した JSON の一部の値を印字しているだけだが、メモリオーバーか?

いま再度試したらアーカイブに成功、復活したか。
2024/06/30(日) 11:39:49.24
ダメだこりゃ
https://archive.is/ey7zy
onion版も試してみたが同じ画面になった
2024/06/30(日) 12:29:36.36
まだ
Sorry
Cannot start capture
のままだな
2024/06/30(日) 13:12:10.15
俺もSorry Cannot start capture
2024/06/30(日) 16:54:17.08
復旧した…か?
2024/06/30(日) 17:37:13.93
直ったっぽい
2024/07/02(火) 06:27:54.45
インスタは保存できなくなった?
2024/07/02(火) 06:50:38.13
取得に失敗したurlもデイリーリミット300にカウントされるようになってて草
40台しか取れてねえ笑
477名無しさん@お腹いっぱい。
垢版 |
2024/07/02(火) 11:10:06.06
https://i.imgur.com/NX4TZsd.png
2024/07/02(火) 13:27:30.92
>>477
画面をキャプチャしたところで "Cannot start capture" 以外は何も判らないから
JSON 拾って来いよ
2024/07/03(水) 03:23:28.45
リンク集は自分で持ってないと困る&
冗長的に野に放たれてないと価値がない&
リンク先消されたらあまり意味がない

インターネット暗黒時代近づいてるというかもう既に始まってるのかもしれんな
アーカイブも1個や2個じゃ足りないだろ
国は頼りねえし明日はどっちだ
2024/07/03(水) 12:09:48.80
始まってるな
右から左にコピペしたかのようなキュレーションブログの乱立と
誤情報や嘘、政治的活動で溢れるSNSの台頭
2024/07/03(水) 18:32:50.24
既存のブログやショッピングサイトなどをコピーしたものにマルウェアを仕込んでいる外国ccTLDのサイトとかもだな
そんなのが検索サイトで検索結果上位に出てくる始末
482名無しさん@お腹いっぱい。
垢版 |
2024/07/05(金) 10:20:12.61
今必死にフォレストページの好きなサイトアーカイブしてるけど、一日200回の制限がキツいわ...
2024/07/05(金) 11:18:21.68
>>482
200回って縛りプレイ?大変だね
こっちは既に322回、一日40000回の制限なんて到達したこと無いw
484名無しさん@お腹いっぱい。
垢版 |
2024/07/05(金) 21:39:10.33
スプシでアウトリンク有りにして1000個くらいアーカイブすればあっという間に5万件の制限かかるぞ
485名無しさん@お腹いっぱい。
垢版 |
2024/07/05(金) 21:45:39.28
typoした4万件だわごめん
https://i.ibb.co/z5r50gD/20240705214230.webp
2024/07/05(金) 23:58:42.35
アカウント作れよ
2024/07/05(金) 23:59:31.26
>>484
アウトリンクってjsとか画像とかしょっちゅう取り逃がすからあんまり使えないよな
488名無しさん@お腹いっぱい。
垢版 |
2024/07/06(土) 05:12:31.93
ページの数が多かったらだるいけどそうじゃないなら適当な拡張機能でページ内のリンク全部取得すればいいだけだから使いようによってはかも
アカウントにあまりあったから482のやつ手伝おうかと思って試したんだけど、検索結果にでてくるHPがおくれて描画されるせいでアウトリンクにかからないのがしんどくてやめた
数千ページもちまちまURL取得するわけにもいかんし
こういうときにささっとスクリピングのスクリプト書いてURL取得するスキルが有ればずっと楽なんだろうけどね(泣)
489名無しさん@お腹いっぱい。
垢版 |
2024/07/06(土) 17:09:45.88
今って一日4万件だけなのかもっと多くなかったっけ
2024/07/07(日) 22:44:32.87
>>489
Save Page Now 2 Public API の User Status 応答の変遷(日本時間午前9時過ぎ)
2023/02/18(土) {"available":6,"daily_captures":0,"daily_captures_limit":100000,"processing":0} この日から記録を始めた
2023/08/21(月) {"available":6,"daily_captures":0,"daily_captures_limit":80000,"processing":0}
2023/09/06(水) {"available":6,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/09/29(金) {"available":8,"daily_captures":0,"daily_captures_limit":70000,"processing":0}
2023/11/23(木) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0}
2023/12/12(火) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0}
2023/12/17(日) {"available":8,"daily_captures":0,"daily_captures_limit":50000,"processing":0}
2024/02/24(土) {"available":7,"daily_captures":0,"daily_captures_limit":40000,"processing":0}
2024/02/29(木) {"available":7,"daily_captures":0,"daily_captures_limit":30000,"processing":0}
2024/03/14(木) {"available":7,"daily_captures":0,"daily_captures_limit":40000,"processing":0}
2024/07/07(日) 23:01:26.63
503出てる
2024/07/08(月) 01:28:10.83
メンテか
2024/07/08(月) 05:31:22.66
メンテ終了したようだ
2024/07/08(月) 11:32:24.08
イモグラはどうでも良いグロ画像をキャプチャしたら取れた。
肝心なヤツはいつも取れない
2024/07/09(火) 12:17:06.83
どうなってんだこれ
https://archive.is/hP9Fi/8cce8700616b47f94347e2773edbee4ce663b5e6.png
496あぼーん
垢版 |
NGNG
あぼーん
2024/07/09(火) 16:18:52.82
ネットサービス板にスクリプト荒らし登場、か。
498あぼーん
垢版 |
NGNG
あぼーん
2024/07/09(火) 19:15:27.15
5ch取ったらitestに飛ばされるようになったのか
2024/07/10(水) 00:58:57.63
またつながらない
2024/07/10(水) 01:35:04.90
つながった
2日前ほど時間がかからずに済んだ
2024/07/10(水) 08:03:41.68
数時間前にアーカイブを表示しようとURLを検索したら503エラー。今も直らない
503名無しさん@お腹いっぱい。
垢版 |
2024/07/15(月) 19:53:32.26
wayback-gsheets のキューが進まない。。。
2024/07/17(水) 18:56:41.27
866 billionから更新されんな
2024/07/18(木) 21:31:39.79
Vector がホームページサービスを終了だとよ。ダウンロードサービスは継続。
https://www.itmedia.co.jp/news/articles/2407/18/news117.html
2024/07/19(金) 02:49:14.00
hpの方に詳しい情報を載せてる作者もままいるから損失もそれなりの規模だなぁ
なんもかんもなくなる日本
2024/07/19(金) 08:43:01.22
まるで日本以外ではなんもかんも残ってるかのようだ
2024/07/19(金) 14:01:49.76
あら?503になって繋がらない…
onion版も一昨日から繋がらないしどうしたんだろ…
2024/07/19(金) 17:12:03.45
いま復活してるけどちゃんと取れるか心配だ
2024/07/19(金) 17:36:17.10
取れないよ
2024/07/20(土) 14:59:01.95
ふむふむ
2024/07/21(日) 15:23:45.67
除外URLって異議申し立て出来ないの?
noteとかメルアドが漏洩した当時はログを消すのは理由があったけど
今でも出来ないのはビジネスの都合なだけじゃん
2024/07/22(月) 00:05:43.81
>>512
著作権があるから無理、ただでさえIAはギリギリの所に居るのにやる意味ない
グレーゾーンを超えたらどうなるかは例の出版社からの訴訟を見れば分かる
2024/07/22(月) 14:02:01.82
まぁどうしても保存したきゃ手間がかかって七面倒な上に証拠能力としての価値はスクショ同然になる問題点はあるがmht保存機能やらを使ってページをローカル保存して足が付きにくいように無関係な適当なファイル名やらに変更した上で難解なパスワード入れて圧縮したzipやら7zやらを適当なロダに上げて直リンをwebarchiveや20MB以内ならウェブ魚拓に保存すると言う奥の手も無くもない。
2024/07/22(月) 15:53:24.11
重いからか知らんけどCollections情報見えないな
2024/07/25(木) 20:09:51.21
1週間近く接続終わってるな
517名無しさん@お腹いっぱい。
垢版 |
2024/07/29(月) 07:20:04.82
xを保存したいんですけど、archive.orgは方法ありますか?
archive.phはいけるんですけど…
518名無しさん@お腹いっぱい。
垢版 |
2024/07/29(月) 08:30:28.47
今はarchive.phへ取ったTweetのURL( archive.ph/〜 )で、再びorgへ取れるようになってるんじゃない?
519名無しさん@お腹いっぱい。
垢版 |
2024/07/29(月) 08:31:05.15
・・・今春辺りまで1年以上、ph内のアーカイブ済みページはorgへ再取り出来ない不便が続いてたみたいだけどさ。
2024/07/30(火) 14:02:34.70
ページ取得ミスする頻度が最近高すぎる・・・
そのくせに再取得まで時間空けなきゃいけないから面倒
2024/07/30(火) 19:25:54.71
寄付少なくて維持が大変なのかな
2024/07/30(火) 19:45:59.34
画像が取れないうえに何度やっても失敗する
2024/08/01(木) 01:14:56.77
Archive制限が多いな、結局mdへ取るしかなかったり。
2024/08/01(木) 14:20:28.07
https://www.itmedia.co.jp/news/articles/2408/01/news124.html
カカクコムは8月1日、アニメやゲームなど“アキバ系”のカルチャーを紹介する情報サイト「アキバ総研」を9月30日に終了すると発表した。
 2002年8月の開設から22年の歴史に幕を閉じる。
終了後、記事やレビュー、投票など各種コンテンツはすべて閲覧できなくなる。
https://akiba-souken.com/article/66874/
2024/08/01(木) 20:28:10.53
ページングが生きてるけど、最古のが2012-01-13。それより前の記事は一覧取れないのかな
https://akiba-souken.com/article/?page=2566
https://akiba-souken.com/article/14614/

タグ検索すると2010-05-21のも取れるから、どこかでインデックス切れてるのかな
https://akiba-souken.com/article/search/tag/?tag=%E5%BA%97%E8%88%97&page=69
https://akiba-souken.com/article/9017/

番号全部漁るしか無いのかな
2024/08/01(木) 21:21:55.59
22年も続いたのかあ・・・
2024/08/02(金) 12:49:22.59
>>525
元々アキバ総研の使ってた古いドメインは( http://akiba.kakaku.com/ )。

しかし最古のTopアーカイブが2007年なんで、もっと前はさらに別かな?





《 アキバ(秋葉原)の最新情報がわかる!アキバ総研

http://web.archive.org/web/20070112154118/http://akiba.kakaku.com/   》
 
528名無しさん@お腹いっぱい。
垢版 |
2024/08/02(金) 18:12:57.73
https://akiba-souken.com/article/250/
これが最古かな?
2024/08/02(金) 19:06:34.60
2002 年 8 月 26 日開設、その 3 日後のキャプチャ。
https://web.archive.org/web/20020829160703/kakaku.com/akiba/
530名無しさん@お腹いっぱい。
垢版 |
2024/08/02(金) 19:37:59.44
比較的単純だから取りやすそう
2024/08/02(金) 22:58:13.55
>>529
J-Sky H" Palm PDA Lモード って時代を感じるな…
2024/08/03(土) 00:12:56.02
YouTubeで消えた動画見ようとしてもCookieの認証が云々って出てそこから進めないんやが
Cookieはどうやって対策するのか、誰か教えてくれると助かる
2024/08/03(土) 02:08:46.06
再生画面すら保存しきれていない動画で
動画本体までアーカイブされているもんかねぇ
2024/08/03(土) 09:23:37.85
 
【  ■5ちゃんねる■過去ログ・過去ログ倉庫■運用情報・不具合報告■
http://agree.5ch.net/test/read.cgi/operate/1697962402/


93 名前:[sage] 投稿日:2024/03/07(木) 13:54 ID:

https://kohada.5ch.net/test/read.cgi/kankon/1369777130/
だめだ みれない




97 名前:[sage] 投稿日:2024/03/08(金) 14:12:29.76 ID:zwv+kDuO0

>> 93
http://mimizun.com/log/2ch/kankon/1369777130/




120 名前:[] 投稿日:2024/04/02(火) 13:04:41.44 ID:

ジムが何年前のインタビューで匿名掲示板バブルは過去の話しだと語っていたから今の5chでは現状維持が精一杯で過去ログ復旧にまで回せる資金はないだろね




153 名前:[sage] 投稿日:2024/05/01(水) 15:59:47.12 ID:

みみずん検索で我慢だな   】
 
535名無しさん@お腹いっぱい。
垢版 |
2024/08/03(土) 15:46:23.33
最近サ終したサイトってでんファミwiki以外になにかある?
536名無しさん@お腹いっぱい。
垢版 |
2024/08/04(日) 08:04:52.78
トップにリダイレクトされるのって仕様?
https://web.archive.org/web/20240803200528/https://akiba-souken.com/vote/v_1111/
2024/08/04(日) 09:06:33.03
>>536
view-source:https://web.archive.org/web/20240803200528id_/akiba-souken.com/vote/v_1111/
144 行目にホスト名が akiba-souken.com かどうかのチェックが入ってる。
538名無しさん@お腹いっぱい。
垢版 |
2024/08/04(日) 09:40:43.69
>>537
つまりリダイレクトされちゃうからアーカイブとってもweb.archive.org上では閲覧できない?
539名無しさん@お腹いっぱい。
垢版 |
2024/08/04(日) 11:46:30.88
>>538
ページ内画像が低質化してしまったり省略されてしまう場合があるけど文章メインで読めりゃいいならCano-Lab等、PC2m系の携帯端末変換スクリプトを通すなり…。

強制リダイレクトを弾ける(無力化)ブラウザがあれば素で開けるだろうけど




      ―――
http://www.cano-lab.org/pc2m/pc2m.php?_ucb_c=300&_ucb_v=2&_ucb_u=https://web.archive.org/web/20240803200528/https://akiba-souken.com/vote/v_1111/

http://www.cano-lab.org/pc2m/pc2m.php?_ucb_c=300&_ucb_v=2&_ucb_u=https://akiba-souken.com/vote/v_1111/
 
2024/08/04(日) 14:31:11.06
CloudFlareの認証画面を使うサイトも増えてきたなぁ
Cookie送れば突破出来るんかな、めんどい・・・
541名無しさん@お腹いっぱい。
垢版 |
2024/08/04(日) 16:25:09.20
>>539
uBoでweb.archive.org##+js(aopr, String.fromCharCode)のルール追加して対処しました!
542537
垢版 |
2024/08/04(日) 19:12:55.52
>>537
いま見直したら行番号が違うな・・・
広告ブロッカーの手が入ったキャッシュを見てたのかも、まあいいや。

>>541
location.host みたいな、オリジンサイトとアーカイブとで値が変わるプロパティの参照を
検出させた方が良いように思えます。
543名無しさん@お腹いっぱい。
垢版 |
2024/08/04(日) 19:20:57.89
>>540
DLsiteやDMMの18歳以上バナーをすり抜ける手段とかもな。

強制リダイレクトはYahoo!内のページでも発生することがあったり
2024/08/05(月) 06:48:22.40
archive.today死んでるね
2024/08/05(月) 13:28:21.41
>>536
disable javascriptすれば見れるけど…
2024/08/06(火) 13:21:50.81
ドメイン毎の統計情報見れるようになったって事かこれ?
https://web.archive.org/details/tld:com
https://web.archive.org/details/tld:jp
2024/08/07(水) 00:23:01.34
なんとかサイト一覧をアーカイブしたいサイトメモ
2024/09/30 閉鎖 アキバ総研 >>524-527
2024/12/20 閉鎖 vectorの作者個人ページ >>505
2024/08/07(水) 00:56:45.51
vectorもったいないよなぁ
2024/08/07(水) 03:42:51.14
archive.todayが一部の回線やブラウザを使うとアクセスできないかwelcome to nginxになる状態なんだけどこれどういう状態なんだ…
2024/08/07(水) 03:59:53.62
>>549
回線は関係ないやブラウザの問題だわ
2024/08/07(水) 06:13:56.55
>>549
welcome to nginxになった時は
archive.todayのCookieを削除すると直る
.zipとか取得しようとするとそうなる
2024/08/07(水) 06:33:54.20
>>549
archive.today は、Cloudflare DNS Resolver の利用を拒否しているのでDNSの設定を自分でいじったのなら他に戻す
2024/08/07(水) 07:06:51.47
>>551,552
ありがとうクッキー消したら一旦は普通にアクセス出来るようになったわ
ちょくちょくタイムアウトするのはまた別の問題かしら
あと特定のサイトの画像を保存しようとするとまたwelcom to nginx状態になった
2024/08/07(水) 12:59:00.50
http://kakaku.com/book_cd_dvd/ 7/31
https://engawa.kakaku.com/ 10/31
2024/08/07(水) 14:10:30.49
>>549
> archive.todayが一部の回線やブラウザを
>


取得済みアーカイブを開く時にブラウザUAが Internet ExplorerだとTopへ飛ばされるんで他へ設定変えなきゃならなくなってる。
 
556あぼーん
垢版 |
NGNG
あぼーん
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況