Internet Archive総合 (web.archive.org) #5

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 06:58:53.37

なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
http://archive.org/

インターネット・アーカイブ - Wikipedia
http://ja.wikipedia.org/wiki/InternetArchive
　------------------
Twitter
https://twitter.com/internetarchive/

関連スレ
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/

前スレッド
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/
https://twitter.com/5chan_nel (5ch newer account)

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 07:00:04.50

【QA】

Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ＆文字化けが起きる＆極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック

Q.Web Archiveでダウンロードしたzipなどが開けない＆CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。

Q.寄付したいんだけど?
こちらから金額,一度きりか毎月か,送金方法を選んで寄付してください
https://archive.org/donate

Q.すぐに保存したい場合は?
Save Page NowにURLを入力して「SAVE PAGE」ボタンを押す
https://web.archive.org/save/

Q.アカウント作ったらなんかいいことあるの?
A.ページのスクリーンショットを保存したり、ページの全てのリンク先を保存できる「Save outlinks」という機能が使える

Q.spn@archive.orgにメールでURLを送ったら保存されるの?
A.1週間後に保存完了のメールが届いたり、何も戻ってこない失敗した場合があるので、確実に保存したいなら辞めたほうがいい

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 07:00:23.53

Q.インスタのURLが保存できないんだけど
A.ログインしないとコンテンツが表示されない仕様になったので保存自体が無理になってます

Q.robots.txtでia_archiverをDisallowしても無視されるの?
A.中古ドメインでサイト見れなくするやつのせいでrobots.txtを見ない仕様になったので無視されることも従うこともある。保存できることもあるので確認してみたほうが早い

Q.鯖落ちしてる?
A.ここで鯖状態を見れる
https://analytics0.archive.org/stats/wb.php
https://archive.org/stats/

Q.Temporarily Offline The Internet Archive's sites are temporarily offline. We apologize for the inconvenience. って何?
A.たまにメンテやってサイト見れなくなることがあるので、待ちましょう。ツイッター(@InternetArchive)でメンテ予告は発表しています

Q.Save Page Nowの制限などの仕様は?
A.ここを参照
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit

Q.Save Page Nowで保存完了しても保存されたページが表示されないんだけど
A.完全にページが見れるようになるのと、/*/のページ一覧やカレンダーに反映されるまで時間かかるので最大数日待ってください
ほとんどは数分後には見えるようになってるはず、もしくはウェブブラウザのキャッシュを削除するといいかも

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 07:01:15.35

Q.「The capture is estimated to start in XX minutes.」って何?
A.Save Page Nowの保存サーバーの空きがなくて保存処理に時間がかかってる状態、急いでなければあとでやるのも手

Q.The same snapshot had been made XX minutes and XX seconds ago. We only allow new captures of the same URL every XX minutes.
A.同じURLを短期間の間に何度も保存できない仕様になっています、誰かが数分前に保存したか、自分で保存したときに一部の画像がかけて保存されている状態でも表示されることがあります
気になるなら1時間後ぐらいにもう一度保存してください

Q.The server didn't respond in time for https://(保存しようとしたURL)
A.極端にページの返答が遅いサイトを保存しようとするとこの表示が出ます、何度かやれば保存できることもあります

Q.「You have already reached the limit of active sessions」が出た
A.同じIPアドレスからの同時保存制限に引っかかってる状態。2021年5月24日以降はログインしていないユーザーは同時保存は3個まで。1分ほど待てば制限解除される

Q.「This URL has been already captured 10 times today. Please email us at "info@archive.org" if you would like to discuss this more.」が出た
A.1日に同じURLは10回まで保存できる制限に達したので、また明日(UTC)

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 07:01:22.75

Q.「This URL has been excluded from the Wayback Machine. 」って何?
A. robots.txtのブロックや、サイトの運営者や著作権者がドメインやこのディレクトリごと非表示化の申請をした可能性があります、
ただしURLの保存はできますし、将来的にブロックが解除されて見れるようになる可能性もあります

Q.「Cannot get status of spn2-乱数」のエラーは何?
A.Save Page Nowで保存中にサーバーの状態が取得できなかったときのエラーで、/*/で保存されているか確認して、されてなければもう一度保存してください

Q.「404 Not Found」のエラーは何?
A.サイトが存在していてもこのエラーが出ることがあります。その場合は時間あけて一度保存してみましょう

Q.「Sorry Job failed」が出た
A.このエラーが出たとしても一部画像やスクリプトファイルが欠けた状態でページ保存できていることがありますので、/*/で確認してみてください
保存できてない場合はやり直してください

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 07:01:40.39

便利なツール
https://github.com/webrecorder/webrecorder-player/
https://github.com/internetarchive/wayback/tree/master/wayback-cdx-server#query-result-limits
https://github.com/hartator/wayback-machine-downloader
https://github.com/overcast07/wayback-machine-spn-scripts
https://github.com/akamhy/waybackpy
https://github.com/JustAnotherArchivist/snscrape
https://github.com/bibanon/tubeup

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 07:01:55.63

拒否URL関係まとめ

This URL has been excluded from the Wayback Machine.
https://note.com/
https://gigazine.net/
https://boards.4channel.org/
https://bokete.jp/
https://yoshidakenkou.net/
https://tanteifile.com/
https://motherless.com/
https://www.lancers.jp/

This URL is in our block list
https://finance.yahoo.co.jp/brokers-hikaku/ 以下全て
https://movie.eroterest.net/
https://anime.eroterest.net/

サイトの仕様で取れないもの
https://ch.dlsite.com/matome　記事本文が取得不可、todayなら取れる
https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる

ArchiveTeamのexcludedまとめ
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 07:02:57.18

アーカイブ済のURL一覧を出力する方法
1. http://web.archive.org/cdx/search/cdx?url=example.com*&;output=txt にアクセス
2. example.comのところをアーカイブしたページのトップページURLに変える。*を誤って消さないようにすること
3. 大量のテキストが出るので全選択してコピー
4. Excel立ち上げてCtrl+Aで全選択して貼り付け
5. 「テキストから列へ」を選んでスペースを基準にセルを区切る
6. セル列のアルファベット文字をクリックしたらその列が全選択になるからURLの列をコピーしてテキストエディタに貼り付けるなりする

同じURLでも保存した時間分の数書いてあるから置換ツールで重複した行を消すこと
IAのURLsでは10000個までしか表示できないがこの方法使ってアーカイブされたURLの正確な総数がわかるはず
WEB版のExcelだと貼り付け時に容量オーバーで受け付けてくれないことがあるからその場合はLibreOffice Calcでも使えばいい
LibreOfficeの場合貼り付け後、表全体の全選択を解除し、1回セルAをクリックしてセルAを全選択した後、データ→テキストから列へを選ぶことでセル分け可能

引用元: https://exposureninja.com/blog/extract-urls-archive-org/
https://mevius.5ch.net/test/read.cgi/esite/1628793497/332

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 07:25:43.19

>>1おつ

Internet Archive総合 (web.archive.org) #2
https://mevius.5ch.net/test/read.cgi/esite/1475246713/5

5 名前：名無しさん＠お腹いっぱい。[sage] 投稿日：2016/10/01(土) 04:24:53.46
テンプレのＱ＆Ａ二件、まだそんなやり方が通用すると思ってる奴いるの？

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 16:21:28.75

おつでありんす

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 19:06:10.70

todayだとヤフーニュースが保存できなくなってる
だからInternet Archiveで保存することが増えた

慶応vs横浜だけじゃない…甲子園目指す球児とファンを悩ます高校野球「パイア問題」とは？
news.yahoo.co.jp/profile/comments/55eb7cbd-6f69-41ed-ab91-6d7a3ebd5d16

**名無しさん＠お腹いっぱい。** · 2023/07/28(金) 19:09:18.35

私も19年前鹿児島県大会の夏、三塁塁審の誤審により三点本塁打となり高校野球を終えました。
主将を務めていた私は何度も三塁塁審へ抗議にいきましたが、塁審は「私が間違う訳がない」の一点張り。
その日に放送されたニュースでもしっかりファウルである映像が映し出されましたが判定が覆ったわけでもなく、
むしろその誤審をした審判は今や鹿児島県高野連の審判長まで登り詰めております。
ただ試合後主審の方が私を呼び出し、「審判も人間だから間違うときもあるからね」と声を掛けられました。
誰が見てもわかる誤審であっても審判長にまで登りつめるためには誤審を認めるわけにはいかない、
審判の方々も会社と一緒でそういったなかでされていて大変なのかもしれないとこの歳になって少しわかってきました。

todayでも↑のコメントを保存したかったなあ…

**名無しさん＠お腹いっぱい。** · 2023/07/29(土) 03:23:34.53

盲人でも野球の審判を業務として行えるという実例ですね

**名無しさん＠お腹いっぱい。** · 2023/07/29(土) 14:34:01.29

twitterのプロフィールはwaybackmachineで保存できなくなった
個別のツイートは保存できるけど、コメント欄は保存できないし、いろいろ改悪されたなあ

**名無しさん＠お腹いっぱい。** · 2023/07/31(月) 10:26:16.62

tubeupでひたすらサムネイルだけ上げてる奴って何が目的なんだ？
他の人がアップロード出来なくなるから普通に迷惑なんだが

**名無しさん＠お腹いっぱい。** · 2023/08/01(火) 12:14:52.09

ニコニコとかYouTubeってarchiveで保存しても動画再生出来ないの？

**名無しさん＠お腹いっぱい。** · 2023/08/01(火) 14:26:51.27

>>16
自分は魚拓サイト初心者だから専門的な知識とかは余り持ってないけど
IAやtodayでは動画サイトの動画は恐らく保存されないと思う

**名無しさん＠お腹いっぱい。** · NG

>>16 >>17
IAはYouTubeだけ特別に動画も保存される仕様になってる

**名無しさん＠お腹いっぱい。** · 2023/08/02(水) 11:49:36.01

>>14
今はプロフィールも保存できるね（ログインしなくても閲覧出来る）

方針コロコロ変えすぎでわけが分からないよイーロン

**名無しさん＠お腹いっぱい。** · 2023/08/02(水) 14:26:37.14

動画サイトが動画直リン保存すればいける場合もあんのか

**名無しさん＠お腹いっぱい。** · 2023/08/04(金) 14:12:38.34

またTwitterのプロフィール取れなくなってるわ
あのさぁ・・・

**名無しさん＠お腹いっぱい。** · 2023/08/05(土) 21:26:33.08

あれ？また取れるようになってるな
非ログイン状態でも見れるプロフィールと見れないやつがある？
条件が分からん

**名無しさん＠お腹いっぱい。** · 2023/08/06(日) 01:13:10.24

なんかtwitterのプロフィール保存すると、過去ツイがランダムに表示されるだけで、最新のツイートが保存されてない。

もう訳わからんわw

**名無しさん＠お腹いっぱい。** · 2023/08/07(月) 10:27:43.52

archive.orgって画像複数を一括保存とか出来る？
いちいち一つずつURL入力保存しないといけないの？

**名無しさん＠お腹いっぱい。** · 2023/08/07(月) 10:37:01.96

>>24
API が公開されているから、画像に限らずそれ利用するスクリプトを組めばよい。
https://docs.google.com/document/d/1Nsv52MvSjbLb2PCpHlat0gkzw0EvtSgpKHu4mk0MnrA/edit

**名無しさん＠お腹いっぱい。** · 2023/08/08(火) 07:22:55.57

>>24
Have you ever wanted to archive all the web pages linked from an email message?

Well, you are in luck because now you can forward that email to savepagenow@archive.org”
and after a few minutes you will get an email back filled with Wayback Machine playback URLs.

**名無しさん＠お腹いっぱい。** · 2023/08/08(火) 12:31:37.42

>>7
>
> サイトの仕様で取れないもの
> https://ch.dlsite.com/matome　記事本文が取得不可、todayなら取れる
> https://www.pixiv.net/ 投コメのみ取得可、todayなら取れる
>

↑今春までならtodayで取った完全アーカイブをarchive.orgへ再取り出来たんだが拒否URLにされたのか弾かれるようになってしまった。。
　
　

**名無しさん＠お腹いっぱい。** · 2023/08/08(火) 12:46:26.56

前スレ埋まってないんだから前スレに書きなよ

**名無しさん＠お腹いっぱい。** · 2023/08/10(木) 00:08:00.56

dclogもサービス終了

**名無しさん＠お腹いっぱい。** · 2023/08/10(木) 06:52:14.96

>>29
終了告知から終了まで1か月もないとはひどいサービスだな

**名無しさん＠お腹いっぱい。** · 2023/08/13(日) 02:05:43.24

音楽レーベル、デジタル化されたレコードコレクションをめぐりインターネット・アーカイブを提訴
https://www.reuters.com/legal/music-labels-sue-internet-archive-over-digitized-record-collection-2023-08-12/

**名無しさん＠お腹いっぱい。** · 2023/08/13(日) 18:25:16.62

Sheetsのbatch処理ここ数日ずっとqueuedのままや
そんなに使ってる人おるんか

**名無しさん＠お腹いっぱい。** · 2023/08/14(月) 01:51:11.53

archiveってpornhubとかエロ動画直リン保存ってしていいの？

**名無しさん＠お腹いっぱい。** · 2023/08/14(月) 05:36:17.08

>>33
やめとけやめとけ、お前のお母さん悲しむぞ

こんなのも絶対に見ちゃいかんｗ
https://archive.org/details/adultcdroms

**名無しさん＠お腹いっぱい。** · 2023/08/14(月) 13:55:59.20

>>31
日本語記事も出た

ソニーら音楽各社、著作権侵害でInternet Archiveを提訴。SPレコード2749作品以上をデジタル化・公開
https://www.techno-edge.net/article/2023/08/13/1742.html

**名無しさん＠お腹いっぱい。** · 2023/08/14(月) 19:47:23.54

>>33
internet archiveの規約を見た感じ特にルールは設けられてなさそうだけど、
archive teamによるとコンテンツが削除されたり、アカウントが凍結されたりする可能性はあるらしい

余談だけど、archive teamは元々ポルノはネット上で最も分散保存されているコンテンツだからアーカイブしないという方針だったんだけど
wikiの編集履歴確認したら、今年8月からは通常のコンテンツと同様の扱いにするという方針に切り替えたっぽいな
https://wiki.archiveteam.org/index.php/Porn

**名無しさん＠お腹いっぱい。** · 2023/08/16(水) 07:35:06.43

最近フラッシュのページのアーカイブ見るとruffleっていうＳＷＦエミュレータが起動してフラッシュを再生してくれるようになったな

**名無しさん＠お腹いっぱい。** · 2023/08/17(木) 09:37:24.83

xtubeの動画のアーカイブもなんとかなりませんか
どうせどっかにあるんだろ

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 07:41:35.73

SPN2のAPIのドキュメントに、「anonymous user」って表記があるんだけど、anonymous でAPI叩くには何を指定すれば良いの？
authorizationヘッダを付けずにAPI呼ぶと、
"You need to be logged in to use Save Page Now."
ってエラーになっちゃう。
anonymousの制約で十分だから、APIキー無しで使いたいんだけどな

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 17:51:35.50

>>39
それ、応答を HTML でも返せるところを
Accept ヘッダでわざわざ JSON 形式を要求すること自体が要アカウントっぽいんだよね。
どーしてまたそんな所に匿名ユーザ制限が入ってるのかは解らんけど。

**名無しさん＠お腹いっぱい。** · 2023/08/21(月) 22:43:21.39

現状のSPN2APIはよく分からん仕様が多くて「痒い所に手が届かない」感じなので
あまり深く考えない方がいい

**名無しさん＠お腹いっぱい。** · 2023/08/22(火) 22:54:25.65

ヤフー知恵袋、SPNだと取れるのにoutlinksの方だけエラーになってるぽいな

**名無しさん＠お腹いっぱい。** · 2023/08/23(水) 22:13:20.02

ここ最近自動でアーカイブされてないこと多いよな。
御叱りでも受けたか？

**名無しさん＠お腹いっぱい。** · 2023/08/23(水) 22:15:20.98

>>14 イーロンの仕業か。

**名無しさん＠お腹いっぱい。** · 2023/08/24(木) 09:10:55.59

ここ数日やけに接続エラーが起きてると思ったらこれなんだよね。
スクリプトは当面 HTTP へ切り替えるかぁ。

**名無しさん＠お腹いっぱい。** · 2023/08/24(木) 18:22:24.75

>>45
道理で最近つながりづらいことが多いと思ったら・・・
俺環だけではなかったのか

**名無しさん＠お腹いっぱい。** · 2023/08/26(土) 03:04:26.70

久々に SPN2 API のドキュメントを見返していたら、
/save/ に新設のパラメータがあることに気づいたぁ。

use_user_agent=<XXX>
Use custom HTTP User-Agent value when capturing the target page.

2022-07-28 日付けの版で追加されてたのね。

**名無しさん＠お腹いっぱい。** · 2023/08/26(土) 11:12:00.83

Sorry Job failed
と表示されるarchive.orgのページが保存される謎バグに遭遇して笑った
ただの表示バグだと思いたい

**名無しさん＠お腹いっぱい。** · 2023/08/28(月) 17:44:50.52

Atwikiってspn で取れなくなってる？
エラー吐いてる

**名無しさん＠お腹いっぱい。** · 2023/08/28(月) 18:00:19.46

と、何のエラーか説明すらできない言語障碍児が申しております。

**名無しさん＠お腹いっぱい。** · 2023/08/28(月) 18:12:11.36

おま環じゃなかったか
アニオタwiki消えそうだから保存しようとしたんだけどなー
Archiveboxで自分でwarc取るしかないか
センキュー

**名無しさん＠お腹いっぱい。** · 2023/08/28(月) 19:13:33.15

HTTP status=403
atwiki側が意図的に排除してる

エラー吐いてる、だけじゃ何もわからんな

**名無しさん＠お腹いっぱい。** · 2023/08/28(月) 19:38:17.09

atwikiって前は取れた気がするけど
方針変えたのか？

**名無しさん＠お腹いっぱい。** · 2023/08/28(月) 20:32:04.13

https://web.archive.org/web/20230828112759/w.atwiki.jp/aniwotawiki/
403から200に戻ったｗ

**名無しさん＠お腹いっぱい。** · 2023/08/29(火) 17:46:42.89

Googleだとなぜかhttpの方がインデックスされてるせいで繋がらないな
というかいい加減httpからhttpsに転送するようにして欲しい

**名無しさん＠お腹いっぱい。** · 2023/08/31(木) 09:07:02.89

Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/975

975 名前：名無しさん＠お腹いっぱい。[] 投稿日：2023/07/24(月) 07:55:27.47
放置してたらURL8万行分集めてて、もう飽きたからこれアーカイブしてdatアーカイブやめます
保存されるやつみたら文字化けしてるし意味あるのかなといった感じでもある
普通の過去ログやる方が有意義におもう

↑エアプ野郎ｗ

**名無しさん＠お腹いっぱい。** · 2023/08/31(木) 11:07:06.36

http://homepage2.nifty.com/J-R/enjoy%20pich.htm
↑のアーカイブを見ようと思ったら「This URL has been excluded from the Wayback Machine.」となってて、つまり除外設定されてるんだけど
これの理由(誰が、いつ申請したか)を知る事って出来る？

禁止しているドメインの一覧は多分↓なんだろうけど、このページ自体は2019年くらいから作られるし、リストに追記される理由とか何も書いてないから詳しくがわからん
https://wiki.archiveteam.org/index.php/List_of_websites_excluded_from_the_Wayback_Machine

個人が作るHPスペースをまるごと除外設定するのが通るのは、インターネットアーカイブの目的としてもちょっと勘弁して欲しいなあ
個人HPこそ後世に残したい

**名無しさん＠お腹いっぱい。** · 2023/08/31(木) 22:19:54.68

>>56
> 保存されるやつみたら文字化けしてるし

テキストエンコーディング変換前のファイル見れるだろ

**名無しさん＠お腹いっぱい。** · 2023/09/01(金) 02:04:41.12

>>58

多分このことじゃね？

https://web.archive.org/web/20230711093514/https://agree.5ch.net/operate/dat/1608930977.dat

**名無しさん＠お腹いっぱい。** · 2023/09/01(金) 06:24:58.23

スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ
https://web.archive.org/web/20230711093514im_/https://agree.5ch.net/operate/dat/1608930977.dat

**名無しさん＠お腹いっぱい。** · 2023/09/01(金) 13:11:43.12

>>57
理由は公開されないけど基本的にサイトの管理者が除外申請した場合だね
確かにアーカイブの目的には反してるが、ここをしっかりしないと著作権侵害で突かれる可能性があるので
あとexcludedであってdeletedではないのでIAには残ってるはず、オンラインでアクセス不可になるだけ

**名無しさん＠お腹いっぱい。** · 2023/09/02(土) 07:00:06.31

YouTUbeの再生ページがアーカイブされるの遅過ぎだろ。
何やってんだよインターネットアーカイブに保存する人は！全然チェックされてないじゃん！
やる気あんのか？寝てたのか？
どうして誰も保存しないんだ？自動アーカイブはどうした？

https://www.youtube.com/watch?v=jjZEQ9Nocp4

https://www.youtube.com/watch?v=lnlyZlIRO1U

**名無しさん＠お腹いっぱい。** · 2023/09/02(土) 07:42:50.72

YouTubeの再生ページがアーカイブされるのがかなり遅いケースがもう10か月以上も続いている。
公開から10時間後とか。
自動アーカイブはどうしたのか？

**名無しさん＠お腹いっぱい。** · 2023/09/02(土) 13:11:42.88

5chをアーカイブしてもエラーページになる事が増えたなぁ
重くなってるのか？

**名無しさん＠お腹いっぱい。** · 2023/09/03(日) 18:03:57.56

一番上に書いてあるvideoとかmusicってなんですか？
いろいろありますけど保存してもいいんですかね？

**名無しさん＠お腹いっぱい。** · 2023/09/03(日) 19:52:30.07

昔と違い私的理由で使う人が多すぎて
ゴミ集積場化が止まらない

**名無しさん＠お腹いっぱい。** · 2023/09/03(日) 22:28:57.02

archive.today繋がらない
おま環？
>>66
たとえばどんなサイトの事言ってるの？

**名無しさん＠お腹いっぱい。** · 2023/09/04(月) 17:39:35.18

>>64
同感

たとえば「【文春砲】令和の米騒動、現場写真がリークされる」というスレッドも
8月31日の11:32:22は保存できているのに、それ以降はエラーが起きて保存されていない

web.archive.org/web/20230000000000*/https://nova.5ch.net/test/read.cgi/livegalileo/1693474206

**名無しさん＠お腹いっぱい。** · 2023/09/05(火) 10:44:06.47

同じスレを何度も保存する意味あるの？

**名無しさん＠お腹いっぱい。** · 2023/09/05(火) 17:30:52.63

1000までいってないなら意味あるんじゃない

**名無しさん＠お腹いっぱい。** · 2023/09/05(火) 20:42:01.45

もう「なんでも実況(ガリレオ)」板のスレは過去ログの魚拓とれないのかもな

【悲報】安倍晋三語録、「同意」を表すものが存在しない
nova.5ch.net/test/read.cgi/livegalileo/1693837620

IAではserver errorとなるしアーカイブトゥデイでも「Not Found (yet?)」となる　→　archive.is/I6WEN

**名無しさん＠お腹いっぱい。** · 2023/09/05(火) 23:40:36.69

昔の魚拓見ようにも重いのかエラー出るな

**名無しさん＠お腹いっぱい。** · 2023/09/06(水) 00:36:21.59

>>71
nova.5ch.net は 7 月から継続的に DDoS 攻撃を受けているサーバのうちの一つ。
その対応で、おそらく日本以外の IP 向けに L4 レベルのアクセス制限を掛けている。

https://agree.5ch.net/test/read.cgi/operate/1673084281/16-

**名無しさん＠お腹いっぱい。** · 2023/09/06(水) 15:40:13.70

>>73
なるほど
確かにエラーが起こるのはnovaが多かったな
永久に解除されない、なんてことにならなきゃいいが・・・

**名無しさん＠お腹いっぱい。** · 2023/09/07(木) 17:59:45.87

【悲報】17歳の上玉白人美少女ちゃん、交通事故の罪で終身刑を言い渡される
nova.5ch.net/test/read.cgi/livegalileo/1693978274

このスレもサーバーエラーで魚拓とれなかったからグーグルのキャッシュ経由で魚拓とった
archive.li/pGUd4

**名無しさん＠お腹いっぱい。** · 2023/09/09(土) 08:46:02.23

家のWi-FiでCONNECTION REFUSEDしか出ないから試しに携帯回線につなぎ替えたら普通に繋がった。
手動で取ってただけでアク禁にされたのか

**名無しさん＠お腹いっぱい。** · 2023/09/09(土) 09:07:31.51

>>76
それ、一週間前にうちもやられた。
仕方なく筑波 VPN 挿して、同じようにガンガン回したけどそっちは止められることが無かった。
何が引っ掛かったのか、全くもって判らん。

**名無しさん＠お腹いっぱい。** · 2023/09/09(土) 22:32:08.21

>>76だけど半日くらいで解除されたっぽい

**名無しさん＠お腹いっぱい。** · 2023/09/10(日) 12:26:18.58

>>73-74
eggもエラー起きるな

**名無しさん＠お腹いっぱい。** · 2023/09/12(火) 01:16:30.06

Twitterまた取れなくなってね？

**名無しさん＠お腹いっぱい。** · 2023/09/13(水) 01:14:09.55

前スレのころ20分ぐらいつながらないことがあったが、
それ以上に長くつながらない・・・

**名無しさん＠お腹いっぱい。** · 2023/09/13(水) 07:16:08.88

81の件、ようやくつながった

**名無しさん＠お腹いっぱい。** · 2023/09/14(木) 16:24:12.75

twitter、じゃなくてX取れなくなってるな
個別のポストはtodayの方で辛うじて取れるが

**名無しさん＠お腹いっぱい。** · 2023/09/15(金) 05:44:55.86

twitterで良くね
Xとか勝手に名称変えたアホ以外誰も言ってねえわ

**名無しさん＠お腹いっぱい。** · 2023/09/15(金) 11:00:18.27

ジャスコ、ダイエー、サティ、ダイヤモンドシティ、イオン、

**archive.is/tTrQN** · 2023/09/15(金) 20:45:51.70

前スレ955への返信だがグーグルキャッシュなどを経由すれば
好き嫌いドットコムのコメント欄も魚拓とれる場合がある

webcache.googleusercontent.com/search?q=cache:syMmr8fOqbkJ:https://suki-kira.com/people
/result/%25E3%2582%2586%25E3%2581%259F%25E3%2581%25BC%25E3%2582%2593

**名無しさん＠お腹いっぱい。** · 2023/09/18(月) 12:38:04.07

>>76
アク禁にされたっぽい
保存はやってなかった、心当たりがあるのは多数の保存済みアーカイブを一斉に開いただけ

**名無しさん＠お腹いっぱい。** · 2023/09/19(火) 01:23:34.92

ツイートと付随する動画像をCSVでまとめて落とせる国産ツールない？
イーロンになってからアーカイブサイトにいれるだけじゃ不安だから、自前で持っておいて必要に応じてアップできるようにしたい

**名無しさん＠お腹いっぱい。** · 2023/09/20(水) 16:11:43.42

Batch process Google Sheetsがabort出来ないバグ何とかしてくれ
相手側に負荷がかかってたらどうすんだよ

89 · 2023/09/20(水) 16:18:49.76

やっと止まったわ、遅すぎ

**名無しさん＠お腹いっぱい。** · 2023/09/21(木) 10:05:32.27

5ちゃんも有料化云々でヤバそうだし
スレアーカイブしといた方が良さそうだな…
そろそろ消えそうな予感

**名無しさん＠お腹いっぱい。** · 2023/09/21(木) 13:38:51.45

いつ復旧するかなー

**名無しさん＠お腹いっぱい。** · 2023/09/23(土) 18:28:51.16

Attempts to archive this video failed.
はなんなんだよ

**名無しさん＠お腹いっぱい。** · 2023/09/24(日) 13:01:59.07

savepagenowを実行したあとにgoogleのサポートページ？に飛ばされるのはどういう仕様？

**名無しさん＠お腹いっぱい。** · 2023/09/24(日) 14:22:50.44

twitterの記録取れなくなるのは将来に禍根を残すと思うわ。
数百年後に歴史を振り返った時にSNSは史料的な価値があると思う。

**名無しさん＠お腹いっぱい。** · 2023/09/24(日) 18:43:53.30

今のツイッターって?failedScript=vendorつけても無理になったの？

**名無しさん＠お腹いっぱい。** · 2023/09/25(月) 18:24:55.68

ﾌｳｰεε=( ~ε~ )y-ﾟﾟﾟ

**名無しさん＠お腹いっぱい。** · 2023/09/29(金) 16:40:42.99

teacup. byGMOレンタル掲示板あんま残ってねえな

**名無しさん＠お腹いっぱい。** · 2023/10/03(火) 16:40:59.85

もう5chの過去ログ課金しないと見れないっぽいね

**名無しさん＠お腹いっぱい。** · 2023/10/04(水) 10:45:27.46

>>99
現役鯖の分はまだ落ちてくるけどなぁ
https://mevius.5ch.net/esite/oyster/1628/1628793497.dat
/oyster/ 以下のディレクトリインデックスが掘れなくなってはいるが

**名無しさん＠お腹いっぱい。** · 2023/10/04(水) 14:13:19.96

Sorry
Cannot resolve host ipv6.icanhazip.com.

IPv6 の名前解決ができなくなってる

**名無しさん＠お腹いっぱい。** · 2023/10/05(木) 21:27:26.21

todayがちと重い

**名無しさん＠お腹いっぱい。** · 2023/10/07(土) 15:40:46.22

>>99
単純に重いだけじゃない？

**名無しさん＠お腹いっぱい。** · 2023/10/07(土) 18:44:36.46

今繋がらないんだけど、私だけですか？

**104** · 2023/10/07(土) 18:57:20.21

Wi-Fiに切り替えたら繋がった。
どうやらアク禁らしい。
普通に閲覧してただけだし、何も心当たりないんだけど…

87 · 2023/10/07(土) 20:45:50.36

>>105
その「閲覧」もヤバい

**104** · 2023/10/07(土) 23:17:39.68

>>106
えっ、そうなの？
とりあえず今はアク禁解除されたっぽいけど、
アク禁になる条件って、短時間にたくさん見るとか？

**名無しさん＠お腹いっぱい。** · 2023/10/08(日) 11:31:56.88

人間レベルの閲覧でアク禁になるなんて聞いたことないが
ただの勘違いじゃないの？

**名無しさん＠お腹いっぱい。** · 2023/10/08(日) 11:55:37.48

画像が大量にあるページでそのほとんど取れてなかったりするとすぐ開けなくなる

**名無しさん＠お腹いっぱい。** · 2023/10/08(日) 13:14:20.29

>>109
> 画像が大量にあるページでそのほとんど取れてなかったり

その取れてない画像、全て/save/にリダイレクトされてるから
結果として大量にアーカイブ要求を発行することになるんだよね

んで、その時にアーカイブされるのは3つ程度であとは全て429エラー
運が悪いとそのままアク禁

**名無しさん＠お腹いっぱい。** · 2023/10/10(火) 14:58:47.09

>>99
過去ログについては一応、2chSCへも殆どがミラーされてるはずだけどな…。

**名無しさん＠お腹いっぱい。** · 2023/10/12(木) 23:37:32.61

油断は禁物

あとpink系は全部だめ
５ｃｈ新設板系も全部だめ

**名無しさん＠お腹いっぱい。** · 2023/10/12(木) 23:58:45.47

ｓｃはクロールされてるなと思って後で確認すると途中でクロールが止まってそのままというのがかなりある
こういう状態になるとクロール再開しないケースが多く５ｃｈ側が飛んだ時に頭のほうしか控えが取れてなかったりする

**名無しさん＠お腹いっぱい。** · 2023/10/16(月) 02:19:32.91

過去ログ、今年中は見れない可能性あるらしいな・・・

0119Ace ★
2023/10/13(金) 09:40:26.65ID:CAP_USER
過去ログについてですが、現状はアーカイブ圧縮状態で
展開再配置は相当に時間がかかる見込みです。
完了は年を越す可能性もあります。

https://agree.5ch.net/test/read.cgi/operate/1697113482/119

**名無しさん＠お腹いっぱい。** · 2023/10/18(水) 23:04:25.87

たまに総アーカイブ数が294 billionって表示されるの何なんだ？

**名無しさん＠お腹いっぱい。** · 2023/10/20(金) 22:59:55.77

>>112
一応なんG板とか、2014年春以降に新設された板でもSC側のbbsmenu一覧ページに追加されてないだけで、

［　http://tomcat.2ch.（えすしー）/livegalileo/　］

…の鯖名から開けばアーカイブされてたりするけど、PINKともども最近の過去ログについては本鯖のモノが未だ活きてる。

**名無しさん＠お腹いっぱい。** · 2023/10/23(月) 17:58:57.35

X保存できるようになってる

**名無しさん＠お腹いっぱい。** · 2023/10/23(月) 17:58:58.33

X保存できるようになってる

**名無しさん＠お腹いっぱい。** · 2023/10/23(月) 17:59:05.79

X保存できるようになってる

**名無しさん＠お腹いっぱい。** · 2023/10/23(月) 18:00:35.82

連投すまん
ミスった

**名無しさん＠お腹いっぱい。** · 2023/10/24(火) 14:07:36.28

>>107-108
残念ながら自分も・・・
前は20分ぐらいつながらなかったのが、
最近は締め付けが厳しくなりそれでは済まないレベルに

**名無しさん＠お腹いっぱい。** · 2023/10/24(火) 14:07:46.22

>>107-108
残念ながら自分も・・・
前は20分ぐらいつながらなかったのが、
最近は締め付けが厳しくなりそれでは済まないレベルに

**名無しさん＠お腹いっぱい。** · 2023/10/25(水) 20:59:15.52

video.twimgとれなくなった？

**名無しさん＠お腹いっぱい。** · 2023/10/27(金) 02:04:52.34

>>123
普通に取れるけど

**名無しさん＠お腹いっぱい。** · 2023/11/02(木) 00:20:55.25

こんなのがいつのまに
2022年11月18日 23時00分レビュー
無料＆広告なしで個人サイトを作成できるGeocities風サービス「Neocities」を使ってみたよレビュー
https://gigazine.net/news/20221118-neocities-free-website/

**名無しさん＠お腹いっぱい。** · 2023/11/05(日) 02:15:27.98

利用者の多いコンテンツの生殺与奪を特定小数人が握ってるのは危なっかしいよな
ttps://hayabusa9.5ch.net/test/read.cgi/mnewsplus/1698901347/
まあつべはバックアップを隠し持ってそうだけど　こんな金になりそうなもん手放さねえだろうし　一般人が直に利用できないだけで

**名無しさん＠お腹いっぱい。** · 2023/11/05(日) 17:54:34.46

日本の書籍が著作権ありのもたまにいいのがアップされてたのが、騒動以後いっこもアップされなくなったなあ
結構暇つぶしにいいのに

**名無しさん＠お腹いっぱい。** · 2023/11/08(水) 01:45:12.70

質問です
・今開いているサイトの魚拓をワンクリックで取る方法はありますか？
（いちいちInternet Archiveのサイトを開いてコピーしたURLをペーストして決定を押すのがちょっと面倒です
）
・サイト全体（orサイトの複数ページ）を自動で保存してくれる機能はありますか？

**名無しさん＠お腹いっぱい。** · 2023/11/08(水) 11:53:44.52

>>128
公式のページで使えと書かれている拡張機能
https://chrome.google.com/webstore/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak
https://chrome.google.com/webstore/detail/archive-page/gcaimhkfmliahedmeklebabdgagipbia

**名無しさん＠お腹いっぱい。** · 2023/11/08(水) 12:48:50.05

アクティブチーム何やってんだよ。
なんで下記のURLは誰もアーカイブしてないんだ？

https://www.youtube.com/watch?v=XGeNeLWnYdc

**名無しさん＠お腹いっぱい。** · 2023/11/08(水) 13:50:28.69

アクティブチームｗ

**名無しさん＠お腹いっぱい。** · 2023/11/09(木) 20:53:09.04

どうしてもすぐにアーカイブしたい動画があるならtubeupを使って自分でうpするか
Yt-dlpを使ってメタデータを含めてローカルに落とすのが理想や！

**名無しさん＠お腹いっぱい。** · 2023/11/10(金) 23:40:24.43

ArchiveTeamは特定の動画(削除の危機がある, ニュース, 政治etc)に限定して保存してるから、保存したい動画は手動保存する必要がある
リソースは有限だからね
↓詳細
https://wiki.archiveteam.org/index.php/YouTube#Scope

**名無しさん＠お腹いっぱい。** · 2023/11/11(土) 13:29:16.82

Wayback Machineに保存されてるそこそこ古めのページを表示すると、一部の画像が表示されない事ってよくあるよね。
あれって何でああなってるの？たとえば以下のページなど。
https://web.archive.org/web/20021017173116/http://www.namco.co.jp/home/cs/lineup/mrdriller/page01.html

このページは2002年保存だけど、比較的新しい2010年とかに保存されたページでも同現象になってたりする。
当時保存した人も、ちゃんと保存できてるか確認して、当時は問題なく表示されてたんだと思う。
今俺たちが保存してるサイトも、10年後には画像がところどころ抜け落ちて不完全な状態になるのかと不安。

**名無しさん＠お腹いっぱい。** · 2023/11/11(土) 13:32:47.70

確認されてないから画像が抜け落ちてる

**名無しさん＠お腹いっぱい。** · 2023/11/11(土) 15:59:18.06

>>134
そもそも Internet Archive でヘッドレスブラウザを実装したのがほんの数年前のことで、
それまでは指示された単一のファイルをアーカイブするだけだったから。

アーカイブされた HTML をクライアント側のブラウザで表示したときに
個々の画像等の保存リクエストが Internet Archive へ発行されるような実装が
なされたこともあったが、それ自体も 2010 年代中盤だったはず。

**名無しさん＠お腹いっぱい。** · 2023/11/11(土) 19:27:03.13

そうかなぁ？
俺はInternet Archive側にある画像ファイルが何らかの理由で勝手に消滅したと思ってる。
以下のサイトとかもそう。画像が1つも保存されてないのはおかしいだろ。
https://web.archive.org/web/20131007222449/http://www.spike-chunsoft.co.jp/fr/index.html

**名無しさん＠お腹いっぱい。** · 2023/11/11(土) 19:39:27.54

>>137
それ Alexa のクローラが保存したアーカイブだしｗ

**名無しさん＠お腹いっぱい。** · 2023/11/11(土) 20:41:42.88

>>137
https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3%E3%82%BF%E3%83%BC%E3%83%8D%E3%83%83%E3%83%88%E3%82%A2%E3%83%BC%E3%82%AB%E3%82%A4%E3%83%96
IA自身がクローラーを回して収集活動を始めるまでの歴史について知っておくと良い。

**名無しさん＠お腹いっぱい。** · 2023/11/11(土) 21:56:56.93

昔のエッチサイトで自分が見たいところだけ抜け落ちてる悲しみ(´･ω･｀)

**名無しさん＠お腹いっぱい。** · 2023/11/13(月) 01:18:15.56

IAのアーカイブって色んな団体のアーカイブがまとまったものだからな、SPNなんてごく一部だよ
画像も収集してる団体もあれば、HTMLだけを取得してる団体もあるのでアーカイブ次第
例えばウェイバックマシンを使ってるとよく目にするCommon Crawlはほぼ画像が取得されてない

**名無しさん＠お腹いっぱい。** · 2023/11/13(月) 11:01:00.35

確実に保存したい時は
InternetArchiveとArchive.todayどっちもアーカイブしてるわ
それで大体残ると思うけどどうだろ

**名無しさん＠お腹いっぱい。** · 2023/11/13(月) 21:58:51.62

>>141
それで精度だったり保存量にばらつきがあるんすね

**名無しさん＠お腹いっぱい。** · 2023/11/14(火) 22:23:03.18

ここ最近自動アーカイブがされてないようだけど一体どうしたんだ？

**名無しさん＠お腹いっぱい。** · 2023/11/15(水) 13:06:21.31

ここのアーカイブ開いても年齢確認から先に進めない

ラズパイでエロゲ
https://sirius10.net/Games/hgames.php

**名無しさん＠お腹いっぱい。** · 2023/11/15(水) 13:33:45.41

>>145
クッキー喰ったことにすればアーカイブはできるな。
使うのは API の capture_cookie パラメータ。
https://web.archive.org/web/20231115043115/sirius10.net/Games/hgames.php

**名無しさん＠お腹いっぱい。** · 2023/11/15(水) 16:29:16.84

えっ？年齢認証のページも保存できたの？初めて知った。
以前、以下のページを保存したかったけど諦めたんだ。
https://www.konami.com/games/pcemini/jp/ja/
もしこのページ保存できるなら、上部メニューの8ページほど保存しといてほしい。もしくはそのAPIの使い方を具体的に教えてほしい。
まだ誰も上手く保存できてないみたいだし。

**名無しさん＠お腹いっぱい。** · 2023/11/15(水) 16:34:01.70

保存してほしいのは以下の6個のURL。もし保存できるのであればだけど。
https://www.konami.com/games/pcemini/jp/ja/
https://www.konami.com/games/pcemini/topics/jp/ja/topics_9
https://www.konami.com/games/pcemini/feature/jp/ja/
https://www.konami.com/games/pcemini/faq/jp/ja/
https://www.konami.com/games/pcemini/inquiry/jp/ja/
https://www.konami.com/games/pcemini/product/jp/ja/

**名無しさん＠お腹いっぱい。** · 2023/11/15(水) 16:54:07.39

保存したい気持ち、解るなぁ
https://web.archive.org/web/20231115074138/www.konami.com/games/pcemini/jp/ja/

**名無しさん＠お腹いっぱい。** · 2023/11/15(水) 17:04:47.72

>>149
確認できたわ、ありがとう！
Internet Archiveを極めてるね！

**名無しさん＠お腹いっぱい。** · 2023/11/15(水) 23:20:06.19

>>146
すげえ、ありがとう

**名無しさん＠お腹いっぱい。** · 2023/11/18(土) 14:45:36.85

If something goes wrong please click here to send us an error report.
ってやつ、下じゃなくて上に配置してくれないかな・・・
何回誤送信したか分からん

**名無しさん＠お腹いっぱい。** · 2023/11/18(土) 15:42:54.81

twitter保存できないことが最近増えてるみたいだけど、archivetodayでも保存できない場合は、cacheリンクをぶち込むと保存できるでー

**名無しさん＠お腹いっぱい。** · 2023/11/19(日) 14:41:27.28

twitter以外の保存できないサイトも、

https://webcache.googleusercontent.com/search?q=cache:保存したいリンク

をWabackmachineに入れればキャッシュを保存できる。

**名無しさん＠お腹いっぱい。** · 2023/11/19(日) 14:44:57.55

認証要る系は無理

**名無しさん＠お腹いっぱい。** · 2023/11/19(日) 19:17:19.50

twitterならnitterで良くね？

**名無しさん＠お腹いっぱい。** · 2023/11/19(日) 19:21:06.50

リダイレクトページを保存して過去のアーカイブ上書きして使いづらくする問題
なんで放置されてんだよ！

**名無しさん＠お腹いっぱい。** · 2023/11/20(月) 04:47:38.50

俺も基本nitterキャプってるなTwitter取得する時は

**名無しさん＠お腹いっぱい。** · 2023/11/21(火) 01:55:39.65

"The requested video has been archived but is not currently available for playback."と"Attempts to archive this video failed."が出たときが一番ダルい

**名無しさん＠お腹いっぱい。** · 2023/11/22(水) 20:57:37.32

イーロン・マスクのせいで、１tweetごとにarchiveしないといけなくなったけど、
より問題なのは、tweet群が本人の削除やアカウント停止などで消されてしまったら、
archiveがあってもtweet同士のつながりがわからなくなること。
以前はtweetを1カ所か何カ所かwayback machineで押さえれば、スレッド丸ごとarchiveできたのに。

**名無しさん＠お腹いっぱい。** · 2023/11/23(木) 07:29:06.67

何度保存しても「Hrm.　The Wayback Machine has not archived that URL.」が出続ける。

**名無しさん＠お腹いっぱい。** · 2023/11/23(木) 16:23:31.19

>>160
ほんとゴミだよな
戻してくれないもんかね…

**名無しさん＠お腹いっぱい。** · 2023/11/25(土) 06:53:47.53

>>161
https://web.archive.org/save/

このページからやればできる。

**名無しさん＠お腹いっぱい。** · 2023/11/25(土) 07:21:35.68

>>161
> 何度保存しても

数日後、その何度も保存したのが一斉にカレンダーに登場するパターンｗ

**名無しさん＠お腹いっぱい。** · 2023/11/25(土) 15:36:03.02

SPNって一日1000ページ保存が上限なのか。初めて引っかかった。outlink込みでやってたからか。

あと最近頻繁にログアウトしてしまうんだけどこれも不具合なのかな。

**名無しさん＠お腹いっぱい。** · 2023/11/27(月) 21:08:31.71

>>162
戻る可能性もありそう。

ツイッターの閲覧制限　「経済的な理由という指摘もある」と辛坊治郎
https://news.1242.com/article/448206
Twitter閲覧制限の理由：データスクレイピングの全てをわかりやすく説明します
https://sotatek.jp/blogs/all-about-the-reason-behind-twitter-new-view-limit/
「情報はタダじゃない」訴える意図？ Twitter閲覧制限 “スクレイピング”…サーバー負荷にマスク氏不満か
https://news.ntv.co.jp/category/society/9517009c0a124432a4ae38cecc2a2cf4
【解説】ツイッター“閲覧制限”なぜ？考えられる2つの理由マスク氏の狙いは
https://news.ntv.co.jp/category/society/78ed7d1aae84431889171d51800beb37
Twitterの閲覧制限が起きた理由｜今後のビジネスへの影響は？
https://blog.formzu.com/twitter_limit

**名無しさん＠お腹いっぱい。** · 2023/11/28(火) 12:24:55.48

>>165
> SPNって一日1000ページ保存が上限
それ何処から来た数字よ？

https://web.archive.org/save/status/user

**名無しさん＠お腹いっぱい。** · 2023/11/28(火) 21:40:26.81

イーロンの野郎また何かやらかしたのか。

**名無しさん＠お腹いっぱい。** · 2023/11/29(水) 10:54:45.08

どっとうpろだ.orgサービス終了かよ
知らなかった

**名無しさん＠お腹いっぱい。** · 2023/11/30(木) 19:42:48.90

忘れた頃に消えてくれるからお世話になったなぁ・・・
長いことおつかれさんでした

**名無しさん＠お腹いっぱい。** · 2023/12/01(金) 16:35:49.47

saveできない状態

**名無しさん＠お腹いっぱい。** · 2023/12/01(金) 18:34:12.83

普段は「Not Found」が出ても何遍か更新すると正常に戻るが、今は何遍更新しても・・・

**名無しさん＠お腹いっぱい。** · 2023/12/01(金) 19:28:00.38

マジか。保存対象URL側に問題あるのかと諦めて魚拓で済ましたけどIA側の問題だったのか

**名無しさん＠お腹いっぱい。** · 2023/12/01(金) 20:03:23.58

URL側の場合は「Not Found」というか普段から「このURLは保存不可」的なのが出るが、
今はどのサイトを入力しても「Not Found」

**名無しさん＠お腹いっぱい。** · 2023/12/01(金) 21:10:57.63

JSON で user status を得ようとしても 503 が返る
逝っちゃってるねぇ
https://web.archive.org/save/status/user

**名無しさん＠お腹いっぱい。** · 2023/12/01(金) 21:28:40.39

今日朝からnot foundだったから来てみたらおま環じゃなかったか

**名無しさん＠お腹いっぱい。** · 2023/12/01(金) 23:30:32.34

ようやくできるようになったが、4時間待ち（待ち時間は環境によるだろうが）

**名無しさん＠お腹いっぱい。** · 2023/12/01(金) 23:31:28.89

復活したけど、これじゃ今日のページ存できないな
The capture will start in ~7 hours, 39 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.

**名無しさん＠お腹いっぱい。** · 2023/12/02(土) 15:23:15.03

待ち時間未明よりは減ってるが、まだ1時間待ち（環境によるだろうが）
ただし、PDF絡みの取得は問題なし

**名無しさん＠お腹いっぱい。** · 2023/12/02(土) 15:52:02.12

重い

**名無しさん＠お腹いっぱい。** · 2023/12/03(日) 02:47:23.34

14 hoursとか取得時間かかりすぎ

**名無しさん＠お腹いっぱい。** · 2023/12/03(日) 19:22:18.20

やっと直ったか

**名無しさん＠お腹いっぱい。** · 2023/12/03(日) 19:46:55.79

ページを保存しようとしたら

The capture will start in ~3 hours, 5 minutes because our service is currently overloaded. You may close your browser window and the page will still be saved.

と言われて、まだ終わらないけど、MP4動画単体を保存したら瞬時に保存された。

2023/12/03(日)19:39:14
URL: https://video.twimg.com/amplify_video/1727180400236417024/vid/avc1/1280x720/WJL1FSGpy8aLWnvc.mp4
Job: https://web.archive.org/save/status/spn2-a3a61ee7a77e38b016777f4e7c9b1139d337b0d8 [success][0.29s][初]
成功: https://web.archive.org/web/20231203103915/https://video.twimg.com/amplify_video/1727180400236417024/vid/avc1/1280x720/WJL1FSGpy8aLWnvc.mp4 - 2023/12/03(日)19:39:15

**名無しさん＠お腹いっぱい。** · 2023/12/04(月) 03:03:18.62

>>183
.jpg とか .png とか .zip とか、ヘッドレスブラウザでレンダせず
ファイル単体を保存するだけで済むものはそんな感じ。
.pdf も outlinks の走査はされるけど何故か速い。

**名無しさん＠お腹いっぱい。** · 2023/12/05(火) 01:10:50.73

でた蔵の過去のテレビ番組のアーカイブ2022年12月以前の削除されちゃったんだな、最悪
gooといい価格コムといい削除するなら最初から公開しなきゃいいのに
NHKも一時期過去の番組表見れないようにしてたし何の目的なんだろうな
維持するのも金がかかるのかねえ

**名無しさん＠お腹いっぱい。** · 2023/12/05(火) 10:15:27.60

更新終了および閉鎖のお知らせ
2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。
2024年3月31日にサイトの完全閉鎖を予定しております。

https://wezz-y.com/archives/95862

**名無しさん＠お腹いっぱい。** · 2023/12/05(火) 10:15:30.24

更新終了および閉鎖のお知らせ
2017年7月より更新を続けてきたウェブメディア「wezzy」ですが、2023年12月31日をもって更新を終了する運びとなりました。長年のご愛読ありがとうございました。
2024年3月31日にサイトの完全閉鎖を予定しております。

https://wezz-y.com/archives/95862

**名無しさん＠お腹いっぱい。** · 2023/12/05(火) 20:35:42.29

こんな糞重いクルクルクルクルしてるだけのゴミクズサイト
すでに2億円も寄付されてるの糞受けるな
裏金アベノイミン党みたいな連中だ

**名無しさん＠お腹いっぱい。** · 2023/12/06(水) 10:55:02.43

Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.

saveできない
また逝ってるのかな

**名無しさん＠お腹いっぱい。** · 2023/12/06(水) 12:06:41.28

またエラー吐いてる・・・

**名無しさん＠お腹いっぱい。** · 2023/12/06(水) 17:58:46.73

まーた404 NOT FOUNDだぞー

**名無しさん＠お腹いっぱい。** · 2023/12/06(水) 19:14:32.73

OH!! NO!!

**名無しさん＠お腹いっぱい。** · 2023/12/06(水) 20:29:25.03

やっと復旧した

┃ 午前9:18 ・ 2023年12月6日
┃ https://twitter.com/textfiles/status/1732192819098292677
┃ Jason Scott @textfiles
┃ Power has gone out at the @internetarchive primary datacenter; waiting for it to return.

┃ 午前10:04 ・ 2023年12月6日
┃ https://twitter.com/internetarchive/status/1732204429066289608
┃ Internet Archive @internetarchive
┃ Sorry, http://archive.org and http://openlibrary.org will be back in a few,
┃
┃ but a short term power outage was long enough to make recovery take a little while.
┃
┃ We apologize.
https://twitter.com/thejimwatkins

**名無しさん＠お腹いっぱい。** · 2023/12/07(木) 15:12:31.98

停電多すぎね？アメリカってそんな停電するの？

**名無しさん＠お腹いっぱい。** · 2023/12/11(月) 10:14:59.64

あ゙あ゙あ゙あ゙あ゙ーーー

**名無しさん＠お腹いっぱい。** · 2023/12/11(月) 19:40:20.47

ここ何日か>>195のような表示がそのときそのときで出たり出なかったり
取得そのものができないよりは増しとはいえ・・・

**名無しさん＠お腹いっぱい。** · 2023/12/11(月) 19:45:40.20

>>196
やっぱそうだよね、自分の環境のせいかと思ってたけど

**名無しさん＠お腹いっぱい。** · 2023/12/11(月) 21:54:33.55

Donateしまくらなきゃな

**195** · 2023/12/11(月) 22:16:37.71

11 時間 42 分経過、結局アーカイブされてなかったからリクエスト発行し直した。
てゆーか 10 時間とか 20 時間とか言われても、数分後に同じ URL のアーカイブを
再リクエストしたらタイミングによってはすぐ保存してくれることもあるので
こういう時はやり直すのが正解だと理解することにした。

**名無しさん＠お腹いっぱい。** · 2023/12/12(火) 01:25:40.30

緑色の一日おき程度に取得した不完全なのを見かけるけどこういう事象の跡なのね