Internet Archive総合 (web.archive.org) #5

0001名無しさん@お腹いっぱい。2023/07/28(金) 06:58:53.37
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
http://archive.org/

インターネット・アーカイブ - Wikipedia
http://ja.wikipedia.org/wiki/InternetArchive
 ------------------
Twitter
https://twitter.com/internetarchive/

関連スレ
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/


前スレッド
Internet Archive総合 (web.archive.org) #4
https://mevius.5ch.net/test/read.cgi/esite/1628793497/
https://twitter.com/5chan_nel (5ch newer account)

0392名無しさん@お腹いっぱい。2024/04/20(土) 13:57:11.01
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?

0393名無しさん@お腹いっぱい。2024/04/20(土) 13:57:11.53
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?

0394名無しさん@お腹いっぱい。2024/04/20(土) 15:31:34.61
>>391-393
アホー知恵袋にでも行って質問なさい、おじいちゃん
https://chiebukuro.yahoo.co.jp/

0395名無しさん@お腹いっぱい。2024/04/23(火) 19:37:25.85
アーカイブチーム、いや、いつもアーカイブしている人たちは全員本当にやる気を感じない
YouTubeの動画のページが公開された時、すぐに保存されないケースが多いし。

0396名無しさん@お腹いっぱい。2024/04/23(火) 20:04:37.85
>>395
「アーカイブ」ってまだちゃんと覚えてられてるんだw
>>130-131

0397名無しさん@お腹いっぱい。2024/04/29(月) 03:17:02.51
あー重い重い

0398名無しさん@お腹いっぱい。2024/04/29(月) 19:58:05.90
ttps://www.courts.go.jp/app/files/hanrei_jp/995/088995_hanrei.pdf
グリーの弁護士、Wayback MachineのURL日付部分を日本時間基準だと勘違いして日付が一致しないとか言ってて草
検証の部分でUTC時間だから問題ないとちゃんと反論されていてよかった、ついでに裁判も負けてる

0399アーカイヴ2024/04/30(火) 22:20:03.49
さっきまでめっちゃ調子よかったのに503

0400名無しさん@お腹いっぱい。2024/04/30(火) 22:42:01.31
てかメンテの表示出てるじゃん。今夜はもう無理かな。

>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。

0401名無しさん@お腹いっぱい。2024/04/30(火) 22:42:04.16
てかメンテの表示出てるじゃん。今夜はもう無理かな。

>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。

0402名無しさん@お腹いっぱい。2024/04/30(火) 22:49:38.87
>>387
そういえば、ちょっと前にyoutube.comの1日の保存上限で8万回?ってエラー出てた。2年ぐらい前にエラー出た時はもっと数字が大きかった気がするけど。
確実に保存したいなら上限がリセットされるはずの日本時間午前9時から早い者勝ちで保存するしかないみたいだが。

0403名無しさん@お腹いっぱい。2024/05/02(木) 16:55:42.41
>>401
130の動画なら保存されてるのでは?
youtubecrawlのコレクションに入ってるが

0404名無しさん@お腹いっぱい。2024/05/04(土) 11:12:18.18
Tor Browser が Internet Archive の .onion 版が利用可能と検出してるけど
繋がらないんだよね・・・コード 0xF2 のエラーが返る
https://archive6zg5vrdwm4ljllgxleekeoj43lqayscd4d4kmhnyblq4h3ead.onion/

0405名無しさん@お腹いっぱい。2024/05/04(土) 12:01:16.02
またメンテか
次はいつ復旧するのやら

0406名無しさん@お腹いっぱい。2024/05/04(土) 15:36:31.33
>>403
今見てみたら、動画ファイルの保存まではできてないみたい。

確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。

0407名無しさん@お腹いっぱい。2024/05/04(土) 15:36:33.70
>>403
今見てみたら、動画ファイルの保存まではできてないみたい。

確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。

0408アーカイヴ2024/05/05(日) 15:10:31.41
Save Page Now browser crashed on https://imgur.com/p5BPbjq.

0409名無しさん@お腹いっぱい。2024/05/05(日) 16:04:43.50
何回か連打してればバックグラウンドで保存に成功するケースが殆ど。

0410名無しさん@お腹いっぱい。2024/05/06(月) 15:54:44.08
archive.todayってMicrosoftのサーバー経由してるのなんで?
MSのサーバーをhostsで遮断したら保存できなくなった

0411名無しさん@お腹いっぱい。2024/05/06(月) 21:39:08.18
>>7
quoraもサルベージできない

0412名無しさん@お腹いっぱい。2024/05/11(土) 14:20:52.07
全然違うfaviconが表示されるのってなんなんだろ

0413名無しさん@お腹いっぱい。2024/05/12(日) 00:23:05.21
なんだこのエラー?
task_id must not be empty. Got None instead.

0414名無しさん@お腹いっぱい。2024/05/12(日) 15:27:19.16
archiveのアニメをWEBで見てたがすごく遅くて適当にVPNで日本で見たらすぐ見れた

IP規制してる??

0415名無しさん@お腹いっぱい。2024/05/16(木) 18:03:20.05
X(twitter)やインスタを保存するのにオススメの方法があったら教えて。

0416名無しさん@お腹いっぱい。2024/05/16(木) 18:57:43.42
すみません。
twitterアカウントを削除する前に、ツイート削除した場合、該当のツイートは見ることできますか??

0417名無しさん@お腹いっぱい。2024/05/16(木) 19:53:45.33
>>415
スクショ
WEBアーカイブ
>>416
見れない
しかし動画や写真のURLさえわかればツイート削除後でも一定期間閲覧可能

0418名無しさん@お腹いっぱい。2024/05/16(木) 20:01:40.36
>>417
ありがとうございます!

0419名無しさん@お腹いっぱい。2024/05/19(日) 09:47:52.15
Amazonの商品ページの過去を見ることできますか?

0420名無しさん@お腹いっぱい。2024/05/24(金) 14:58:58.03
>>419
見れる(保存されていれば)

0421名無しさん@お腹いっぱい。2024/05/27(月) 03:27:05.36
今落ちてるか?

0422名無しさん@お腹いっぱい。2024/05/27(月) 03:40:50.05
/save/status 以下の状態取得 API が生きてたりしてるけど他は 503
まぁそんな事もあるさ

0423名無しさん@お腹いっぱい。2024/05/27(月) 20:03:17.06
現在503になって繋がらないけど他の方々はどうだろうか?

0424名無しさん@お腹いっぱい。2024/05/27(月) 23:01:42.52
一瞬繋がったり503に戻ったり
ダメな日だね

0425名無しさん@お腹いっぱい。2024/05/28(火) 00:17:54.53
>>420
確かに昔ブックマークしたのは見れた。

04263462024/05/28(火) 01:43:54.31
最近archive.orgは繋がらないことが多いな

imgurの直リンはarchive.orgでは不可だったけど
archive.todayでは問題なく撮れた

ここ今、運営が頭狂でURLが貼れなくなってるね

0427名無しさん@お腹いっぱい。2024/05/28(火) 03:39:21.51
>>185
https://kakaku.com/tv/
テレビ紹介情報は2024年5月30日をもちましてサービスを終了いたします。

アーカイブ必須だな

0428名無しさん@お腹いっぱい。2024/05/28(火) 04:04:36.99
テレビ、ねぇ。
あまり見んからなぁ・・・

0429名無しさん@お腹いっぱい。2024/05/28(火) 11:08:33.41
Yahoo!テレビの番組コメは長年特別扱いのテレ東もしっかり叩かれてたのが良かったのに3月で終わってしまった

0430名無しさん@お腹いっぱい。2024/05/28(火) 22:27:45.16
昨日繋がらなかったのはどうやらDDOS攻撃食らってたからみたいね
ttps://gigazine.net/news/20240528-internet-archive-under-ddos-attack/
そして今現在また503や504になってるがまたDDOS攻撃食らってるのか…?

0431名無しさん@お腹いっぱい。2024/05/28(火) 22:59:38.15
今日は増しだと思ったら結局
もはや「まぁそんなことも」なんてレベルではない

0432名無しさん@お腹いっぱい。2024/05/28(火) 23:45:39.54
なんでこの時期に突然DDOS…

04334262024/05/28(火) 23:55:23.08
>>430
https://x.com/internetarchive/status/1795451463465845141
Internet ArchiveのTwitterを見れば状況が判ったな

archive.orgで撮れなくてarchive.todayで撮れるサイトが近頃多い
Instagramもarchive.orgでは不可だったけど
archive.todayでは問題なく撮れた

0434名無しさん@お腹いっぱい。2024/05/29(水) 00:14:52.44
>433
使い方の差ではあるのだろうが個人的にはwebarchiveで出来てtodayで出来ない点として
・大容量zip等とかが保存可能かどうか(todayじゃそもそもzipどころかmp4やmp3すら保存出来なかったような…)
・検索エンジンで足がつくか否か(todayの場合割りと簡単に足がつきやすい)
・そしてwebarchiveで言う所のSave outlinks機能があるかどうか
というのが引っかかってね…(ほぼ鯖側に負担がかかるのばっかじゃねえかって話ではあるが…)

0435名無しさん@お腹いっぱい。2024/05/29(水) 02:47:36.00
today運営の素性がわからんしいつ消えるかもわからんしなー

0436名無しさん@お腹いっぱい。2024/05/29(水) 03:00:41.86
>>427
ギャーーーー!!これ今知った!!!
こういうのも貴重な情報だったのに…なんてこった。・゜・(ノД`)・゜・。

でた蔵はちょくちょく、表からのリンク先のページが無かったりするし
起こされた内容もだいぶ偏ってて不完全なのがどうもなあ…

0437 警備員[Lv.2][新芽]2024/05/29(水) 03:54:52.06
wayback-gsheetsにアップデートはいってて驚いた

04384332024/05/29(水) 07:19:08.25
>>434
archive.orgで撮って
撮れなかったらarchive.todayを使ってる
todayで撮れてorgで撮れないってどうなのかなって

>>435
それが問題
魚拓サイトなのに魚拓サイトが消えたら元も子もないw
todayはドメインが代わったりして大丈夫なのか感がある

archive.todayはURLがarchive.orgみたいに長くならないのが
5chなんかで使う時には良かったりもする

archive.orgを利用してて思うのは、
全く同じキャプチャが重複して何個も何個も撮られてて無駄だなって事と
セーブ時のSave error pages (HTTP Status=4xx, 5xx)の☑はデフォルト外しといた方が良いんじゃないかって事

0439名無しさん@お腹いっぱい。2024/05/29(水) 07:39:31.64
視野が狭いな

04404382024/05/29(水) 07:45:49.70
>>439
具体的に言ってくれる?
参考にしたい👁

0441名無しさん@お腹いっぱい。2024/05/29(水) 20:22:01.58
todayのURL、916132832超えたらどうなるの

0442名無しさん@お腹いっぱい。2024/06/01(土) 15:39:13.02
>>441
アルファベットが6桁になる、今の所は半分程度が使用されてるって数年前のブログに書いてた気がする

てかtodayって毎月30万近くかかってるらしいんだが、どうやって個人で維持できてるのか謎すぎるな・・・

新着レスの表示
レスを投稿する