Internet Archive総合 (web.archive.org) #5
ttps://twitter.com/textfiles/status/1773203790159565077
また停電だってよ去年もあったね
https://twitter.com/thejimwatkins 503エラーちょこちょこ出るけど、復帰したね乙でした Queue-Itの待合室経由みたいに、いったんリダイレクトされてJavascript動作してから本サイトにリダイレクトされるようなサイトはどうやってアーカイブするの?
save page nowではなくて、自PCでアクセスして表示したページをそのままアーカイブできる機能とかあればしりたい。 詐欺紛いのサイトがアーカイブを徹底的に拒否しているのは笑える
https://www.sotwe.com/DuceTCG >>360
拒否してるのはサイトじゃなくてTwitterWebViewerの方だった。俺の勘違い imgur、画像の直リンは無理だとしても postpagebeta=0 というクッキーを食べたことにして
こういうアーカイブを取れば行けるなぁ。
つまり capture_cookie パラメータを使用。
https://web.archive.org/web/1/imgur.com/EwuqXZU これは失敗。
https://web.archive.org/web/1/imgur.com/sBfrwVv
imgur でアダルト判定を食らった画像を表示させて "Yes, I'm over 18" をクリックしたときに追加されるクッキーの中に
over18=1 ってのがあるけど、それも食べたことにすれば行けるかな。 どうも postpagebeta=0 のクッキーだけ送っておけば、
リファラ無しの画像直リンでも OK っぽいな。
>>367
スクリプト使うのも Save Page Now のページを使うのも、やってる事は全く同じなんだけど
後者では入力できないパラメータを送る必要があるんだよね。
https://web.archive.org/save/ を表示させて、次のブックマークレットで入力欄を追加してから
上の欄に imgur の画像 URL、下の欄に postpagebeta=0 を入力してボタンを押せば
たぶん保存できる。
https://pastebin.com/uEZ1Dbqi >>368
サンクス。保存できたっぽい
こんな荒技があったとは >>368
保存できていたのに保存できなくなったぽい? imgur の画像直リンが、クッキーを付けてあってもリダイレクトされるようになってしまったかも。
それでも拡張子の無い https://imgur.com/xxxxxxx 形式の URL を
クッキー付きでアーカイブさせれば、画像にはリファラが送られるので保存はできている。 Resources (ページ内画像等) としてアーカイブされた URL がカレンダ表示に登場するまでに
時間が掛かってる
APIでリファラも送れるようにしてくれないかな
cookieやUAは送れるのにリファラは対応してないの何で? 間違った転送先を保存してしまい何故か修正できないヤツ
https://web.archive.org/web/20240407072915/https://i.imgur.com/UtKDI8X.jpeg
アニメ絵と実写エロ注意 大文字小文字違いかw
uTKdi8x
UtKDI8X archive.today
数日前からX(旧Twitter)のアーカイブできなくなってる? >>377
自分も、ここ最近X(旧Twitter)のアーカイブが取得できなくて困ってる。 Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again. またイモグラ保存できなくなったんじゃないだろうな
もうイモグラは使わないでくれ OutLinksを使うと保存できてる時もあるっぽいな。
これが原因か? いや関係無いっぽいな。
試しにスクリプトが上げてるグ□画像を保存してみたらOutLinksなんて無くても一発で取れた。
取れる画像と取れない画像があるのか? ゲッ、いつの間に同一URLの保存回数が一日5回までに減ってやがる…
https://web.archive.org/web/0im_/https://files.catbox.moe/xei3k9.PNG
19年の頃は保存回数制限もなく保存再開出来る時間も10分間隔だったんだがなぁ… >>385
>>305-308
さらに少なく、一日一回だけに制限しているホストもあるからね。 保存回数上限がホスト毎に決められているけど、回数はURL毎に数えているってことか。 自分がアーカイブを取ってるサイトは大概 1 回だけなんだよなぁ。
そろそろやばいやばいっていわれてるけど、Archive.liがなくなる事ってあるのかね。
そもそもあいつの資金源どうなってんだ? 運営費がかさむかさむって言ってたし、ロシアでの運営じゃ厳しいだろ。
国を出ないなら、このまま吹き飛びそうだな。 【質問】Wayback machineで既に誰かがウェブサイトをアーカイブしていたときサイトのアーカイブは更新されるのか
拡張機能web archivesでwayback machineを選択する→既にアーカイブされている1年前のものが表示される
画像などが保存されていないので現在の最新の状態で完全なものをアーカイブしたいんですが可能なんですかね?やり方がわかりません
gyazo.com/2dea0146024edc6952878c8d25b9b572 Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると? Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると? アーカイブチーム、いや、いつもアーカイブしている人たちは全員本当にやる気を感じない
YouTubeの動画のページが公開された時、すぐに保存されないケースが多いし。 >>395
「アーカイブ」ってまだちゃんと覚えてられてるんだw
>>130-131 ttps://www.courts.go.jp/app/files/hanrei_jp/995/088995_hanrei.pdf
グリーの弁護士、Wayback MachineのURL日付部分を日本時間基準だと勘違いして日付が一致しないとか言ってて草
検証の部分でUTC時間だから問題ないとちゃんと反論されていてよかった、ついでに裁判も負けてる てかメンテの表示出てるじゃん。今夜はもう無理かな。
>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。 てかメンテの表示出てるじゃん。今夜はもう無理かな。
>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。 >>387
そういえば、ちょっと前にyoutube.comの1日の保存上限で8万回?ってエラー出てた。2年ぐらい前にエラー出た時はもっと数字が大きかった気がするけど。
確実に保存したいなら上限がリセットされるはずの日本時間午前9時から早い者勝ちで保存するしかないみたいだが。 >>401
130の動画なら保存されてるのでは?
youtubecrawlのコレクションに入ってるが Tor Browser が Internet Archive の .onion 版が利用可能と検出してるけど
繋がらないんだよね・・・コード 0xF2 のエラーが返る
https://archive6zg5vrdwm4ljllgxleekeoj43lqayscd4d4kmhnyblq4h3ead.onion/
>>403
今見てみたら、動画ファイルの保存まではできてないみたい。
確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。 >>403
今見てみたら、動画ファイルの保存まではできてないみたい。
確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。