X



Internet Archive総合 (web.archive.org) #5

0342名無しさん@お腹いっぱい。
垢版 |
2024/03/15(金) 16:03:39.90
imgur 画像のリファラ検査が始まり、直リンが禁止されてアーカイヴできなくなった。
https://i.imgur.com/8oRShxz.jpeg

https://imgur.com/8oRShxz
ページ内の埋め込み画像はリファラが送られるが、この URL では駄目。

https://imgur.com/8oRShxz/embed
この URL のアーカイヴを保存させればよい。

結果
https://web.archive.org/web/20240315065808im_/i.imgur.com/8oRShxzl.jpg
0343名無しさん@お腹いっぱい。
垢版 |
2024/03/16(土) 14:31:32.48
>>342
その方法を今試してみたけど保存できてないよ。
保存したファイルと元のファイル比較してみれば分かるけど解像度もファイルサイズも違うしURL末尾辺りに謎の小文字lが付加されてる。
0344342
垢版 |
2024/03/16(土) 15:04:21.21
>>343
あーほんとだ、気付かんかった

8oRShxz
8oRShxzl

何か良い方法は無いかな
0348名無しさん@お腹いっぱい。
垢版 |
2024/03/22(金) 05:15:15.83
NHKが運営するネット上の特設ページ、続々と運営終了。放送法改正を見据えた動きか

https://internet.watch.impress.co.jp/docs/yajiuma/1577805.html

2024年4月1日10:00をもちまして、以下特設ページの掲載を終了(番組ストリーミングを含む)いたします。(NHKゴガク)
https://www.nhk.or.jp/gogaku/
NHK、「政治マガジン」など6サイト更新停止へ 新サービスを検討(朝日新聞デジタル)
https://www.asahi.com/articles/ASS375VHPS36UCVL04P.html
NHKやばいな。どんどんデジタルサービス終了させている。声調確認くんとか、凄く良かったのに。デジタル頑張っていた中の人たちが気の毒。(Togetter)
https://togetter.com/li/2334548
0349名無しさん@お腹いっぱい。
垢版 |
2024/03/23(土) 15:57:54.15
特許や意匠権の参考文献にURLが記載されてる事って多いんだけどさ
昔のホームページだと404かつ何処にもアーカイブされてないとかざら何だよな
せめてその辺は国がアーカイブしないと将来的に困ったことにならんのか?と思う
0359名無しさん@お腹いっぱい。
垢版 |
2024/03/28(木) 15:36:57.20
Queue-Itの待合室経由みたいに、いったんリダイレクトされてJavascript動作してから本サイトにリダイレクトされるようなサイトはどうやってアーカイブするの?
save page nowではなくて、自PCでアクセスして表示したページをそのままアーカイブできる機能とかあればしりたい。
0368名無しさん@お腹いっぱい。
垢版 |
2024/04/02(火) 19:17:02.33
どうも postpagebeta=0 のクッキーだけ送っておけば、
リファラ無しの画像直リンでも OK っぽいな。

>>367
スクリプト使うのも Save Page Now のページを使うのも、やってる事は全く同じなんだけど
後者では入力できないパラメータを送る必要があるんだよね。
https://web.archive.org/save/ を表示させて、次のブックマークレットで入力欄を追加してから
上の欄に imgur の画像 URL、下の欄に postpagebeta=0 を入力してボタンを押せば
たぶん保存できる。
https://pastebin.com/uEZ1Dbqi
0372名無しさん@お腹いっぱい。
垢版 |
2024/04/04(木) 13:26:28.62
imgur の画像直リンが、クッキーを付けてあってもリダイレクトされるようになってしまったかも。
それでも拡張子の無い https://imgur.com/xxxxxxx 形式の URL を
クッキー付きでアーカイブさせれば、画像にはリファラが送られるので保存はできている。
0373名無しさん@お腹いっぱい。
垢版 |
2024/04/06(土) 22:10:26.61
Resources (ページ内画像等) としてアーカイブされた URL がカレンダ表示に登場するまでに
時間が掛かってる
0374名無しさん@お腹いっぱい。
垢版 |
2024/04/07(日) 12:36:44.17
APIでリファラも送れるようにしてくれないかな
cookieやUAは送れるのにリファラは対応してないの何で?
0378名無しさん@お腹いっぱい。
垢版 |
2024/04/09(火) 18:51:29.66
>>377
自分も、ここ最近X(旧Twitter)のアーカイブが取得できなくて困ってる。
0380名無しさん@お腹いっぱい。
垢版 |
2024/04/14(日) 14:05:36.49
Not Found
The requested URL was not found on the server. If you entered the URL manually please check your spelling and try again.
0381アーカイブ
垢版 |
2024/04/15(月) 06:08:58.29
またイモグラ保存できなくなったんじゃないだろうな
もうイモグラは使わないでくれ
0383アーカイブ
垢版 |
2024/04/15(月) 14:34:30.98
OutLinksを使うと保存できてる時もあるっぽいな。
これが原因か?
0384アーカイブ
垢版 |
2024/04/15(月) 16:54:08.33
いや関係無いっぽいな。
試しにスクリプトが上げてるグ□画像を保存してみたらOutLinksなんて無くても一発で取れた。
取れる画像と取れない画像があるのか?
0387アーカイブ
垢版 |
2024/04/16(火) 08:03:08.50
保存回数上限がホスト毎に決められているけど、回数はURL毎に数えているってことか。
0389名無しさん@お腹いっぱい。
垢版 |
2024/04/19(金) 22:35:13.33
そろそろやばいやばいっていわれてるけど、Archive.liがなくなる事ってあるのかね。
そもそもあいつの資金源どうなってんだ?
0390名無しさん@お腹いっぱい。
垢版 |
2024/04/19(金) 22:39:26.28
運営費がかさむかさむって言ってたし、ロシアでの運営じゃ厳しいだろ。
国を出ないなら、このまま吹き飛びそうだな。
0391名無しさん@お腹いっぱい。
垢版 |
2024/04/20(土) 13:11:21.35
【質問】Wayback machineで既に誰かがウェブサイトをアーカイブしていたときサイトのアーカイブは更新されるのか

拡張機能web archivesでwayback machineを選択する→既にアーカイブされている1年前のものが表示される

画像などが保存されていないので現在の最新の状態で完全なものをアーカイブしたいんですが可能なんですかね?やり方がわかりません
gyazo.com/2dea0146024edc6952878c8d25b9b572
0392名無しさん@お腹いっぱい。
垢版 |
2024/04/20(土) 13:57:11.01
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?
0393名無しさん@お腹いっぱい。
垢版 |
2024/04/20(土) 13:57:11.53
Wayback machineで除名を申し入れされたとして、
それはそのウェブサイトは見かけ上保存はできてそうなんだけど閲覧できないだけ?
そのドメインを後から手に入れる事ができ、除名を解いたら、それまでに保存を要請してきたウェブサイトを見る事ができるようになると?
0395名無しさん@お腹いっぱい。
垢版 |
2024/04/23(火) 19:37:25.85
アーカイブチーム、いや、いつもアーカイブしている人たちは全員本当にやる気を感じない
YouTubeの動画のページが公開された時、すぐに保存されないケースが多いし。
0398名無しさん@お腹いっぱい。
垢版 |
2024/04/29(月) 19:58:05.90
ttps://www.courts.go.jp/app/files/hanrei_jp/995/088995_hanrei.pdf
グリーの弁護士、Wayback MachineのURL日付部分を日本時間基準だと勘違いして日付が一致しないとか言ってて草
検証の部分でUTC時間だから問題ないとちゃんと反論されていてよかった、ついでに裁判も負けてる
0399アーカイヴ
垢版 |
2024/04/30(火) 22:20:03.49
さっきまでめっちゃ調子よかったのに503
0400名無しさん@お腹いっぱい。
垢版 |
2024/04/30(火) 22:42:01.31
てかメンテの表示出てるじゃん。今夜はもう無理かな。

>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。
0401名無しさん@お腹いっぱい。
垢版 |
2024/04/30(火) 22:42:04.16
てかメンテの表示出てるじゃん。今夜はもう無理かな。

>>391 URLをそのままSPNで保存すればいいよ。そうすれば日付違いで保存されて表示されるはず。
>>392-393 前のドメイン権利者が除外要請を出した時と連絡先など一致してなかったり譲渡されたと嘘付いても、解除通るの?
>>395 ArchiveTeamの巡回を待ってるなら、自分でSPNから保存したほうが早いよ。動画ファイルも半分ぐらいの確率で保存してくれる。
削除予告が出ていて緊急なら#down-the-tubeのチャットで理由書いてコマンド打てばいい。量が多いと完璧に保存されないけど失うよりはいいし。両方やっとけば残る確率高くなる。
>>396 てか>>130で文句言ってるXGeNeLWnYdcの動画ファイル保存されてないね。昨日試しにSPNで保存したけど1日経ってもファイル保存されてねえわ。
0402名無しさん@お腹いっぱい。
垢版 |
2024/04/30(火) 22:49:38.87
>>387
そういえば、ちょっと前にyoutube.comの1日の保存上限で8万回?ってエラー出てた。2年ぐらい前にエラー出た時はもっと数字が大きかった気がするけど。
確実に保存したいなら上限がリセットされるはずの日本時間午前9時から早い者勝ちで保存するしかないみたいだが。
0406名無しさん@お腹いっぱい。
垢版 |
2024/05/04(土) 15:36:31.33
>>403
今見てみたら、動画ファイルの保存まではできてないみたい。

確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。
0407名無しさん@お腹いっぱい。
垢版 |
2024/05/04(土) 15:36:33.70
>>403
今見てみたら、動画ファイルの保存まではできてないみたい。

確認用コード
curl -I "https://web.archive.org/web/2oe_/http://wayback-fakeurl.archive.org/yt/img/XGeNeLWnYdc"
ターミナルで動かしてヘッダー部分だけ取得すると、転送先の動画ファイルURLがlocation:として出てこないで404エラーになってる。
保存されていればgooglevideo.comの長いURLが出てくるはず。保存されるまで何度かSPNで保存繰り返せばいいけど。
0410名無しさん@お腹いっぱい。
垢版 |
2024/05/06(月) 15:54:44.08
archive.todayってMicrosoftのサーバー経由してるのなんで?
MSのサーバーをhostsで遮断したら保存できなくなった
0414名無しさん@お腹いっぱい。
垢版 |
2024/05/12(日) 15:27:19.16
archiveのアニメをWEBで見てたがすごく遅くて適当にVPNで日本で見たらすぐ見れた

IP規制してる??
0415名無しさん@お腹いっぱい。
垢版 |
2024/05/16(木) 18:03:20.05
X(twitter)やインスタを保存するのにオススメの方法があったら教えて。
0416名無しさん@お腹いっぱい。
垢版 |
2024/05/16(木) 18:57:43.42
すみません。
twitterアカウントを削除する前に、ツイート削除した場合、該当のツイートは見ることできますか??
0418名無しさん@お腹いっぱい。
垢版 |
2024/05/16(木) 20:01:40.36
>>417
ありがとうございます!
0421名無しさん@お腹いっぱい。
垢版 |
2024/05/27(月) 03:27:05.36
今落ちてるか?
0426346
垢版 |
2024/05/28(火) 01:43:54.31
最近archive.orgは繋がらないことが多いな

imgurの直リンはarchive.orgでは不可だったけど
archive.todayでは問題なく撮れた

ここ今、運営が頭狂でURLが貼れなくなってるね
0429名無しさん@お腹いっぱい。
垢版 |
2024/05/28(火) 11:08:33.41
Yahoo!テレビの番組コメは長年特別扱いのテレ東もしっかり叩かれてたのが良かったのに3月で終わってしまった
0430名無しさん@お腹いっぱい。
垢版 |
2024/05/28(火) 22:27:45.16
昨日繋がらなかったのはどうやらDDOS攻撃食らってたからみたいね
ttps://gigazine.net/news/20240528-internet-archive-under-ddos-attack/
そして今現在また503や504になってるがまたDDOS攻撃食らってるのか…?
0434名無しさん@お腹いっぱい。
垢版 |
2024/05/29(水) 00:14:52.44
>433
使い方の差ではあるのだろうが個人的にはwebarchiveで出来てtodayで出来ない点として
・大容量zip等とかが保存可能かどうか(todayじゃそもそもzipどころかmp4やmp3すら保存出来なかったような…)
・検索エンジンで足がつくか否か(todayの場合割りと簡単に足がつきやすい)
・そしてwebarchiveで言う所のSave outlinks機能があるかどうか
というのが引っかかってね…(ほぼ鯖側に負担がかかるのばっかじゃねえかって話ではあるが…)
0436名無しさん@お腹いっぱい。
垢版 |
2024/05/29(水) 03:00:41.86
>>427
ギャーーーー!!これ今知った!!!
こういうのも貴重な情報だったのに…なんてこった。・゜・(ノД`)・゜・。

でた蔵はちょくちょく、表からのリンク先のページが無かったりするし
起こされた内容もだいぶ偏ってて不完全なのがどうもなあ…
0437 警備員[Lv.2][新芽]
垢版 |
2024/05/29(水) 03:54:52.06
wayback-gsheetsにアップデートはいってて驚いた
0438433
垢版 |
2024/05/29(水) 07:19:08.25
>>434
archive.orgで撮って
撮れなかったらarchive.todayを使ってる
todayで撮れてorgで撮れないってどうなのかなって

>>435
それが問題
魚拓サイトなのに魚拓サイトが消えたら元も子もないw
todayはドメインが代わったりして大丈夫なのか感がある

archive.todayはURLがarchive.orgみたいに長くならないのが
5chなんかで使う時には良かったりもする

archive.orgを利用してて思うのは、
全く同じキャプチャが重複して何個も何個も撮られてて無駄だなって事と
セーブ時のSave error pages (HTTP Status=4xx, 5xx)の☑はデフォルト外しといた方が良いんじゃないかって事
0440438
垢版 |
2024/05/29(水) 07:45:49.70
>>439
具体的に言ってくれる?
参考にしたい👁
0442名無しさん@お腹いっぱい。
垢版 |
2024/06/01(土) 15:39:13.02
>>441
アルファベットが6桁になる、今の所は半分程度が使用されてるって数年前のブログに書いてた気がする

てかtodayって毎月30万近くかかってるらしいんだが、どうやって個人で維持できてるのか謎すぎるな・・・
0443名無しさん@お腹いっぱい。
垢版 |
2024/06/04(火) 19:32:52.16
度々すみませんm(_ _)m
一部のツイートを削除してからTwitterアカウントごと削除した場合、waybackmachineに収集されていれば削除した一部のツイート内容も見ることできますか??
0444名無しさん@お腹いっぱい。
垢版 |
2024/06/04(火) 20:38:01.07
>>443
削除前に保存されてれば見れる
ただそのツイートのURLが分からないとダメなので、URLを忘れたら事実上誰も見れなくなる
0445名無しさん@お腹いっぱい。
垢版 |
2024/06/05(水) 23:25:18.82
少なくともXに関してはtodayで取れるようになった
0450438
垢版 |
2024/06/13(木) 03:57:29.35
archive.todayでもTwitter(𝕏)が
>Something went wrong. Try reloading.
で記録されてしまって撮れなくなった模様

Twitterは、archive.orgで撮ってたのが見れなくなってたりしない?
表示されないのが多過ぎる気がする

Facebookは
archive.todayは撮れて
archive.orgでは撮れなかった

>>449
以前は普通に撮れてたのに
現在は撮れないサイトが多すぎるんだヨネ
レスを投稿する


ニューススポーツなんでも実況