X



Internet Archive総合 (web.archive.org) #4

レス数が1000を超えています。これ以上書き込みはできません。
2021/08/13(金) 03:38:17.64
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
  ------------------


Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう

A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック


Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される

A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。


前スレッド
Internet Archive総合 (web.archive.org) #3
https://mevius.5ch.net/test/read.cgi/esite/1585760889/
2023/07/12(水) 22:56:55.39
threadsってアーカイブ出来ないタイプのサイトかぁ・・・
2023/07/12(水) 22:56:57.12
threadsってアーカイブ出来ないタイプのサイトかぁ・・・
2023/07/14(金) 06:06:42.35
埋まるからちとscに貼っとこ
955名無しさん@お腹いっぱい。
垢版 |
2023/07/15(土) 00:51:33.90
「好き嫌い.com」は魚拓サイトで魚拓を取ってもコメント欄だけが保存されない

どうすればコメント欄も保存できるかな?

i.imgur.com/2uPwBGz.png archive.li/6nRmy
2023/07/15(土) 05:12:26.78
5chを保存しようとクロールしたらクロールが全く意味を成さないわね…なにかいい方法あるだろうか?
2023/07/15(土) 20:07:35.02
Internet ArchiveのFlashエミュレータが改良されてより多くの作品をサポートできるようになった模様
これにより今まで利用できなかった作品がコレクションに加わるとのこと

詳細
https://mastodon.archive.org/@textfiles/110697893762381822q
新たに実行可能になった作品例
https://twitter.com/internetarchive/status/1679948028008955904
https://twitter.com/5chan_nel (5ch newer account)
2023/07/16(日) 13:40:10.97
これからAI時代になると、IAのデータってますます重要になりそうだな(AIとIAでややこしい)
959名無しさん@お腹いっぱい。
垢版 |
2023/07/17(月) 19:01:14.10
5chの過去ログほとんどアーカイブされてないのか
960名無しさん@お腹いっぱい。
垢版 |
2023/07/18(火) 18:40:50.87
yahooニュースのコメント保存できるようになったな
961名無しさん@お腹いっぱい。
垢版 |
2023/07/19(水) 01:28:09.90
>>959
板にもよるだろうけど軽く触ってみた感じは全部first archiveだな
https://litter.catbox.moe/bk9qgj.png
962名無しさん@お腹いっぱい。
垢版 |
2023/07/19(水) 08:24:09.27
過去ログ取ろうとしたけど膨大やな
自分の環境だと七時間で2500urlぐらい
2023/07/20(木) 17:51:13.77
>>961
2chから5chにURL変わった影響もありそう

てかTwitterの会話取れなくなったの不便すぎるな
2023/07/20(木) 17:53:22.93
ここ最近やる気を感じないな、アクティブチームは。
自動アーカイブも全然取れてないし。
2023/07/20(木) 22:16:04.23
>>964
>>595

アクティブチームw
966名無しさん@お腹いっぱい。
垢版 |
2023/07/20(木) 23:04:52.71
アクティブチームって何だArchive-teamのこと?
2023/07/21(金) 00:44:18.55
URLが.phから.isに変わった?
968名無しさん@お腹いっぱい。
垢版 |
2023/07/21(金) 03:00:05.35
>>967
すれち&時代遅れ
https://itest.5ch.net/mevius/test/read.cgi/internet/1554553882/
2023/07/22(土) 00:46:07.17
うーん、ボタンを押しても即座にこれが返ってくる
2023/07/22(土) 01:02:42.11
俺もや、ついに規制くらったかと思ったけど
サーバー側の問題か
2023/07/22(土) 01:16:32.28
どこか特定のサイトを取得する場合の問題かと思ったら別のサイトで試しても>>969
972969
垢版 |
2023/07/22(土) 06:28:15.78
https://web.archive.org/web/1im_/o.5ch.net/21i4q.png
復活っ!!
2023/07/23(日) 01:54:01.56
https://web.archive.org/web/*/mevius.5ch.net/esite/oyster/*
過去ログdatのアーカイブ取ってる人って居ないよなぁ
2023/07/23(日) 04:07:26.60
過去ログはとってるけど全然追いついてないな
975名無しさん@お腹いっぱい。
垢版 |
2023/07/24(月) 07:55:27.47
放置してたらURL8万行分集めてて、もう飽きたからこれアーカイブしてdatアーカイブやめます
保存されるやつみたら文字化けしてるし意味あるのかなといった感じでもある
普通の過去ログやる方が有意義におもう
2023/07/25(火) 22:01:25.69
スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ
2023/07/25(火) 23:00:40.88
Twitchもyoutubeみたいにアーカイブ保存出来るようにならんかなぁ
というかyoutubeと違って一定期間で消えるから、むしろこっちを優先して欲しいまである
2023/07/26(水) 07:00:14.47
動画ファイルバカでかいししゃーないでしょ
キリないもん、あとtubeupえばupはできると思う
だけどあれ待機時間がすげー長いんだよなぁ
2023/07/26(水) 16:48:33.58
>>976
それなに? スクリプト使ってないから知らない
2023/07/27(木) 08:29:32.45
>>975
どうやって8万行も集めたの?
詳しく聞かせてほしい

Googleの拡張機能でアーカイブ常に取る設定にしてたとか?
981名無しさん@お腹いっぱい。
垢版 |
2023/07/27(木) 16:31:17.56
>>980

ただずっと>903のスクリプト動かしてただけ
outlinkの取得先は全板の過去ログのurlを指定した
2023/07/27(木) 18:44:11.66
スクリプト回してるのにim_とかid_とか知らないって嘘くせぇ
983名無しさん@お腹いっぱい。
垢版 |
2023/07/28(金) 05:52:22.75
次スレたのんます
984名無しさん@お腹いっぱい。
垢版 |
2023/07/28(金) 07:03:23.87
Internet Archive総合 (web.archive.org) #5
https://mevius.5ch.net/test/read.cgi/esite/1690495133/
985名無しさん@お腹いっぱい。
垢版 |
2023/07/28(金) 16:20:58.19
おつでごわす
2023/07/31(月) 10:21:47.20
立て乙
2023/08/01(火) 08:12:52.33
1週前ぐらいに取得した(ことになってる)はずなのに取得できてないのがいくつも・・・
The snapshot may not be available right now, please try again later.
最近が↑たまに出るが、
それとの関係だろうか・・・
せっかく時間かけて取得したはずができてないのは残念
2023/08/01(火) 08:14:32.08
最近が↑→最近↑が
2023/08/09(水) 21:27:34.47
>>975
エアプ乙w
2023/08/09(水) 22:47:57.99
todayの話題はここでいいの?
2023/08/10(木) 05:28:04.06
archive.isはもう3日ほど繋がらないし
Wayback Machineは相変わらずツイッタープロフィールとリプがダメで
リプで繋がってるものも個々でしか取れないから面倒くさい
2023/08/10(木) 18:48:05.30
todayは普通に使えるが
おま環では?
2023/08/10(木) 21:07:26.73
archive.today は、まだ Cloudflare の DNS(1.1.1.1) を拒否しているのかな?
2023/08/11(金) 20:59:13.51
>>991
おま環なのかわからないけどtodayは4日前までは普通に繋がってたけど
急に繋がらくなって今も繋がない
このサイトにアクセスできませんarchive.is により途中で接続が切断されましたって出る
chrome・edge・Fire Foxの全部で繋がらないから環境だとしたら何が原因なのかさっぱり
因みにCloudflare の DNS(1.1.1.1)ではないよ
2023/08/11(金) 21:46:49.16
レス間違えましたすみません
>>994 は >>992 が正しいです
2023/08/11(金) 23:46:35.07
>>993
とか言うだけで、実際に叩いてみたりしないんだ

所詮その程度w
997名無しさん@お腹いっぱい。
垢版 |
2023/08/13(日) 12:11:34.23
あれarchive.org落ちてる?spnエラー吐いてる
998名無しさん@お腹いっぱい。
垢版 |
2023/08/13(日) 12:18:35.35
直ってた
2023/08/13(日) 13:16:40.27
>>997-998
ここ数日 web.archive.org への接続自体がエラーとなるケースが増えてると思うよ。
2023/08/13(日) 13:17:17.00
次スレ
Internet Archive総合 (web.archive.org) #5
https://mevius.5ch.net/test/read.cgi/esite/1690495133/

他所のアーカイブの話題はこちら
【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.5ch.net/test/read.cgi/internet/1554553882/
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 730日 9時間 39分 0秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況