X



【保存・記録】ウェブアーカイブ総合 Page.01
レス数が1000を超えています。これ以上書き込みはできません。
0001192.168.0.7742019/04/06(土) 21:31:22.29ID:KqAD+H9+0
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web,archive,org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
0952192.168.0.7742023/10/02(月) 01:30:11.89ID:3/wo9WhU0
>>943
ありがとう
これはなかなか良い
リンクをローカル用に修正してくれないのが欠点だが、保存だけなら完璧
0953192.168.0.7742023/10/05(木) 15:54:01.76ID:i6GCcsDS0
ここはお前のTwitter(X)やブログじゃないんだから毎度だらだら連投しないである程度考えまとめたり結論出してから1つのレスで書き込んでくれないか
09549502023/10/05(木) 21:51:08.86ID:NdAg2WJu0
意外と読んでる人いるのね、このスレって。レスの勢いが鈍行なので。

てっきり、(>>950までの途中過程の)自分のレスは、取捨して読み飛ばしてくれてるものだと思ってた。(ちなみに >>945を書き込んだ際は、間違ってageてしまった。)



>>951
「Nitter側が、本当にツイート内容などを改竄してないか?」「ツイート内容変更後に、原本(Twitter)とNitterで差異が無いか?」とかの証明は難しいんでしょうね。
09559312023/10/06(金) 07:48:00.80ID:iu8iKKZW0
>>931-932
なんとなく表記揺れをまとめると

X(旧Twitter)
X(Twitter)
Twitter(X)
TwitterX
x=Twitter (従来通りTwitter表記呼称、あるいは Xと書いて 読みはツイッター)
Twitter/X
X/Twitter
x.com (https://www.affility.co.jp/?p=1770 )
0956192.168.0.7742023/10/06(金) 10:37:09.47ID:iu8iKKZW0
昨夜あたりから、archive.isで ウェブ魚拓(トップページ)を保存しようとすると、

「Welcome to nginx!」画面になって、再アクセスすると

「このサイトにアクセスできません archive.is からの応答時間が長すぎます。」

と、一定時間アクセスできなくなる気がする。

例: https://archive.is/submit/?submitid=sxIrd9y3YbEtDKkLjC8I3IfsId506PIYo1H3XOT5fjyjpXszt70KHIOege2rgiV3&url=http%3A%2F%2Fmegalodon.jp%2F


もしかしたら、archive.isの使用者ごと弾かれるNGなサイトURLでもあって、archive.is側は判定しているんだろうか?

しかし、5chも重いなあ…最近。
0957192.168.0.7742023/10/10(火) 14:48:25.08ID:AfINMwgb0
>>943
まNitterのほうがX(Twitter)本体のUIよか圧倒的に挙動も軽いから、訴訟以外のバックアップ取りなら最強だけどな
0958192.168.0.7742023/10/11(水) 18:05:55.84ID:xUx5SPHW0
Archive todayに削除依頼を送っているんだけど、こいつほんまに通さないな。
良い方法ない?
0959192.168.0.7742023/10/11(水) 20:18:18.45ID:jHEB4zsh0
archive.todayの削除に成功したのってはるかぜちゃんの新しい方の弁護士と尊師だけなんじゃなかったっけ
確か現地の弁護士経由かつかなりしっかり動かないと全部突っぱねられるんじゃなかった?
0960192.168.0.7742023/10/11(水) 20:55:34.32ID:xUx5SPHW0
>>956
このまま潰れてくんねぇかな。
0961192.168.0.7742023/10/11(水) 20:56:39.25ID:xUx5SPHW0
>>959
流石にふざけてると思うわ。
0962192.168.0.7742023/10/11(水) 20:57:58.76ID:xUx5SPHW0
法的手順をチラつかせたら削除されたってヤフー知恵遅れを見たが、どうなんだろうな。
0963192.168.0.7742023/10/11(水) 21:06:00.49ID:EL8C4Tol0
ドメインも著作権も全部自分に帰属してるんだがな。
ウェイバックマシンは、テキストファイルを用意して、サイトにアドレス置いたら消してくれたんだが。
こいつは、手順も不明確且つ削除してくれる望みが薄そう。
どうかしてるぜ。
0964192.168.0.7742023/10/11(水) 21:07:44.35ID:xUx5SPHW0
DMCAとかで検索エンジンから表示は消せても、ウェブサイトの削除依頼はできないんだからなぁ
どうにかならんもんかね。
0965192.168.0.7742023/10/11(水) 21:32:14.34ID:xUx5SPHW0
ISPに通報するのが有用とも聞いたけどどうなの?
0966192.168.0.7742023/10/12(木) 02:18:23.64ID:7bMyoE320
サービスが終了しそうになっても、誰かしら引き継いだり売ったりするんじゃないのか?
まぁそもそもインターネットアーカイブのサービス終了ってのは想像がつかないが。
0967192.168.0.7742023/10/12(木) 02:21:30.42ID:7bMyoE320
実際、運営は個人レベルだったはずだから、寿命を迎えれば消えてなくなるかもな。
それ相応の団体化するとそう簡単には行かないが。
それこそ寄付金があるからな。あれが潰れるってのはあまり考えれられない。
0968192.168.0.7742023/10/12(木) 22:24:19.71ID:Cc0NPZ9j0
>>965
todayは何度もドメイン変えたり、過去に児ポ通報攻撃にあっても生き残ってるので無理じゃないかな
まぁURL分からなきゃまず誰もアクセス出来ないし、諦めて忘れた方が良いと思う
0969192.168.0.7742023/10/14(土) 17:33:19.38ID:Jcc+eBcl0
早い話、日本人のnitterサーバー管理者を証拠申請すれば済むような
0971192.168.0.7742023/10/16(月) 11:41:38.02ID:azdWzTrc0
セルフホストしたらええんちゃう
tps://matoken.org/blog/2021/02/17/self-hosting-the-lightweight-twitter-front-end-nitter/ ↩
0972192.168.0.7742023/10/16(月) 17:36:48.55ID:BkCyhBrA0
.orgだとイスラエル首相がツイートした焼死赤子の写真が全部"Hmm...this page doesn’t exist. Try searching for something else."
.todayで1件だけ見れる
0973192.168.0.7742023/10/18(水) 16:16:06.14ID:RIuGCdRE0
今気づいたんだけどツイートの直リンクだとログインなしで見れるのね
Nitter からスクレイプして直リンク取得でwaybackmachineに打ち込めるやん!
0974192.168.0.7742023/10/19(木) 17:03:11.12ID:YZO3LNYf0
>>973
一部見れないツイートがあるのと(おそらくR18認定)、リプライが見れなくなったから一つひとつアーカイブしなきゃいけないけどね
0975192.168.0.7742023/10/19(木) 18:32:56.68ID:BbSSQwx/0
nitterはシクブラとか職場でR18突破するために見つけたんだよね、イーロン以前
0976192.168.0.7742023/10/20(金) 05:27:28.98ID:MWss6HyY0
Nitterのスクレイプ試したけど2万ツイートぐらいで取得できなくなる?
インスタンスにもよるのかな一度だけ三万ツイート取得できたけど
0977192.168.0.7742023/10/22(日) 10:17:10.67ID:ZodK+h9h0
.org沈黙したな
0979192.168.0.7742023/10/22(日) 17:52:16.71ID:hiS5hxVm0
Twitter公式が旧UI完全廃止で重ったるい現行UI強制来た時にnitterを発掘した。
0980192.168.0.7742023/10/24(火) 17:22:09.42ID:ZAGhQ3u+0
衆議院議員が陰部ポロリXに.orgも.todayも役立たず
0981192.168.0.7742023/10/29(日) 22:21:48.35ID:Ft9/6eOi0
todayのpixivアカウント消えたっぽいな
0982192.168.0.7742023/11/02(木) 00:41:26.94ID:zMOd/xdd0
『どっとうpろだ』が 2023/11/30 を持ってサービス終了
サービス終了と同時に全データも削除とのこと
0984192.168.0.7742023/11/05(日) 19:40:01.13ID:IXzGmb0O0
TVでた蔵(https://datazoo.jp/ )が重い 最近。

消失すると地味に困るかも。
0985192.168.0.7742023/11/05(日) 20:05:07.55ID:k4gYNeRG0
※「価格com テレビ紹介情報」は株式会社ワイヤーアクションが提供するTV放送ログを掲載しています。
https://kakaku.com/tv/

まあ会社が飛んだら提供も止まるし削除だろうけどな
09869842023/11/06(月) 15:39:04.93ID:hjrGk5W/0
いや、でた蔵が重い要因や理由は何だろう?っていう話。


----

「電波ログテキストマイニング(録画バカ一代)」(http://dnptxt.com/)が、消えてしまった。

もうちょっと持つかと思ったがダメだったか。


こういうサービスや記録のサイトって、意外と需要が無く誰もサイト丸ごと保存やIAとかに公開しないんだろうか。


----

gooテレビ番組って関西の番組内容の抄録もあって、でた蔵より充実してたな…。これも誰も丸ごと保存してなさそうだし。

関西版でた蔵って無いんだろうか。
0987192.168.0.7742023/11/07(火) 05:21:16.35ID:OLRw/jQk0
Way backだとツイート直リンクでアーカイブできなくなってるのか
白い画面しか表示されない、todayは大丈夫だけど
0989192.168.0.7742023/11/07(火) 14:58:27.31ID:2Phbl9ID0
>>987
ちょっと前から表示は出来なくなってる
ソースを見るとツイート内容の保存はされてるらしい
0990192.168.0.7742023/11/08(水) 20:24:56.72ID:FYJKvk760
面倒だからtwitter直じゃなくてnitterリンクでwayback にプッシュした方がいいな
Todayはキャプチャまみれで大量に取りにくいんだよな
0992192.168.0.7742023/11/15(水) 11:57:08.59ID:Ip7omGo40
ghostはURLの最後に*付けて芋づる式検索が出来なかったり容量オーバー名目で記録拒否されたリする
0993192.168.0.7742023/11/15(水) 14:05:35.00ID:FWXSB1gA0
>>991
Shift JISとか化けてない?
0995192.168.0.7742023/11/20(月) 17:59:00.89ID:pAClgikJ0
もし自分が次スレを立てるなら、

次スレのスレタイは

【保存・記録】ウェブアーカイブ総合 page.02

という表記にしようかと思ってる。(これでもピリオドの部分も微妙な感じがするが。)

上記などに異議が無いなら上記で次スレを立ててるかも。(万が一、規制に巻き込まれてとかで次スレを立てられなかったらごめん。)



それで「いや自分が次スレ立てたい」という人がいるなら、任せた。

そもそも次スレの需要があるかどうか不明だが。
0996192.168.0.7742023/11/21(火) 02:15:29.47ID:gtrkUTCl0
きっしょ
0998192.168.0.7742023/11/22(水) 10:46:01.18ID:QZxCudHS0
>>997
じゃあ「Page.01」のそのピリオドは何の意味なんだ?
例えば「p.52 (52ページ)」というような略記法な使い方とも違うじゃん。

そんな表記だと、キャピタライゼーションルールとも違うわけだし、そんなんだったら「Page」は「page」になる方が好ましいだろうが。


>>996
この無知者め
0999192.168.0.7742023/11/22(水) 11:16:03.00ID:S5C4Okpm0
気持ち悪すぎる
1000192.168.0.7742023/11/22(水) 11:24:01.44ID:eA83YbWK0
無意味な煽り合いはやめてね
10011001Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 1690日 13時間 52分 39秒
10021002Over 1000Thread
5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。

▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/

▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況