X



【保存・記録】ウェブアーカイブ総合 Page.01
レス数が1000を超えています。これ以上書き込みはできません。
0001192.168.0.774
垢版 |
2019/04/06(土) 21:31:22.29ID:KqAD+H9+0
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web,archive,org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
0004192.168.0.774
垢版 |
2019/04/06(土) 22:57:35.43ID:C58mCeVw0
なんか、良く解ってない奴がスレ立てた感がもりもり
0005192.168.0.774
垢版 |
2019/04/06(土) 23:08:18.32ID:W+Cd7+OG0
随分ふんわりとした否定だな
0006192.168.0.774
垢版 |
2019/04/07(日) 00:26:33.03ID:8q7+ly+v0
スレ立てする時に5chの使い方と日本語以外に解ってなきゃいけないことがあるなんて初めて聞いた
0007192.168.0.774
垢版 |
2019/04/07(日) 06:32:56.08ID:rvx0PlzU0
サービスの使い方、お知らせなど
日経トレンディネットは3月31日に更新終了、日経クロストレンドへ統合します
https://trendy.nikkeibp.co.jp/atcl/manual/15/1048699/022200013/
2019年03月01日
既存の「日経トレンディネット」の記事は、4月以降、順次閲覧ができなくなり、6月30日にはすべての記事の閲覧ができなくなります(一部は「日経クロストレンド」で閲覧可能です)。
長い間のご利用、ありがとうございました。
0008192.168.0.774
垢版 |
2019/04/07(日) 06:55:45.40ID:rvx0PlzU0
2019年8月15日(木) niconareサービス終了について
https://blog.nicovideo.jp/niconews/104611.html

4月11日(木) 投稿者向けのデータダウンロード機能の提供

投稿者の方がご自身の投稿いただいたスライドや、
スライドについたコメントをダウンロードできる機能を提供いたします。

この機能はniconareのサービス終了日までご利用いただくことができます。

7月18日(木) スライドの投稿、およびコメント投稿機能の提供終了

これ以降はスライドの視聴および、
投稿済みスライド情報の編集のみ行うことができます。
0009192.168.0.774
垢版 |
2019/04/07(日) 06:58:08.86ID:rvx0PlzU0
今後、はてなグラフ、ポケットはてななど、複数のサービスの提供を終了する予定です
http://hatena.g.hatena.ne.jp/hatena/20180911/1536650034

終了予定
はてなグラフ ( http://graph.hatena.ne.jp )
はてな認証 ( http://auth.hatena.ne.jp )
はてな検索 ( http://search.hatena.ne.jp )
はてなMobileGateWay ( http://mgw.hatena.ne.jp )
ポケットはてな ( http://mobile.hatena.ne.jp)
各サービスのフィーチャーフォン向けの機能・サポート
はてなキーワードAPI ( http://developer.hatena.ne.jp/ja/documents/keyword )
はてなメッセージAPI ( http://developer.hatena.ne.jp/ja/documents/message )
はてなポイント送信機能
0010192.168.0.774
垢版 |
2019/04/07(日) 07:11:15.82ID:4ZacPRRJ0
最近は本当にサービス終了多いな・・・
0011192.168.0.774
垢版 |
2019/04/07(日) 07:32:13.57ID:rvx0PlzU0
https://www.cabling-ol.net/cabledirect/news/news190401-1.php
ケーブルダイレクトおよびケーブリングオンラインの各Webサイトの閉鎖日時が決まりましたのでお知らせいたします。  
ケーブルダイレクトおよびケーブリングオンラインの各Webサイトは、2019年5月31日(金曜日)の午後12時をもって閉鎖することとさせていただきますので、お知らせいたします。
0012192.168.0.774
垢版 |
2019/04/07(日) 07:37:42.65ID:rvx0PlzU0
Adobe Flashのサポート終了まであと2年。消えゆくFlashゲームを保存する「Flashpoint」の登録作品がリリースから1年で1万タイトルを超える
https://news.denfaminicogamer.jp/news/181225g

歴史の中に消えようとするデジタルコンテンツを収集し保存するボランティア団体「Archive Team」に所属するBen Latimore氏が、終焉の危機にひんしているFlashゲームを収集し、誰もがプレイできるプラットフォーム「Flashpoint」を公開してから1年が経つ。
0013192.168.0.774
垢版 |
2019/04/07(日) 07:40:18.59ID:rvx0PlzU0
パブー閉店に伴うブクログからのお知らせ
http://info.booklog.jp/?eid=1007

【パブー・サービス終了までのスケジュール】
2019年6月30日(日) パブー新規作品の作成・公開の停止、プロ版サービス終了、新規会員登録停止
2019年9月30日(月) パブー閉店(商品販売の終了)
2019年10月1日(火)ブクログでのパブー検索終了
2019年11月30日(土) パブー側のログイン機能の停止
2019年12月1日(日)ブクログ本棚のパブー発行書籍の書影の非表示化
0014192.168.0.774
垢版 |
2019/04/07(日) 07:48:48.33ID:kQbvec6m0
>>10

儲からないからね
0015192.168.0.774
垢版 |
2019/04/07(日) 09:57:35.03ID:4ZacPRRJ0
とりあえずニコナレ1ページ保存してみたけどやっぱ動的?なサイトだとそう簡単には動いてくれないな
https://web.archive.org/web/20190407004022/https://niconare.nicovideo.jp/watch/kn4316
専門的な知識無いからわかんないや

>>14
情報集めといて一気に消滅させるのやめてほしいわ・・・
結局どのサイトも最終的には消えて無くなるんだろうけどさ
0016192.168.0.774
垢版 |
2019/04/07(日) 10:38:53.84ID:8q7+ly+v0
【魚拓】とか【Internet Archive】とかスレタイに付けないと検索にひっかからなさそうな気がするわ
立て直した方が良いんじゃないの?
0017192.168.0.774
垢版 |
2019/04/07(日) 10:55:17.23ID:rvx0PlzU0
Janne Da Arc オフィシャルファンクラブ「マドモアゼルなあなた達」会員の皆様へ
Janne Da Arc解散に伴うファンクラブ解体のお知らせ
https://fanclub.janne.co.jp/
0018192.168.0.774
垢版 |
2019/04/07(日) 11:20:57.88ID:rvx0PlzU0
【サイト閉鎖のお知らせ】睡眠情報メディア・フミナーズ
https://fuminners.jp/journal/entertainment/16241/

睡眠情報メディア・フミナーズは、2019年3月末日をもって全ての記事の更新をストップし、準備が整い次第、サイトを閉鎖することとなりました。
0020192.168.0.774
垢版 |
2019/04/07(日) 13:56:52.92ID:PI3RUhLx0
【意図しないデータ消失事故にアーカイブが活かされた事例】

・2019年3月18日
2003年にサービスを開始して以来、2億人以上のユーザー数を誇っていた米音楽系SNS「Myspace」が、
過去12年間に投稿された写真、動画、音声の全てのファイルをサーバー移行失敗により消失したと発表。

これにより1400万組のアーティストによる5000万以上も楽曲が損失したこととなり、世界各地では亡くなった友人や家族との思い出が消えてしまったなどという悲痛の声があがった。


・2019年4月1日
インターネット・アーカイブが「MySpaceが消失した音楽ファイルのうち、約50万曲が匿名の学術グループによって提供された」と発表し、そのファイルを公開した。
喪失した音楽ファイル全体の1%にも満たない曲数ではあるが、復旧したデータ量は1.3TBにも及ぶ。
今後の第三者によるデータ提供に注目が集まっている。


Myspaceの喪失データのうち約50万件の音楽ファイルが学術グループにより復活
https://gigazine.net/news/20190405-recover-half-million-myspace-songs/
0021192.168.0.774
垢版 |
2019/04/07(日) 14:30:36.57ID:rvx0PlzU0
2019.02.26 サービス終了のお知らせ
http://www.mapfan.net/news/index.html#190226

平素は「MapFan.net」をご愛顧頂きまして、誠にありがとうございます。

「MapFan.net」は、2020年3月31日をもちましてサービス終了させて頂きます。
ユーザーの皆様には大変ご迷惑をおかけ致しますが、何卒ご理解賜りますようお願い申し上げます。

サービス終了に伴い、2019年2月26日時点で「通常版」*1をご利用中のユーザー様につきましては、有効期限を2020年3月31日まで延長させて頂きました。
サービス終了までご利用頂けますので、継続利用手続きの必要はございません。
なお、新規購入につきましては、サービス終了する1年前の2019年3月31日をもちまして、お手続きを停止致しました。

また、「MapFan.net」は終了致しますが、今後は、MapFanプレミアム会員向けサービス *2の中で、パソコン用地図ソフトをご利用いただけるよう準備しております(2019年度中予定)。
0022192.168.0.774
垢版 |
2019/04/07(日) 14:38:15.11ID:rvx0PlzU0
全サービス終了のお知らせ | DNSを自由に簡単に。Dozens(ダズンズ)
https://dozens.jp/close/

サービス終了までのスケジュール
・2019年3月1日(金)
新規会員登録・有料プランへのアップグレード受付終了
・2019年9月30日(月)
コントロールパネル・APIの停止
・2019年10月31日(木)
DNSサーバーの停止・サービスの完全終了
0023192.168.0.774
垢版 |
2019/04/07(日) 17:43:24.63ID:FMiv5iU/0
>>16

同意する
0024192.168.0.774
垢版 |
2019/04/07(日) 18:13:55.69ID:PI3RUhLx0
色々なサイトの情報が集まってきているからwikiとかがあった方がいいかもね
0025192.168.0.774
垢版 |
2019/04/07(日) 20:26:45.76ID:8q7+ly+v0
【Internet Archive】ウェブアーカイブ総合 Page.01【ウェブ魚拓】
のスレタイで立て直すけどいい?
0026192.168.0.774
垢版 |
2019/04/07(日) 20:39:47.53ID:R6TrddMD0
【魚拓】ウェブアーカイブ総合 Page.01【Internet Archive】
こっちのほうが見やすいかも
0028192.168.0.774
垢版 |
2019/04/07(日) 21:03:08.45ID:5OnOP9Lv0
テンプレのURL中のカンマも何とかしろよ
要らんものにも付いてるし、大文字を使うだけで回避できるのもある
0029192.168.0.774
垢版 |
2019/04/07(日) 21:21:30.37ID:PI3RUhLx0
archive.today は https じゃなくて httpだぞ
0031192.168.0.774
垢版 |
2019/04/07(日) 21:47:48.30ID:8q7+ly+v0
これでいいかな

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive.org/
archive is
http://archive%2eis/
ウェブ魚拓
https://megalodon.jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
0032192.168.0.774
垢版 |
2019/04/07(日) 21:55:01.17ID:PI3RUhLx0
(Rock54回避のためピリオドをカンマに変更)が消えてないよ
0033192.168.0.774
垢版 |
2019/04/07(日) 22:01:00.95ID:8q7+ly+v0
【魚拓】ウェブアーカイブ総合 Page.01【Internet Archive】

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://archive%2eis/
ウェブ魚拓
https://megalodon.jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
0038192.168.0.774
垢版 |
2019/04/08(月) 00:10:23.59ID:csp1RLRO0
これ以上意見なさそうなんで立て直してくる
0039192.168.0.774
垢版 |
2019/04/08(月) 00:16:32.72ID:csp1RLRO0
本文はこれにする
ただスレタイの文字数制限に引っ掛かってしまったんでどこか削らないと駄目だな

ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://Archive.is/
ウェブ魚拓
https://megalodon.jp/
WebCite
https://www.webcitation.org/archive
Archive.st
http://archive.st
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
0040192.168.0.774
垢版 |
2019/04/08(月) 00:34:32.72ID:kFS6Xl/I0
ジオシティーズ消える前に立てないあほ
0041192.168.0.774
垢版 |
2019/04/08(月) 00:43:05.43ID:csp1RLRO0
>>40
ジオシティーズスレでのアーカイブ活動の振り返りから生まれたスレらしいのでそれはそう

スレタイだけど、これならインターネット板の制限に収まるはず これで良いよね
ウェブアーカイブ総合【Internet Archive・魚拓】#1
0042192.168.0.774
垢版 |
2019/04/08(月) 00:45:54.81ID:HokS2hQ10
archive.st はいらんでしょ
0043192.168.0.774
垢版 |
2019/04/08(月) 00:50:15.61ID:HokS2hQ10
【魚拓】ウェブアーカイブ総合1【Internet Archive】
スレタイこれでもいける
0044192.168.0.774
垢版 |
2019/04/08(月) 00:54:42.68ID:csp1RLRO0
>>43
この板のスレタイ制限は48バイトなんだが、それは50バイトだからオーバーしてしまう
0046192.168.0.774
垢版 |
2019/04/08(月) 02:17:39.24ID:Lv11LAhu0
パート数増える事考えると少し余裕もたせたいね
0047192.168.0.774
垢版 |
2019/04/08(月) 04:47:52.01ID:Lv11LAhu0
魚拓諦めてIAだけのほうがいいのかな
【InternetArchive】ウェブアーカイブ総合 Page.1
いっそ文字数制限の緩和を申請してみるのもいいかもしれない
0048192.168.0.774
垢版 |
2019/04/08(月) 06:12:04.28ID:1L4c/w+i0
>>24

あー、そうだな。

誰かにウィキ作ってほしい。
0049192.168.0.774
垢版 |
2019/04/08(月) 08:07:46.10ID:1ZNe+OlH0
wikiはみんなで作るものだぞ
0050192.168.0.774
垢版 |
2019/04/08(月) 09:29:10.99ID:kuGZ5jM70
共同編集サイトで有名なのってwiki以外だとgoogleドキュメントくらいか
他に候補ある?
0051192.168.0.774
垢版 |
2019/04/08(月) 09:37:42.02ID:csp1RLRO0
>>47
文字数制限緩和の申請は賛成だけど、どれくらい待たされるか分からん(そもそも許可されないかも)し、とりあえず>>48のスレタイで立てるよ
0053192.168.0.774
垢版 |
2019/04/08(月) 09:41:17.79ID:kuGZ5jM70
【ウェブ魚拓】インターネットアーカイブ総合 #1

一つの案として。
0054192.168.0.774
垢版 |
2019/04/08(月) 09:44:44.34ID:Lv11LAhu0
立て直す前にwiki作っとかない?
どうせならもうテンプレに突っ込んどいちゃったほうがいいと思うんだけど
0055192.168.0.774
垢版 |
2019/04/08(月) 13:23:24.39ID:Gn50FMSd0
>>49

最初の設定は誰かが単独で行うだろ。
0056192.168.0.774
垢版 |
2019/04/08(月) 13:23:40.54ID:Gn50FMSd0
>>54

同意
0058192.168.0.774
垢版 |
2019/04/08(月) 13:54:47.88ID:csp1RLRO0
>>53
Internet Archiveのスレと間違われそう

誰かwikiの管理をできる時間がある人がいたらwiki作成宜しく
自分は管理者業務とか無理だわ
0059192.168.0.774
垢版 |
2019/04/08(月) 14:42:32.50ID:kuGZ5jM70
どこか既存のwikiに専用のページを作るっていう方法もある
アーカイブ関係のwikiがすでにあればそういうところがいいんだけど
0060192.168.0.774
垢版 |
2019/04/08(月) 17:21:50.82ID:7Gb6dlTw0
一分に一件ずつ保存しても一日1440頁しか保存できない。
0061192.168.0.774
垢版 |
2019/04/08(月) 18:46:46.19ID:csp1RLRO0
これで立てようとしたけどホスト規制に引っ掛かってしまったので誰か頼んだ

タイトル:ウェブアーカイブ総合【Internet Archive・魚拓】#1
内容:
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://Archive.is/
ウェブ魚拓
https://megalodon.jp/
WebCite
https://www.webcitation.org/archive
Archive.st
http://archive.st
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズの件から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

・旧スレ
http://mevius.5ch.net/test/read.cgi/internet/1554553882
0062192.168.0.774
垢版 |
2019/04/08(月) 20:23:02.60ID:IXy1N+9U0
正直そんなに慌てて次スレ建てなくてもいい
このスレでwikiの作成や話し合いを十分にやってから立てればいい
0063192.168.0.774
垢版 |
2019/04/08(月) 21:41:07.95ID:csp1RLRO0
それもそうか
Wiki作るって言っても無計画にやったら瓦解するだろうし、具体的に何を書く(書いていい)Wikiなのか決めとかないと
0064192.168.0.774
垢版 |
2019/04/08(月) 23:09:47.96ID:73UxGWOW0
規律と理念、主要なアーカイブサイトのアーカイブリクエスト方法と見方、主要なツールの使い方、アーカイブに便利なソフトウェア一覧、関連リンク集、サービス終了が告知されている中で保存に公益性がありそうなサイト一覧、将来的に保存が必要になりそうなサイト一覧
とか?
多少ArchiveTeamに倣ったほうがよさそう
0065192.168.0.774
垢版 |
2019/04/09(火) 00:37:25.02ID:qC7dF5bK0
他力本願で技術力が足りない人が多すぎるから、人を集めることも重要だな
0066192.168.0.774
垢版 |
2019/04/09(火) 01:27:21.91ID:vAsLhlqU0
【12日まで】500円を貰える春のばらまきキャンペーン開催中です     

@ スマホのApp Storeから「プリン(pring)」をインストールする  
A 会員登録を済ませる    
B 下図の通りに進む    
https://pbs.twimg.com/media/D3pIexoU0AY4_so.jpg 
C コードを登録 [5gAYSz]  
    
これで五百円を貰えます  
スマホでセブンATMからお金を下ろせたり便利なアプリですので是非お試し下さい。   
0067192.168.0.774
垢版 |
2019/04/09(火) 02:14:18.12ID:Xrq4p9iW0
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか?
0068192.168.0.774
垢版 |
2019/04/09(火) 06:11:46.94ID:bDBZAOBP0
>>67

その二択なのか?
0069192.168.0.774
垢版 |
2019/04/09(火) 07:35:20.06ID:aX1j4Hrw0
MediaWiki 一択でしょ
0070192.168.0.774
垢版 |
2019/04/09(火) 07:42:31.88ID:aX1j4Hrw0
>>64
というか ArchiveTeam の日本語版を作ったほうがいいな
向こうが全てにおいて優れているから自分達で1から始める理由がない
日本支部的な感じで翻訳から始めよう
0071192.168.0.774
垢版 |
2019/04/09(火) 10:44:41.80ID:47CWuxog0
そのまま日本語化は無理だろうね、法律違うし
アーカイブをまとめてtorrentで配布とかそもそもサイトをアーカイブして勝手に公開することとか
禁止しないといけないこと、解釈を変えないといけないこと色々あるでしょう
0072192.168.0.774
垢版 |
2019/04/09(火) 12:18:20.83ID:j/bARIBT0
Torrent配布は日本では完全に無理だな
Archive Teamはインターネットアーカイブをデータを提供しているらしいから、それに倣った方がいい
0073192.168.0.774
垢版 |
2019/04/09(火) 17:30:25.36ID:ilhSCREf0
そういえば少し前にググルマップがゼンリン切ったけど、ゼンリンが提供してた部分以外で何か独自の消失したものってあった?
0074192.168.0.774
垢版 |
2019/04/09(火) 20:25:46.98ID:R0ew9YH30
このスレってパソコン初心者感がすごいな
このまま進んでも上手くいかないだろうな、というのが見てて分かる
0075192.168.0.774
垢版 |
2019/04/09(火) 20:40:23.16ID:TX2XtJeD0
随分ふんわりとした否定だな
0076192.168.0.774
垢版 |
2019/04/09(火) 21:42:02.72ID:j/bARIBT0
初心者っぽいポイントを挙げてみろよ
出来ないならそれは単にイチャモン付けてるだけだぞ
0077192.168.0.774
垢版 |
2019/04/09(火) 21:51:39.41ID:j/bARIBT0
×初心者っぽいポイント
○上手くいかないであろう根拠

逆に聞くが>>74はどうやったら上手くいくと思うよ?
0078192.168.0.774
垢版 |
2019/04/09(火) 22:06:36.56ID:Ybc45mGn0
適当に作ったブックマークレット各種
google cache化
javascript:{window.open('http://webcache.googleusercontent.com/search?q=cache:'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}

保存 WayBackMachine (web.archive.org)
javascript:{window.open('https://web.archive.org/save/'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}

WayBackMachine最新
javascript:{window.open('https://web.archive.org/web/submit/?url='+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'&type=replay');eval();}

GeoLog化
javascript:{window.open('https://thaliana.mydns.jp/GeoLog/'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}
0079192.168.0.774
垢版 |
2019/04/09(火) 22:34:51.34ID:Ybc45mGn0
適当に作ったブックマークレット各種(2)
Save to Archive.today
javascript:void(open('http://archive.today/?run=1&;url='+encodeURIComponent(document.location)))

Web魚拓化
javascript:{window.open('http://gyo.tc/'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}
0080192.168.0.774
垢版 |
2019/04/09(火) 23:12:16.41ID:thZOPaUB0
グッジョブ
0081192.168.0.774
垢版 |
2019/04/10(水) 14:33:20.20ID:0KzfqGnC0
>>78
google cacheをWayBackMachineに保存するときに保存のブックマークレット使うと失敗しますね。
最新の方で開いてから「Save this url in the Wayback Machine」をクリックで成功。
一度失敗してしまった場合はgoogle cacheのURLの後ろに「&hl=ja」等をつけてから最新で開いて「Save This URL」。
0084192.168.0.774
垢版 |
2019/04/10(水) 22:12:15.15ID:5UKQiW/z0
/web/2/ってのは/web/*/の勘違いかタイポなんだろうな
/web/*/使えばもっと簡潔に書けると思うよ
0085192.168.0.774
垢版 |
2019/04/10(水) 22:14:34.68ID:Qi/9tnuY0
/web/*/だと一覧に飛んで/web/2/だと最新のに飛ぶんでないの
0087192.168.0.774
垢版 |
2019/04/11(木) 00:46:30.73ID:2s+xSUEt0
/web/URLでも最新に飛べるけどな
0088192.168.0.774
垢版 |
2019/04/11(木) 10:08:33.22ID:NcP8kiVw0
このスレ見つけらんねえよ
魚拓,archive,waybackとかスレタイに含まれてなきゃ
0089192.168.0.774
垢版 |
2019/04/11(木) 10:41:01.74ID:zpHmesQE0
上の方で話してたけどスレタイの文字数制限厳し目だからウェブアーカイブ総合の横にInternetArchiveと魚拓入れただけでカツカツになっちゃうんだよね
板設定変更依頼スレッド見ると簡単には設定変更してくれないようだしなんか削らないと
いっそ魚拓・InternetArchive総合にすりゃいいのか?
0090192.168.0.774
垢版 |
2019/04/11(木) 11:12:44.61ID:JiNXg/cV0
良スレだな。応援してるわ
日本のサイトもサービス終了対策しないと空白になってしまうので
管理人が全員生きてて引っ越し出来るとも限らんし、消された情報が将来誰かに必要・不要なんて分からんのよね

日本の法律から、終了するサイトは丸ごと個人のローカルへ保存する方法が有ると良いな
分散バックアップにもなると思う
0091192.168.0.774
垢版 |
2019/04/11(木) 11:26:31.44ID:3yDWyDnm0
>>89
タイトル案

【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】ウェブアーカイブ1【InternetArchive】
【魚拓】ウェブアーカイブ1【IA】
【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】アーカイブ1【Internet Archive】
【魚拓】Web archiving1【Internet Archive】
魚拓:ウェブアーカイブ1:Internet Archive
ウェブアーカイブ1【Wayback Machine,魚拓】
ウェブアーカイブ1【Internet Archive,魚拓】
ウェブアーカイブ1【魚拓】
ウェブアーカイブ1😂InternetArchive魚拓
ウェブアーカイブInternetArchive魚拓1
archive 1【魚拓】
魚拓 1
0092192.168.0.774
垢版 |
2019/04/11(木) 12:00:59.64ID:aWNM129m0
魚拓やWayback Machine以外のツールも扱うよ、ってことで「総合」は付けておきたい
0093192.168.0.774
垢版 |
2019/04/11(木) 12:04:19.18ID:aWNM129m0
>>91
追加

ウェブアーカイブ総合【Internet Archive・魚拓】#1
【ウェブ魚拓】インターネットアーカイブ総合 #1

>>1にリンクがあるウェブ魚拓スレやIA専用スレと間違われないようなスレタイが望ましい
0094192.168.0.774
垢版 |
2019/04/11(木) 12:18:42.95ID:zpHmesQE0
となるとやっぱりウェブアーカイブ総合は外せないか?
魚拓、InternetArchiveの他にウェブページを保存したい人が調べそうな単語ってあるんかな
収集、保存、保管、ダウンロード、キャプチャ、スクラップ
うーん・・・
0095192.168.0.774
垢版 |
2019/04/11(木) 12:26:06.26ID:D+Yqkgbv0
魚拓もウェブ魚拓って完全にスレタイに含めないと話にならない
0096192.168.0.774
垢版 |
2019/04/11(木) 13:18:54.90ID:aWNM129m0
ウェブ魚拓は固有名詞としても使うだろ
https://info.5ch.net/index.php/魚拓
このサイトでも「魚拓」とだけ紹介してるし、何よりスレタイ制限の48バイトって結構カツカツだし、魚拓だけで良いんじゃないかな
0097192.168.0.774
垢版 |
2019/04/11(木) 13:20:20.32ID:aWNM129m0
>>96
×魚拓だけで良いんじゃないかな
○「ウェブ魚拓」と完全にスレタイに含める必要は無いんじゃないかな
0098192.168.0.774
垢版 |
2019/04/11(木) 13:59:00.00ID:D+Yqkgbv0
そんなにこだわってないならIAは略していいってことになるけどそうはならないのと同じ
ウェブ魚拓とスレタイに含めないと立てる意味がない
0099192.168.0.774
垢版 |
2019/04/11(木) 14:44:54.16ID:zpHmesQE0
【ウェブ魚拓】ウェブアーカイブ総合 Page.1【InternetArchive】
sjisで60バイト
ウェブ魚拓をweb魚拓にすれば57バイト
ウェブアーカイブもwebアーカイブにすれば54バイト
64バイトまで引き上げてもらえば全部入る
【ウェブ魚拓】を抜けば48バイトに収まる
とりあえずウェブ魚拓抜いて立て直して申請通ったら次のスレからウェブ魚拓も入れるのがいいんじゃないか
なぜIAじゃなくてウェブ魚拓を抜くのかについてはGoogleの検索トレンドを参考にした
https://i.imgur.com/cNx29z9.png
0100192.168.0.774
垢版 |
2019/04/11(木) 15:23:27.94ID:rHrFPNjW0
大抵「Archive」でスレタイ検索するなあ自分は
0101192.168.0.774
垢版 |
2019/04/11(木) 16:54:04.85ID:aWNM129m0
「ウェブ魚拓」と「魚拓」のどちらでも、Googleなら上手いこと検索に引っ掛かってくれそうではある
Bingは知らん
0102192.168.0.774
垢版 |
2019/04/11(木) 18:36:21.34ID:3yDWyDnm0
「魚拓」 でも引っかかるから「ウェブ」は要らないね
https://www.google.com/search?q=%E9%AD%9A%E6%8B%93+site%3A5ch.net

というか普通にスレあった
https://mevius.5ch.net/test/read.cgi/esite/1498902308

>>92
「ウェブアーカイブ」だけで全てを説明できてるから「総合」も要らないと思う
Internet Archive, Wayback Machine, archive.is, 魚拓, ArchiveTeam は全部「ウェブアーカイブ」で説明できる 👀
Rock54: Caution(BBR-MD5:1322b9cf791dd10729e510ca36a73322)
0103192.168.0.774
垢版 |
2019/04/11(木) 18:59:21.43ID:zpHmesQE0
ウェブアーカイブ(に関するものを)総合(したスレッド)
ていうかそれ総合格闘技とか格闘技で空手やら柔道やら説明できるから総合いらないじゃんって言ってるようなもんでしょ
総合とわざわざ表記することによって一つではなく全体であることを暗に示してるんだよ
0104192.168.0.774
垢版 |
2019/04/11(木) 19:37:27.64ID:3yDWyDnm0
いや、どっちかというと「空手 part1」でも十分なのに「空手総合 part1」 にしてる感じ
ウェブアーカイブの技術としては1つにまとまるから総合しなくてもいい
「ウェブアーカイブサービス総合」なら自然だね
文字列制限があるなら省いても問題ない
0105192.168.0.774
垢版 |
2019/04/11(木) 19:55:40.33ID:3yDWyDnm0
今気づいたけど「ウェブアーカイブ」が何を指すかの認識の違いだね

@ ウェブアーカイブ → アーカイブのサービス (digital archive or archive site)
A ウェブアーカイブ → アーカイブ技術 (web archive or web archiving)

アーカイブ技術という意味で使っても良いかと思う
0106192.168.0.774
垢版 |
2019/04/11(木) 23:09:34.96ID:L2Qvrxob0
>>78-79
window.open()の後ろにeval()付けたり、void()の引数にしたり、
未定義値を返したいだけなのに方法がバラバラ。
同じ人が作ったにしては変な話だな。
0107192.168.0.774
垢版 |
2019/04/12(金) 00:06:00.46ID:dU8Shh4A0
公式が公開しているものをコピペしたのも含まれてるのかな
0108192.168.0.774
垢版 |
2019/04/12(金) 03:12:04.19ID:IEOgrIFJ0
todayは公式のやつだったかも。てへぺろッ
0109192.168.0.774
垢版 |
2019/04/12(金) 07:27:14.62ID:SClfSpUI0
67 名前:192.168.0.774
投稿日:2019/04/09(火) 02:14:18.12 ID:Xrq4p9iW0
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか?


69 名前:192.168.0.774
投稿日:2019/04/09(火) 07:35:20.06 ID:aX1j4Hrw0
MediaWiki 一択でしょ



まずここから考えよう
0110192.168.0.774
垢版 |
2019/04/12(金) 07:30:12.18ID:SClfSpUI0
シーサーブログのシーサーウィキというのもあるらしいが。
0112192.168.0.774
垢版 |
2019/04/12(金) 07:36:46.55ID:SClfSpUI0
Seesaa Wiki(シーサーウィキ)とはシーサー
株式会社が運営するレンタルウィキサービスである。

@wiki(あっとうぃき、atwiki)とは、和歌山県の有限会社アット
フリークスが提供するレンタルウィキ。2ちゃんねる掲示板のパート
スレッド(パートスレ)まとめに用いられることが多い。

(以上ウィキペディアより)
0113192.168.0.774
垢版 |
2019/04/12(金) 12:28:44.53ID:xJcFOgmj0
MediaWikiはきちんとしたシステムが作れるのはメリットだけど管理が面倒
Pukiwikiはどうだろう
https://pukiwiki.osdn.jp
0114192.168.0.774
垢版 |
2019/04/12(金) 16:01:45.26ID:U3RvVBMo0
ミクシィもSNSはお荷物事業だからそろそろたたむ準備してそうだな
0115192.168.0.774
垢版 |
2019/04/12(金) 16:32:28.92ID:zTEegk2Q0
相変わらずパソコン初心者感が満載
おかげさまで、パクりの寄せ集めを「作った」と詐称しても
その不自然さに気付けないという

>>113
この流れだと、セットアップ済みのレンタルWikiの方が無難だと思うよ
0116192.168.0.774
垢版 |
2019/04/12(金) 17:13:46.28ID:OzOD5/Ux0
高圧的に的確な指示出しててワロタ
0118192.168.0.774
垢版 |
2019/04/12(金) 19:44:52.10ID:IEOgrIFJ0
初心者とかどうでも良い。使えさえすれば。
0119192.168.0.774
垢版 |
2019/04/12(金) 19:48:37.42ID:3kWgI93v0
今必要なのは初心者じゃないけどな
0120192.168.0.774
垢版 |
2019/04/12(金) 23:04:13.37ID:6eRxenyu0
使えりゃ何でも良いから不自然だろうが気にしないけどな
使ってて問題がありゃ自分で作り直すまでだ
0121192.168.0.774
垢版 |
2019/04/12(金) 23:06:32.84ID:6eRxenyu0
>>115
>セットアップ済みのレンタルWikiの方が無難
確かにな、一からサーバ立てて設定しなきゃいけないWikiだと結局グダりそうだ
そうなるとポピュラーなatwikiあたりかな
0122192.168.0.774
垢版 |
2019/04/13(土) 04:31:44.74ID:PBKRoLHf0
ShoutWiki なら無料で MediaWiki 使えるね
とりあえず有能な人が来るまではこれでいいでしょ
0123192.168.0.774
垢版 |
2019/04/13(土) 05:50:27.39ID:oa76VPkq0
>>122

それで異存はない。
0124192.168.0.774
垢版 |
2019/04/13(土) 10:15:26.73ID:ybhQs0Es0
そしてwikiサービス終了するんですね分かります
0125192.168.0.774
垢版 |
2019/04/13(土) 14:37:20.47ID:BP9fC9wY0
終了したらどこか別のところへ移転すれば良い
0126192.168.0.774
垢版 |
2019/04/13(土) 17:53:03.37ID:BP9fC9wY0
>>104
「総合」を付けることを発案した者です
単に「ウェブアーカイブ」というとIAやArchive.is等のウェブサービスを使うことを連想している人が多かったようなので、
ウェブアーカイブはそれだけじゃないよ、wget等のツールや自作ソフトを使うのも立派なウェブアーカイブなんだよ、ということを強調したかった
そして、IA専用スレやウェブ魚拓スレで扱われないウェブアーカイブ技術関連の話題の受け皿にしたかった
>>105の言う通り認識にズレがあるみたいだね
0127192.168.0.774
垢版 |
2019/04/13(土) 19:36:41.35ID:LxikEBfR0
>>126
126名無しさん@お腹いっぱい。2019/04/06(土) 09:24:43.110
インターネット遺産のアーカイブ系総合スレみたいなところってどこ?
そういうところは5chに無いのかな

総合ってはじめに使い出したのは俺なんだけどな
0128192.168.0.774
垢版 |
2019/04/13(土) 20:07:13.70ID:HJ17KfG20
>>127
すまん、ここのスレタイを考えたのは自分だったので思い違いをしてた
0130192.168.0.774
垢版 |
2019/04/14(日) 01:04:52.71ID:CM5+hhVJ0
日本だとウェブアーカイブは著作権侵害(犯罪)になるからこのスレ危ないよね?
逮捕されたくないので消えます
0131192.168.0.774
垢版 |
2019/04/14(日) 01:25:36.52ID:nTd5PtnI0
実際その辺は心配ではある
弁護士に聞いてもやめとけで終わりそう
個人でDLしての私的利用ならアリなのかな
とりあえずツール中心の紹介にとどめておくべきかもね
0132192.168.0.774
垢版 |
2019/04/14(日) 02:56:48.93ID:v+D0MDAi0
まだ親告罪だから訴えられなければセーフ
0133192.168.0.774
垢版 |
2019/04/14(日) 03:08:40.08ID:v+D0MDAi0
ちゃんと説明すると、非親告罪化された著作物は金銭的な利益が絡むものに限られてるので、
大体のウェブアーカイブの場合問答無用で捕まることはないはず(多分)
あと著作権法に抵触するのはウェブアーカイブを無断で公開した場合のみであって、
各個人でサイトを保存して私的に取っておくこと自体は違法でもなんでもない

Archive Team経由でInternet Archiveにデータを寄付してしまえば日本の法律では手が出せないはず
0134192.168.0.774
垢版 |
2019/04/14(日) 03:17:25.65ID:SqtAvvkZ0
ウェブ魚拓の運営も捕まってないよね
0135192.168.0.774
垢版 |
2019/04/14(日) 03:26:04.24ID:qw07bbn30
削除依頼無視でもしない限りは大丈夫なんじゃないの
アーカイブしたサイトに違法なコンテンツがあったらどうなるかわからんけど
0136192.168.0.774
垢版 |
2019/04/14(日) 03:44:40.89ID:v+D0MDAi0
>>134
そうなんだよね
パッと見完全にアウトなサービスだけどちゃんと続いてるってことは、上手くやれば訴訟を起こされるようなことにはならないってことだし
それにあそこの運営は企業だから、事業の一つにもなりうるってことでもある
0137192.168.0.774
垢版 |
2019/04/15(月) 03:23:24.42ID:zgYzoRmr0
Shoutwikiでサイト立てるのは誰がやる?
暇だったら自分がやってたんだが正直管理業務とかやってる余裕がない
0138192.168.0.774
垢版 |
2019/04/15(月) 22:12:08.31ID:k4EioB070
いっそ最初はwikiじゃなくて各々が個人サイトとかブログで情報まとめたりしてそれらのサイトをリスト化すればいいんじゃないか
0139192.168.0.774
垢版 |
2019/04/15(月) 22:26:55.43ID:+QZpIriz0
>>138
全員が個人サイトやらブログやらを持っている訳じゃないし、持ってても手間がかかって面倒だって人間もいるだろう
各々が直接情報を書き込んで行く方が手間がかからない
そうなると、きちんとした体制さえ構築できるのならWikiが一番良い
0140192.168.0.774
垢版 |
2019/04/15(月) 22:40:37.04ID:k4EioB070
それはわかってるけどwikiを管理する技術と時間がある人いるのかって話なんすわ・・・
0141192.168.0.774
垢版 |
2019/04/15(月) 23:09:48.42ID:OIWksCm90
wikiが必要なほどの量の情報が集まるのかが疑問
アーカイブに関することと言ってもツールの使い方を翻訳するくらいしかできないだろう

本格的なアーカイブ作業をするのならArchiveTeamに入るべき
日本支部を作るにしても結局はArchiveTeam本部の力が必要

日本のサイトは英語圏から見逃されやすいから日本人の注目を集めることでArchiveTeamに貢献することもできるかもしれない
ただし本当に技術がある人は既に英語圏のコミュニティに参加しているからどれほど効果があるかは分からない
0142192.168.0.774
垢版 |
2019/04/15(月) 23:10:03.44ID:+QZpIriz0
それは確かになぁ
正直>>115がやれば良いんじゃないかという感じがする
0143192.168.0.774
垢版 |
2019/04/15(月) 23:17:05.99ID:+QZpIriz0
ArchiveTeamって多くの日本人は入りづらい所があると思うんだ
だからArchiveTeam本部と一般の日本人ネットユーザーの架け橋になるような組織はあって損はないと思う
ArchiveTeamのサイトにはアーカイブについての知見がまとめられているから、MediaWikiなんて大仰なものが必要かは疑問ではあるけど、
彼らの知見を翻訳して日本人向けに公開する場所はそれなりに有意義じゃないだろうか
0144192.168.0.774
垢版 |
2019/04/15(月) 23:19:08.03ID:d2BbUiX90
とりあえず最初はgoogleドキュメントみたいな手軽なところでやってみれば
0145192.168.0.774
垢版 |
2019/04/15(月) 23:20:08.99ID:+QZpIriz0
日本でウェブアーカイブというと既存のウェブサービスを利用するイメージが強いからね
英語コミュニティで活動する日本人エンジニアはある程度いるが、そうした人の中でもウェブアーカイブについて詳しい人はそんなにいないと思うよ
0146192.168.0.774
垢版 |
2019/04/17(水) 12:15:06.93ID:KC94xqUc0
英語コミュニティで活動する日本人エンジニアで、ウェブアーカイブについて詳しい人は結構いると思うが
ウェブアーカイブに関する活動に多くのリソースを使おうと考える人は非常に少ないだろうね
0147192.168.0.774
垢版 |
2019/04/17(水) 13:25:55.62ID:pBKnwE2u0
ウェブアーカイブ専門の日本人は、国内コミュニティ・英語コミュニティ問わずかなり少ない
機械学習用のデータ収集やWebサービスの構築などの目的で、クローラを動かしてスクレイピングすることはエンジニアの間でかなり一般的になってきた感じがある
(ウェブアーカイブについての知識があるエンジニアにはこういう事をやってる人が多い)
でもそれは「データ収集手段としての保存」であって、ウェブアーカイブという「目的としての保存」を専門にしている人はほんの一握りよ
0148192.168.0.774
垢版 |
2019/04/18(木) 20:54:33.70ID:231mhavm0
Webスクレイピングは仕事になるけどWebアーカイブは仕事にならんものな
専門家が少ないのも道理
0149192.168.0.774
垢版 |
2019/04/19(金) 12:33:49.48ID:Sck2kHkT0
結局サイトはどうするよ
Googleドキュメントはお手軽だけど検索エンジンで見つからないし、Wikiサービスがいいと思う
Wikiの選択肢はatwikiかShoutWikiになるのかな
0150192.168.0.774
垢版 |
2019/04/20(土) 01:32:08.39ID:nlnJtIGb0
完全に人が消えてるな
>>74の予言が順調に実現して来てて笑う
0151192.168.0.774
垢版 |
2019/04/20(土) 02:38:53.71ID:EOflkhQE0
ネット上のデータを残し続けることに皆そこまで意義感じてないんじゃね
0152192.168.0.774
垢版 |
2019/04/20(土) 03:32:20.14ID:j74qt4l90
全部のリンクたどると凄い数になる。
数が多いと絞り込むのも大変だし、応答なしになるし、全部処理するということ自体出来るのか?と不安になるくらい次から次へとアドレスが出てくる。
過去に処理したやつ除外すれば…と思ったがかえって遅くなった。
あとURLが一部壊れてしまうのも原因不明。
0153192.168.0.774
垢版 |
2019/04/20(土) 10:06:44.64ID:uNdtbvPn0
あまりにも膨大で途方もないから
大抵の人は投げてしまうのさ
0155192.168.0.774
垢版 |
2019/04/21(日) 03:12:31.96ID:BVyeUYoM0
昔に比べてネット人口が増えたけど、PCユーザー自体は減ってるんじゃ無いかと…
0156192.168.0.774
垢版 |
2019/04/21(日) 16:10:39.88ID:HZbpua5K0
増えてますよ
0157192.168.0.774
垢版 |
2019/04/21(日) 16:34:58.79ID:+zJhJQgi0
法人向けは売れてるだろうけど一般家庭はスマホばっかりでPC減ってるでしょ
0158192.168.0.774
垢版 |
2019/04/24(水) 03:14:37.20ID:KjJLD36j0
>>151
これって割と深刻なことじゃね?
0159192.168.0.774
垢版 |
2019/04/24(水) 04:15:47.92ID:015wg1cT0
旗を揚げられる人間がいないだけなんじゃないかとも思うけどね
知識とやる気が揃ってなきゃできねぇ
俺は白旗なら掲げられるぞ
0160192.168.0.774
垢版 |
2019/04/25(木) 00:55:31.95ID:keVKSV/80
旗掲げたいけど今年いっぱいは時間が取れねぇ
0161あめ ◆P0jSlC5fJs
垢版 |
2019/04/29(月) 05:15:38.68ID:qYOC6Fj20
何をそんなに困ってるのかわからない
後は WebRecoder + ipwb を簡単にできたらおっけーじゃないの?
0162192.168.0.774
垢版 |
2019/04/30(火) 02:07:11.84ID:4bCzSUvm0
>>161
ログを読もう
端的に言うとやらなきゃいけない事が多い割に率先して出来る人間がいない
0163192.168.0.774
垢版 |
2019/04/30(火) 16:16:38.40ID:4bCzSUvm0
>>161
それだけでおっけーじゃないから皆こうやって話し合ってるのよ
0164192.168.0.774
垢版 |
2019/05/03(金) 12:31:09.57ID:/o+BXXwL0
テラバイトを溜めこむ、デジタルゴミ屋敷に棲むデータホーダーたち
https://www.gizmodo.jp/2019/05/digitalhoarder.html
断捨離にコンマリ。
そんなテクニックを使いでもしなければ、人は一度手にいれたものは、どうにも手放したくない
生き物のよう。
形ある物は必ず壊れる、諸行無常の響きはインターネットの世界でも鳴りわたっているようです。
わたしはハードディスクはかならずひとつ外付けを使ってデータをローカルと外付けの2回ずつ
保存しているんですよね。いまはそれはNASに変わりましたが、以前はDVDに焼いて保存したり、
FTPを使ったり、クラウドが台頭するようになってからはクラウドも多用していますが、どうも
クラウドもソーシャルメディアも永遠の存在ではなさそう。
今回は米Gizmodoで組んでいる「ゴミ」特集のひとつを翻訳しました。外部ジャーナリストのSteven
Melendezの書き下ろしです。ちょっと長いですが考えさられる内容。ぜひ、じっくりとご覧ください。
0165192.168.0.774
垢版 |
2019/05/03(金) 12:57:09.31ID:rDYW7khY0
gizmodoが世間からどういう評価を受けてるかわかった上でそれ貼ってるの?
0166192.168.0.774
垢版 |
2019/05/03(金) 17:24:56.15ID:AncjvUWJ0
腐れTwitter.5chまとめサイトよりマシ程度
0167192.168.0.774
垢版 |
2019/05/03(金) 17:39:06.81ID:s/8yyqZn0
どちらかというと >>164 はアーカイブに対してポジティブな記事だよ
ちょっと煽り気味の釣りタイトルだけどちゃんとアーカイビストの偉業を紹介してる
素直に褒めたくない意地悪さがにじみ出てるけどね
0168192.168.0.774
垢版 |
2019/05/04(土) 00:44:21.71ID:I7t6q7HU0
大量のアーカイブを管理するには個人だと限界があるわな
団体を作って分担作業し、出来ることならInternet Archiveのように社会的信用を得ないといけない
0169192.168.0.774
垢版 |
2019/05/04(土) 09:00:26.72ID:bL2u5kxf0
動画は円盤保存
画像と文字は印刷保存
0170あめ ◆P0jSlC5fJs
垢版 |
2019/05/05(日) 05:55:19.34ID:YysNkSBx0
>>162
実はスレがたったときから居て1から読んでるんだよなぁ
記事少し作るだけでここまで悩む不思議
>>74 の未来を変えるために降臨したのに
0171192.168.0.774
垢版 |
2019/05/05(日) 15:45:48.96ID:fUOQo4az0
>>170
ならあんたが未来を変えてくれ
0172192.168.0.774
垢版 |
2019/05/05(日) 15:49:26.42ID:fUOQo4az0
そもそもIPFSで本当に良いのかって話になったまま議論が止まってたはず
そこからArchive Team Japan的なものを作ろうじゃないかって話になって、そんなものに貢献できる日本人はもう本家に行ってるだろって話になって、
日本人でウェブアーカイブやってる人自体少数だよねって話になって、結局グダグダになって現在に至る
0173192.168.0.774
垢版 |
2019/05/06(月) 19:41:21.46ID:6bTK53bC0
まず5ch自体オワコンだから人が集まるはずないよな
0174192.168.0.774
垢版 |
2019/05/07(火) 16:01:29.67ID:nOGBK00T0
それ
5chで集められる人数なんてたかが知れてるから、外部サイト作ってTwitterとかで広めないとキツい
優秀なエンジニアはTwitterにかなり集ってるし、関心を持ってもらえれば良いんだが
0175py ◆o3kzHb/in8w0
垢版 |
2019/05/14(火) 19:06:58.64ID:cP8wStLG0
https://u1.getuploader.com/irvn/download/1657
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14

web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■

動作試験環境:windows10pro Irvine1.3.1
0176192.168.0.774
垢版 |
2019/05/15(水) 02:01:39.76ID:kfIYGIBa0
>>175
Internet Archiveスレでも情報共有しとけ
手動Save Pages Now以外の方法を知らない人達ばかりだから相当喜ばれるぞ
0177192.168.0.774
垢版 |
2019/05/16(木) 17:03:10.13ID:/p1LTvuX0
ヤフー「Yahoo!コンテンツディスカバリー」サービスの終了を発表
https://media-innovation.jp/2019/05/16/yahoo-revealed-they-stop-ycd/

【解約と配信停止のスケジュール】
6月中旬頃 解約通知書の発送開始予定
9月2日 コンテンツ修正相談受付終了
9月6日 コンテンツ修正相談の結果問合せ終了
9月13日 入稿時審査受付終了・タグ発行・掲載面ブロック等の配信設定業務受付終了
9月20日 入稿時審査の問合せ終了
9月30日 Yahoo!コンテンツディスカバリー 配信停止(順次)
11月29日まで Yahoo!コンテンツディスカバリー 管理ツール等の最終停止(順次)
0178192.168.0.774
垢版 |
2019/05/18(土) 21:20:44.41ID:thTbnaVW0
Yahooブログアーカイブ活動スレより引用

0031 Trackback(774) 2019/05/18 14:30:36
yahooブログは「記事がありません」のページで404を返すのだが、web2IAWBM.dmsが404のページを解析できなくてリンクをたどれていない可能性がある。
ブラウザでは普通にリンクをたどれる。
ID:l5DCkLS9
0179192.168.0.774
垢版 |
2019/05/21(火) 16:36:54.75ID:nRmqsex+0
サイトごとにやってると分かるけど、途中で止まってることがよくあるから、
終わったらブラウザで確認した方が良い。
0181192.168.0.774
垢版 |
2019/05/26(日) 10:51:40.72ID:oi3wUViY0
Index of /
ttp://infoseek_rip.g.ribbon.to/
0182192.168.0.774
垢版 |
2019/05/26(日) 11:04:21.99ID:oi3wUViY0
>>78
GeoLog Project
https://geolog.mydns.jp/
> お知らせ
>
> 2019/05/12 16:30
> ・URLを変更しました。リンク切れ等の不具合がもしあればご連絡ください。
> まだ旧ドメイン名が残っている部分がありますが、こちらは順次修正します。
> ・GeoCities URL収集 ttps://geo.98nx.jp/ 様にてアーカイブされたデータを順次統合中です。
>
> 2019/05/08 23:50
> ・近日中に、以下のとおりURLを変更します。
> 旧URL:https://thaliana.mydns.jp/GeoLog/
> 新URL:https://geolog.mydns.jp/
> 移転後も、旧URLはリダイレクトとして残す予定です。
0184192.168.0.774
垢版 |
2019/05/28(火) 23:18:36.54ID:6dDxcHOe0
中学生かな?
まだ夏休みには早いと思うんだけど
0186192.168.0.774
垢版 |
2019/05/29(水) 02:16:14.09ID:rgaJjZzR0
ん、IA調子悪いのか?
0187192.168.0.774
垢版 |
2019/05/29(水) 03:41:38.21ID:rgaJjZzR0
涼しいからスクリプト走らせようと思ったのに
0188192.168.0.774
垢版 |
2019/06/07(金) 03:14:38.91ID:EZciTwz+0
サーバーエラー出てる間のは保存されてないのに緑のチェックマークで成功扱いになるから注意して
0190192.168.0.774
垢版 |
2019/06/12(水) 05:55:56.93ID:DnPdDFAp0
ニュース記事は2ページ目以降が保存されていないことが多いよな。
魚拓も、1ページ目を保存しただけでは、2ページ目以降は保存されないよな?
パッと見保存されているように見える
0191192.168.0.774
垢版 |
2019/06/13(木) 02:01:24.77ID:DBW1u0DS0
Webcite、何故かアクセスできない
0192192.168.0.774
垢版 |
2019/06/13(木) 02:43:36.27ID:Fctk1dcQ0
>>191
あぁまたか、あそこは良く DNS から消える。
でもサーバはしっかり生きてるんだな、これが。
0193192.168.0.774
垢版 |
2019/06/17(月) 14:43:18.30ID:Xz9V42zC0
GASにアーカイヴ作業させられないかな
10分おきに起動
0194192.168.0.774
垢版 |
2019/06/18(火) 15:34:14.81ID:MI2+ZpWl0
ニュース記事みたらSave Pageするのが習慣になってきた。
0195192.168.0.774
垢版 |
2019/06/19(水) 17:32:14.54ID:iJXbWhxE0
>>193
できそうな気もするがどうなんだろう
0197192.168.0.774
垢版 |
2019/06/21(金) 14:13:34.55ID:9K2NkZ870
一日に間隔をあけて数回アーカイブするくらいなら何とかなるのでは
誰か試して見てくれ
0198192.168.0.774
垢版 |
2019/06/22(土) 15:09:24.70ID:S8tpOgcn0
ArchiveBoxというものを見つけた
自前のマシンでウェブアーカイブをするためのオープンソースソフトウェアだって
https://archivebox.io/
0199192.168.0.774
垢版 |
2019/06/22(土) 15:19:39.24ID:S8tpOgcn0
>>198
基本的にCUIで操作するものなので注意
自分でリンクを辿るのではなく、アーカイブするURLのリストを読み込ませる方式らしい
HTMLやWARCはもちろん、画像やPDFでの出力にも対応してるのが便利そう
0200192.168.0.774
垢版 |
2019/06/23(日) 20:49:35.28ID:27h915gg0
[JavaScript] Wayback Machine Script - Pastebin.com
https://pastebin.com/ZxryGY8F
Automatically save the page you visited (or all links you can see) to "Wayback Machine".
試していないので使えるかどうかはわからない
0201192.168.0.774
垢版 |
2019/06/25(火) 23:07:44.50ID:5uQFWJVA0
IAが昼過ぎからずっとメンテ
0202192.168.0.774
垢版 |
2019/06/26(水) 22:53:23.97ID:Qb0QQC6K0
配布終了したフリーソフトの保管庫も欲しい
0203192.168.0.774
垢版 |
2019/06/28(金) 15:19:25.28ID:JC6hqmSv0
getASFstreamも実行ファイルがIAから削除されてるな。
0204192.168.0.774
垢版 |
2019/06/28(金) 15:22:44.92ID:JC6hqmSv0
getASFstreamはVectorのが生きてたからまだ平気か。
0205192.168.0.774
垢版 |
2019/07/03(水) 17:10:46.83ID:0BbpBYkz0
ルートラボ2020年3月末終了
https://www.itmedia.co.jp/news/articles/1907/03/news096.html

これはWayback Machineでも保存できないので同じようなサービスにデータを
移行したもの以外のデータは消え去ることとなる。

これからこのようにアーカイブできないデータは増えていく一方だろう。
0206192.168.0.774
垢版 |
2019/07/06(土) 04:08:11.16ID:6FkUH5GE0
アーカイブできないデータの筆頭がオンラインゲーム・ブラウザゲーム・ソーシャルゲームだよねえ
0207192.168.0.774
垢版 |
2019/07/06(土) 14:21:01.48ID:GinQGT8r0
昔流行ったフラッシュはアドレス直打ちSavePageNowで保存できたけどゲームは分からん。
0209192.168.0.774
垢版 |
2019/07/10(水) 16:20:17.46ID:fnXJF4Pm0
Wayback Machineやたら重いんだけど
時間帯によるもの?
0210192.168.0.774
垢版 |
2019/07/11(木) 07:59:17.31ID:7Pk3v1uW0
スクリプト走らせてる人が70人近くいるはずだし重くなっても不思議は無い。
保存されているかを確認するために実際に開いて確認してから保存している。
同じページを何度も確認していたなんてこともあると思う。
0211192.168.0.774
垢版 |
2019/07/13(土) 00:39:32.34ID:Y10L19C40
ここの住人にYahooブログをアーカイブしてほしい
0212192.168.0.774
垢版 |
2019/07/13(土) 13:20:12.05ID:LEU3bec70
異様に書き込み減ったし多分みんな保存してる。
個別にURL指定してくれれば優先する。
0213192.168.0.774
垢版 |
2019/07/16(火) 11:16:16.55ID:hXIS632N0
ジオシティーズの時のようにURal収集フォームみたいなのがあれば便利なんだけどな
0214192.168.0.774
垢版 |
2019/07/16(火) 11:17:07.12ID:hXIS632N0
タイプミス
URLな
0215192.168.0.774
垢版 |
2019/07/17(水) 12:47:13.54ID:8BflpvwW0
質問です。
Wayback Machineを使って、見たかったサイトは見つかったのですが、画像はありませんでした。
その画像を見つけることはもうできないのでしょうか?
0216192.168.0.774
垢版 |
2019/07/21(日) 06:02:59.22ID:PLd/1lFQ0
GASは程度にもよるが増やしすぎるとすぐこうなる。思ったより使えない。
> サービスで 1 日に使用しているコンピュータ時間が長すぎます
0218215
垢版 |
2019/07/28(日) 17:53:01.59ID:2hYx5uH+0
>>217
そうなんですか、残念ですがありがとうございます
0220192.168.0.774
垢版 |
2019/07/30(火) 03:06:48.87ID:w+bM/0cg0
ロリコンはネトウヨ
女叩きしてるのはBBA
DQNも何方かと言えばネトウヨ色が強い

5chとネット上で、金魚の糞を巻き散らかしてるのはコイツら
0221192.168.0.774
垢版 |
2019/07/30(火) 18:42:36.22ID:rAPLQn650
改憲なんてしてもアメリカが作った自作自演の戦争に巻き込まれて戦争犯罪に加担するだけじゃん。
愛国者なら9条改正には反対しないと。どこの国も上層部は裏で繋がっている、つまり中国韓国ロシアはアメリカと通じていて、本当の敵はアメリカの中にいる。
敵国条項は残っているんだから日本がちょっとでも怪しい動きしたらロシア中国韓国アメリカから攻撃されて今度こそ日本無くなるぞ。
そして、緊急事態条項は独裁完成法。
独裁完成したら安倍晋三が死ぬまで安倍政権が続くぞ。
0223192.168.0.774
垢版 |
2019/08/16(金) 10:44:48.49ID:c/w5mu590
>>175のやつ最近のログ見たら保存されてないのに保存済みと表示されて保存してないURLある事に気付いた。
IA側が仕様変更したのか?
0224192.168.0.774
垢版 |
2019/08/16(金) 10:48:02.20ID:c/w5mu590
>>223
Show Allでは確かにキャプチャーがあるのに、それを開くとHrm.で表示できない。
0225192.168.0.774
垢版 |
2019/08/17(土) 23:15:30.53ID:Z4rWSf4u0
閉鎖がアナウンスされてるサービスについては、
Wikipediaから参考文献などとしてリンクを貼られているサイト、Twitterでシェアされているサイトを優先してアーカイブした方がいい
ジオシティーズの時もこの方式が取られてたと思う
Yahooブログのアーカイブを考えてる人がいたら参考にしてくれ
0226192.168.0.774
垢版 |
2019/08/18(日) 05:20:36.47ID:zB3uGj7T0
>>222

アドブロックが普及しすぎて、ブログサービスはどこも儲かっていないらしい。
0227192.168.0.774
垢版 |
2019/08/18(日) 22:44:14.13ID:lH1BP5oP0
最近はアンチアドブロックとかもあるよね
0228192.168.0.774
垢版 |
2019/08/18(日) 23:41:17.08ID:m6no0JBr0
>>226
スマートフォンだと余り普及して無いけど、
スマートフォンでブログやる人って少ないのかな…
0231192.168.0.774
垢版 |
2019/08/21(水) 14:54:06.94ID:b3NNDeZP0
>>230
今のところ1768個の記事があるらしい
0232192.168.0.774
垢版 |
2019/08/22(木) 23:08:10.94ID:c46PChaz0
水谷修のサイト保存してくれた人いるのか
0233192.168.0.774
垢版 |
2019/09/14(土) 14:16:10.61ID:Xphq9GAC0
情報が古くても需要がありそうなのは
小説・漫画・映画のレビュー・考察サイト
ゲーム関係のサイト(攻略サイト・レビューサイトなど)
Web小説
あたりか
0234192.168.0.774
垢版 |
2019/09/15(日) 22:34:40.70ID:6+5CjbXu0
興味あるので保守
0235215
垢版 |
2019/09/20(金) 05:31:59.01ID:QM3MI5eR0
アーカイブしたいサイトがある時、どうやって保存するの?
Winなら巡集みたいなソフト使ってやるの? Macではターミナル?
0236192.168.0.774
垢版 |
2019/09/23(月) 03:23:58.52ID:TCqq29480
ニコ生アラートのバイナリ保存されていない…残念
0238215
垢版 |
2019/09/23(月) 05:25:08.76ID:2+4wj0ye0
>>237
Windowsしか書いてないけど、macで行ける?
0239192.168.0.774
垢版 |
2019/09/23(月) 08:45:19.53ID:TCqq29480
Macはもってないので分からない。
>>175のやつWindowsでも機能していない可能性がある。保存されたって出てるけど実際は保存されていないとか。
0240192.168.0.774
垢版 |
2019/09/25(水) 18:16:46.74ID:TR/fy2AH0
サービス終了に関するご報告
https://www.rich.co.jp/news_article/20190930/

>この度、2015年よりサービスを続けてまいりましたメディア「ヘルスケア大学」について、当社事業領域の整理に伴い社内リソースを別領域に集中させることに決定し、2019年9月30日にサービスを終了することとなりました。
0241192.168.0.774
垢版 |
2019/09/27(金) 23:51:14.06ID:4H4+28EN0
ワイ「古い車買ったろ。整備は大変そうやけど、ネットには先人の知恵がいっぱいや」

1 :名無しさん@おーぷん:19/09/27(金)23:31:11 ID:2JG主 ×
ジオシティーズ「ん?」
ディオン「んん?」
ニフティー「んんん?」

2:名無しさん@おーぷん:19/09/27(金)23:31:38 ID:2JG主 ×
先人の知恵、消える

3:名無しさん@おーぷん:19/09/27(金)23:31:46 ID:6EZ ×
しゃーない

5:名無しさん@おーぷん:19/09/27(金)23:32:30 ID:cUL ×
悲しいなぁ…
0242192.168.0.774
垢版 |
2019/09/28(土) 08:08:34.63ID:bq44L+WV0
各アーカイブサービスの検索機能が優秀なら良いんだけどな
保存してもそれを探し出せないなら死蔵と変わらんな
0243192.168.0.774
垢版 |
2019/09/29(日) 01:09:52.47ID:q9QXqdnD0
無料ソフトウェアのサイトは保存されてても実行ファイルを含むzipファイルは保存されていません。
可能な限り保存します。
0244192.168.0.774
垢版 |
2019/09/29(日) 01:34:12.78ID:T/2cpgi20
>>242
単にアーカイブしたファイルの中身に対して検索を行えるかどうかの話。
それを優秀などという語でしか表現できない貧弱なボキャブラリー。
0245192.168.0.774
垢版 |
2019/09/29(日) 02:04:44.22ID:q9QXqdnD0
Googleとかで「 site:web.archive.org」を付けて検索するのが現実的かと。
0246192.168.0.774
垢版 |
2019/09/29(日) 11:02:46.70ID:IeSWqng50
wikiうんぬんの話が出ているので、いくつか使ったことがあるから書いておくけど
atwiki SeesaaWiki FC2wiki などはそれぞれ記法が独特でバックアップが取れない
atwikiは特に仕様がころころ変わる上に不具合発生率も高くて、書き込みだけに集中できないし
アカウントを削除してもサーバーからデーターが完全削除されないみたい

pukiwiki/pukiwiki plusベースのところはdumpデーターは取得できるけど
運営が個人だったり個人で会社を作ってやっているところはその人がどうにかなると連絡が取れなくなる
それでもサーバーやドメインが維持されいるとサービスは利用できるけど
ある日突然使えなくなることがある
0247192.168.0.774
垢版 |
2019/09/29(日) 12:20:42.26ID:T/2cpgi20
コンテンツ制作側としてのバックアップの話をここでやってどーするの。
0248192.168.0.774
垢版 |
2019/09/29(日) 12:33:23.11ID:IeSWqng50
個人サイトで無料/有料に関わらず共用サーバーを使っている場合
サーバー管理会社によってサーバーのスペック変更が行われると
サービスが終了していなくてもサイトが閲覧不可になることがあるよね

PHP5.3までしか対応していないものを使ってサイト運営をしているのに
サーバー側がPHP7.2にしちゃったとか
サーバーを丸ごと交換してデフォルトがUTF-8になったのに
サイトのほうでcharsetを指定していないとか
DBのバージョンが上がってデーターが呼び出せなくなった
等の理由で、閲覧が困難になるケース

閲覧しに行って真っ白だったり文字化けしていたりするのはこの辺の理由
0249192.168.0.774
垢版 |
2019/09/29(日) 12:56:37.11ID:T/2cpgi20
なんだ、新手のスレ埋め立てかw
0250192.168.0.774
垢版 |
2019/09/29(日) 13:09:54.41ID:T/2cpgi20
そういやPukiWikiのサイトをInternetArchiveで保存させる場合、
一覧ページから数階層分のURLを掘って、その全URLに/save/リクエストを
発行すれば完了だろうな。
適当なツールが無ければIrvineとメモ帳のテキスト置換機能を使えばよい。
ソースのバックアップの話はスレチ。
0251192.168.0.774
垢版 |
2019/09/29(日) 17:04:53.57ID:q9QXqdnD0
このスレで使うwikiが消滅する場合の対策の話じゃないの。
0252192.168.0.774
垢版 |
2019/09/29(日) 22:23:17.96ID:n8nVup7e0
>>244
人の揚げ足取る暇があったらアーカイブしろ
0253242=252
垢版 |
2019/09/29(日) 22:32:55.86ID:n8nVup7e0
だいたいページ内容の走査だけで検索機能実装しても優秀とは到底言えないからな
検索エンジンサービスのようにページランク等を考慮して初めて、優秀というかようやく使いものになる
アーカイブサービスのように膨大な数のページを検索しなきゃいけない場合は、そういったアルゴリズムの必要性がさらに高まる
こういう話をいちいちするのが面倒だから話を全部ひっくるめて「優秀」の一語で表現した
これで満足か?
0254192.168.0.774
垢版 |
2019/09/29(日) 22:36:12.79ID:n8nVup7e0
ページランクは固有名詞に近いからランキングアルゴリズムと言うべきだったかもしれない
0255192.168.0.774
垢版 |
2019/09/29(日) 22:40:09.36ID:n8nVup7e0
クソリプが跋扈するツイッターや人口の多い他の5ch板ならまだしも、
このご時世にこんな専門板で、横からいきなり会話してる訳でもない相手からレスが飛んでくるとは思わなかった
随分面食らったわ
0256192.168.0.774
垢版 |
2019/09/29(日) 22:48:43.54ID:T/2cpgi20
Wiki立てる話自体が消えたと思ってたw
0257192.168.0.774
垢版 |
2019/09/30(月) 11:04:24.16ID:MZVGPwZn0
>>256
また話が出るかもしれないから一応書いておいただけ

atwiki上のサイトで差分が見れないところがあったから
archive.orgで探してみたけど
archive.orgのbotをatwikが蹴っているみたいで最近はエラーページが保存されちゃってる

意図的にそのページを残したい人がarchive.orgのアカウントを作って残す場合は別として
消えちゃったページを後からarchive.orgで探すのは難しくなっていると思うよ
クローリングの期間がだいぶ開いている
これはGoogleのキャッシュもそうだと思う
サイトを運営している人がGoogleのアカウントを取得して
Google Search Consoleからクローリングのリクエストを出して当然ってなってきているみたい
0258192.168.0.774
垢版 |
2019/09/30(月) 15:43:12.38ID:yT22Xmkr0
>>245
実際に検索してみると分かるけど、その方法だと引っかからないアーカイブが結構あるんだよな
Googleのクローリングが追いついてないんだと思うけど
0259192.168.0.774
垢版 |
2019/09/30(月) 17:16:29.06ID:yT22Xmkr0
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/l50/

74 Trackback(774) 2019/09/30(月) 17:07:59.58ID:th5gp/Yr
Internet ArchiveでYahooブログを保存すると遷移スクリプトが発火する話なんだけど、
web.archive.org/save のページから「Save outlinks」にチェックを入れて保存すると
どうもYahooのトップページに遷移されずにアーカイブできるみたいだ
さっき偶然発見して何回か試したけど今のところ全て上手く保存されてる
0260192.168.0.774
垢版 |
2019/10/08(火) 01:13:45.16ID:MXp0IOeT0
Twitter埋め込みが一切保存されない問題
0261215
垢版 |
2019/10/08(火) 08:01:40.33ID:GswYVQiV0
>>260
アメリカの図書館にいけよ
0262192.168.0.774
垢版 |
2019/10/08(火) 14:30:06.60ID:fXMCPs+v0
アメリカの図書館はもうTwitterの全保存やめたんじゃなかったか
0263192.168.0.774
垢版 |
2019/10/18(金) 01:06:58.74ID:F6Bah8760
当時の「魔法のiらんど」上で作られたサイトは現在ではほとんど残っていない。
WebArchiveでも表層しか掘れないサイトばかりである。
当時の掲示板でのやりとり等はもちろん、かのクレリアさんが自サイトに書き記していた構築解説ですらも現在は散逸してしまった。
0264192.168.0.774
垢版 |
2019/10/25(金) 10:22:59.94ID:ZZgmHhFq0
手動で一ページずつやってもToo Many Requestsになって捗らないな。
Wayback Machineは金払うから一気に取得かアップロードさえて欲しい。
0265192.168.0.774
垢版 |
2019/11/03(日) 20:32:03.04ID:I05N5XH+0
もしかしたらしたらば掲示板やばいかもしれんな
0266192.168.0.774
垢版 |
2019/11/03(日) 22:05:54.91ID:IGp2y1Ub0
>>265

理由は?
0267192.168.0.774
垢版 |
2019/11/04(月) 01:30:31.73ID:d2EYioZ60
>>264
有料取得依頼みたいなんなかったっけ

最近Archive Today重いのは俺だけかい?
すぐNetwork Errorになる
0268192.168.0.774
垢版 |
2019/11/04(月) 07:36:42.44ID:1kde+9Me0
したらば掲示板が丸一日メンテナンスしてたみたいですな。
0269192.168.0.774
垢版 |
2019/11/05(火) 18:04:06.02ID:P7AeCNyG0
>>258
そういや最近グーグルってサイト作成者がクロール要求しないと
なかなかクロールしてくれないってどっかの記事で読んだような気がする。

↓こういうのをテキストエディタで作ってからIrvineの「URLを展開して貼り付け」をすると全頁まとめて登録できる。画像一覧とかも同様
https://blogs.yahoo.co.jp/************/MYBLOG/yblog.html?m=l&;p=[1-最後のページ番号]
例のスクリプトの登録漏れをある程度減らせると思う。
0271192.168.0.774
垢版 |
2019/11/10(日) 19:44:29.07ID:OJOj/1ou0
何故自分でやらないのか
0272192.168.0.774
垢版 |
2019/11/10(日) 22:43:10.93ID:Qg+FaNtt0
ジオシティーズの時もそうだったが、特定サービスのアーカイブって何だかんだ言ってかなりの時間と労力を必要とするんだよ
自分でやりたいのは山々だが、そこに労力を注ぎ込める余裕がない
なのでアーカイブをやっている人が多少は集まっているであろうここに投げた
0273270=272
垢版 |
2019/11/10(日) 22:45:26.50ID:Qg+FaNtt0
>>270のサイトの作者と自分は何にも関係ないことは一応断っておく
0274192.168.0.774
垢版 |
2019/11/11(月) 09:12:05.10ID:DmcMWPY20
Yahooブログにアーカイブすべき物なんてあるのか?
0275192.168.0.774
垢版 |
2019/11/11(月) 10:42:59.86ID:HD2VAMf80
単なる日常記録も多いけど、そこらのジオシティーズよりも濃い情報が詰まってるものも多いよ
自分が知ってる範囲だと、今は消えた街並みの記録や京都のマイナーな神社の訪問記、イギリスでの聖人信仰の研究サイト、ゲーム業界の裏話やゲーム攻略などがあるよ
自分が知ってる範囲のブログだけはいくつかWayback Machineに突っ込んだが、他にも有益な情報がたくさん眠ってると思うよ
Yahooブログなんて消えても誰も困らないだろうと思ってる人が結構いるみたいだが、とんでもない偏見だよ
0276GeoLog Project ◆RJRIJK3wcLw8
垢版 |
2019/11/11(月) 20:36:22.34ID:kHI2SrFf0
>>270
試しにhttrackに突っ込んだら画像のリンクが取れず、
調べたら元のHTMLにはないリンクを後から生成して突っ込んでますね。。。

動的サイト嫌いです。。。
0277192.168.0.774
垢版 |
2019/11/11(月) 23:27:18.77ID:HD2VAMf80
動的サイトのWebアーカイブ用クローリングとなるとHeritrix(Internet Archiveが使ってるクローラ)の出番ですね
実績もあるし高性能で拡張性もそれなりにあるものの、マシンの要求スペックが比較的高めなのが難点か
0278192.168.0.774
垢版 |
2019/11/14(木) 17:49:41.79ID:zR5VNa+N0
Heritrixの最低動作スペック自体はそこまで高くないよ
ただ、リッチなコンテンツを含むページをアーカイブしようとするとメモリを食うことがある
あと基本的にLinux環境しかサポートしていないので、人によっては手が出しにくいかもしれない
0280192.168.0.774
垢版 |
2019/11/17(日) 22:45:04.48ID:n+VdMpHA0
メモリ持て余してるけどストレージが足りない
ArchiveTeamWarrior的なのがあれば参加するんだけど
0281192.168.0.774
垢版 |
2019/11/19(火) 15:35:27.56ID:WcaVo5T50
ArchiveTeamに常駐してる人がここにいれば捗るんだが
0282192.168.0.774
垢版 |
2019/11/22(金) 05:16:46.52ID:8zBYuW1S0
むしろ元のHTMLの方には正しいリンク先URLがあるんじゃないの。
それで画像取得できないだろうか
0284192.168.0.774
垢版 |
2019/11/24(日) 23:10:35.97ID:Sj5SnpvV0
>>283
「拡大すると大きめの画像のある」って言うのがどういう意味かよく分からないので、もう少し詳しく説明をお願いしたい
0285215
垢版 |
2019/11/25(月) 05:25:36.43ID:U4MdffN+0
>>284
ライトボックスとかじゃない?
0286GeoLog Project ◆RJRIJK3wcLw8
垢版 |
2019/11/25(月) 20:34:05.84ID:KvWZhxVE0
>>284
言葉足らずですみません

Yahoo!ブログは画像をクリックすると別ページに飛んで元の大きい画像が見られるらしいのですが、
ページのimgタグに書いてある画像より、元画像の方が大きい例があるかどうかを気にしました
>>282 の「元のHTML」に元画像へのリンクがあるのか確認したかったので
0287192.168.0.774
垢版 |
2019/11/27(水) 13:24:37.22ID:+cJOWs3G0
Twitter、休眠アカウント削除へ 対象アカウントに12月11日までにログインするよう警告
https://www.itmedia.co.jp/news/spv/1911/27/news069.html

これ亡くなった著名人などのアカウントも容赦なく削除するらしいから、期限までに出来る限りアーカイブしておきたいところ
Twitterで #休眠アカウント削除 がトレンド入りしてるから、アカウントが消えるのが嘆かれてる故人のアカウントはこれでかなり拾えると思う
0288215
垢版 |
2019/11/27(水) 18:54:59.39ID:y0cHyaRo0
>>287
やり方おせーてくれたら手伝えるけど
0290192.168.0.774
垢版 |
2019/11/27(水) 21:52:41.92ID:+cJOWs3G0
>>288
とりあえず一番手っ取り早い方法は、>>289のツイートに貼られてるリンク先の入力フォームから、
保存して欲しいアカウントのIDを入力して送ること
もしかしたら他にも誰かが保存プロジェクトをやってるかもしれないから要調査だな
0292192.168.0.774
垢版 |
2019/11/30(土) 04:08:01.49ID:IS98dA580
>>291
海外からのアクセスに対し 403 Forbidden エラーを返すよう
設定されているみたいですから、Internet Archive や Archive.is では
無理でしょうね。
さらにそのエラーページは他サイトへの遷移スクリプトが
埋め込んであるので、フツーの人はエラー扱いされていることすら
気付けないでしょう。

当該エラーページの HTML ソースを貼っておきます。
https://pastebin.com/Vy7uYhiK
0293215
垢版 |
2019/11/30(土) 05:13:24.84ID:Yk7eFuvo0
>>290
DLだけ、自分でってことはできないの?
0294192.168.0.774
垢版 |
2019/11/30(土) 10:31:13.20ID:b+Bfz/GQ0
>>293
自分のPC中にアーカイブをローカルで保存することは出来ないかってこと?
Heritrixなど動的サイトを処理できるクローラを使えば問題なく出来る、出来るけどアーカイブは死蔵してたら意味が無いからね
自分だけで閲覧する用に保存しておくこともありうるけどそれはアーカイブとは言えない
ArchiveTeamが収集したファイルはWayback Machineに登録されるようになってるので、そういう意味では安全
0296192.168.0.774
垢版 |
2019/12/03(火) 03:09:24.37ID:zKh+7e4i0
Current Running Warrior Project: Yahoo! Groups
0297192.168.0.774
垢版 |
2019/12/03(火) 03:21:33.26ID:W45k6bBP0
Yahoo GroupsはYahooブログとは全くの別サービスだから早とちりすんなよ
0301192.168.0.774
垢版 |
2019/12/14(土) 23:22:02.29ID:AA4HPrSj0
Ci-en移行に伴うDLsite blogサービス提供終了予定のお知らせ
ttp://home-info.dlsite.com/archives/9427708.html
0302192.168.0.774
垢版 |
2019/12/15(日) 18:24:18.14ID:r3L4BzMu0
Yahooブログ今日までか
0303192.168.0.774
垢版 |
2019/12/16(月) 16:10:29.42ID:RltCXRJ+0
ほとんど何もできなかった
0305192.168.0.774
垢版 |
2019/12/16(月) 22:27:54.54ID:P9Fjib/40
人いねえもの
呼び掛けが不十分だとこうなってしまう
0306192.168.0.774
垢版 |
2019/12/17(火) 00:52:29.58ID:SWkI+H1w0
>>272 >>294
リンク構造維持できて程々の容量に収まるなら分割rarやzipに纏めてもらってもいい。

今は低速スマホしか使う余裕無くなったから巡集やWeboxみたいな取り込みアプリで一括アーカイブ化するのも無理だし
読売の縮刷版CD/DVDなんかは1年分で12万もするし
0308192.168.0.774
垢版 |
2019/12/17(火) 23:19:41.41ID:ZjrTQ21f0
ネットサービス企業は、スマホからの収益がメインやから、

PCだけに成ったら大倒産時代や
0309192.168.0.774
垢版 |
2019/12/18(水) 01:13:33.38ID:7iAMrhRQ0
色々と話がとっ散らかって来たな
>>306からして何が言いたいのか今一つ要領を得ない
0310192.168.0.774
垢版 |
2019/12/19(木) 20:23:09.25ID:s5RLoz8q0
もうyaplogに行ってる
0312192.168.0.774
垢版 |
2019/12/19(木) 23:36:07.17ID:P9Gt+F0u0
geocitiesのアーカイブサイトは複数ある様だけどYahoo!ブログも有る?
0313192.168.0.774
垢版 |
2019/12/20(金) 01:21:34.83ID:W2QHpneb0
>>312
Yahooブログスレの方にも載ってないから今のところないんじゃないかな
0314192.168.0.774
垢版 |
2019/12/28(土) 07:55:33.34ID:GiJFu1gz0
Archive.TodayはグーグルやBingのキャッシュを保存した場合でも原本URLを認識できるのが素晴らしい。
0315◆P0jSlC5fJs
垢版 |
2019/12/29(日) 21:46:36.02ID:3C6Rg8sC0
archive.todayのTwitterの魚拓がモバイル版にならなくなった?
アカウントは新UI、ツイートは旧PC用UI
0316◆P0jSlC5fJs
垢版 |
2019/12/30(月) 13:29:31.10ID:dXRB6Vq/0
>>315
それどころかアカウントの魚拓がかなり下の方までスクロールされた状態で保存されるようになった
つまり1回の魚拓でかなりたくさんのツイートが保存されるようになった
いいね
0317192.168.0.774
垢版 |
2019/12/30(月) 23:49:45.17ID:Sts0O97Y0
>>314
検索で出ないことあるからやっぱ微妙だった
0318192.168.0.774
垢版 |
2019/12/31(火) 18:45:45.57ID:eDEktBsz0
Webサイトの保存ってみんなどうやってしてるの?
このスレにすでに書いてたらすまん
0319192.168.0.774
垢版 |
2020/01/02(木) 07:10:20.03ID:5F6LDkXn0
ローカル保存&魚拓
0320192.168.0.774
垢版 |
2020/01/02(木) 10:39:14.28ID:ucP82yGj0
魚拓ってのは
https://megalodon.jp/
でローカル保存ってのはchromeなんかにあるオフラインで読む系機能であってる?
0322192.168.0.774
垢版 |
2020/01/04(土) 18:01:40.04ID:G3xvEvXn0
激重で読み込めない…
0323192.168.0.774
垢版 |
2020/01/04(土) 20:37:51.83ID:YBh70eiZ0
Scheduled Maintenance
The Internet Archive's sites are offline for scheduled maintenance and upgrades.
Please check our twitter feed @internetarchive for updates.
Sorry for the inconvenience.
0327192.168.0.774
垢版 |
2020/01/09(木) 21:40:15.88ID:y/kpjRu/0
Yahooボックスってサービス終了して無かったのか…
0330192.168.0.774
垢版 |
2020/01/19(日) 06:21:23.58ID:c42zUqjI0
>>328

魔法のiらんど はまだ存在しているのかw
0331192.168.0.774
垢版 |
2020/01/24(金) 17:33:52.87ID:TbU4PUEj0
https://archive.org/

ここに

http://ishidate.my.coocan.jp/index.html

の、「Visual C++の勉強部屋」は保存できてるようなんだけど
「Visual Studio Community 2017でPythonを始める」が
トップだけあって他のリンクが上手く保存が出来てないようなんだけど
残す方法ありますか?始めてやろうとしてるので変な残し方をしたら気まずい・・・
0332192.168.0.774
垢版 |
2020/01/24(金) 17:40:24.75ID:TbU4PUEj0
あれ?慌てただけで反映されてなかっただけかな?

http://ishidate.my.coocan.jp/python/python.htm

上から2個目まではアーカイブされてました、すみません
一個ずつセーブしていくのかな?2個目はやってないはずなんだけど
トップページをセーブすると、自動で全部の保存処理をしてくれてるのだろうか?
0333192.168.0.774
垢版 |
2020/01/24(金) 19:35:46.36ID:DGrUFhpx0
>>331-332
すみません、反映するまで時間が掛かってただけのようです
順調に保存が進みました
0334192.168.0.774
垢版 |
2020/01/30(木) 04:23:53.98ID:DpjoWFqw0
上の保存出来たと思ったら何も変わってなかった
もう訳が解らん、個人的にローカルへ残す事にします・・・
0335192.168.0.774
垢版 |
2020/01/30(木) 09:17:01.89ID:QEGy6HlG0
最近財政難を表明してからInternet Archiveはやけに不安定だからなあ
Internet Archiveのシステムはページをクロールする部分とクロールしたページを表示する部分に分かれてるんだけど、最近は後者の部分がやけに不安定だったりする
閲覧できてないだけで実は保存できてたりすることもあるけど、不安ならオフラインコピーや他のアーカイブサイトを使うといい
0336192.168.0.774
垢版 |
2020/01/30(木) 09:18:37.13ID:QEGy6HlG0
まあ財政難表明する以前からちょくちょく不安定になることはあったんだけど、最近は不安定になる頻度がやたら高くなってきてる
保存されるアーカイブの量にリソースが追いついてないらしい
0338192.168.0.774
垢版 |
2020/02/10(月) 15:13:07.48ID:GaTPIR040
Geocitiesのときはいくつかブックマークから追加したけどiらんどはなかったよ・・・
0339192.168.0.774
垢版 |
2020/02/17(月) 12:57:14.40ID:JLl8Pqxs0
Wayback Machine ツイッターが簡単に登録できなくなったね
try againになる
0341192.168.0.774
垢版 |
2020/02/21(金) 08:42:25.85ID:SqQJO7aU0
と思ったらReCaptcha導入でgyo.tc/urlまでもが廃止されたのかよ。
ReCaptchaの画面に飛ばしてくれればいいだけなのに。
タイトル画像詐欺になってるがな。
0342192.168.0.774
垢版 |
2020/02/21(金) 08:50:19.65ID:SqQJO7aU0
右下のリキャプチャマーク表示されてから5秒数えてから押せばいけるっぽい?
0343192.168.0.774
垢版 |
2020/02/25(火) 14:42:33.24ID:RVV1cF750
https://web.archive.org/
ここ一週間くらい調子悪いね?

保存できたと思って翌日くらいに見ようとしたら消えてて見られなくなってる
0344192.168.0.774
垢版 |
2020/02/25(火) 23:55:53.96ID:jlsY//Cy0
Internet Archiveはアーカイブ実行用クローラ(Heritrix)と
保存したアーカイブの専用ビューワ(Wayback)を組み合わせて動いてるんで、
保存したアーカイブがサーバ不調で一時的に見られなくなってても、
アーカイブさえきちんと出来てればそのうち問題なく見られるようになる
0345192.168.0.774
垢版 |
2020/02/27(木) 12:58:06.64ID:mwbfDK4S0
>>344
本当ですね!
さっき見てみたら復旧されたようでちゃんと保存できてました!
0346192.168.0.774
垢版 |
2020/02/29(土) 11:53:24.69ID:zPIV21fz0
アーカイヴトゥデイがGoogleキャッシュだけでなくBingキャッシュも原本と関連付けてくれれば神なんだが。
0347215
垢版 |
2020/03/20(金) 19:04:44.43ID:JhAw491V0
大住:僕は父親が来て、探偵ファイルをやめるべき理由を膨大に書き連ね
「これ以上やるなら親子関係を考えざるを得ない」と結んだ手紙を置いていきました。

wwwwwwwww
0348192.168.0.774
垢版 |
2020/03/24(火) 15:24:23.68ID:y1vf31FW0
Mが九つ…これはリッジレーサーのあの曲ですねぇ…間違い無い
0349192.168.0.774
垢版 |
2020/03/29(日) 00:39:38.40ID:fQaeQ4aI0
【リマインド】 魔法のiらんど
2020年 3/31 リニューアルに伴いホームページ機能終了
アーカイブの必要がある場合は早急に対応を。

https://maho.jp/renewal/
0350192.168.0.774
垢版 |
2020/04/11(土) 13:13:02.49ID:wGeDLnxf0
削除されたなろう小説や Wayback Machineでも見れないサイトを見たいなあ
0351192.168.0.774
垢版 |
2020/04/12(日) 03:38:35.21ID:9mojHch+0
レビューサイトや攻略サイトはどんなに古くても価値があると思う
0352192.168.0.774
垢版 |
2020/04/17(金) 16:09:58.55ID:jHjl/hvx0
Todayにリキャプチャ付いた。かわりに画像単体のキャプチャができるようになっていた。
0353192.168.0.774
垢版 |
2020/04/17(金) 17:07:42.90ID:hEp8fbMZ0
archive.today (archive.is)

URLがいくつもあるわけだが

archive.today
archive.is
archive.li
archive.fo
archive.vn
archive.md
archive.ph

ひとつがサーバーダウンしている時には
他のURLも使えないのかどうか。
0354192.168.0.774
垢版 |
2020/04/17(金) 19:43:09.88ID:DEdL3XQ50
>>353
名前を色々と増やし始めたのはこれが発端。
http://echo.5ch.net/test/read.cgi/esite/1189771222/587-590

ドメイン名乗っ取り攻撃に対する冗長性確保が目的。
何れかの名前が乗っ取られても他の名前で利用できるようにしてあるだけで、
> ひとつがサーバーダウンしている時には
> 他のURLも使え
〜るといった 20 年前みたいな事は意図していないはず。
0356192.168.0.774
垢版 |
2020/05/10(日) 18:31:31.05ID:0BWUOz3X0
>>355

> 「DLsite blog」

そんなブログサービスがあるということを今はじめて知った
0357192.168.0.774
垢版 |
2020/05/13(水) 22:57:43.18ID:+6V16oE90
>>351
そう簡単に常識が変わるわけではないジャンルだしな
0359192.168.0.774
垢版 |
2020/05/25(月) 18:40:03.53ID:DqvUJCjh0
2020年6月30日
連合型SNS『マストドン』 日本2位,3位のインスタンスが閉鎖
・msdtn.jp (登録20万人, 5500万トゥート)
・mastodon.cloud (利用者数6万人, 340万トゥート)

SNS『mstdn.jp』、誹謗中傷への対応の事務負担増に耐えられないと判断して6月30日で閉鎖へ
https://news.yahoo.co.jp/byline/shinoharashuji/20200525-00180247/

運営引き継ぎも募集しているらしい
https://mstdn.jp/about
0361192.168.0.774
垢版 |
2020/06/12(金) 20:04:22.23ID:kaj5j2rY0
>>360

外資は儲からないと判断するとすぐ撤退する傾向が強いからなあ。不安。
0362192.168.0.774
垢版 |
2020/06/12(金) 23:01:41.40ID:r8G+EqEg0
「誹謗中傷の証拠取得用に」と謳った「Twitter魚拓」なるWebサービスが出来てバズってるが、
やってることは単にスクショ撮ってimgurに上げるだけらしい
スクショはブラウザの開発者機能でいくらでも改竄できるし、
これならArchive.isの方がずっと優秀だな
スクショに法的な証拠能力ってあるのかな
0363192.168.0.774
垢版 |
2020/06/12(金) 23:03:10.00ID:r8G+EqEg0
>>361
買収先は確かTwitter非公式クライアントの開発チームじゃなかったっけ
儲からないのは織り込み済みじゃないかな?
0365192.168.0.774
垢版 |
2020/06/18(木) 15:31:00.91ID:YE4F+hQG0
Twitter魚拓に画像ハッシュを電子署名で埋め込む機能がやっと付いたらしい
結局画像を撮る前の段階で偽造可能なのはどうしようもないけど
0366192.168.0.774
垢版 |
2020/06/20(土) 02:54:49.17ID:h9ZrYl1H0
archive todayの魚拓検索でURL以外の文字列入力すると
Googleのカスタム検索経由で全文検索できるようになってるな
0368192.168.0.774
垢版 |
2020/06/20(土) 12:12:23.28ID:D5VLdHFC0
Googleのやつより見やすいな
日本語で書いてあるせいか?
0369192.168.0.774
垢版 |
2020/06/24(水) 20:08:29.48ID:VaXpj8XL0
149 名前:名無しさん@ggmatome :2020/06/24(水) 19:41:32 ID:GJp4RZxo0
Adobe Flash Playerの2020年末サービス終了は、古いゲームの公式サイトとかに影響が出そう
0370192.168.0.774
垢版 |
2020/06/25(木) 23:41:47.74ID:dwRtuOnD0
ArchiveTeamがなんかやってるかなと思ったけどまだ動いてないっぽい
0371192.168.0.774
垢版 |
2020/06/27(土) 14:07:35.48ID:qfiK+Scz0
Flashの保存活動やってる人自体はいるよ
ArchiveTeamが動いてないだけかと
0372192.168.0.774
垢版 |
2020/07/01(水) 06:54:14.16ID:pvfyXrsy0
This URL has been excluded from the Wayback Machine.のサイトも掘り出したいわね
0374192.168.0.774
垢版 |
2020/07/01(水) 11:22:29.30ID:ha7maYO50
かなりデカい保存対象がやってきた

NAVERまとめ サービス終了のお知らせ : NAVERまとめ公式ブログ
http://navermatome-official.blog.jp/archives/83259956.html

>突然ではございますが、NAVERまとめは2020年9月30日をもちましてサービスを終了することとなりました。​​
>下書きや非表示のまとめも含め、9月30日をもちましてすべて閲覧ができなくなります。​
0375192.168.0.774
垢版 |
2020/07/01(水) 20:40:49.49ID:36DWDi3y0
naverブランドじゃ将来性見えないもんな
かといってヤフー、ラインブランドに変えてまでやるほどでもないし
0376192.168.0.774
垢版 |
2020/07/01(水) 22:39:13.89ID:4eKj5JMl0
>>373
いちいちブロックしてたらキリがないなろう系サイトはともかく
こういうドメインは一部のサイトだけ見れないように緩和してほしいわ
0377192.168.0.774
垢版 |
2020/07/02(木) 03:05:37.80ID:qEIVQ0nx0
Webサイト保存してる人はなに使ってる?

自分は巡集とWebsite Explorerを使ってる
0378192.168.0.774
垢版 |
2020/07/02(木) 22:25:47.86ID:PGzwXvql0
>>371
ちなみにFlash のアーカイブって何やるの?
0379192.168.0.774
垢版 |
2020/07/02(木) 22:55:14.72ID:VMG0QPRf0
>>374
ほぼコピペしか無いサイトだからオリジナルのデータは少なそう…
0380192.168.0.774
垢版 |
2020/07/03(金) 01:54:56.18ID:pnZtief20
>>379
8割方はどうでもいいコピペまとめなんだけど、これを個人サイトみたいに使ってる人や、真っ当な有益情報をまとめてくれてる人もいるんだよね
そういった情報が消えるのはもったいないし、今後困る人がいそう
0381192.168.0.774
垢版 |
2020/07/03(金) 22:23:28.54ID:0J0hhHF10
来年から新しい著作権法が施行されるらしいけど、
ウェブ魚拓とかの古いデータが、削除されたりしないか少し心配
0382192.168.0.774
垢版 |
2020/07/03(金) 23:54:06.51ID:pnZtief20
ウェブ魚拓は削除申請来たらバンバン消してるらしいから今更感ある
archive.todayやInternet Archiveは著作権の前にサーバ処理が追いつくのか心配
0383192.168.0.774
垢版 |
2020/07/04(土) 13:35:00.45ID:inafeRIM0
>>382
同意
0384192.168.0.774
垢版 |
2020/07/08(水) 22:28:06.73ID:JMicZAgO0
NAVERまとめだけじゃ無くLINEノベルも終了か…
ソフトバンクグループ特有のサービス終了ラッシュ
0385192.168.0.774
垢版 |
2020/07/09(木) 01:28:23.13ID:c1obRcGo0
へー、ソフバンは避けよう
0386192.168.0.774
垢版 |
2020/07/09(木) 03:09:48.75ID:K/ssIawO0
朝鮮系は避けてたから掠りもしないw
0387192.168.0.774
垢版 |
2020/07/09(木) 07:32:19.74ID:qxukY3NX0
ヤフーと合併するってことはこういうことだ
米国のヤフーがその典型で、買収した企業やサービスはことごとく閉鎖させてるしね
0388192.168.0.774
垢版 |
2020/07/09(木) 08:42:41.16ID:c1obRcGo0
潰したい企業を買収してからわざと潰すっていう性格の悪い投資家の話聞いたことがあるけど
まさかヤフーがそれだったりしないよな
0389192.168.0.774
垢版 |
2020/07/13(月) 15:08:26.85ID:JeHTcZXr0
>>384
うーんこの
0390192.168.0.774
垢版 |
2020/07/14(火) 15:25:35.44ID:bp/ba6L20
>>351
変則将棋とかのニッチすぎるカードゲームやボードゲームのサイトもだね
0391192.168.0.774
垢版 |
2020/07/15(水) 12:36:07.34ID:6KInjDIb0
保存する価値が特に高いサイト
(時間が経っても役に立たなくなることがまずないため)

レビューサイト
ゲーム攻略サイト
ボードゲーム・カードゲーム関係(ただしTCGなどは除く)
タロット占いなどの占い系
料理レシピ・裁縫などの家事系
0392192.168.0.774
垢版 |
2020/07/16(木) 02:27:44.38ID:okkeNa+i0
ウェブ小説サイトとかも
0393192.168.0.774
垢版 |
2020/07/17(金) 17:41:35.04ID:iWA6pxH10
旅行・探検系も含めていいかも
あと災害etcで現存しない場所の訪問記とか
0394192.168.0.774
垢版 |
2020/07/18(土) 01:13:41.89ID:MoAmN+OG0
昔のイベント体験記もだな
0395192.168.0.774
垢版 |
2020/07/18(土) 01:27:31.30ID:MoAmN+OG0
ついでに暇つぶしにネット検索してたら
ocn1.netなるサイトを発見した
0396192.168.0.774
垢版 |
2020/07/18(土) 02:15:45.46ID:HI8FU48P0
>>395
https://www.google.com/search?q=site:ocn1.net&;lr=lang_ja&newwindow=1&hl=ja&tbs=lr:lang_1ja&sxsrf=ALeKk03M6bSG2JwS_U8icd02MQFRuM0Vsg:1595006071724&ei=d9wRX__qK7KCr7wPofi7mAQ&start=200&sa=N&ved=2ahUKEwi_gsfS5NTqAhUywYsBHSH8DkM4ZBDw0wN6BAhlEDQ&biw=944&bih=1083
0397192.168.0.774
垢版 |
2020/07/18(土) 14:45:04.72ID:42EZKBGK0
>>391-394
こういうサイトを優先的に保存すべきだな
0398192.168.0.774
垢版 |
2020/07/19(日) 04:44:14.87ID:lFOHvKxW0
こういう魚拓系サイトってエロ動画とか保存いけんの?
0399192.168.0.774
垢版 |
2020/07/19(日) 14:44:03.36ID:5VoHw/dK0
ocn1.netってサーバー名だったのかサイト名ではなかったのか
キューブのへやは一通り保存しといたけど他にもいっぱいあるやん
0401192.168.0.774
垢版 |
2020/07/22(水) 00:43:31.60ID:Qv2V5tOA0
>>400
保存する価値が高いな
0402192.168.0.774
垢版 |
2020/07/22(水) 06:22:06.26ID:5ZyfxxsF0
検索サイトにアーカイブが引っ掛かる又はWeb Archiveに保存されてる以外だと実質的な消滅に等しい
0403192.168.0.774
垢版 |
2020/07/25(土) 12:03:11.28ID:vPQBVdbR0
> お知らせです。Neverまとめ終了に伴い、【実走!酷道・険道のまとめ】についても、終了させることにしました。
>2013年以来、約7年間のご利用有難う御座いました。
>道路ネタについては、引き続きツイートしていきます。どうぞ、宜しくお願いします。
twitter.com/kendou774/status/1286852266280890368
https://twitter.com/5chan_nel (5ch newer account)
0404192.168.0.774
垢版 |
2020/07/25(土) 20:28:57.46ID:op0juaWZ0
ウェイバックでアーカイブしたNAVERまとめ記事でページ移動しようとすると
URLにgrid=falseっていうパラメータが追加されるみたい
誰か原因わかる人いる?
このせいでせっかくアーカイブしても2ページ目以降が参照できない問題が起きてしまう
0405192.168.0.774
垢版 |
2020/07/25(土) 23:03:50.67ID:vPQBVdbR0
>>404
自分が取ったアーカイブはそんな症状は出てないな
その問題が出たアーカイブのURLを教えてくれんか
0406192.168.0.774
垢版 |
2020/07/26(日) 00:15:07.54ID:6TmDXbEI0
>>405
例えばこのまとめのアーカイブ
2159020990876963301

2ページ目のボタンを押すとこのページに移動してエラー
2159020990876963301?page=2&grid=false

何度か試すと通常通りのページが表示される時もあるようで、今一どういう条件で発生するのかわからない
0407192.168.0.774
垢版 |
2020/07/28(火) 01:55:57.75ID:GOjmQFzm0
>>406
そのまとめではエラーにならなかったが、別の複数のまとめでエラー発動したわ
条件は全然分からないな
0408192.168.0.774
垢版 |
2020/07/31(金) 18:21:02.96ID:hz5s2lhM0
最近/save/の後にURLつけてブラウザで踏んで保存しようとするととんでもなく時間かかるようになってるんだけど
もっと早く保存する方法ないかな
0409192.168.0.774
垢版 |
2020/07/31(金) 19:38:16.52ID:gaCi8uhU0
>>408
同じく
しかもちゃんと保存できてるかどうかも怪しい
0410192.168.0.774
垢版 |
2020/07/31(金) 20:26:07.21ID:TTL90URn0
これ使えんの?
175 名前:py ◆o3kzHb/in8w0 [sage] 投稿日:2019/05/14(火) 19:06:58.64 ID:cP8wStLG0
https://u1.getuploader.com/irvn/download/1657
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14

web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■

動作試験環境:windows10pro Irvine1.3.1
0411192.168.0.774
垢版 |
2020/07/31(金) 21:15:44.33ID:x6UEbNzr0
>>410
自分で使ってみては?
レビューしてくれ
0412192.168.0.774
垢版 |
2020/07/31(金) 22:16:46.71ID:BOBaNxn40
>>411
>>408-409
へのレスしたつもりなんだけどね
誤解させてごめんねw
0413192.168.0.774
垢版 |
2020/07/31(金) 22:59:42.22ID:x6UEbNzr0
>>412
理解した

このところ/save/にURL繋げて直接保存させるのやってないから分からんけど、
ブラウザのsave page nowのフォームから保存するときとは色々処理が違うのかもね
最近Waybackの調子が特に良くないらしいから多分サーバ自体の問題だとは思うけど
0414192.168.0.774
垢版 |
2020/08/02(日) 02:59:54.76ID:BxGk29Xt0
Naverまとめを色々漁ってたらネット上で出回ってるコラの元画像・出典を集めたやつがあった
単なる宣伝まとめに完全汚染される前は、こういう地味だけど役立つまとめを書く人がそこそこいたんだけどな...
00年代から10年代のインターネットの残滓みたいな側面もあっただけに惜しい話だ
ArchiveTeamにどうにかして持っていきたい
0415192.168.0.774
垢版 |
2020/08/04(火) 10:42:23.62ID:kQccth3l0
昔のエロゲーとか普通の深夜アニメとかの公式サイトで保存されていないページが時々ある
0416192.168.0.774
垢版 |
2020/08/07(金) 14:35:38.67ID:SiHrQHil0
Googleマップの埋め込みはArchiveTodayで録れる
0417192.168.0.774
垢版 |
2020/08/15(土) 19:40:30.73ID:PMZXDU5C0
>>398
無理じゃね?
0418192.168.0.774
垢版 |
2020/08/16(日) 20:27:14.92ID:98xsFRfG0
ストリーミング配信のクロールは技術的に結構難しい
0419192.168.0.774
垢版 |
2020/08/16(日) 20:27:47.53ID:98xsFRfG0
動画を保存するならメタデータを含めた上で普通にダウンロードした方がいい
0420192.168.0.774
垢版 |
2020/08/18(火) 18:55:08.22ID:e28RrLlN0
トップページは見れるけど細かい中身までは保存されてないのか見れないことが多いわね 特に画像や動画は死んでる
0421192.168.0.774
垢版 |
2020/08/18(火) 21:04:20.75ID:xoxZKMa90
さくらインターネット専用サーバ
2020年11月30日で全て終了
0422192.168.0.774
垢版 |
2020/08/18(火) 23:33:08.82ID:FetPd1Vj0
>>421
古い専用サーバだけが対象

>この度、1997年6月より提供開始した「専用サーバ」および2007年1月より提供開始した「専用サーバ Platform Ad / St」につきまして、
>2020年11月をもちまして、サービスを終了いたします。
>これらサービスは、サービス開始から10年以上の期間が経過しており、今後、保守部材の確保ができず、サービス継続が困難な状況でございます。
>さくらの専用サーバ(2012年2月 提供開始 〜 現在申込受付)」はサービス終了の対象ではございません。
https://server.sakura.ad.jp/dedicated_server_end/
0423192.168.0.774
垢版 |
2020/08/19(水) 17:14:03.56ID:iZ5+0Ecr0
>>422
既に消えてるページあるよ
エロゲの回想未収録エロを個別セーブデータで対応してくれてたサイトとか
まあlzhの脆弱性騒動でlzh書庫セーブデータはsなしhttp,xp,win7締め出しみたいにサーバ側に既に全消去されてたけど
http://daidokoro.sakura.ne.jp/data/eroge_data.htm
http://web.archive.org/web/20180430112946/http://daidokoro.sakura.ne.jp:80/data/eroge_data.htm

NGワード引っかかったから、気になるなら半角にテキストエディタかなんかで変換して
0424192.168.0.774
垢版 |
2020/09/06(日) 17:22:46.19ID:CBf1XfYV0
サービス終了のお知らせ

長らくのご利用まことにありがとうございます。
大変恐れ入りますが、当サービスは2020年9月末をもって終了させていただきます。
mobile space

携帯(ケータイ)無料ホームページ提供フリーサイト「MobileSpace(モバスペ)」
http://m-space.jp/
0425192.168.0.774
垢版 |
2020/09/07(月) 12:06:40.69ID:3OpmkuSp0
Naverまとめのバックアップしてる有志いないかー?
自分も最近バックアップしてるんだがURL集めとかどこにすればいいかわからない
0426192.168.0.774
垢版 |
2020/09/07(月) 15:14:13.63ID:3OpmkuSp0
>>404
それはしゃあない、NAVERまとめは2ページ以降のURLも規則的だから、そこは見る側がインターネットアーカイブからURLをいじってアーカイブを見る方法しかないと思う
2ページ以降のURLがわかる以上アーカイブするにあたってそこまで気にしなくてもいい
0427192.168.0.774
垢版 |
2020/09/08(火) 03:14:53.75ID:rgMOAV4l0
>>397
同意
0428192.168.0.774
垢版 |
2020/09/08(火) 22:10:50.40ID:+a/fwcct0
将来役に立つか分らんけど書いとく
Naverまとめは2ページ目以降のURL末尾が
@: ?page=ページ番号
A: ?&page=ページ番号
の2パターンあるので注意
通常であれば2ページ目→@、3ページ目以降→Aのパターンで保存されてるはず(だが例外もある)
あとはこの辺 >>404 >>406
0429192.168.0.774
垢版 |
2020/09/09(水) 08:08:33.67ID:iGXkHt4n0
とりあえず作ったからURL集めここにしないか?
NAVERの終了近づいてるから立てといた
https://jbbs.shitaraba.net/internet/25479/

5chだと多量URLは規制くらうし、かといっていちいちGeoLogみたいなURL集め場作るのもあれだし
したらばはGoogle検索ひっかかるししたらば自体もアーカイブできるから万が一にも備えられるしURL保管庫としては優秀
後から集めたURLにタイトルつけてスレ立てすれば後世代の人がググって見つけられる可能性が出てくるのが大きい
他にサービス終了候補出たらここにスレ立ててURL集める感じで
0430192.168.0.774
垢版 |
2020/09/09(水) 22:03:15.69ID:GaAB5Js70
>>429

汎用的に使えるし次スレからここのテンプレに入れた方がいいな

>>429は念の為にトリップ付けてしたらばと5ch両方に書き込んでおくと良いかも
したらばと5ch(&おーぷん2ch)とではトリップの生成アルゴリズムが違うらしく同じ名前でも違うトリップになるけど、とりあえずでも管理人だという証明がある方が何かと安心だしね
0431◆Oddz6L15vQ
垢版 |
2020/09/09(水) 22:23:41.61ID:iGXkHt4n0
>>430
OK、付けておく
0432192.168.0.774
垢版 |
2020/09/10(木) 17:58:45.52ID:lCL9EyAY0
150万記事くらいURLかき集めてタイトルとページ数もセットで保存してあるよ
ArchiveTeamにも先月渡したんだけどどうやら忙しいらしくて動きがない
0433192.168.0.774
垢版 |
2020/09/10(木) 20:34:28.12ID:S0dI6L/m0
>>432
ArchiveTeamに渡すってことはインターネットアーカイブには保存できてないってこと?
0434192.168.0.774
垢版 |
2020/09/11(金) 15:17:14.37ID:FY5rw0Vj0
>>433
ArchiveTeamが保存したサイトはWayback Machineにアップロードされて、最終的にちゃんとInternet Archiveに保存される仕組みになってる
0435192.168.0.774
垢版 |
2020/09/11(金) 15:43:42.84ID:FY5rw0Vj0
>>432
150万はすごいな、何を使って収集したのか気になる
あとArchiveTeamとのコンタクトってどうやって取ったん?
サイトの説明を色々読んでるけど窓口が見つからない
0436192.168.0.774
垢版 |
2020/09/11(金) 17:53:04.83ID:vIEy03BU0
>>434
いや、そういう意味ではなくArchiveTeamの動きないってことはインターネットアーカイブに保存できてないんじゃないかってこと
もしインターネットアーカイブに現時点で保存できなくて、ArchiveTeamに動きなければ>>432がローカルで保存できてない限り9月30日を迎えたらそれも無駄になる
0437192.168.0.774
垢版 |
2020/09/11(金) 18:38:50.57ID:FY5rw0Vj0
>>436
なるほどな、確かにArchiveTeamに動きがなかったら保存されないね

ArchiveTeamが今どういう状況なのかがよく分からないんだけど、本当にNAVERまとめは一切手付かずなのかな?
0438192.168.0.774
垢版 |
2020/09/11(金) 19:41:43.80ID:vIEy03BU0
>>437
いろいろ保存してるけど本当に2ページ以降はクロールされてないよ
クローラーの仕様でGoogle検索に出る1ページだけは保存されるけど
だから人力で保存されてる記事はあんまりないね
0439192.168.0.774
垢版 |
2020/09/12(土) 09:44:43.85ID:+xgSs3Ql0
>>438
もう自分でクローラソフト動かしてローカルに保存した方が安心じゃね?
ネットのデータなんて今じゃいつ消えるか分からない
もうバックアップのバックアップ(調子悪くてバックアップ後に取り外したHDDに入れっぱなしのデータ等)くらいのオマケ

アーカイブサイトに保存して安心してたら見られなくなってて、
txtでちょっとメモした断片的情報しか手元に残ってなくて絶望したわ
0440192.168.0.774
垢版 |
2020/09/12(土) 12:00:07.88ID:G5q1lmCg0
>>439
確かにそれもそうだし愛読書のごとく読むようなウェブページはpdf化してるけどさ
やはりローカル保存じゃ限界がある、数万記事とか保存しようものならHDD持たないし
それにアーカイブに保存する理由はみんなが見れるからね、知恵袋や古い2chの過去ログ見ててそこのリンクがリンク切れになっても大丈夫なようにある
インターネットアーカイブが消えるときってやっぱり削除要請に応じてるからなのかな
今のところ自分で保存した記事で消えた経験はないが、削除要請以外の自動削除はないと信じたい
0441192.168.0.774
垢版 |
2020/09/12(土) 12:06:20.24ID:G5q1lmCg0
ちなみにArchivetodayや他の魚拓サイトは個人経営らしいから経営者が死んだらサーバー更新できず見られなくなるから、そこに大事なものがあればローカル保存したほうがいい、数十年後に見られなくなってる可能性あるし
やはり数百年後の人類に情報を残すなら法人経営のインターネットアーカイブ
0442192.168.0.774
垢版 |
2020/09/12(土) 14:19:44.63ID:smUg5j0l0
>>439
そうなんだよなあ
前にインターネットアーカイブで閲覧してた削除済みのサイトが
「This URL has been excluded from the Wayback Machine」で
見られなくなってしまってローカルに保存していなくて今も後悔してるわ
前は見られていた分ショックがでかい

こういうのってドメイン再取得した人が解除申請出すしかまた見られる
方法ないのかね?
これって「完全に削除」されたわけじゃなくて単純に「除外」された状態らしいから
0443192.168.0.774
垢版 |
2020/09/12(土) 19:09:30.26ID:G5q1lmCg0
>>442
除外したってことはやっぱりサーバーの容量不足とかじゃなくて要請に応えただけか
サービス終了とかじゃなくてそのページがあると都合が悪いからって意図的に消してるのはローカル保存しかないと思うよ
俺は何回も読むサイトは1ページだけならpdf化してる
さすがに保存対象のURLが何個もあるサイトを全部やるのは面倒だけど
ドメイン再取得していけるかはわからんけど管理者であったことを証明しないとさすがに難しいんじゃないか?でも今の管理者ではダメとも限らないしなー
0444192.168.0.774
垢版 |
2020/09/12(土) 19:14:06.20ID:GdLneOCP0
>>443
クローラソフトで.mhtやindex.html等で階層いくつ潜るか設定してクロールすればいいじゃん
0445192.168.0.774
垢版 |
2020/09/12(土) 19:35:49.12ID:smUg5j0l0
>>443
>>444
微妙なラインだよなー
ぶっちゃけるとそのサイトはジオシティーズドメインのページで、ジオシティーズの
URLは普通にアーカイブ何万も保存されてて見られるんだけど、そのドメインのサイトは
除外されてるんだよな
自分はそもそもの管理者じゃなくてそのページのファンで、もしまた見られるなら
自分が読んで楽しみたいだけなんだけど、やっぱ厳しいかもしれんな
0446192.168.0.774
垢版 |
2020/09/14(月) 03:08:56.33ID:W68LNMti0
ArchiveTeamがNAVERまとめのアーカイブ作業に取り組み始めてくれてたみたい
進捗はわからないけど、これでひとまず安心かな
漏れもあるだろうから重要なページは各自で保存する必要があるけどね

>>435
pythonでスクリプト組んで収集した
ArchiveTeamはIRCを使って活動してる
サイトの#から始まるリンクをクリックすれば各プロジェクトに対応したチャットルームに行けるよ
コマンド入力でクローラ操作してる人がいるArchiveBotの部屋が活発なイメージ
0447435
垢版 |
2020/09/14(月) 04:11:09.04ID:Np2NU3M80
>>446
なるほど、どうもありがとう
ArchiveTeamが動いてくれたなら最悪の事態は避けられるはずだな...
もちろん>>432(446)の収集したURLあってこその事だから自分も見習わないといけないが
0448446
垢版 |
2020/09/14(月) 11:29:54.09ID:sR0ATY0Y0
NAVERまとめデータ共有
csvデータ(URL, ページ数, タイトル)記事数:1472709, 更新日昇順, 192 MB
https://web.archive.org/web/20200913150754if_/https://transfer.notkiska.pw/r9mfn/NAVER_matome_article_list.csv

※収集後に更新されたことでタイトル、ページ数が異なったり削除されていたりする可能性あり
トピック一覧ページから収集したからトピックが設定されてない記事は1つも収集できてない
0449192.168.0.774
垢版 |
2020/09/14(月) 15:27:58.62ID:Np2NU3M80
>>448
503エラーのページがアーカイブされているんだが
0450192.168.0.774
垢版 |
2020/09/14(月) 15:30:52.44ID:fWxNFkB80
ごめんなさい。恥ずかしいのですがarchiveteamって何ですか?
0451192.168.0.774
垢版 |
2020/09/14(月) 15:32:16.47ID:Np2NU3M80
Wayback Machineが一時的に落ちてただけだった
何回かリロードしたらちゃんとダウンロード出来たわ、すまん
0452192.168.0.774
垢版 |
2020/09/14(月) 15:36:10.18ID:Np2NU3M80
>>450
ウェブアーカイブを組織的にやってる(おそらく非営利の)団体
ArchiveTeamが保存したコンテンツはInternet Archiveで公開される仕組みになってる
正直に言うと自分もArchiveTeamの公式サイトを読んでる途中だから、具体的な活動の様子とかはちょっとわからない
https://ja.wikipedia.org/wiki/Archive_Team
https://www.archiveteam.org/
0454192.168.0.774
垢版 |
2020/09/24(木) 21:11:36.87ID:kg/LREFg0
Braveの機能を使って少額寄付した
0455192.168.0.774
垢版 |
2020/09/25(金) 12:26:47.34ID:Cm7cjbfH0
>>454
Braveいいよね特にスマホ
ポイントサイトで乞食活動やるよか割もいいし
0456192.168.0.774
垢版 |
2020/09/28(月) 05:48:18.46ID:ydgdSdUA0
今更NAVERまとめをローカルに落とそうとしているのだが
Website Explorer・WinHTTrack・Cyotek WebCopy
はうまくいかず(設定ミスがあるのか?)

NAVER&FC2まとめダウンローダ
http://shimarisu.webcrow.jp/naver_matome.html

は画像もhtmlも一応取れるのだがhtmlにダウンロードした画像
はリンクされてない。
後はmhtとpdfぐらいしか無く……

他の人はどのようにローカルに落としているのでしょうか?
0457192.168.0.774
垢版 |
2020/09/29(火) 11:41:45.96ID:IYXlvscX0
そもそもローカルに落としてないな...
Wayback Machineに頼ってる
0458192.168.0.774
垢版 |
2020/09/30(水) 00:31:14.62ID:6Ozi/51l0
Naverまとめはほぼバックアップされてるっぽいから安心した
ただNaverのトピックのアーカイブの表示がいろいろおかしい、まったく違う記事名出たりする
どうやらNaver側はURLの大文字と小文字を区別してるのにウェイバックマシン側では区別してないから発生するバグっぽい
トピック見れなかったら別の時間のアーカイブ参照すると見れることがある
例えばトピックのIDがaaabbの場合IDがAaaBbやAAABBの別トピックもウェイバックマシン側がaaabbとして扱うから収集された時間で記事が混在する
2ページ以降のトピック表示は2ページ目の存在による
aaabbにだけ2ページ目以降が存在すればaaabbしか表示されない、他のIDにもあると2ページ以降も混在状態になる
aaabbに2ページ目がなくてAaaBbにある場合もURLいじったりして2ページ以降行くとAaaBbの2ページ目が表示される
NAVERまとめ共有データの中を特定のワードで検索してそこのまとめにアクセスして所属トピック押せばある程度好きなトピックに飛べるから有効に使えると思ったけど少し難ありか
記事にはまったく関係ないから大丈夫、トピックURLが英数字5文字で大文字小文字の違いで別ID扱いされる仕様により起きてるだけだから
記事の中身のURLで個別化されている部分は全部数字だから大丈夫
0459192.168.0.774
垢版 |
2020/09/30(水) 14:43:23.75ID:g0DIZp7G0
ツイッターを見ているとNAVERまとめがなくなったことを喜んでる人結構多いし、
何なら「あんなの保存しとく価値はない」みたいな意見も見受けられる
でも、アーカイブが必要かどうかを判断するのは現在生きている自分たちじゃなく将来の人々だと思うんだよね

自分もYahooブログが終わった時は「あんなの保存したってしょうがないだろう」と思っていた側だったんだけど、サ終してしばらく経ったある時、
自分の専門分野に関するとある重要な記録がYahooブログ上で公開されていたらしいこと、
なおかつブログ主が亡くなっていて再公開の見込みもないこと、
そしてどこにもそのアーカイブが残っていないらしいことが判明して、かなり後悔した事があった
これはあくまで一例に過ぎないけども、とにかくWebアーカイブを取る必要があるかどうかは取る側の人間ですら判断できるものじゃないんだと思うわ
長文&自分語りすまない
0460192.168.0.774
垢版 |
2020/09/30(水) 14:52:44.90ID:g0DIZp7G0
しかしまあNAVERまとめをブログ代わりに使ってた人結構多かったみたいだな
0461192.168.0.774
垢版 |
2020/09/30(水) 15:31:27.75ID:aEbDHVq00
>>459
バカッターなんて結論決まってて後押し(確証バイアス)がほしい時だけ見るもんだよ
今回のなんて馬鹿は想像力も共感力も低くて他人の痛みが分からないから見るだけ無駄だったわけだし
0462192.168.0.774
垢版 |
2020/09/30(水) 17:47:30.32ID:g0DIZp7G0
>>461
確かにそれはそういうものなのかもしれないな
0463192.168.0.774
垢版 |
2020/10/04(日) 01:53:55.83ID:t5NF2s3S0
ArchiveTeamのリソースほんとすごいな...
0464192.168.0.774
垢版 |
2020/10/05(月) 21:28:33.39ID:PD0n9p530
「Webスペース」 サービス提供終了について
https://www.so-net.ne.jp/info/2020/op20200908_0039.html

平素はSo-netをご利用いただき、誠にありがとうございます。

このたび、誠に勝手ながら、2021年1月28日(木)をもちまして、「Webスペース」サービスの提供を終了させていただくこととなりました。
0466192.168.0.774
垢版 |
2020/10/06(火) 12:42:46.60ID:phjE2/zo0
so-netが終了したらまた古のインターネットが色々消えるな
0467192.168.0.774
垢版 |
2020/10/06(火) 22:52:50.75ID:DBLhvSyO0
So-netブログはSeesaaに成ったからブログ以外か…
0469GeoLog Project ◆RJRIJK3wcLw8
垢版 |
2020/10/11(日) 16:23:42.66ID:wq/dYYyR0
so-netのURL収集を始めることにしました
知っているURLがあれば追加してください
現時点でユーザー名単位で2万程度、個別URLでは300万くらいDBに入ってます

https://geolog.mydns.jp/so-net/

特にJavaScript等から呼び出されるファイル群は網羅が難しいので、何か良い手があれば
0470◆sOHUy6jdA4II
垢版 |
2020/10/13(火) 01:07:49.82ID:y1bzU/4u0
>>469
日本語版ウィキペディアの外部リンクから2000個ほど抽出したんですが、スクリプトでの送信とかって受け付けてます?
(既に収集済みのものとだいぶ被りがありそうですが)
0471GeoLog Project ◆RJRIJK3wcLw8
垢版 |
2020/10/13(火) 19:39:50.63ID:5fIpkaAP0
>>470
特に制限はしてないですが、処理速度的に現実的ではない気がするので、
フォームを改行区切りで複数受け付けられるように直したいと思います
0473192.168.0.774
垢版 |
2020/10/13(火) 23:27:30.09ID:vjEziSOV0
geocitiesのときはそれなりに貢献できたけど今回はブクマ見てもso-netなかったわ・・・
0474あめ ◆P0jSlC5fJs
垢版 |
2020/10/18(日) 05:37:28.91ID:SRaefsBF0
【告知】ニコニコ動画のコメントサーバーリニューアルについて
https://blog.nicovideo.jp/niconews/141893.html
> マイメモリー機能の提供を終了
> ・マイメモリーの新規作成や、 既存マイメモリーの視聴ができなくなります
> 削除された動画へのコメント投稿とコメント表示の終了
> ・ 動画タイトルや説明文などの情報も表示されなくなります

期限は「2021年の春までに実施」とのこと
0475192.168.0.774
垢版 |
2020/10/18(日) 15:46:35.08ID:kWrTLNjS0
削除済み動画を全部リストアップして、動画説明文/タイトル/コメントなどの情報を取得していく感じか
コメントに関してはXML形式で取得する手法があったような気がする
マイメモリー機能は使ったことないから分からん
0476192.168.0.774
垢版 |
2020/10/18(日) 15:47:20.86ID:kWrTLNjS0
sm1から順に数字をカウントアップしていけばいいのかな
0477192.168.0.774
垢版 |
2020/10/19(月) 19:56:27.93ID:PssRg44Z0
>>472
検索で引っかかったサイトは送信した
WaybackMachineにも保存できないかな
0479192.168.0.774
垢版 |
2020/10/20(火) 18:21:05.26ID:eWiUZHxk0
>>478
Google検索なんて糞化が酷くてもう使ってないからどーでもいい
0480192.168.0.774
垢版 |
2020/10/20(火) 23:29:11.48ID:Puq2k3e00
世界一使われてる検索エンジンだしな
個人の好みとしてはGoogleが何をしたってどうでもいいとしても、
影響力を考えると決して無視はできないよ
0481192.168.0.774
垢版 |
2020/10/21(水) 03:05:19.74ID:2kIOGutW0
数年前からネットサーフィン=スマホに成ったからなぁ…
0482192.168.0.774
垢版 |
2020/10/21(水) 18:11:15.59ID:le0ESoNU0
Google 絶対じゃなくなったんであまり件数ヒットしない検索ワードは Bing や Yandex 併用だよ。
0483192.168.0.774
垢版 |
2020/10/21(水) 22:24:10.23ID:Yfu1DTmm0
DuckDuckGoで出ない時だけGoogle
0484192.168.0.774
垢版 |
2020/10/23(金) 16:57:51.30ID:qVAboCuj0
>>477
誰かがArchiveTeamにURLリスト渡してくれれば多分保存できる
NAVERまとめの時はアーカイブ開始までに1ヶ月くらいかかったから保存したい場合は早めに相談したほうがいいかも
0485192.168.0.774
垢版 |
2020/11/03(火) 09:39:05.85ID:q2UfgLtS0
wgetでWARC.GZファイルを書き出したとき画像ファイルとかも格納される?
どなたかご存知だったらお願いします
0486192.168.0.774
垢版 |
2020/11/04(水) 22:28:08.38ID:iEXbTPK90
>>485
WARCは画像ファイルや音声ファイルも含めてページを丸ごと保存する仕組みになっているから、
--page-requisitesオプションを付けて確実に画像がダウンロードされるように指定すれば、ちゃんと画像が格納されるはず
0488192.168.0.774
垢版 |
2020/11/05(木) 16:18:21.95ID:bSeXiffE0
>>487
ありがとです
--page-requisitesがうまく反映されてなかったみたいでした
0489192.168.0.774
垢版 |
2020/11/05(木) 17:30:05.38ID:M9nLXqV10
コロナ騒動の最中に消えていったお店のサイトも手動で保存している。
0491192.168.0.774
垢版 |
2020/11/22(日) 08:30:10.87ID:q2CdPGCc0
>>469 を使ってみた
URLをページ内検索で探したらなかったのに、送信するとDBにあると出た...
ページ内検索がダメなのかな
あと、文字化けしているところがあるけど大丈夫なのかな
0492GeoLog Project ◆RJRIJK3wcLw8
垢版 |
2020/11/22(日) 13:39:23.43ID:nA7b/lhh0
>>491
どのURLでしょう?

ロジック上は文字コードを考慮していないので、文字化けはそのせいかもしれないです
一応UTF-8のはずなんですが
0493192.168.0.774
垢版 |
2020/11/26(木) 12:16:05.64ID:8QHBEnW70
ttps://archive.st が全然取れなくなってしまった
0494192.168.0.774
垢版 |
2020/12/04(金) 19:50:57.91ID:UDGmJ95l0
>>493

復旧した?
0495192.168.0.774
垢版 |
2020/12/04(金) 21:37:24.55ID:Onk8N+kv0
そこってサイトによって取れたり取れなかったりしない?
0496192.168.0.774
垢版 |
2020/12/05(土) 10:13:49.51ID:jr20iitY0
>>493
そこって消える前のフリーウェアとかアーカイブ出来ないクソじゃね
0497192.168.0.774
垢版 |
2020/12/10(木) 20:48:32.73ID:vQ+C+6Ux0
>>496
自分の目的が果たせないものをクソ扱いするのは幼稚だからやめような
フリーウェアはInternet Archiveに持っていくとか、
証拠に使うから削除されたくないものは削除申請が通りにくいarchive.today使うとか、
各サービスを使い分けるのがより無難だよ
0498192.168.0.774
垢版 |
2020/12/12(土) 15:13:48.12ID:ELOCcQrr0
「Yahoo!ライフマガジン」サービス終了のお知らせ
この度「Yahoo!ライフマガジン」は、2021年3月31日(水)をもちまして、サービスを終了させていただくことになりました。
記事コンテンツは、引き続き「Yahoo! MAP」アプリ上でご覧いただけます。
これまで長きにわたりご利用いただき、ありがとうございました。
0499192.168.0.774
垢版 |
2020/12/14(月) 04:34:30.82ID:h53jvyxt0
chakuwiki存亡の危機

友人との永遠のお別れ
https://midorikawa.themedia.jp/posts/10408887/

運営していた谷口 一刀さんが8月に亡くなられた事により
12月にドメイン名でのアクセスが不能になった。
(IP https://52.69.139.163/ では可能)

遺族は存続に消極的みたいな模様。


バックアップはしてみたいものの
かなりの容量だと思われるからなあ〜
どのぐらいの大きさなんだろうな。
0500192.168.0.774
垢版 |
2020/12/14(月) 06:32:22.27ID:9FaOalLE0
もっと早く情報投げて貰えればドメイン失効前にどうにか出来たのに
0503192.168.0.774
垢版 |
2020/12/14(月) 16:04:34.06ID:gA+U1PtW0
>>502
[[特別:統計]]によると記事だけで17,306個もあるみたい
Botとかで一度にエクスポートできるの?
0504192.168.0.774
垢版 |
2020/12/14(月) 16:08:04.03ID:gA+U1PtW0
>>503
勘違いしてた。一度にできる方法があるのか
0505192.168.0.774
垢版 |
2020/12/14(月) 16:32:18.01ID:9FaOalLE0
chakuwikiスレにこのスレッドのURLを書くだけ書いてきた
0508507
垢版 |
2020/12/14(月) 18:15:31.65ID:4RCQuIfW0
どうなるか分からないけどwiki teamに伝えておいた
今調べてくれてるらしい
0510507
垢版 |
2020/12/14(月) 19:29:16.39ID:4RCQuIfW0
SSLの問題で通常のwikiのダンプツールが機能しないらしい
詳しい人いますか?
0511507
垢版 |
2020/12/14(月) 19:38:36.21ID:4RCQuIfW0
すまんアーカイブの準備がある程度できたらしい
wiki team
0512507
垢版 |
2020/12/14(月) 20:10:05.26ID:4RCQuIfW0
変更になるかもしれないけど今のところChakuwikiのアーカイブ状況は
このページから確認できる (ident: 2ns616z58rh5gawijen5s2foi)
http://dashboard.at.ninjawedding.org/3

アーカイブ対象のURLは https://52.69.139.163/
ある程度時間が経ったらWayback Machineに反映されるよ
0515192.168.0.774
垢版 |
2020/12/14(月) 21:19:05.89ID:v8wPmt2c0
教えて下さい。
Chakuwikiのこのページをアーカイブ化したいんですが、
なぜかうまくいきません。
https://52.69.139.163/index.php/中野_(中野区)
なにかエラーかバグが起きているようなのですが、
回避策はないのでしょうか。
0516192.168.0.774
垢版 |
2020/12/14(月) 21:26:38.73ID:9FaOalLE0
>>515
Internet ArchiveのSave Page Nowで'Job failed'とか出るということなら、それはInternet Archive側の内部エラーだからどうにもならない
0517192.168.0.774
垢版 |
2020/12/14(月) 21:27:56.18ID:h53jvyxt0
>>512
アーカイブ対象はIPで保存しているようだけど
Wayback Machineにはドメイン名でアクセスできるのでしょうか?
0518192.168.0.774
垢版 |
2020/12/14(月) 21:34:23.14ID:9FaOalLE0
>>517
無理なはず
アーカイブをした対象のURLがIPアドレスであるならば、Wayback MachineにもIPアドレスのまま保存されます
chakuwiki側がドメインを改めてIPに紐づけた上で、もう一度アーカイブを取り直すしかないです
0519192.168.0.774
垢版 |
2020/12/14(月) 22:27:22.40ID:y0BEHrZG0
>>507
archive.org にサイト指定してarchive bot走らせること依頼出来るの知らんかった
ニコニコ実況もできたのかな
0520192.168.0.774
垢版 |
2020/12/14(月) 22:49:25.71ID:9FaOalLE0
>>515
さっきそのページ試してみたけど普通に取れましたよ
多分chakuwikiかInternet Archiveのどちらかでたまたま内部エラーが起きたんじゃないかと思う
0521192.168.0.774
垢版 |
2020/12/14(月) 23:07:45.15ID:v8wPmt2c0
>>520
ありがとうございます。
教えてちゃん状態で申し訳ありません。
こちらのページは可能でしょうか。半角記号が間に入ると保存できないということなのかと思いましたが、常にそうでもないようで……
https://52.69.139.163/index.php/玉造_(大阪市)
https://52.69.139.163/index.php/小阪_(東大阪市)
https://52.69.139.163/index.php/仁川_(兵庫)
0522520
垢版 |
2020/12/15(火) 00:35:35.36ID:Y7gKbm450
>>521
全て保存できてます

507氏の申請により、海外のArchiveTeamという非営利団体がbotをぶん回して現在進行系でアーカイブを取ってくれてます
ArchiveTeamのbotが収集したデータはInternet Archive上に移管されるようになっているので、わざわざ手動でアーカイブ取る意味は薄いです
0523192.168.0.774
垢版 |
2020/12/15(火) 01:45:51.77ID:L/BURrrN0
やはりArchiveTeamはつよい
0524192.168.0.774
垢版 |
2020/12/15(火) 03:45:40.17ID:Y7gKbm450
chakuwikiのAWSの契約がいつ切れるか分からない以上、時間との戦いって感じかね
保存対象として読み込まれてるリソースの数は現時点で総計173万個
さすがに1ヶ月後までには終わってると思うんだけど心配だな
0525192.168.0.774
垢版 |
2020/12/15(火) 07:57:43.86ID:Vnn2vEmu0
>>507
>>522
ありがとうございます。
因みにそのアーカイブサイト上のChakuwikiページはどちらになるか、わかりますでしょうか。
0526192.168.0.774
垢版 |
2020/12/15(火) 11:39:28.70ID:BgcXnTgc0
>>525
反映される時期は不明だけどWayback Machineから
https://52.69.139.163/ で始まるURLで検索すれば閲覧できるようになるよ
ちなみに保存されたルートはアーカイブされたページの右上にあるAbout this captureを押せばわかる
Live Web Proxy Crawlsは一般人が通常通り手動で保存した場合で、Archive teamとかだったらbot経由で保存されてる
https://i.imgur.com/O6IOeI2.jpg
https://i.imgur.com/GL1hLBT.jpg
0527192.168.0.774
垢版 |
2020/12/15(火) 12:51:45.53ID:K0GtvYEh0
少なくともChakuwiki関係者の誰かがドメイン取って
Chakuwiki.netから52.69.139.163に転送するようにすればつながるのかな?

確かサイト移転どかで転送する際はアーカイブでも転送してくれたっけ?
0528192.168.0.774
垢版 |
2020/12/15(火) 15:14:02.30ID:Y7gKbm450
>>527
そこまで至れり尽くせりではない
Internet Archiveがドメインの名前解決をしてくれるわけじゃないので、
新しくドメインを取ったところで、52.69.139.163で取られたアーカイブには転送されない
0529192.168.0.774
垢版 |
2020/12/15(火) 15:23:48.12ID:agHpSR5h0
https://blog.nicovideo.jp/niconews/141893.html
2021年の春までにニコニコ動画の削除跡地の動画タイトル、説明文、コメントが消えるらしいので
どうにかしてアーカイブを取りたい

ただ、保存ツールはNicomentXenoglossiaが使いやすいんだけど、
アクセス制限の関係上1時間で250件くらいしか落とせないから全削除動画を落とすのは現実的じゃない

仕方ないからコメントは諦めて動画タイトルと説明文だけでも視聴ページからアーカイブしたいと思ったんだけど、
今年に入ってから削除動画は非ログイン状態だと一切表示できなくなってるんだよね…
ArchiveTeamはログイン状態でアーカイブすることって出来るんですか?
0530192.168.0.774
垢版 |
2020/12/15(火) 17:13:19.13ID:Y7gKbm450
>>529
自分はArchiveTeamと直接連絡を取ったことはないので断言はできないけど、
可能な限りの融通は効かせてくれるんじゃないかと思う
とりあえずArchiveBotのIRCで相談してみてはどうだろう、DeepL翻訳やみらい翻訳を駆使すれば英語が無理でも何とかなる
https://archiveteam.org/index.php?title=Internet_Archive
https://archiveteam.org/index.php?title=ArchiveBot
0531192.168.0.774
垢版 |
2020/12/15(火) 17:55:09.16ID:agHpSR5h0
>>530
ありがとうございます
交渉してみます
0532192.168.0.774
垢版 |
2020/12/15(火) 18:52:56.51ID:Vnn2vEmu0
>>526
ありがとうございます。
こちらのスレの皆様には本当に助けていただきました。
ありがとうございました。
0533192.168.0.774
垢版 |
2020/12/15(火) 21:45:39.63ID:/3eTgo780
>>530
今の機械翻訳は優秀だし、日本の教育水準はなんだかんだ高いから、
高校まで真面目に英語やってれば大学でサボってても機械翻訳のおかしなところ微調整で長文も余裕
0534192.168.0.774
垢版 |
2020/12/16(水) 00:43:03.58ID:ZACL66BA0
このスレへの書き込みのみを見る限り、chakuwikiはこのスレが建ってから初めて大規模アーカイブにまで持ち込めた案件ってことになるのかな
実際に依頼したのは>>507ではあるけど
0535192.168.0.774
垢版 |
2020/12/16(水) 00:44:24.01ID:ZACL66BA0
でも情報をここに書き込んでくれた>>499がいなかったらそもそもArchiveTeamへの連絡にこぎつけることもできなかった訳だしな
0536192.168.0.774
垢版 |
2020/12/16(水) 01:04:34.43ID:p+5BPWXT0
連絡しなくてもサイト全体をダウンロードする方法を書いてくれた人もいるのに、
ここの住民は知識だけで人に任せるしかできず、初めからやる気がないんだろ
0537192.168.0.774
垢版 |
2020/12/16(水) 04:37:34.04ID:ZACL66BA0
>>536
上で書かれてるサイト全体をアーカイブする方法は、主に使ってる技術とサイトの規模の問題で全く使い物にならない
ArchiveTeamは実績も知見も関係各所へのコネもあるところなので、
大規模なサイトを対象にする場合はあそこの力を借りるしかない
こういう言い方はしたくないが、知識もなければ自前でクローラ回したこともない癖にイチャモン付けないで欲しいわ
0538192.168.0.774
垢版 |
2020/12/16(水) 11:52:40.02ID:vM349Ric0
>>537
個人でやれる事なんてせいぜい大型個人サイトまでだもんね
wikiみたく大勢が集まって作っていくようなのは漏れが出やすいしね
0539192.168.0.774
垢版 |
2020/12/16(水) 14:39:30.07ID:ZACL66BA0
ジオシティーズもGeoLogプロジェクトが半年くらいかけて収集してたけど、ArchiveTeamはその10倍くらいの量を60%くらいの時間で処理してた記憶
0541192.168.0.774
垢版 |
2020/12/16(水) 23:02:03.61ID:ukZ3LQFO0
>>531
自分も保存したいと思ってた
IRCログだとアクセス間隔を開けないといけないという話で終わっている気がするけどどうなるんだろう‥
とりあえず具体的な日程が出次第即IRC側に報告しよう
0543192.168.0.774
垢版 |
2020/12/17(木) 20:15:51.98ID:YcW6IKDX0
お尋ねしたいんですが、Webarchiveで一度アーカイブされていて、
きちんとその状況が確認できていたものが、
アーカイブから消されることってあるのでしょうか。

因みにアーカイブしていたのはChakuwikiの一部ページです。
0544192.168.0.774
垢版 |
2020/12/17(木) 21:28:26.50ID:67XwC+lO0
前からたまになかったっけ?このスレでも上の方で何度か言われてたような
0545192.168.0.774
垢版 |
2020/12/17(木) 23:12:31.52ID:A7vSMMBJ0
>>543
そのサイトの運営者(chakuwikiで言えば亡くなった創設者の人)は、自分がそのサイトの運営者だという証拠を提出した上でアーカイブの削除を要請できる
この要請が通れば、Internet Archiveから既存のアーカイブが削除されるようになっている
chakuwikiに関してはおそらくそういう心配はないと思う
可能性があるとしたら遺族が削除申請を出すことかな
0546192.168.0.774
垢版 |
2020/12/17(木) 23:17:57.23ID:A7vSMMBJ0
あとInternet Archiveのサーバはよく不具合を起こす
これのせいで、ちゃんと取れているはずのアーカイブが一時的に見れなくなったり、
アーカイブはちゃんと取れているのに、まだ取られていないという誤った表示が出てきたりすることがある
多分だけど>>543はその不具合にたまたま遭遇したんだと思う

これはInternet Archiveのサーバ内部の問題なので、こちらが取れる対処法はない
サーバの調子が良くなってまた見れるようになるのを待つしかない
0547192.168.0.774
垢版 |
2020/12/17(木) 23:20:53.20ID:A7vSMMBJ0
借井戸に「今週月曜日に取ったはずのアーカイブがごっそり消えている」って報告があったけど、
これは>>546で説明したサーバ不具合の典型的症状やね...
0548192.168.0.774
垢版 |
2020/12/18(金) 20:05:26.93ID:I5zRjHzA0
Chakuwikiのアーカイブについて
https://52.69.139.163/index.php/
のドメインで今アーカイブをとっているのですが、"()"の他に"!"や"&"がURLに入っているページもWayback Machineではうまく保存できないことが判明しました
(archive.todayでは保存できたのですが…)
0549192.168.0.774
垢版 |
2020/12/19(土) 02:11:50.74ID:Xqo4Hlfy0
>>548
もしかしてAPIでチェックしてる?
APIでは一部記号(自分が確認出来たのは"&")が入ってるとアーカイブされててもレスポンスが空の不具合がある
カレンダー側では問題なく確認出来るよ
0550192.168.0.774
垢版 |
2020/12/19(土) 15:18:27.59ID:hlXdl83U0
今日Chakuwikiのアーカイブを見て回ったら多くのページが保存されていました。
少なくとも普通に閲覧に支障がないレベルでアーカイブ化が完了しております。
0551192.168.0.774
垢版 |
2020/12/22(火) 00:11:10.59ID:ck8IlUdE0
攻略サイトのアーカイブがあったら便利だと思う
0552192.168.0.774
垢版 |
2020/12/22(火) 13:53:42.96ID:A07YUt/w0
@wikiとか?
〜wikiとかwiki系で攻略wiki作ってるの多いよね
0553192.168.0.774
垢版 |
2020/12/22(火) 14:12:52.20ID:FQJnL9rZ0
atwiki系のサイトがサービス終了したら影響大きいだろうな
0554192.168.0.774
垢版 |
2020/12/22(火) 15:44:40.36ID:dhdxyEHd0
ランス10みたく色んなwikiに情報あるならまだマシだけど、
攻略サイト作成者や利用者が声がデカイ一部の一強厨にゴリ押しされて、
2番手移行を併合しようとするような流れになったら困る

分かれてるのは作成者とその周辺と気が合わないというのもあるだろうけど、
いつ消えるか分からないこのご時世、何かあった時のための避難所0では無保険過ぎて不安だし
0555192.168.0.774
垢版 |
2020/12/23(水) 22:26:51.27ID:Ff2Y6ihq0
chakuwiki、とうとうサーバ自体が消えたっぽい
0557192.168.0.774
垢版 |
2020/12/23(水) 23:32:41.83ID:Ff2Y6ihq0
もうちょっと早めに分かってればなぁ
Mediawkiの機能を使った記事や画像のエクスポート自体は完了しているらしいのが不幸中の幸いかな
0560192.168.0.774
垢版 |
2020/12/25(金) 00:43:20.22ID:cNkRqGyv0
>>552
HTMLで書かれた個人サイトも忘れずに
0561192.168.0.774
垢版 |
2020/12/25(金) 22:50:27.91ID:9qhqNqL90
今時個人サイトのゲーム攻略は絶滅危惧種でしょ
だからこそ保存しなきゃいけない訳だが
0562192.168.0.774
垢版 |
2020/12/26(土) 15:11:07.30ID:8pI8HusK0
>>561
ぶっちゃけエロゲ攻略サイト以外の個人ゲーム攻略サイトなくね?w
どーでもいい、スクショもない感想サイトや呟きレベルならあるけど
0563192.168.0.774
垢版 |
2020/12/26(土) 17:11:37.89ID:BbmhGsC00
>>562
昔はエロゲ以外のゲームのやつも結構あったんだよ
だからこそ「絶滅危惧種」って言った訳
0564192.168.0.774
垢版 |
2020/12/27(日) 07:00:17.63ID:1AIVcw2g0
Wayback machine がFlashをアーカイブして2021年以降も使えるようになるって本当?
0565192.168.0.774
垢版 |
2020/12/27(日) 12:27:01.23ID:OAvLElxI0
>>564
どの程度網羅してるのかはわからないけどここから確認できるね
https://archive.org/details/softwarelibrary_flash
好きなのクリックすればPCからでもスマホからでもflash playerなしで実行できる

データ持ってる場合はアカウント作ってこの記事の下辺りにある手順でアップロードすればいいらしい
http://blog.archive.org/2020/11/19/flash-animations-live-forever-at-the-internet-archive/
0567192.168.0.774
垢版 |
2020/12/29(火) 00:49:00.02ID:fGs7aR1x0
Wayback MachineでアーカイブされているサイトのFlashで作られたメニューって2021年以降に見られるのかな?
調べてもよくわからない…
0568192.168.0.774
垢版 |
2020/12/30(水) 18:17:22.94ID:90IN69Gr0
若干スレチかもしれないけどどこに書けばいいのかわからないので
ニコニコ動画の「テクノ」の記事に貼ってあった
ttp://techno.org/electronic-music-guide/
このサイト、とても参考になるけど全体がFlashで出来ていて、ローカルに保存したswfでもRuffleを使ってみても(今のところ)きちんと動かなくて
このままじゃ来年見られ無くなっちゃうから元のサイト(www.di.fm)の方にFlash以外での形式で公開してほしいって伝えたいけど自分には英語力がない…
誰か英語のできる人が伝えてほしい
0569192.168.0.774
垢版 |
2020/12/30(水) 18:22:29.55ID:90IN69Gr0
>>568
568です
ニコニコ動画→ニコニコ大百科の間違いでした
0570192.168.0.774
垢版 |
2020/12/30(水) 20:33:01.57ID:7rdlBseX0
>>568
よく分からないけどこのサイトってどこかの法人が運営してるものっぽいね
他のページは更新されてるのにこれはFlashのまま放棄されているあたり、運営側としても更新する予定はないんだと思うけど
0571192.168.0.774
垢版 |
2020/12/30(水) 20:34:00.97ID:7rdlBseX0
あと、依頼するならここよりもテクノ系の5chスレッドを探して書き込んだ方がいいと思うよ
0572192.168.0.774
垢版 |
2020/12/31(木) 12:32:10.38ID:5dDGXSjX0
>>565
有名なものならあるようですね
もっと増えて欲しいな
0573192.168.0.774
垢版 |
2020/12/31(木) 15:27:29.78ID:jUqjw1pb0
ttps://automaton-media.com/articles/newsjp/20200203-112338/
こういったものもあるみたい
仕組みはいまいちよく分からないが
0574192.168.0.774
垢版 |
2021/01/01(金) 17:14:31.78ID:vTF78S5L0
https://ch.nicovideo.jp/nicotalk/blomaga/ar1955376
【ニコニコ動画】コメントサーバー・システムのリニューアルと、それにともなう一部機能の終了について

前にも出てたが動画跡地の他にコメントの過去ログも完全には見られなくなる模様。
うp直後のコメントとか見たい時があるので取得しておきたいけど何か良い方法は無いかな
0575192.168.0.774
垢版 |
2021/01/01(金) 17:57:54.92ID:61If5RTI0
だいたい再現ってのはコメントの一部を消すってことじゃなくてコンマ以下の秒数とか表示位置が若干変わるってことじゃないかな?
過去のコメントアートが楽しめなくなるってことだから結局よろしくないんだけど
0576192.168.0.774
垢版 |
2021/01/01(金) 18:04:16.35ID:VRDQC31q0
どんどんつまらないインターネットになってくな
0577192.168.0.774
垢版 |
2021/01/01(金) 23:46:40.12ID:ORqqm+qO0
削除動画のコメントについてはArchiveTeamに依頼しようとしてた人いたよね
どうなったんだろう
0578192.168.0.774
垢版 |
2021/01/08(金) 20:40:53.18ID:23QpLw4X0
>>559
アフィで原住民ともめた曰く付きが管理人
0579192.168.0.774
垢版 |
2021/01/10(日) 11:31:17.49ID:rsgyZDHH0
2ch(5ch)が閉鎖されたら過去ログはどこかアーカイブしてるのかな
0580192.168.0.774
垢版 |
2021/01/12(火) 00:33:19.63ID:aav8V+4w0
>>579
ある程度は既にアーカイブされてるんじゃないだろうか
まあ閉鎖が発表されたら誰かがアーカイブプロジェクト立ち上げるだろうけど
0581192.168.0.774
垢版 |
2021/01/12(火) 01:22:47.19ID:uojRCtJs0
完全ではないけどmimizunとかログ速とか
0582192.168.0.774
垢版 |
2021/01/12(火) 21:45:06.15ID:tYoR8j5L0
そもそも昔から2ch過去ログサイトはいっぱいあるよね
まあ最近見ないから消えたかもしれんけど
0583192.168.0.774
垢版 |
2021/01/13(水) 03:35:42.25ID:XzQwgawd0
過去ログサイトとウェブアーカイブってちょっと違うような気はする
まあWayback Machineに入ってないスレは沢山あるだろうね
0584192.168.0.774
垢版 |
2021/01/16(土) 17:03:51.78ID:3A5W7IEK0
ニコ動そのものがサービス終了したら動画のアーカイブはどうなるんだろう
やっぱりArchiveTeamかな
0585192.168.0.774
垢版 |
2021/01/18(月) 19:39:35.39ID:1x0bZ4YH0
動画データってアーカイブ可能なの!?
じゃあ…Pornhubのデータは…
0586192.168.0.774
垢版 |
2021/01/18(月) 21:20:43.57ID:IjzqQxcQ0
>>585
一般に動画のアーカイブは技術的に難しい
ストリーミング配信の動画なんかは特に難しい
0587192.168.0.774
垢版 |
2021/01/18(月) 22:35:35.34ID:+jP6yxXM0
動画ダウンローダあるんだからアーカイブ自体は可能
無劣化は無理っぽいけど
0588192.168.0.774
垢版 |
2021/01/19(火) 22:37:31.86ID:lxRWFQ6M0
mp4のまま丸々上げてるサイトなら別だけど普通は無理だよ
自分でダウンロードして動画のアーカイブの方にアップロードするしかない
0589192.168.0.774
垢版 |
2021/01/19(火) 22:51:33.07ID:7KqAH0Yd0
そりゃ情弱には無理
痛いpc雑誌読者以下の情弱っぽいし
0590192.168.0.774
垢版 |
2021/01/20(水) 07:30:47.61ID:WT4rpqz70
ストリーミング形式はHeritrixも無理らしいという話は聞いたことがある
本当かは知らん
0591192.168.0.774
垢版 |
2021/01/20(水) 20:17:20.26ID:EkoIINwL0
そういえば既に知っている人もいるかも知れないが、URLのリストから一括でSavePageNowできるアドオンがある
Firefox、Chromeともにウェブストアにはないけど起動時に読み込めば、一括保存(BulkSave)、右クリックで保存とかができる
https://github.com/internetarchive/wayback-machine-webextension
ここのInstalling the Latest Buildのところにインストール方法が載ってる
0592192.168.0.774
垢版 |
2021/01/20(水) 23:22:59.02ID:dMVBuuQl0
>>591
野良だからな〜
コード読める人、こういうの↓の検証頼む

【Firefox,Chrome】危険なアドオン・拡張機能の一覧を作るスレ【Edge,etc】 [無断転載禁止]©2ch.net
https://egg.5ch.net/test/read.cgi/software/1483763294/33

33 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2018/02/13(火) 11:00:20.51 ID:aB7Xo92Z0
ソース見てXMLHttpRequestかfetchが書いてある場合は注意した方が良い。
XMLHttpRequestかfetchはpostで情報送信できるので。manifestのパーミッションも不要だし。
拡張で情報送信できるのはこの2つの関数だけだと思う。
0594192.168.0.774
垢版 |
2021/01/28(木) 22:55:09.92ID:qWdIByIL0
WayBackMachineにSo-netが追加されてた
今回は全てを取得することはできなかったみたいだがほとんどを取得できたみたい
感謝ですね
0595192.168.0.774
垢版 |
2021/01/29(金) 13:46:14.84ID:fKGUCp210
so-netもサービス終了か
0596192.168.0.774
垢版 |
2021/01/30(土) 05:46:22.13ID:jbLv2ZF+0
外出自粛で引きこもり増えてるんだからウェブサービス全盛かと思うのにな
サービス終了ラッシュで流れ弾のどれかに当たって鬱こもり増えそう
0597192.168.0.774
垢版 |
2021/01/30(土) 18:06:31.16ID:9LlaKpOV0
IPFSが普及すれば価値のある情報がもうちょっとは残りやすくなるのかな
ピン打つだけでローカルに保存できるの便利
0598192.168.0.774
垢版 |
2021/01/30(土) 22:13:26.31ID:g+UddPtz0
>>596
家でもスマホって人が多数派だろうからPC向けのサービスには辛い時代
0599192.168.0.774
垢版 |
2021/02/07(日) 22:03:08.65ID:PATKCzwG0
そういや自分で適当にサイト立ち上げてそこにバックアップしたいURL書き込み、してIAでsave outlinks使えば実質的にそこに書いてあるURL一括でバックアップできるよな?
save outlinksは会員限定機能で特定のページ内に書いてあるURL全部バックアップする機能
0600192.168.0.774
垢版 |
2021/02/07(日) 22:19:27.61ID:PATKCzwG0
これ思いついて今までURLに置換ツールで/save/つけてクリップボード一括開きしてたのが馬鹿らしくなった
あれサーバーに負担かけるしエラーの確認だので時間とられるし
注意点としては余計なリンク作らないことだな、だからブログとかでやるのはやめたほうがいい
何回も同じリンクをバックアップするから規制される可能性もあるし、真っ白なページ作ってURL記述が最善
読取用にHTMLでURL記述する必要があるが置換ツール使うかブックマークインポート使えば簡単にできるはず
0601192.168.0.774
垢版 |
2021/02/08(月) 11:45:19.12ID:bbPCsvBH0
何個だったか忘れたが、save outlinksは読み込める外部リンクの数に上限があったはずだからそれは要注意だな
0602192.168.0.774
垢版 |
2021/02/08(月) 12:45:54.21ID:AksXCukq0
やってみたらできた
URLの一覧をHTMLコードに変換してホームページ作成サイトにアップロードしてからそのリンクをバックアップ
save outlinksでバックアップできるURLは100個が限界で100個超えてたらランダムに選ばれるみたいだから要注意
FC2ホームページ使うと最後にPowered by FC2ホームページ っていうリンクが強制で1つ最後に入ってしまうから実質は99個が限界かな
完全に真っ白なページ(広告もなし)作れれば理想なんだがどっかないかな、ちなみにAndroidスマホをWebサーバー化したらバックアップ時にエラーが出た
0603192.168.0.774
垢版 |
2021/02/08(月) 14:34:59.59ID:bbPCsvBH0
>>602
GitHub PagesかNetlify使ったら?
前者はGitの知識がないと厳しいから実質後者一択かな
0604192.168.0.774
垢版 |
2021/02/08(月) 20:07:50.66ID:AksXCukq0
>>603
なるほど、やってみたけどやはり手軽なのはFC2だな、indexファイル含めたフォルダごとアップロードしないといけないのは地味に手間だ
FC2はファイルマネージャーにドラッグドロップするだけでアクセスできるようになるからかなり時間効率はいい
複数バックアップのリスクもこれ見る限りでは大丈夫そうではあるな
https://imgur.com/a/f0XwCdA.png
0605192.168.0.774
垢版 |
2021/02/08(月) 20:10:39.63ID:AksXCukq0
ただ複数ファイル最初からアップロードするならNetlify使ってやったほうがやりやすいかもね
100ジャストだから数えやすいし
URLに/ファイル名 つけるだけでまとめてアップロードしたhtmlにはアクセス可能
0606192.168.0.774
垢版 |
2021/02/08(月) 22:35:56.52ID:AksXCukq0
https://i.imgur.com/WXbHftz.jpg
https://i.imgur.com/xdvJ1eJ.jpg
とりあえずまとめてバックアップしてみたけど上限の100個でも問題なくできるね
特定のURLがずっとSavingが続く場合は画面のURLをバックアップ成功したの含めて全部コピーしてメモ帳に貼り付けしてサクラエディタとかで「Done!」が入ってる行を一括削除処理するとバックアップできてないURLだけメモ帳に残せる
そしたらサクラエディタで/web/2/付け足して数日経ったらまとめて開いて保存できてるか確認、一見ずっとsavingになってても後で確認したら保存できてる可能性が高い、バックアップできてなければ再度バックアップ
これで、手間がだいぶ減る
あとFC2ホームページは日本語の入ってるURLは文字化けするね、netlifyは特に何も設定しなくても文字化けはしない
0607192.168.0.774
垢版 |
2021/02/08(月) 23:09:30.63ID:AksXCukq0
あと、これやるならsave error pagesのチェックは毎回外したほうがいいかも
大量にやるとバックアップされる側が一時重くなるのもあるから404ページが保存されてしまうかもしれない
0608192.168.0.774
垢版 |
2021/02/09(火) 01:20:04.21ID:WeH/rIuE0
ゲームやりながらほぼ放置でURL1600個バックアップできた、一度に100個保存できるのは革命だな
やはりsave error pagesのチェック外すのは必須、結構高い頻度でgatewayエラー出るから
多くて100個中5個くらい、出るときはだいたい1.2個エラーになる
チェック外しておくとwaybackmahineがどのURLがエラーで保存できなかったか通知してくれるからそれは手動で個別にバックアップ
0609192.168.0.774
垢版 |
2021/02/09(火) 16:38:32.21ID:zDnBjMvk0
>>608
さすがに大量のリンクをアーカイブするのはSPN側のキャパもあるだろうしArchiveTeamに頼んでSPNじゃないところでアーカイブしたほうがいいと思う。
じゃないとSPNのサービス縮小、最悪の場合はSPN終了になりかねない
ArchiveTeamのIRCでDeepl翻訳とか使って言うと対応してくれるらしいので
https://webirc.hackint.org/#irc://irc.hackint.org/#archiveteam-bs
0610192.168.0.774
垢版 |
2021/02/10(水) 00:34:19.03ID:z46S15zT0
Save Page Nowあんまり使いすぎてSPN自体が無くなったらどうしようもないから、自分はSPNでアーカイブする量をセーブしてる
多くても週300くらい
0611192.168.0.774
垢版 |
2021/02/10(水) 18:55:46.65ID:m/SVxvNY0
>>609
Save outlinks自体が大量バックアップしてくれっていうような機能だし大丈夫じゃないか?
ブログとかだったら意図的じゃなくても1ページ50リンク以上あるとかザラだし、大量バックアップ推奨してなかったらあんな機能普通つけないよ
個人的に無会員で大量にタブ開いてバックアップするのが一番負担かけるやり方だと思うわ、それよりはかなり負担少ないように感じる
save outlinksが会員限定機能な以上邪魔になったらアカウント制限しにくるだけ、何個も重複してバックアップとか意図的に負担かけるようなことしなければ平気だとは思うけど、ただしやりすぎは禁物かもね
あと正直archive teamは画像のバックアップを正常にとれないみたいだから画像ありきのページだと正直依頼するには微妙かもしれない、Naverまとめとか画像まともに表示されてないものが多い、手動で保存したものはしっかり表示される
waybackmachineの自動クロールも画像保存されないことある、手動だとやはり保存される
負担減らしたいならバックアップ済はバックアップしないってチェック項目あればいいのにね
0612192.168.0.774
垢版 |
2021/02/11(木) 10:34:08.22ID:f+DQ9uVI0
別に問題ないと思うよ
よく負荷がどうこうっていうけど、個人サイトじゃあるまいし影響は無い
0613192.168.0.774
垢版 |
2021/02/12(金) 02:19:02.11ID:D+7XoyFI0
容量の負荷は軽減出来るが処理負荷は増えそう
0614192.168.0.774
垢版 |
2021/02/15(月) 17:24:11.93ID:BROhNSp40
【告知】ニコニコ動画のコメントサーバーリニューアルに向けた機能提供終了・変更のお知らせ【PC版ニコニコ動画】|ニコニコインフォ
https://blog.nicovideo.jp/niconews/147588.html
0615192.168.0.774
垢版 |
2021/02/15(月) 18:01:13.52ID:KmI3cA970
>>614
■ 実施スケジュール

実施日時 実施内容
2021年3月1日(月)
過去ログ機能の変更
過去ログのURL共有機能を提供
2021年3月15日(月)
削除された動画へのコメント投稿とコメント表示の終了
 - 動画タイトルや説明文などの情報も表示されなくなります
マイメモリー機能の提供を終了
 - マイメモリーの新規作成や、 既存マイメモリーの視聴ができなくなります
2021年 春以降
動画コメントサーバーを新コメントサーバーに順次リニューアル
2021年リニューアル
完了後
動画投稿一覧などに表示される最新コメントに、投稿者用NG設定を適用
「コメント投稿ユーザーをNG登録」する機能の効果を永続化
自分が投稿したコメントを削除できるように
0616192.168.0.774
垢版 |
2021/02/21(日) 10:24:19.04ID:0mwGDu3d0
会員になることのメリットって何かある?
0617192.168.0.774
垢版 |
2021/02/21(日) 12:57:56.20ID:Ya0mID5E0
outlinksとGoogleSpreadsheetのバッチ処理が使える。
0619192.168.0.774
垢版 |
2021/02/23(火) 10:23:00.62ID:uox55Xkf0
iRONNA終了
> 2014年10月にスタートした総合オピニオンサイト「iRONNA」は、
> 諸般の事情により2021年3月下旬をもって新規コンテンツの公開を終了することになりました。(中略)
>  尚、終了後もこれまでのiRONNAのコンテンツが閲覧できる環境を維持するための態勢構築を進めています。(後略)
https://ironna.jp/article/16883
閲覧は維持してくれるらしいので緊急性はない。
0620192.168.0.774
垢版 |
2021/02/23(火) 16:53:36.76ID:qBkXHra00
総記事数1万7000くらいか
0621192.168.0.774
垢版 |
2021/02/23(火) 17:22:19.47ID:BW828Cy80
せっかくwaybackmachineでアーカイブしたのに、どうアーカイブされているか見ようとしたら別の日にアーカイブされたものに飛ばされてしまった。
少し待たないとダメな感じ?
0622192.168.0.774
垢版 |
2021/02/23(火) 18:18:35.09ID:uox55Xkf0
基本少し待って確認だけどそれでも反映されてなかったり、反映されてるけど取れてなかったりする。
0623192.168.0.774
垢版 |
2021/02/24(水) 22:58:36.25ID:3JX98v140
ここ最近は調子悪いからしばらく様子見たほうがいいよ
0624192.168.0.774
垢版 |
2021/02/27(土) 08:23:57.01ID:6CS9oMdW0
この前読んだ漫画に、WaybackMachineを使っているシーンがあった
1コマ程度だけど
0625192.168.0.774
垢版 |
2021/02/27(土) 20:23:05.25ID:Ly2ncyWo0
Archive Teamでニコ動のコメントとメタデータ(タイトルとか説明文)の保存が始まった
動画の中でも日本からしか見れないものとかはArchiveTeamの人からは取得できないらしく
Dockerを扱える人いたらWarriorというパッケージを導入すれば誰でも貢献できるのでやってくれるとありがたい
https://hub.docker.com/r/archiveteam/warrior-dockerfile/
https://wiki.archiveteam.org/index.php?title=ArchiveTeam_Warrior
0626192.168.0.774
垢版 |
2021/02/27(土) 21:59:52.26ID:Jb4WnfRj0
わおナイス
0627192.168.0.774
垢版 |
2021/03/01(月) 00:57:53.21ID:ihnmbLOX0
最近ニコ動の調子が悪いのはこれのせいなの?
落とすようなのはリスクあるから自分とこのIPではあまりやりたくないな…
0628192.168.0.774
垢版 |
2021/03/01(月) 01:35:46.84ID:wfxDiFoy0
割と可能性はあるな

【3/1 0時追記】動画が視聴できない不具合など【調査中・ニコニコ動画】
連日の不具合につき、ご利用の皆様にご不便をおかけし、大変申し訳ございません。
本不具合について、海外からの通常の量ではないアクセスにより、引き起こされております。
現在、さらなる原因調査と、追加の対応を行っております。

不具合発生時間
2021年2月28日(日) 06:06頃〜

https://blog.nicovideo.jp/niconews/148255.html
0629192.168.0.774
垢版 |
2021/03/01(月) 02:04:13.92ID:wfxDiFoy0
この公式ページの情報によると2月27日23時頃から断続的に不具合が起こってるらしいね
ニコ動アーカイブのトラッカーはここから確認できるっぽい
残り70万/3500万で今も動いてる
https://tracker.archiveteam.org/niconico/
0630192.168.0.774
垢版 |
2021/03/01(月) 02:11:24.07ID:0zo7s6Wq0
luaスクリプト読んでみたら、waitもかけずに全力でぶん回すようになってるじゃん
そりゃニコ動も不安定になるわ。DDoSそのものだもん
ttps://github.com/ArchiveTeam/niconico-grab/blob/ade778c0df8bd3ee5b0aa497c79e9ed97a604883/niconico.lua#L356
0631192.168.0.774
垢版 |
2021/03/01(月) 06:14:48.33ID:L+5MH82N0
>>630
間隔を1秒たりとも空けてないとは思わなかった
プルリクエストした方がええんかな
ArchiveTeam側に連絡取れるようならあちら側で対処してもらうよう依頼した方が良さそうかな
0632192.168.0.774
垢版 |
2021/03/01(月) 06:26:19.58ID:L+5MH82N0
今気付いたがアーカイブする対象の動画はどういう指定になってるんだろう
sm+数字連番とかで指定されているようならnmはどうなるんだ
0633192.168.0.774
垢版 |
2021/03/01(月) 06:34:33.80ID:LwaG001V0
間隔なしでアクセスしてたのか
連絡できる方お願いします
0635192.168.0.774
垢版 |
2021/03/03(水) 21:00:06.05ID:qMU8PBl90
>>629
保存が止まってるような気がする
0636192.168.0.774
垢版 |
2021/03/03(水) 22:36:32.38ID:IvY6bDaH0
意図的に止めたか、UserAgentとかでブロックされたか
0637192.168.0.774
垢版 |
2021/03/04(木) 19:19:41.51ID:0W4MjtMV0
今日archive.isでページを保存しようとしたら
「One more step
Please complete the security check to access archive.is」という画面になった
(そのページのURLは”ttps://archive.is/submit/”、あと”私はロボットではありません”っていうのも出てくる)
こうなるのはなぜ?
0638192.168.0.774
垢版 |
2021/03/04(木) 19:42:08.01ID:bGr5q6NW0
>>637
ボットからのアクセスからじゃないかをチェックするため
「私はロボットではありません」ってボックスをクリックかタップするとボットでは無いことを証明出来る
0639192.168.0.774
垢版 |
2021/03/06(土) 07:37:06.43ID:hlDxyvDV0
>>636
>>628で「対策を行なった」らしいから止められている可能性もあるね
0640192.168.0.774
垢版 |
2021/03/07(日) 20:08:35.16ID:9bQuMkRs0
訴えられればいいのに電脳ゴミ屋敷屋
0641192.168.0.774
垢版 |
2021/03/13(土) 23:55:10.58ID:8jEEmAHJ0
ニコ動のやつWaybackMachineで見れるようになってる
けど、コメントは無い模様
ttp://web.archive.org/web/20210228064205/https://www.nicovideo.jp/watch/sm100000
0642192.168.0.774
垢版 |
2021/03/13(土) 23:59:45.89ID:dBDnkJKI0
上の方で、「はてな」のサービス終了に触れてるのを見かけたけど、2020年1月末で終わったはてなグループについては誰も言及してないあたりそんなにも影が薄いサービスだったんだろうか…
はてなグループ終了時に運営がデータエクスポートしてくれるやつを実際に頼んだ人っているんだろうかね。
0643192.168.0.774
垢版 |
2021/03/14(日) 17:08:52.84ID:P0VVc7Hv0
はてなグループなついw
Twitter調べたらエクスポート依頼してる人いたよ 掲示板やタスクのデータはjson形式で送られてるみたい
0645192.168.0.774
垢版 |
2021/03/23(火) 14:43:54.48ID:dIBn548U0
最近のニコニコはサービスの改善を図ってか古いものを終了させてるね
いちユーザーとしてはようやくニコニコが大規模に改修されるのかという安堵があるけど、アーカイブしなければならないものが増えるのは厄介だな
0646192.168.0.774
垢版 |
2021/03/23(火) 16:22:26.81ID:dIBn548U0
MMDモデルのライセンス情報をブロマガに書いてた人もいるらしい
全員が全員とも引っ越しできるはずはないからライセンス関係のトラブルが起きそう
0647192.168.0.774
垢版 |
2021/03/23(火) 17:16:07.79ID:v4cm6WhT0
ブロマガは地味に有用な情報埋まってるからなあ
0649192.168.0.774
垢版 |
2021/03/23(火) 22:53:01.21ID:F3Q9JjE00
来年の今頃はau3G終了で古い掲示板が更に無くなりそう…
0650192.168.0.774
垢版 |
2021/03/24(水) 14:26:11.85ID:hCLf6Q2s0
「Webメディア『WHAT’s IN? tokyo』終了のお知らせ」
https://tokyo.whatsin.jp/634630
3月末日をもって終了らしい
0651192.168.0.774
垢版 |
2021/03/24(水) 14:30:00.31ID:hCLf6Q2s0
>>650
結構有名なアーティストのインタビューとかライブレポートが載ってるから早めにやった方がいいかも
0652192.168.0.774
垢版 |
2021/03/24(水) 19:19:31.06ID:Dbq8uDYn0
>>651
自分でいくつかアーカイブ作業したけど記事やコラムもいっぱいあるから自力でやるには限界がある…
Archive Teamに頼めないかな(でも画像の表示とかできるようになるか心配、有名人の写真とか結構載ってるから)
0654192.168.0.774
垢版 |
2021/03/25(木) 13:43:04.79ID:dIw+mgHL0
今ざっと確認してみた感じほとんど保存されてるから
頼む必要はなさそう
0655192.168.0.774
垢版 |
2021/03/27(土) 09:00:04.94ID:IQF/ehSw0
>>654
保存されてないものも多いようだけど..
0657192.168.0.774
垢版 |
2021/03/28(日) 10:20:45.25ID:7uSirFX90
質問です
なぜWayback Machineやarchive.isでのTwitterのページは昔のUIの表示で保存されるのですか?
0658192.168.0.774
垢版 |
2021/03/28(日) 10:25:32.20ID:wf8cUzOd0
>>657
Waybackmachineのユーザーエージェント情報が不明または古いブラウザのものだから
0659192.168.0.774
垢版 |
2021/03/28(日) 23:27:36.83ID:W3XigIE00
Twitterの旧UIって前に廃止された様な気が…
0660192.168.0.774
垢版 |
2021/03/30(火) 16:11:02.65ID:iT+KYP130
>>657
Twitterの旧UIは2年くらい前に廃止されたはずだけど、それ以前に取られたアーカイブの話してる?
もしそうなら、それがウェブアーカイブというものだからですとしか答えられない
廃止以後に取られたアーカイブで旧UIになってるものはそもそも遭遇した事がない
0661192.168.0.774
垢版 |
2021/03/30(火) 16:13:47.90ID:iT+KYP130
>>654
保存されてないの結構あるから依頼の必要があると思う
もう少し注意して確認してみてくれ
0662192.168.0.774
垢版 |
2021/03/30(火) 21:13:15.91ID:us3SRCC+0
>>661
今waybackのAPIで7300記事の保存状況を確認したところエラーが起きたのは30記事くらいだった
念のためこれはアーカイブし直してるけど何か抜けてたりミスしてるところがあるのかな
0663192.168.0.774
垢版 |
2021/03/31(水) 02:52:17.69ID:sigMsPVG0
テレビ番組表の記録
っていう2007年からの膨大な番組表データを記録しているサイトがあるんだけど、
番組の詳細内容が表示されなくなったり過剰なアクセス制限があったりと最近改悪が激しい

Waybackのクロールも拒否してるし、
貴重なデータの割にこのサイトにしか残っていない情報が多いので今後ちょっと不安だ
0665192.168.0.774
垢版 |
2021/04/01(木) 00:28:51.15ID:b0/dZpQp0
503のせいで四月馬鹿サイトのキャプチャができない
0666192.168.0.774
垢版 |
2021/04/02(金) 02:20:51.93ID:E098KUjC0
aimix-BBSというレンタル掲示板を見たら今月末でサービス終了するそうだ…
0668192.168.0.774
垢版 |
2021/04/02(金) 04:18:45.08ID:E098KUjC0
あら>>648で既出かすまん
0670192.168.0.774
垢版 |
2021/04/04(日) 23:07:03.32ID:1NgTlwaH0
503はでなくなったぽいな
ちゃんと保存出来てる
0671192.168.0.774
垢版 |
2021/04/06(火) 10:45:21.00ID:bcYYdv9U0
archive.todayの検索したページ全部ローカルに落としたいんですけどいい方法ありませんか?
0672192.168.0.774
垢版 |
2021/04/06(火) 10:49:57.61ID:bcYYdv9U0
一つ一つだと時間が、、、
0673192.168.0.774
垢版 |
2021/04/06(火) 12:52:00.97ID:zmjScz9w0
「同人用語の基礎知識」
https://www.paradisearmy.com/doujin/
が閉鎖されたようだ。

4日までは存在、5日に閉鎖されたようだ
まあ大体アーカイブに保存されてるようだが。
0674192.168.0.774
垢版 |
2021/04/06(火) 13:11:01.58ID:si5uHLGE0
選択範囲のリンクをコピーするアドオンでコピー。
改行置換できるテキストエディタで
「(改行)https://archive.ph/」を 「.zip(改行)http://archive.fo/download/」に 置換してダウンローダーに登録。
0675192.168.0.774
垢版 |
2021/04/06(火) 21:44:46.66ID:bcYYdv9U0
>>674
ごめん。素人すぎて理解できない。ありがとう
0677192.168.0.774
垢版 |
2021/04/07(水) 22:24:00.01ID:jaaDWMPS0
>>644 に出てるブロマガってarchive teamで動いてる?
動いてなかったら誰か頼んでもらえます?
0678192.168.0.774
垢版 |
2021/04/09(金) 20:51:54.18ID:qy0N6K120
>>673
今試したが繋がるね
サーバダウンかドメインの期限切れだったのでは
0679192.168.0.774
垢版 |
2021/04/14(水) 12:17:08.79ID:48TpJwRy0
ここで聞いていいかわからないけどiPhoneでサイト丸ごと保存できるようなアプリってある?
0680192.168.0.774
垢版 |
2021/04/14(水) 18:25:29.79ID:bpOyJRlR0
ローカルの話だったらプリントしてpdfとして保存するのが楽
ネット使っていいならInternet archive
0681192.168.0.774
垢版 |
2021/04/14(水) 18:27:41.00ID:bpOyJRlR0
safariでできる、真ん中のボタン押してプリント押してpdfプレビュー見えたら拡大してから右上のボタン押してファイルに保存
0682192.168.0.774
垢版 |
2021/04/14(水) 18:29:19.40ID:ZWSQBuck0
横からだけど、それでサイトを丸ごと保存できるの?
0683192.168.0.774
垢版 |
2021/04/15(木) 00:23:03.00ID:CGl/6bWS0
>>682
「サイト丸ごと」が全てのページって意味なら無理
IAのアカウント作ってTOPページからアーカイブすれば近い事は出来るけど
0684192.168.0.774
垢版 |
2021/04/15(木) 00:25:00.78ID:EOF13stj0
1ページ全部保存できるよ、pdfのページの切れ目は気になるかもしれんけど
0685192.168.0.774
垢版 |
2021/04/15(木) 18:46:33.49ID:NH0zTLbd0
そのページだけでなくサイト全体、全てのページという意味でした
紛らわしくて申し訳ない
0686192.168.0.774
垢版 |
2021/04/22(木) 02:30:48.66ID:AxQTCk/Z0
以下全然関係ないメモ
wget --spiderでやってログをTxtファイルに出力
TxtファイルからURLを抽出して別のTxtファイルに出力
GoogleSpreadSheetを開いてファイル>インポート、アップロードのタブを開いてTxtファイルをインポート
Internet ArchiveのBatchでArchiveする
0687192.168.0.774
垢版 |
2021/04/22(木) 12:02:39.96ID:/9qqH/bs0
ClipTrapっていう神ツール見つけた
これ使うと起動中にクリップボードを勝手にメモ帳に書き込んでくれる、URL収集が格段に楽になった
今までコピーして自分でメモ帳に貼り付けてたのが起動してURLをコピーするだけでよくなる

https://web.archive.org/web/20210223043918/https://www.dcmembers.com/skwire/wp-content/uploads/sites/5/apps/cliptrap/ClipTrap.zip
0688192.168.0.774
垢版 |
2021/05/01(土) 11:40:31.74ID:9IzoZg0U0
いいねそのツール

aimix bbsはまだ繋がるけど時間の問題か
0689192.168.0.774
垢版 |
2021/05/02(日) 01:11:35.64ID:lC3RPbeK0
試しに自分が使ってたコミュニティのaimixbbsログ取ってるけど
7件ごとしか表示できないからクッソめんどいねコレ
あとWAで保存したあとに表示されるURLがバグってページ内に使われてるjavascriptのURLが出たりする
しばらくして保存指定したURLで見るとちゃんと取れてるけども
0690192.168.0.774
垢版 |
2021/05/02(日) 13:35:59.09ID:vaVxAMxx0
「There are no running processes.」を真に受けて複数同時にBatchを走らせちまった
0691192.168.0.774
垢版 |
2021/05/03(月) 07:15:00.86ID:/kznU+lx0
みんカラのブログはUserAgent無しだとwgetがエラーになるっぽいな
0692192.168.0.774
垢版 |
2021/05/08(土) 07:51:11.20ID:9Fhy2QW70
さすがにUserAgentは適当なブラウザのを指定しとけよw
UserAgentにbotって入ってるだけでブロックするクソサイトもあるし
0693192.168.0.774
垢版 |
2021/05/18(火) 21:27:51.57ID:oveHwTzF0
最近思うけど個人サイトっていくら有名でも10年後に見られる保証はないんだよね…
そこはか通信とかchakuwikiみたいに管理してた人が突然亡くなっちゃうこともあるし(幸い両方とも移転したけど)
0694192.168.0.774
垢版 |
2021/05/19(水) 19:21:18.50ID:jJ5ExFLB0
>>693
本当にその通りだと思うわ
見つけた時にできる限り保存しておくに限る
0695192.168.0.774
垢版 |
2021/05/21(金) 15:01:04.55ID:7xzrhdl00
bbspinkのスレを取得しようとすると403になってうまくいかないなー昔は出来たぽいのに
5chのほうは今もスレURLそのままでいけるんだけど
0696192.168.0.774
垢版 |
2021/05/28(金) 21:25:26.51ID:2ckbrUc60
こころんにあるミラーってWaybackMachineに保存しようとすると504を返してきて保存できないね
0697192.168.0.774
垢版 |
2021/06/15(火) 21:34:37.24ID:fVgCsqNm0
【重要】PC版GREEのサービス終了のお知らせ
2021年6月24日 15:00(木)をもちまして、PC版GREEのサービス提供を終了させていただくこととなりました。

■提供を終了するサービス
サービス終了後は、下記を含む全ての機能がご利用いただけなくなります。
・ゲームプレイ
・ゲーム内アイテムの利用
・GREEコインの購入
・チャットやコミュニティなどのSNS機能
・アバター機能
・会員登録/退会
・日記の外部ブログへの転載機能
※日記の転載先として登録済URLは削除されます
※外部ブログから投稿済の日記はそのまま残ります
https://jp.apps.gree.net/ja/static/page/20210201_pcnotices
0698192.168.0.774
垢版 |
2021/06/16(水) 20:55:19.05ID:O3qSVHMS0
ガラケー版GREEは2021年11月25日終了
0700192.168.0.774
垢版 |
2021/07/05(月) 03:42:36.80ID:BBrljrOf0
SiteMixというレン鯖の調子が悪いらしい。
ttps://it.srad.jp/story/21/06/29/1618244/
まだ消滅しないとは思うけど、個人HPがたくさん残ってるのと、
適当なURLをarchive.org/wayback/availableに投げたら、結構保存されてないので、
消える前に保存したほうがいいかも。
0701192.168.0.774
垢版 |
2021/07/05(月) 09:11:16.10ID:8On27QWK0
iPhoneアプリのOffice Pagesってもう機能してないのかな
使ってる人います?
0703192.168.0.774
垢版 |
2021/07/19(月) 13:30:59.74ID:fiblEnSF0
今日最初の保存でYou have already reached the limit of active sessions.出すな
0704192.168.0.774
垢版 |
2021/07/22(木) 10:00:06.11ID:Ar5GRjJC0
フリーソフトの再配布まとめもほしいなあ
0705192.168.0.774
垢版 |
2021/08/17(火) 08:48:52.70ID:5NZSHDeK0
わかる
0706192.168.0.774
垢版 |
2021/09/02(木) 11:41:25.91ID:3hkeXiph0
2020年頃からtwitterのツイートも一個一個自動でアーカイブ取るようになったけど
取るようになる以前のツイートとか元鍵垢の鍵かかってた頃のツイートとか兎に角過去に遡ってまでやってくれないのは無能だと思う

前に鍵垢が一時的に開いてたのがあって夜通し手動でアーカイブ取ってたが500くらいしか録れない内に鍵かけ直されちゃった
アクセストークンとか使えたらわざわざいつ開くかわからん鍵が開くまで待つ必要もなくなるんだが…
0707192.168.0.774
垢版 |
2021/09/02(木) 11:42:26.46ID:3hkeXiph0
>>706
書き忘れたけどWaybackMachineの話ね
0709192.168.0.774
垢版 |
2021/09/05(日) 15:40:36.27ID:mfjx+saw0
工エエェェ(´д`)ェェエエ工
0711192.168.0.774
垢版 |
2021/09/05(日) 16:25:46.16ID:hHeoYwam0
mpeg4.jpってのは全然使われてなさそうだな
0713192.168.0.774
垢版 |
2021/09/05(日) 22:04:48.06ID:hHeoYwam0
おお、ありがとう!
0715192.168.0.774
垢版 |
2021/09/07(火) 10:24:27.31ID:tjiIa94U0
現状、Wayback Machine とGeoLogでアーカイブが存在しないジオシティーズのサイトは
もう2度と見ることは不可能ですか?
親父との思い出がすべて消えてしまったようなので非常に残念
0716192.168.0.774
垢版 |
2021/09/07(火) 13:09:59.05ID:LYRD7+970
>>521
無理だね
ただほとんどアーカイブされてるからアーカイブされてないやつは少ない
0717192.168.0.774
垢版 |
2021/09/07(火) 13:10:38.87ID:LYRD7+970
>>716
安価ミス

>>715
0718192.168.0.774
垢版 |
2021/09/08(水) 18:41:42.82ID:yT2ioJcy0
今日archiveis落ちてます?
0719192.168.0.774
垢版 |
2021/09/09(木) 11:25:30.05ID:FyBcnQE10
ふとArchiveTodayのURL見てて思ったんだけど
ここのURLって大小英数字で5文字だけど、これだと(26*2+10)^5で9億チョイにしかならないんだよね
9億ってInternet archiveの1か月分にすらならないんだけど流石に少なすぎない?
本当に全部アーカイブしてるのかな
0721192.168.0.774
垢版 |
2021/09/10(金) 13:52:15.68ID:1Zu8rxzZ0
ニコニコのブロマガがそろそろ終わる
URLはナンバー割り振りだからスクリプト等での取得は楽そうだが…
0723192.168.0.774
垢版 |
2021/09/15(水) 15:02:30.62ID:eir66lMu0
5chの過去ログの閲覧が有料会員限定になってしまった
sc使えば見られるらしいが有益なスレは念のため魚拓とるようにした方がいいかも
0724192.168.0.774
垢版 |
2021/09/16(木) 00:58:25.90ID:1xT4uIKN0
itestだけだな
PC版は見れる
0725192.168.0.774
垢版 |
2021/09/16(木) 03:17:33.64ID:zSMJSyx20
PC版を見れるうちに ってことかな
0726192.168.0.774
垢版 |
2021/09/16(木) 05:05:04.36ID:0ExHl1wP0
>>723
scも最近はクロールがすぐいかれるので必要なログはちゃんと押さえておく必要がある
/test/read.cgi/patisserie/1506253827/l50
0727192.168.0.774
垢版 |
2021/09/16(木) 12:27:15.17ID:HjXFmpnmO
2ちゃんねる過去ログは「ぬこ」使え。過去過ぎるのはほぼ消えたけど。
0728192.168.0.774
垢版 |
2021/09/17(金) 00:20:21.39ID:9TrqYaCb0
itestの過去ログまた見れるようになったな
あれも専ブラみたいなもんだからたぶん仕様変更による不具合、元々専ブラじゃ過去ログは見れないし
PC版はHTMLだから影響なかった
0729192.168.0.774
垢版 |
2021/09/23(木) 16:38:00.26ID:SnlBsIcL0
「東京大学見聞伝ゼミナール」 ttp://kenbunden.net/general/
「dacapo」 ttps://dacapo.piichi.jp/
どっちもここ数年更新されてないからアーカイブしたほうがいいのだろうか?
0730192.168.0.774
垢版 |
2021/09/23(木) 19:18:56.23ID:5qf7Ids20
みんなクイック魚拓javaでinternet archiveとarchive todayの取得していないのか? URLのリストがあれば一括で取得できるけど
まだ消えていない個人ブログならfeedlyに登録して、Title-Only Viewで記事の一覧を上から下まで選択して、copy selected linksでURLのリストを取得できる
Screaming Frog SEO Spiderとかを使ってURL取得する方法もあるけど
0731192.168.0.774
垢版 |
2021/09/23(木) 19:19:54.95ID:5qf7Ids20
それとYoutubeの各動画の説明欄にある帰属情報の表示ページが2021年9月以降に廃止されるらしい

帰属情報にはクリエイティブ・コモンズ情報(CC-3.0)が記されている動画があって、そういった動画はまるまるウィキメディア・コモンズに動画を転載して実質的なバックアップとすることができる。もちろん、ウィキメディアのコミュニティが教育的でないと判断したら削除されるが、結構生き残るから試して見る価値はある

帰属情報欄が消されると、ウィキメディアの査読者たちがYoutube上でクリエイティブ・コモンズの動画かどうか確認できないから、消されてしまう。それを回避するためには各動画ページのアーカイブを取得する必要がある
0732192.168.0.774
垢版 |
2021/09/26(日) 06:38:01.90ID:w6nU2vk/0
archive.phで.txtをアーカイブした場合、プレーンテキストを表示させるにはどうしたら良い?
0735192.168.0.774
垢版 |
2021/10/29(金) 01:31:40.54ID:aL+Cspmv0
スレ違い気味ですみません

ttp://tojinomiko-tomoshibi.jp/
上記の冒頭での「斬る」エフェクトアニメがどうしても保存できません
どうすればいいでしょうか?
0736192.168.0.774
垢版 |
2021/10/29(金) 11:12:11.18ID:QSc2canI0
>>735
アニメーションを自分の端末に保存したいってことかな?
ソースを見ると1枚の画像をブラウザの処理で変形させてアニメーションにしてるから
画面収録とかして保存するしかないと思う
0737192.168.0.774
垢版 |
2021/10/29(金) 11:55:15.50ID:aL+Cspmv0
>>736
サンクス
やっぱりそうかあ>1枚の画像をブラウザの処理で変形させてアニメーションにしてる
静止画保存で妥協します
0738192.168.0.774
垢版 |
2021/10/29(金) 12:33:00.97ID:aL+Cspmv0
って、開発者モードから静止画が取れないみたいですね
キャプチャ(画面撮影)くらいしか方法がないのかな?
0740192.168.0.774
垢版 |
2021/10/29(金) 19:43:33.53ID:aL+Cspmv0
>>739
いやもう本当にサンクス おかげで助かりました
0741192.168.0.774
垢版 |
2021/11/16(火) 17:17:26.39ID:JttJ7yZa0
>>729
kenbunden.net Internet Archiveに保存されてなかった80ページほどのURLを昨日SPNに投げて保存しといた
dacapo.piichi.jp こっちも保存されてなかった1700ページぐらいをSPNに投げて保存した
>>734
10月末にArchiveteamが巡回保存済、誰か依頼出したみたい
0743192.168.0.774
垢版 |
2021/11/17(水) 12:33:14.44ID:In0ODzl20
自動化してまとめ記事作ってるところもあるだろうし際限なさそう
0744192.168.0.774
垢版 |
2021/11/19(金) 12:17:06.05ID:CyrJshBK0
>>741
729です ありがとうございます
いま見聞伝の昔のサイト「KENBUNDEN2009」(ttp://kenbunden.net/wpmu/)のアーカイブをInternet Archiveで途中までとっているのですが
ttp://kenbunden.net/wpmu/blog/2010/03/14/%EF%BC%92%EF%BC%8E%E6%96%87%E8%8A%B8%EF%BC%88%E8%AA%AD%E6%9B%B8%EF%BC%89%E3%82%B5%E3%83%BC%E3%82%AF%E3%83%AB%E5%BA%A7%E8%AB%87%E4%BC%9A/
ttp://kenbunden.net/wpmu/blog/2010/03/14/%EF%BC%92%EF%BC%8E%E6%96%87%E8%8A%B8%EF%BC%88%E8%AA%AD%E6%9B%B8%EF%BC%89%E3%82%B5%E3%83%BC%E3%82%AF%E3%83%AB%E5%BA%A7%E8%AB%87%E4%BC%9A/
ttp://kenbunden.net/wpmu/blog/2010/03/15/%EF%BC%94%EF%BC%8E%E5%8F%96%E6%9D%90%E2%97%86%E6%B0%B8%E6%B1%9F%E6%9C%97%E5%85%88%E7%94%9F%EF%BC%88%E3%83%A9%E3%82%A4%E3%82%BF%E3%83%BC%EF%BC%89/
ttp://kenbunden.net/wpmu/?attachment_id=1097
ttp://kenbunden.net/wpmu/blog/2009/07/13/%E3%80%8C%E8%A1%97%E3%83%B2%E6%83%B3%E3%83%95%E3%80%8D/
ttp://kenbunden.net/wpmu/blog/2009/07/13/%E3%80%8C%E8%87%AA%E5%88%86%E4%BA%8B%E5%8C%96%E3%80%8D%E3%81%99%E3%82%8B%E3%80%82/
ttp://kenbunden.net/wpmu/?attachment_id=1068
ttp://kenbunden.net/wpmu/blog/2009/12/01/%E2%97%86intro-2/
ttp://kenbunden.net/wpmu/hiroyasu/2009/09/23/nins%E3%82%B7%E3%83%B3%E3%83%9D%E3%82%B8%E3%82%A6%E3%83%A0%E4%BA%8B%E5%89%8D%E5%8F%96%E6%9D%90%E6%9D%BE%E6%B2%A2%E5%85%88%E7%94%9F/
これらのページがURLに含まれる記号等のせいかきちんとアーカイブできません
0745192.168.0.774
垢版 |
2021/11/19(金) 18:59:05.02ID:Pk06F6JR0
>>744です
上記のURLの内
ttp://kenbunden.net/wpmu/blog/2010/03/14/%EF%BC%92%EF%BC%8E%E6%96%87%E8%8A%B8%EF%BC%88%E8%AA%AD%E6%9B%B8%EF%BC%89%E3%82%B5%E3%83%BC%E3%82%AF%E3%83%AB%E5%BA%A7%E8%AB%87%E4%BC%9A/
ttp://kenbunden.net/wpmu/?attachment_id=1068
以外はアーカイブできました これより後だと
ttp://kenbunden.net/wpmu/blog/2009/12/01/%E2%97%86intro-2/
ttp://kenbunden.net/wpmu/blog/2009/07/13/%E8%99%B9%E3%81%AF%E9%BB%92%E3%81%84%EF%BC%81%EF%BC%9F/
ttp://kenbunden.net/wpmu/?attachment_id=1063/
ttp://kenbunden.net/wpmu/blog/2009/06/03/%E3%80%90%E7%95%AA%E5%A4%96%E7%B7%A8%E3%80%91%E3%80%8Enuovo-cinema-paradiso%E3%80%8F%EF%BC%88%E3%83%88%E3%83%AB%E3%83%8A%E3%83%88%E3%83%BC%E3%83%AC1989%EF%BC%89/
ttp://kenbunden.net/wpmu/blog/2009/05/12/%E5%89%8D%E6%9B%B8%E3%81%8D/
が時間を置いても今のところだめです
0746192.168.0.774
垢版 |
2021/11/21(日) 04:32:28.52ID:clopneT/0
>>744-745
Save Page Nowから保存しようとすると俺の環境でも出来なかったけど、
curl使って/save/に投げたら保存できた

?attachment_id=1063と?attachment_id=1068はNot Foundでページが自体が無いけど、
Save Page Nowで保存できたよ

取りこぼし無ければ俺が確認できたブログ記事118ページ全て保存できてるはず
0747192.168.0.774
垢版 |
2021/11/23(火) 18:21:37.02ID:W/yKXnUq0
ツイセーブってアーカイヴ的な意味でTwitterの保存に使えるのかな
0748192.168.0.774
垢版 |
2021/12/11(土) 19:00:09.35ID:2OqI6BpU0
エキサイトフレンズサービス
ttps://friends.excite.co.jp/notice/?type=info&no=172
サービス提供の終了 2022年4月27日(水)15時
0749192.168.0.774
垢版 |
2021/12/22(水) 16:07:43.18ID:i8v1M90L0
ttps://ameblo.jp/imai-yuzo/entry-12716798529.html
今井ゆうぞうさんのブログが明後日の19時に閉鎖されるそうです
0751192.168.0.774
垢版 |
2022/01/30(日) 10:58:40.76ID:2zlArtBu0
ttps://shop.plaza.rakuten.co.jp/
店長の部屋Plus+は2022年1月をもって提供を終了致します。長きに渡りご愛読ありがとうございました。
0752192.168.0.774
垢版 |
2022/02/03(木) 07:58:26.18ID:sxAD5/Ob0
スクウェア・エニックスの開発資料を管理するプロジェクト「SAVE」のセッションをレポート。ゲーム開発の過去を探ることで,未来につなげる
https://www.4gamer.net/games/999/G999905/20220126058/
0753192.168.0.774
垢版 |
2022/02/04(金) 13:46:00.41ID:IFofhrOr0
気色悪すぎるポエマー基地外婆
痛い妄想婆。芸能人のゴシップネタに顔文字で嘲笑い中傷しか少ししたら即消し。
自分にひたすら赤ポチ付け命懸け
周囲に青ポチ連打。
若ぶってる還暦近いニート婆
https://news.yahoo.co.jp/profile/id/FuFiWDuNeXn41agPfYcGqcw-/comments
0754192.168.0.774
垢版 |
2022/02/08(火) 15:54:59.53ID:23mO94fl0
「ウェブリブログサービス終了(2023/1)のお知らせ」
ttps://info.at.webry.info/202201/article_2.html
0756192.168.0.774
垢版 |
2022/02/15(火) 14:21:23.44ID:73XsCTsE0
TechCrunch Japanおよびエンガジェット日本版 終了のお知らせ
https://www.beboundless.jp/press/corporate-announcement-02-15-2022

これ誰かArchive Teamに連絡してもらえないかな
どちらも日本のITニュースサイトの草分け的なサイトで、過去記事が完全に無くなってしまうと結構な影響が出る
0758756
垢版 |
2022/02/15(火) 20:04:52.81ID:73XsCTsE0
>>756
CCPA(カリフォルニア州消費者プライバシー法)
の問題で米国のIPアドレスからはアクセス出来ないという話もあるから、
アーカイブ時は日本国内でクローラ動かす方が無難かもしれないということを補記しておきます
https://twitter.com/ken_sugar/status/1388338534788919298
https://twitter.com/niw/status/1493465935126032384
https://twitter.com/5chan_nel (5ch newer account)
0761192.168.0.774
垢版 |
2022/02/16(水) 16:06:31.58ID:Z1Ikjh2D0
エンガジェット日本版はハードル高そうだね
パッと見た感じだと動的なページ読み込みでmaxで最新の200記事くらいしか確認できない
0763192.168.0.774
垢版 |
2022/02/17(木) 10:31:12.61ID:XjL575Qm0
>>762
それだと古い記事の取得が難しくない?
0764192.168.0.774
垢版 |
2022/02/19(土) 20:57:57.17ID:6EQfnQ7T0
https://www.dead-link-checker.com/ja/
これに突っ込めばいけるんじゃ?
余計な文字や他のURLはサクラエディタの置換ツールで消せる
0768192.168.0.774
垢版 |
2022/03/01(火) 16:03:16.34ID:fwCwRkUg0
見た限りTechCrunch Japanはほぼすべてのページが保存されてるから更新停止以降にページ一覧をアーカイブするだけでいけそうだけどそれで大丈夫だよな?
0769192.168.0.774
垢版 |
2022/03/01(火) 17:44:29.93ID:fwCwRkUg0
と思ったけど米国版にリダイレクトされてるから無理だ
結局日本のipでとらないといけない
0770192.168.0.774
垢版 |
2022/03/01(火) 20:22:17.47ID:kjwJQzj60
BLOGOS サービス終了のお知らせ
https://blogos.com/feature/blogos_close

サイトの公開を終了する2022年5月31日以降、編集部執筆のオリジナル記事など一部の記事のみlivedoor ニュースにアーカイブされ、その他の転載記事は閲覧することができなくなります。
0771192.168.0.774
垢版 |
2022/03/01(火) 22:22:22.23ID:JNCFZ5HK0
>>770
サイト更新終了は3/31
0772192.168.0.774
垢版 |
2022/03/05(土) 18:55:25.04ID:JfM0EMs40
【重要なお知らせ】teacup. byGMOのサービス終了につきまして(3月01日 14時00分)【重要なお知らせ】teacup. byGMOのサービス終了につきまして(3月01日 14時00分)
https://www.teacup.com/information/view?id=243
2022年8月1日(月)13:00にサービス終了らしい
0773192.168.0.774
垢版 |
2022/03/05(土) 19:02:54.10ID:JfM0EMs40
>>772です
すみません、記事タイトルを二重にコピペしているのに気づかず投稿してしまいました
0774192.168.0.774
垢版 |
2022/03/05(土) 19:04:47.75ID:lIy6/OLr0
いいじゃないのー
0775192.168.0.774
垢版 |
2022/03/06(日) 15:23:24.56ID:8Eb0by620
ネット掲示板の文化は衰退するしかないのか
0776192.168.0.774
垢版 |
2022/03/08(火) 21:46:01.42ID:5zB+Bh040
各種の小さな掲示板が村社会のように乱立する時代じゃなく、
単一の巨大なSNSプラットフォームで緩やかに繋がる時代にシフトしたって事だろうね
5chもそのうち無くなるよ
0780192.168.0.774
垢版 |
2022/03/11(金) 20:41:52.02ID:dMI2duLO0
明らかに荒らすのが目的の怪しい書き込みが勢いあるスレに定期的に湧いたりしてるしね5ch
ぶっちゃけツイッターは都合・耳障りの悪い書き込みは通報されてるから外面のいい書き込みばっかで好きじゃない
フォロワー数200はないと当たらない抽選リツイート広告もうざいけど
0781192.168.0.774
垢版 |
2022/03/18(金) 22:31:31.38ID:szX8RIiK0
13 番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 0222-Gxrt)[] 2022/03/18(金) 10:12:48.10 ID:WOefpNSE0

過去ログも無い
フラッシュゲームも無い
画像映像すべてDeleted表示
個人サイトは404NOTFOUND
便利な新サービスができてもすぐ終了

最新のものが瞬間的にしか存在しないのが2010年代のインターネットであった
検索結果がアフィまみれなのが2010年代のインターネットであった


【電子書籍】Microsoft Storeから電子書籍が削除。購入書籍は全額返金
http://egg.5ch.net/test/read.cgi/bizplus/1554275673/
Google Play Music、サービス終了。8月末から音楽のダウンロードが不可に [434464885]
https://leia.5ch.net/test/read.cgi/poverty/1596600303/
【IT】Yahoo!ブログがサービス終了--黎明期のサービス続々終了
http://egg.5ch.net/test/read.cgi/bizplus/1551370150/
infoseekの無料HPサービスを使ってる全HPが11/1の2:00限りで見れなくなるぞー ネット遺産消滅 ★3
http://hato.5ch.net/test/read.cgi/news/1288538812/
ニフティ、個人などのホームページ14万件が1カ月後に自動消滅、8割以上が放置されたまま [無断転載禁止]c2ch.net [594632409]
http://hitomi.5ch.net/test/read.cgi/poverty/1472451809/
【lycos】ライコス消滅まであと1日【infoseek】
http://news19.5ch.net/test/read.cgi/news/1062256363/
【悲報】インターネットがまとめサイトのせいでどんどん使い辛くなってると話題に
http://leia.2ch.net/test/read.cgi/poverty/1538296178/
【お知らせ】Yahoo!ジオシティーズは、2019年3月末をもちましてサービスを終了させていただくこととなりました★2
http://asahi.5ch.net/test/read.cgi/newsplus/1538426761/
個人サイトってもう完全に消えたよな 今は検索に引っかかるようにしたブログか、要件だけ伝える簡素な会社HPか、どちらかしかない [998357762]
https://leia.5ch.net/test/read.cgi/poverty/1541513802/
魔法のiらんど、ホームページ・ブログサービス終了 小説投稿サイトにリニューアル [495152168]
https://leia.5ch.net/test/read.cgi/poverty/1579211303/
【悲報】レンタル掲示板のteacup.が8月1日でサービス終了 25年の歴史に幕 [632443795]
https://hayabusa9.5ch.net/test/read.cgi/news/1646374116/
インターネットがつまらなくなった理由とは? スマホキッズの流入、アフィキッズの流入、飛び交うネットスラング・・ [175746563]
http://leia.5ch.net/test/read.cgi/poverty/1538426531/
いつから日本のインターネットってこんなにつまらなくなったんだろうな [377388547]
http://leia.2ch.net/test/read.cgi/poverty/1513348977/
短い情報を数ページに渡って読ませた挙げ句、最後に「いかがでしたか」って書いてあるまとめサイトのゴミっぷり [566475398]
http://leia.5ch.net/test/read.cgi/poverty/1552338977/

15年前のお前ら「一度ネットで炎上したら一生残るずwww」ほとんど残ってない件 [811796219]
https://leia.5ch.net/test/read.cgi/poverty/1617362844/

【悲報】「ネットの情報は永遠に残る」が完全に嘘だったことが判明。10年前のWebの情報は8割、20年前は99%が消失 [976470219]
http://leia.5ch.net/test/read.cgi/poverty/1538708384/
0782192.168.0.774
垢版 |
2022/03/18(金) 23:43:51.79ID:DKmBxVJn0
【重要】サービス終了のお知らせ
http://2style.net/support-end.html
「2Style.net無料ホームページサービス/無料レンタルサーバーホスティング」が一部サービスを除き2022年3月31日で終了
0783192.168.0.774
垢版 |
2022/03/31(木) 02:51:54.80ID:ErUtL89n0
Internet Archive
@internetarchive
·15時間
📣 ATTENTION: PG&E our local power company is implementing a planned power outage tomorrow between approx. 7:00-7:30 AM Pacific, near one of our main data centers.
Please expect some disruptions in service. Thank you for your patience.
0784192.168.0.774
垢版 |
2022/03/31(木) 03:19:47.30ID:ErUtL89n0
Internet Archive
@internetarchive
ATTENTION: PG&E, our local power company, is implementing a planned power outage today near one of our datacenters.
They now report that they will be done before 2pm PT.
Please expect some disruptions in service. Thank you for your patience.
0785192.168.0.774
垢版 |
2022/04/01(金) 09:25:02.27ID:/u3wwaak0
>>782です
まだ今の時点では「2Style.net」のページが閲覧できます
0787192.168.0.774
垢版 |
2022/04/19(火) 13:13:36.41ID:Q9RUGxtI0
swfまで保存してくるアーカイブなんてないだろ
0788192.168.0.774
垢版 |
2022/04/21(木) 17:34:44.42ID:CDAqJWFb0
2002年頃に閉鎖された趣味系の個人サイトがWayback Machineに記録されてたんだけど、
15個くらいあるページ(html)のうち1つだけがアーカイブされてなかった・・・残念だ
なんでこのページだけ?って気持ちはあるけど、まぁそういうものだと思って諦めるしかないよね

どこか他のアーカイバで保存されてないかと探したけど案の定なさそう
Wayback Machineで見つからなければジエンドか
0789192.168.0.774
垢版 |
2022/04/21(木) 17:55:08.09ID:2BhHZRWk0
Waybackになくて他にあったことはほとんどないなぁ確かに
0790192.168.0.774
垢版 |
2022/04/21(木) 23:25:26.05ID:DQbVufnt0
ログイン必須なとことかInternet Archiveが保存から除外してるサイトだと
Wayback Machineにはなく他だとあるってことがよくあるけど
そういうの別に関係ないサイトでWayback Machineにはなく他だとあるっていうのは言われてみれば今までなかったかもなー
あるにはあるんだろうけど
0791192.168.0.774
垢版 |
2022/04/22(金) 01:42:05.73ID:+AC+HCAC0
2000年くらいまでのネットは今とはだいぶ空気違くて、時々懐かしくなって見たくなるんだよな
素朴だけど良いサイトいっぱいあった
0792192.168.0.774
垢版 |
2022/04/27(水) 18:01:43.52ID:iJ8p7/dI0
終了するサービスを時系列でまとめてみました
「g.o.a.t」「BLOGOS」 2022年5月31日→
「teacup.」 2022年8月1日(月)13:00→
「ウェブリブログ」 2023年1月31日(2022年1月18日以降新規記事投稿のないブログは2022年12月1日に閲覧終了)
0795192.168.0.774
垢版 |
2022/05/07(土) 14:31:38.80ID:xW1GHZ640
>>776
「SNSはネット掲示板に代わるもの」というには心もとないのになぁ
ネット掲示板は影響力とか肩書きとか関係なしに交流とか情報発信ができるが、SNSはそうはいかない
ひたすらひとりごとしてるだけならまだしも、誰かしらに見てもらいたい書き込みだと不便
0796192.168.0.774
垢版 |
2022/05/07(土) 17:02:21.93ID:UY+P1SK20
SNSはネタになりそうな作話で大量のレスポンスを釣って、
「バズったので~」って宣伝するいいね乞食がマジでキモ過ぎて無理
有名人が実名晒して宣伝してたBlogを、誰でも簡単に見てもらえるようにした仕組みだけど、
企業広告じゃない拙劣で低俗な「広告」が溢れすぎてて話にならない
動画もニートが金儲けのために必死でアップしてるだけだし

掲示板は個人ユーザーが書き込んでも原則利益に繋がらない仕組みなのが健全
ステマはあるけど
0797192.168.0.774
垢版 |
2022/05/08(日) 06:26:24.43ID:WdAN0K/o0
>>796
そもそもSNSって中華とかにある言論統制あるじゃん
ビッグネームに否定的なレスすると、粗探し通報されまくってアカ停止
片面提示大好きの愚民向け
0798192.168.0.774
垢版 |
2022/05/09(月) 13:41:20.45ID:mDbEsZ6E0
昔のネットはよかったなぁ
今と違って消費・消耗するような場ではなかった
懐古主義とか嫌いなはずなのに、こんなふうにノスタルジーに浸るようになるとは
0800192.168.0.774
垢版 |
2022/05/14(土) 08:35:48.06ID:d1eHR6fV0
>>799
Archive Teamに相談してみては?
少なくとも俺は大規模アーカイブするソフトとか使ってなく、webアーカイブという概念への貢献度の低い一利用者にすぎないため特に貢献できない…
0801192.168.0.774
垢版 |
2022/05/17(火) 18:28:22.74ID:uOl3oXdZ0
>>799
12日に誰かがSPNでたくさんのページを保存してる
抜けてるのだけやればいいよ
0802192.168.0.774
垢版 |
2022/05/25(水) 22:01:51.56ID:Q9rsYdoD0
こういうのって企業は平気と閉鎖するけど、ブランド戦略としては悪手じゃないのか
掲示板じゃないけど、何十年も前の自社製品の取説とか公開し続けてる企業ってすごい好印象だわ
0803192.168.0.774
垢版 |
2022/05/28(土) 21:27:59.70ID:gnJ54i+v0
>>794

当時はブログパーツがたくさんあって、これが良かったんだがなあ…。しくしく。
0806192.168.0.774
垢版 |
2022/06/09(木) 02:54:36.10ID:MnJqqY9m0
元記事(Taiwan News)はInternet Archiveでも保存されてるのに何故Ghost Archiveを紹介したんだろうか
0807192.168.0.774
垢版 |
2022/06/12(日) 12:45:25.93ID:jWoeKDPs0
gigazineはInternet Archive弾いてるし、嫌いなんじゃね
知らんけど
0808192.168.0.774
垢版 |
2022/06/16(木) 06:39:41.81ID:sQjnP0OR0
今年だけで既に9本の記事にWayback MachineのURL貼ってるな、GIGAZINEさんは。
右手でアーカイブURLを貼りながら、左手ではブルースター・ケールに中指突き立てて削除要請という絵面。
0809192.168.0.774
垢版 |
2022/06/18(土) 13:36:50.84ID:dJ4p7a0d0
>>808
最近まではアーカイブ出来てたんだけどね
noteみたいに特に何かあったわけでもないのに不思議だ
0810192.168.0.774
垢版 |
2022/06/18(土) 22:14:57.06ID:H3SY4jTj0
正直最近のGigazineは政治的偏りが出てきてるように思うから外的な圧力があるのか保存されると都合が悪いのかってところだろう
0811192.168.0.774
垢版 |
2022/07/11(月) 11:57:06.50ID:HoZJHzgL0
国立国会図書館のアーカイブも非公開なってるな
0812192.168.0.774
垢版 |
2022/07/13(水) 18:48:14.77ID:9ioxaolt0
IAにアーカイブしないでウェブ魚拓使ってる人って何が目的なのか気になる
消される確率や開示リスクを考えたら何もメリットないと思うんだけど
0813192.168.0.774
垢版 |
2022/07/15(金) 12:18:02.34ID:SbXJdT4o0
魚拓って検索するとそれが最初に出てくるからな
それしか知らないんだろう
0814192.168.0.774
垢版 |
2022/07/21(木) 11:48:47.24ID:A4jqpbL00
最近today不安定だな
0815192.168.0.774
垢版 |
2022/07/31(日) 17:00:29.92ID:KUi/t+bC0
山上のツイート消えちゃったのか
ツイッターってWayback Machineで取れるんだっけ?
0816192.168.0.774
垢版 |
2022/08/01(月) 08:57:00.33ID:FYRWIllf0
今更だけど、teacup.の掲示板をSaveする際、掲示板の2ページ以降のURLの末尾に;や/を入れないと、「次のページ》」などのリンクが繋がらなくなるので、Tipsポイント。

例:
「8038.teacup.com/muhihi/bbs?page=2&」でURLを指定してSaveすると
「8038.teacup.com/muhihi/bbs?page=2」で保存されて、閲覧時3ページ目以降のリンクが切れるので、
「8038.teacup.com/muhihi/bbs?page=2&;」と指定する必要がある。
0817192.168.0.774
垢版 |
2022/08/01(月) 09:06:00.75ID:FYRWIllf0
teacup.の掲示板やブログが、NAVERまとめやGeoCitiesの時みたいに有志によって保存されんのね…。

無念あとは頼む (他力本願)
0818192.168.0.774
垢版 |
2022/08/01(月) 10:43:17.30ID:qFg/6NZR0
呟きはinstanceも意外と穴
0819192.168.0.774
垢版 |
2022/08/04(木) 22:28:49.37ID:puvcQAIF0
どなたかよろしくお願いいたします...

> 京都大学オープンコースウェア(OCW)の閉鎖について
> 京都大学高等教育研究開発推進センターは2022年9月末に廃止されることになりました。京都大学オープンコースウェア(OCW)も、残念ながら9月中旬以降にサイトを閉鎖することになりました。2005年以来、京都大学OCWをご利用いただき誠にありがとうございました。
https://ocw.kyoto-u.ac.jp/news/6/
0821192.168.0.774
垢版 |
2022/08/09(火) 02:33:23.62ID:ke8LkrWk0
pinkのスレすげえ保存難しくね?
0822192.168.0.774
垢版 |
2022/08/09(火) 03:02:05.89ID:ke8LkrWk0
現状だと5ch-ranking.comが取得してるものはそれをアーカイブすることで一応可能だが
ここがキャッシュしてないスレがお手上げ状態
0823192.168.0.774
垢版 |
2022/08/26(金) 16:06:28.90ID:KLH4TeT40
.ph/ で保存したつもりのエラーページが破棄されてるのか出てこなくなった
0824192.168.0.774
垢版 |
2022/09/02(金) 07:30:26.49ID:+0hUFwJw0
ghostはノロノロ待たせてエラー吐くようになった。
成仏かなー。
0825192.168.0.774
垢版 |
2022/09/09(金) 15:03:28.96ID:Lhk1DeNO0
[CEDEC 2022]「復刻できないあのゲームを、合法的にプレイできるようにするために、今できること」レポート。キーワードは裁定制度と納本制度
https://www.4gamer.net/games/999/G999905/20220826060/


[CEDEC 2022]スクウェア・エニックスの過去資産サルベージプロジェクトの“今”が語られた「実践!資料保存活動の現場編」聴講レポート
https://www.4gamer.net/games/999/G999905/20220826086/


[CEDEC 2022]ゲームは大きな財産。ゲーム展示や開発資料の活用方法を,多様な見地から俯瞰する
https://www.4gamer.net/games/999/G999905/20220826043/
0826192.168.0.774
垢版 |
2022/09/09(金) 20:33:37.78ID:XkqpAB1c0
この運動をしてる人らの興味関心がそうなのか、古いゲームにしか目を向けられてないが、
ソシャゲも頼むわ
雨後の筍のごとく出てくるのにサ終で何も残らないんよ
0827192.168.0.774
垢版 |
2022/09/10(土) 04:45:47.90ID:Np9v8fvP0
>>826
ブラウザゲーで公開されてるファイルの一部はたまにアーカイブに送ってるが
flashゲーみたいに動作する状態での保存はできんからな
JAVAのですら内部で呼び出すファイルのアドレスが書き換わってしまうためにそのままでは動かん
0828192.168.0.774
垢版 |
2022/09/10(土) 22:55:52.26ID:OKuA9sBP0
ソシャゲがソシャゲであるためにはサーバ側の処理が不可欠
サービスが終了してるならもう何も出来ない
0829192.168.0.774
垢版 |
2022/09/10(土) 23:18:51.94ID:svSJBUbd0
そのサーバー側の処理も含めてどうにかスタンドアローン化するか、
それが非現実的な場合は動作する状態でなくても、
静的な状態でも良いから何かしらのアーカイブ化をしてほしいわけだ
0830192.168.0.774
垢版 |
2022/09/11(日) 14:14:25.65ID:XkRKFEua0
海外だとオフライン版とか勝手に作られてるし、
単にスキルないだけ
0831192.168.0.774
垢版 |
2022/09/11(日) 22:27:35.18ID:+H/C2qB+0
1万人より100万人、100万人よりも1億人というふうにファンの裾野が広ければ上位個体が発生するし、野良サーバーも生まれ、語り部サーバーになる。
0832192.168.0.774
垢版 |
2022/09/13(火) 18:31:00.61ID:taJfRpp70
https://twitter.com/kitoakari_1016/status/1569191723062149121

https://twitter.com/kitoakari_1016/status/1569204688545021952

https://twitter.com/kitoakari_1016/status/1569321693453381632

これらのページの過去のデータがインターネットアーカイブに保存されていない?
クローラー回ったのにそれぞれ公開されたとき保存する人が居なかったのか?
それとも拒否された?
https://twitter.com/5chan_nel (5ch newer account)
0833sage
垢版 |
2022/09/13(火) 20:29:41.72ID:taJfRpp70
そんなにURがヤバイ性能だったら3周年まで実装するのは待てとあれほど・・・。
なぜ周年前に実装した?

前年の8月のフェス限やパーティ限もそうだったし。
0834192.168.0.774
垢版 |
2022/09/13(火) 20:30:14.92ID:taJfRpp70
>>833の書き込みは間違いでした。
失礼しました。
0835192.168.0.774
垢版 |
2022/09/15(木) 20:24:22.68ID:+VNL1tON0
NY市の「9/11トリビュート・ミュージアム」が恒久的に閉鎖 コロナ禍の財政難で
https://www.cnn.co.jp/amp/article/35192027.html

>発表によれば展示品や記録映像の大半は、ニューヨーク州オルバニーにあるニューヨーク州博物館に移される。

>ただミュージアムのウェブサイト自体は今後もオンライン上で存続する。↓
https://911tributemuseum.org
0837192.168.0.774
垢版 |
2022/10/07(金) 14:10:07.48ID:Gm23UfBP0
teacup.掲示板 何とかしてでも自動でクロールしてIAに保存すればよかったと思ってる。
そんな技術自分には無いけど後悔してる。
0838192.168.0.774
垢版 |
2022/10/25(火) 09:42:16.70ID:5dp/GsMD0
それも人生
0840192.168.0.774
垢版 |
2022/11/09(水) 22:03:50.96ID:KJLZEhd40
こんなのあったんか・・・見たかったとこはリンク切れのアーカイブやった残念
0841192.168.0.774
垢版 |
2022/11/10(木) 03:14:11.27ID:65CCCiKn0
>>839
インターネットアーカイブにはデータ渡してあるのかな
0842192.168.0.774
垢版 |
2022/11/12(土) 22:00:11.37ID:hJ1L2Sdc0
ヤフーニュースだとコメント欄部分の数行ダイジェストは閲覧都度ライブで取りに行ってるみたいだな。👍👎の数を見るとわかる
0843192.168.0.774
垢版 |
2022/11/12(土) 22:04:03.57ID:hJ1L2Sdc0
.orgでカレンダー日付にポインタ当てて保存時刻を選ぶ奴が出てくるまでのグールグール♪がクソ長くて苛々することがある。
0844192.168.0.774
垢版 |
2022/11/13(日) 09:45:33.49ID:oaOJTvfG0
>>843
前は早かったんだけどな
段々遅くなってる気がする
0845192.168.0.774
垢版 |
2022/11/16(水) 06:37:25.11ID:MBOIyKEq0
.phのqueue待ちで最後の最後に変な表示でエラーとか最悪
0846192.168.0.774
垢版 |
2022/11/18(金) 07:00:39.92ID:KRegOq6w0
>>754
12/1からウェブリブログも終了するからURL収集して後悔のないようにしないと
0847192.168.0.774
垢版 |
2022/11/24(木) 14:14:44.58ID:eU6nWylr0
.ghostは長く待たされた挙句に保存も出来ないフェイクサイトになり果てた模様
0849192.168.0.774
垢版 |
2022/11/26(土) 02:39:51.92ID:XEVjePrl0
todayは今モルドバ鯖がメインか。
twitter直撮りは待たされるけどインスタンス系は200queueごぼう抜きですぐ終わる謎の現象。
0850192.168.0.774
垢版 |
2022/11/27(日) 17:59:57.39ID:BvGPumAM0
このサイトにアクセスできませんweb.archive.org で接続が拒否されました。
次をお試しください

接続を確認する
プロキシとファイアウォールを確認する
ERR_CONNECTION_REFUSED
0851192.168.0.774
垢版 |
2022/11/29(火) 00:39:41.77ID:dQ2KTYIn0
.org、カレンダー画面にも表示されるのに保存されてない謎の症状。
0852192.168.0.774
垢版 |
2022/12/01(木) 12:36:42.61ID:Ra0VHK8/0
恩赦の余波
The capture will start in ~* minute, ** seconds because we are doing too many captures of twitter.com right now. You may close your browser window and the page will still be saved.
0853あめ ◆P0jSlC5fJs
垢版 |
2022/12/02(金) 17:25:06.69ID:cfSG1PGB0
ニコニコミュニティの掲示板のレスをすべてアーカイブする方法を教えてほしい
なんかdatで取れたような気がする
0855192.168.0.774
垢版 |
2022/12/12(月) 01:11:37.20ID:Av3sCgkO0
そら困ったな
0856192.168.0.774
垢版 |
2022/12/14(水) 16:31:20.77ID:SaVczf8Y0
Twitter公式やGoogleウェブの日本語検索結果ページを直接取ると文字化けしちまうからArchive.isに取ったやつを複取りしてたが常時取得エラーになってしまった。
0858192.168.0.774
垢版 |
2023/01/13(金) 23:27:21.56ID:rKU1x0K50
0860192.168.0.774
垢版 |
2023/02/06(月) 18:08:17.44ID:sbf557/90
ここって個人運営だけどメディアに紹介されてるような有名サイトの終了の情報貼るのは駄目ですか?
0861192.168.0.774
垢版 |
2023/02/06(月) 18:09:42.52ID:sbf557/90
>>860
若干訂正
「個人運営だけどメディアに紹介されてるような有名サイト」です
0862192.168.0.774
垢版 |
2023/02/13(月) 21:41:19.47ID:DUzuNsxg0
別に良いんじゃない?
0864192.168.0.774
垢版 |
2023/02/19(日) 11:21:00.06ID:fZ1Jytpd0
とりあえずIAで保存実行してみたけどすでにやってあったみたいだね
ブログ記事は個別保存していかないとだめかな?
0865192.168.0.774
垢版 |
2023/03/01(水) 23:44:12.47ID:4Lv8OVCl0
世界的には結構アーカイブサイトは変動してるんだな。
元サイトによって尻切れトンボになったりの対策・使い分けで複数使ってるけど。
なんかツイッターの凍結アカはアーカイブ無視して現在情報参照させられてる気がするんだが気のせいか?
0866192.168.0.774
垢版 |
2023/03/04(土) 06:02:15.03ID:xrbGQDNX0
3年くらい?前からIAのIPが@wikiにスパム扱いされてるみたいで
アーカイブ取ろうとしても専用ページにジャンプさせられるから取れないな
0867192.168.0.774
垢版 |
2023/03/04(土) 22:49:21.39ID:piyyUyni0
ghostはクソだな


nginx error!
The page you are looking for is temporarily unavailable. Please try again later.
Website Administrator
Something has triggered an error on your website. This is the default error page for nginx that is distributed with Fedora. It is located /usr/share/nginx/html/50x.html

You should customize this error page for your own site or edit the error_page directive in the nginx configuration file /etc/nginx/nginx.conf.

[ Powered by nginx ] [ Powered by Fedora ]
0868192.168.0.774
垢版 |
2023/03/07(火) 00:57:35.23ID:jOe6rLBG0
まったくだ
0869192.168.0.774
垢版 |
2023/03/09(木) 14:34:48.09ID:01o/RAs/0
IAの保存ツイートは"Something went wrong. Try reloading."に置換されてるのか
0870192.168.0.774
垢版 |
2023/03/27(月) 16:00:14.90ID:x3Vx/oK90
IAさん、フェアユース認められず敗訴
storage.courtlistener.com/recap/gov.uscourts.nysd.537900/gov.uscourts.nysd.537900.188.0.pdf
UNITED STATES DISTRICT COURT SOUTHERN DISTRICT OF NEW YORK
The plaintiffs in this action, four book publishers, allege that the defendant, an organization whose professed mission is to provide universal access to all knowledge, infringed the plaintiffs’ copyrights in 127 books (the “Works in Suit”) by scanning print copies of the Works in Suit and lending the digital copies to users of the defendant’s website without the plaintiffs’ permission.
The defendant contends that it is not liable for copyright infringement because it makes fair use of the Works in Suit. See 17 U.S.C. § 107. The parties now crossmove for summary judgment. For the following reasons, the plaintiffs’ motion for summary judgment is granted, and the defendant’s motion for summary judgment is denied.
ユナイテッド・ステーツ・ディー・コート ニューヨーク州南部地区
本訴訟の原告である書籍出版社4社は、あらゆる知識への普遍的なアクセスを提供することを使命とする団体である被告が、原告の許可なく訴訟作品の印刷物をスキャンしてデジタルコピーを被告のウェブサイトの利用者に貸し出すことにより、127冊の書籍(「訴訟作品」)に関する原告の著作権を侵害したと主張するものである。
被告は、訴訟著作物を公正に利用しているため、著作権侵害の責任を負わないと主張している。合衆国法典第17編第107条を参照。現在、両当事者は略式判決を求めて交差している。以下の理由により、原告の略式判決申立は認められ、被告の略式判決申立は却下される。
0871192.168.0.774
垢版 |
2023/03/28(火) 19:07:26.59ID:YVjB5VmQ0
>>870
緊急図書館は正直やり過ぎだったな
あれのせいで目を付けられた
0872192.168.0.774
垢版 |
2023/03/29(水) 08:34:35.07ID:oezul0dK0
順番待ち長すぎてツイート魚拓はSwwTr(Something went wrong. Try reloading.)多い
0873192.168.0.774
垢版 |
2023/04/03(月) 11:35:00.72ID:pCaKP+8h0
Instagramのユーザーページ(www.instagram.com/{ユーザー名}/)見れなくなってる。投稿記事は見れるが。


ページが見つかりません • Instagram

このページはご利用いただけません。
リンクに問題があるか、ページが削除された可能性があります。Instagramに戻る
0874192.168.0.774
垢版 |
2023/04/03(月) 19:18:59.97ID:pCaKP+8h0
Instagramのユーザーページって、IAもarchive.isもウェブ魚拓もキャッシュ取れないよね…?
キャッシュ取れるアーカイブサイトってある?

IAは、ログイン画面にリダイレクトされたり、「Please try again in ~600 min. Crawling this host is paused because they notified us that they are overloaded right now.」
archive.isは、Not Found (yet?)  投稿記事(/p/*)は取れたり取れなかったり。
ウェブ魚拓は、robots.txtブロック
0875192.168.0.774
垢版 |
2023/04/05(水) 20:48:48.79ID:cywY8s8c0
英語wikiのList of Web archiving initiativesでも参照してインスタ保存出来てるところを探すしかないかな
0876192.168.0.774
垢版 |
2023/04/08(土) 01:43:21.82ID:wb01j5vG0
画像データだけは直リンクで取れたと思う
0880192.168.0.774
垢版 |
2023/04/14(金) 15:47:25.69ID:NWabO92K0
混雑で遅延になるくらいなら寄付額で優先度振り分けすればいいのになー、使い物にならんよ

アーカイブサイト運営が忖度で混雑を放置してないかね
0881192.168.0.774
垢版 |
2023/04/14(金) 16:15:57.47ID:NWabO92K0
際どい内容を発表するときはアーカイブが混雑している時間帯にすれば良いってことになるな
0882192.168.0.774
垢版 |
2023/04/16(日) 23:13:03.25ID:6MwVud6d0
.todayはpdfが間抜けな尻切れトンボになって分散保存にもならない
0883192.168.0.774
垢版 |
2023/04/18(火) 02:36:39.85ID:ZB8dEz+O0
todayはpdfは対応してないって言ってた気がする
0885192.168.0.774
垢版 |
2023/04/21(金) 14:15:21.67ID:WZpfvCf90
サービス終了難民の類にグロや児ポが含まれてればアーカイブ運営に削除要請来たり閉鎖の危機は予想できる所
0886192.168.0.774
垢版 |
2023/05/06(土) 13:21:12.20ID:7npAI4V10
Haasie: imgurの画像をアーカイブするサイト
https://haasie.com

【使い方】
テキストボックスに https://i.imgur.com/* のリンクを改行区切りで入力して Backup をクリック
保存後は https://i.haasie.com/* のリンクから閲覧可能


5月15日に、ポルノ画像・匿名ユーザーが投稿した非アクティブコンテンツが削除されるという報告を受けて開発に至ったとのこと
↓開発者の投稿
https://news.ycombinator.com/item?id=35835971
0887192.168.0.774
垢版 |
2023/05/09(火) 05:07:53.59ID:XNJpBCSJ0
イーロン・マスクがTwitterの非アクティブアカウントを削除していると発表
https://twitter.com/elonmusk/status/1655608985058267139

Twitterポリシーによると30日以上ログインしていないと非アクティブ判定
長期間非アクティブ状態だと削除される可能性あり
https://help.twitter.com/en/rules-and-policies/inactive-twitter-accounts
https://twitter.com/5chan_nel (5ch newer account)
0888192.168.0.774
垢版 |
2023/05/09(火) 08:04:54.63ID:pNdYyC010
>>887
中国のqqとかいうやつと同じ事してて草
イーロン・マスクはチャイニーズだった!?
0889192.168.0.774
垢版 |
2023/05/09(火) 17:49:19.14ID:GhFHYYjY0
 
↓ポルトガルのサービスらしいけどココはWebページの保存が出来るわけじゃないのかね?

https://arquivo.pt/
0890192.168.0.774
垢版 |
2023/05/10(水) 05:37:33.82ID:mRmRJ/wr0
保存はできるけど特定国から集中するとポリシー変更、削除、閲覧ブロックはあり得る
》Termos e Condições
》O Arquivo.pt é um serviço disponibilizado em www.arquivo.pt, da responsabilidade e gestão da FCT| FCCN cujo objetivo é o arquivo periódico de conteúdos portugueses disponibilizados publicamente na Internet e posterior disponibilização ao público através de um sistema de pesquisa integrado.
(deepl翻訳)ご利用条件
Arquivo.ptは、FCT|FCCNの責任と管理のもと、www.arquivo.pt、インターネット上で公開されているポルトガル語のコンテンツを定期的にアーカイブし、統合検索システムを通じて一般に提供することを目的としたサービスです。
》Caso a FCT|FCCN tenha conhecimento de que está a armazenar conteúdos cuja ilicitude for manifesta, procederá nos termos do Decreto-Lei n.º 7/2004 de 7 de janeiro, impossibilitando o acesso aos mesmos.
(deepl翻訳)FCT|FCCNが、不正な性質が明らかなコンテンツを保存していることを知った場合、1月7日の法令第7/2004号の条項に従って手続きを行い、これらのコンテンツへのアクセスを不可能にするものとします。
0891192.168.0.774
垢版 |
2023/05/10(水) 05:57:42.94ID:FTjMaooS0
>>888
キンペーと共依存なの知らんのか?
あいつが目指してるのは中国的な支配構造だぞ
0892192.168.0.774
垢版 |
2023/05/10(水) 15:24:20.34ID:MwZh1enT0
【Twitter】ツイッター休眠アカウント削除 30日に1回ログイン必要に [837857943]
https://hayabusa9.5ch.net/test/read.cgi/news/1683581318/

【SNS】ツイッター、休眠アカウント削除へ アーカイブ化とマスク氏 [田杉山脈★]
https://egg.5ch.net/test/read.cgi/bizplus/1683624208/

【Twitter】イーロン・マスク「30日に1回はログインしなきゃアカウントBANね」Twitter民阿鼻叫喚
https://greta.5ch.net/test/read.cgi/poverty/1683626336/
0894192.168.0.774
垢版 |
2023/05/16(火) 03:10:26.10ID:1h5RbfcV0
>>893
odnのホームページのホスト名はこの2つっぽいな
www1.odn.ne.jp
www2.odn.ne.jp
0895192.168.0.774
垢版 |
2023/05/17(水) 14:23:07.05ID:oETQfxsR0
.pt試してconclude押してしばらく待ったけど通らないのか時間差なのか分からん状態
0896192.168.0.774
垢版 |
2023/05/18(木) 07:36:46.89ID:CO9ZGfrQ0
同じドメインのページを他の人は.ptで録れてるのに俺の要望が通らないのはなぜだろう
0897192.168.0.774
垢版 |
2023/05/19(金) 11:14:45.53ID:Po3S6t3r0
ブラウザの標準機能の範囲でVPNも試したが駄目だった
0898192.168.0.774
垢版 |
2023/05/20(土) 15:29:42.73ID:T4pkTbRc0
わざわざそこ使う必要ある?
0900192.168.0.774
垢版 |
2023/05/21(日) 12:38:09.77ID:h7w7HN4Y0
長期的にはtodayもorgもどうなるか分からないから開拓地が必要
0901192.168.0.774
垢版 |
2023/05/21(日) 18:20:50.04ID:xet5iWQI0
wayback machineだけが信頼できる
0902192.168.0.774
垢版 |
2023/05/21(日) 19:01:33.72ID:h7w7HN4Y0
wayback machineもtodayも特定条件ではスクリプトが原本サイトに取りに行ってるようなんだよね
貫通現象とでも呼ぶべきか
0905192.168.0.774
垢版 |
2023/05/28(日) 21:34:12.91ID:OLDh0esP0
静的HTMLページを手軽に生成・シェアできる https://txti.es が2023年7月1日に閉鎖
相次ぐ悪用に耐えかねたらしい
0908192.168.0.774
垢版 |
2023/06/01(木) 11:59:37.14ID:Zyr5NdMH0
>>907
るしあと再会できたわありがとう
0909192.168.0.774
垢版 |
2023/06/11(日) 17:50:18.74ID:BFKhT9Er0
RedditのAPI値上げ声明に対し、サードパーティアプリ淘汰に繋がると大規模ストライキ決行へ
明日月曜日から4000以上のコミュニティが非公開になる模様
無期限非公開のリスクに備えてArchiveTeam Warriorは絶賛フル稼働中

Reddit blackout: Subreddits to go private on Monday
https://www.bbc.com/news/technology-65855608
ブラックアウトトラッカー
https://reddark.untone.uk
ArchiveTeam has saved over 10.8 BILLION Reddit links so far. We need YOUR help running ArchiveTeam Warrior to archive subreddits before they're gone indefinitely after June 12th! : DataHoarder
https://reddit.com/r/DataHoarder/comments/142l1i0/archiveteam_has_saved_over_108_billion_reddit/
0910192.168.0.774
垢版 |
2023/06/20(火) 06:12:37.22ID:80zqFpd30
Lord
0914192.168.0.774
垢版 |
2023/07/03(月) 19:42:30.30ID:SZEw+3KY0
ArchiveBoxって捏造に使われやしないかちと心配
0915192.168.0.774
垢版 |
2023/07/05(水) 17:12:47.46ID:x3g1nPM10
>>914
あれは自分のコンテンツを保存することが目的なので、そもそも証明手段にはならないよ
0916192.168.0.774
垢版 |
2023/07/18(火) 23:05:41.66ID:wJHDKi820
レトロゲームの87%はもう遊ぶことができなくなっている
https://gigazine.net/news/20230711-retro-games-disappearance/

現在も入手可能なレトロゲームは1割程度。アーカイブが困難すぎるゲーム業界
https://www.gizmodo.jp/2023/07/difficulty-in-obtaining-retro-games.html

>映画『タイタニック』がVHSでしか手に入らないようなものです。
もし、博物館のガラスケースの中で再生されている状態でしか『タイタニック』を見る術がないとしたらどう思いますか?
0917192.168.0.774
垢版 |
2023/07/28(金) 18:20:51.34ID:ui0JR2g50
archive.today死んでる?
アクセスしても「Welcome to nginx!」って表示される
0918192.168.0.774
垢版 |
2023/08/17(木) 18:48:37.12ID:HU46gLci0
愚痴なんだが、
Twitterの各アカウントのトップページに出るツイートが、「X」に変わった辺りからツイート並び順の仕様が変わったせいで、最新のツイート順に魚拓できなくて結構困る。


いつのまにかIAの3200件ツイート保存機能って無くなったんだな。
0919192.168.0.774
垢版 |
2023/08/17(木) 18:50:01.69ID:HU46gLci0
愚痴なんだが、
Twitterの各アカウントのトップページに出るツイートが、「X」に変わった辺りからツイート並び順の仕様が変わったせいで、最新のツイート順に魚拓できなくて結構困る。。。


いつのまにかIAの3200件ツイート保存機能って無くなったんだな。
0920192.168.0.774
垢版 |
2023/08/18(金) 08:05:33.38ID:DfG01Ot20
Googleのポリシー変更に伴い、2年間非アクティブなGoogleアカウントが2023年12月1日から削除対象へ

> Googleアカウントが少なくとも2年間使用またはサインインされていない場合、Googleワークスペース(Gmail、ドキュメント、ドライブ、ミート、カレンダー)およびGoogleフォト内のコンテンツを含む、アカウントとそのコンテンツを削除する場合があります。


アクティブ判定の基準など詳細情報は下記記事参照

無効な Google アカウントに関するポリシーを更新しました(2023/5/19)
https://japan.googleblog.com/2023/05/GoogleAccount.html
無効な Google アカウントに関するポリシー
https://support.google.com/accounts/answer/12418290?hl=ja
0921192.168.0.774
垢版 |
2023/08/18(金) 09:08:51.44ID:12R/F5090
テクノロジー系ニュースサイトCNETが、検索エンジンのSEO対策として古い記事を大量削除していることが内部情報により判明
この手法はcontent pruningと呼ばれるSEO対策のひとつとして確立されている模様

Googleはこれを受けて反論ツイートを投稿、なおその反論に対し懐疑的な意見を持つネットユーザーも多く見受けられる


日本のニュースサイトの場合は、過去記事を削除するなんてのは当たり前で、数ヶ月前の記事が見られないなんてことはザラだからそれ以前の問題なんだけども

CNETがGoogle検索のランキングを向上させるために古い記事を大量削除、一方でGoogleは古いコンテンツでも大丈夫だと反論(2023/8/10)
https://gigazine.net/news/20230810-cnet-delete-article-google-seo/
0922192.168.0.774
垢版 |
2023/08/20(日) 17:06:13.52ID:6wDSbppV0
あsdf
0923192.168.0.774
垢版 |
2023/08/20(日) 17:19:59.50ID:6wDSbppV0
Twitterにはログインしない程のユーザーだけど、archive.isですら確実に冪等的にツイートを保存しづらくなった仕様改変、本当残念。

「Not Found (yet?)」になったり、mhtml保存も途中のツイートが見切れたり、

「ツイート書き込みの証拠を残す」とかも結構困難だろうなと。
0925192.168.0.774
垢版 |
2023/09/05(火) 18:46:00.55ID:+CTFTnL00
もう5chのスレも、IAではError code 520を返されたり、archive.isですら「Not Found (yet?)」で取得できなかった。

書き込みや閲覧の専ブラの規制もキツイ5ch。
0926192.168.0.774
垢版 |
2023/09/08(金) 11:24:01.79ID:qKw8POOn0
ウェブ魚拓保存する度にreCAPTCHAテストで、6問ぐらい出されてちゃんと画像を選んでるのに「もう一度お試しください。」

それを何回もやってるのに失敗になって嫌気がさしてくる。わしゃロボットか。


Chromeのシークレットウィンドウで魚拓を人力で取ってるのに。
0927192.168.0.774
垢版 |
2023/09/08(金) 11:30:01.67ID:qKw8POOn0
> エクスポート機能もないような閉鎖的プラットフォームにせっせと投稿するような間違いを、人はなぜ何度も繰り返すのか?
https://youkoseki.com/f/2021_html

5ch(2ch)もTwitterみたいに使い捨てなプラットフォームになってしまったのだと。と今更気付いた。

ブラウザでスレを見てても重いし。


「書きこみ&クッキー確認」画面の時点で強制スルーされ書きこまれちゃうし。
0929192.168.0.774
垢版 |
2023/09/09(土) 09:51:01.35ID:3736ejUH0
今のTwitter(X)は、板チョコ1枚を全部バラしてしまってる状態に近い。

未ログインだと、バラバラに切り割れ分けられたダミー(※)な板チョコになるが、
ログインすると、一部分だけ、割られてない板チョコを享受できる。


※食品サンプルとか。
0930192.168.0.774
垢版 |
2023/09/09(土) 10:11:00.78ID:3736ejUH0
日本人(団体でなく個人)のTwitterの使い方としては、口コミや陰口の延長だと思っている。

----

日本人以外の使い方の傾向や海外事情は知らないが、もしXが日本のその傾向を理解か把握が無くシステムを変えてるとす
ると、方針が合わなかったり融通が利かなくなってくる可能性。

単に一般論で、使う側の事情や使い勝手を把握してないと使いづらくなる。に過ぎないだろうが。
0931192.168.0.774
垢版 |
2023/09/09(土) 10:45:01.20ID:3736ejUH0
NHKの番組とかでも見る、現TwitterとXでの表記揺れについて
X(Twitter)
Twitter(X)
TwitterX


など表記に色々候補があると思うが

x=Twitter なら、一般向けに限っては「Twitter」表記のままでいい気がした。
0933192.168.0.774
垢版 |
2023/09/09(土) 11:24:00.81ID:3736ejUH0
09時半過から逃避してか駄弁ってたら、もうこんな時間…。
0934192.168.0.774
垢版 |
2023/09/09(土) 11:29:01.86ID:3736ejUH0
情報が捌けなくなってる…
0935192.168.0.774
垢版 |
2023/09/09(土) 11:35:00.87ID:3736ejUH0
このスレッドのレス、どちらかというとツリー型の方がいいな。多分。
0936192.168.0.774
垢版 |
2023/09/13(水) 08:30:28.19ID:j3jMns/A0
ブラウザで
archive.todayを叩くと
archive.phにリダイレクトして
↓の画面になるんだけど
https://i.imgur.com/rIj3UMI.png

ドメインが.isに変わったのが反映されてない?
DNSサーバーの設定か何かが間違えてんのかな?
0937192.168.0.774
垢版 |
2023/09/13(水) 09:53:53.31ID:P4XBRFsg0
ツイート保存はnitterでも良くね?まあ訴訟絡みには使えないだろうし、nitterの有志サーバーが飛んだら個々の仕様検証も出来なくなるので脆弱だが
0939192.168.0.774
垢版 |
2023/09/16(土) 23:10:40.53ID:Ow+h1ktP0
>>938
普通にInternetArchiveでいい気がするけど
まぁ分散化されるのは良いこと
0941192.168.0.774
垢版 |
2023/09/23(土) 22:08:25.17ID:Zvh9/x5L0
>>937
なんでnitterだと訴訟で使えなくなるの?
0942192.168.0.774
垢版 |
2023/09/26(火) 03:07:26.06ID:NdzKENx+0
Internet Archiveに保存されてるサイトをローカルに保存したいんだが、良い方法はないか
wgetは何かうまくいかないしブラウザで一ページずつ保存するのも面倒
0944192.168.0.774
垢版 |
2023/09/30(土) 00:38:53.02ID:QkH/6pUe0
どんなことでも相談してみて。助けるよ。
0945ぼやき
垢版 |
2023/10/01(日) 08:22:04.23ID:RnrJ/PMK0
X/Twitterについてもあまり詳しくないけど

Nitterってnitter.netが大元な本家でいいんだよな‥? (他: nitter.1d4.us nitter.cz)

でもnitter.netでのツイートをarchive.isで保存しようとすると、Not Found (yet?)で必ず失敗して保存できない覚えがあったような。


(nitter.)czの場合は、保存できた覚えがあるけど、czやusなどのNitterミラー版の発信元や信頼性って不明な印象で(※自分はまだ調べてない)、

もしページを信頼性も保ったまま恒久的に残そうとしたら総合的にはnet版以外のNitterは何かうまくいかなさそうな印象が。
0948で、
垢版 |
2023/10/01(日) 08:54:01.82ID:RnrJ/PMK0
そんな事よりも、

Nitter(>>937)といい、ArchiveBox(>>0914)といい、それらをここで最近知ったけど、

皆どこで そういう便利な物があるっていう事を知り得てるの? ツイッター?ニュースサイト?
0949946の続き
垢版 |
2023/10/01(日) 09:26:01.85ID:RnrJ/PMK0
(この場合、やっぱりここ ツリー型の方が見やすいんだろうな…。)

----

詰まるところ


nitter.czで見た物と
nitter.netで見た物、

「どちらも原本である」っていう事が分かるようにできればいいんだろうな。

(なんなら「twitter.comとNitterが同一であるか? またはそれを証明可能か?」ができればいいんだろうが。)
0950949
垢版 |
2023/10/01(日) 09:39:01.87ID:RnrJ/PMK0
そうなると、Web3(ブロックチェーン)???

超うろ覚えだけど、あれってあれなのか。エンドユーザーに浸透するの?
0951192.168.0.774
垢版 |
2023/10/01(日) 12:53:27.91ID:QbUlJotb0
>>949
TwitterとNitterの違いはツイートの時間表記だけ
Twitterは日本時間だけどNitterはUTCになってる
でもアカウント名、IDとかツイート内容は同じだから同一であると証明できるんじゃないですか
0952192.168.0.774
垢版 |
2023/10/02(月) 01:30:11.89ID:3/wo9WhU0
>>943
ありがとう
これはなかなか良い
リンクをローカル用に修正してくれないのが欠点だが、保存だけなら完璧
0953192.168.0.774
垢版 |
2023/10/05(木) 15:54:01.76ID:i6GCcsDS0
ここはお前のTwitter(X)やブログじゃないんだから毎度だらだら連投しないである程度考えまとめたり結論出してから1つのレスで書き込んでくれないか
0954950
垢版 |
2023/10/05(木) 21:51:08.86ID:NdAg2WJu0
意外と読んでる人いるのね、このスレって。レスの勢いが鈍行なので。

てっきり、(>>950までの途中過程の)自分のレスは、取捨して読み飛ばしてくれてるものだと思ってた。(ちなみに >>945を書き込んだ際は、間違ってageてしまった。)



>>951
「Nitter側が、本当にツイート内容などを改竄してないか?」「ツイート内容変更後に、原本(Twitter)とNitterで差異が無いか?」とかの証明は難しいんでしょうね。
0955931
垢版 |
2023/10/06(金) 07:48:00.80ID:iu8iKKZW0
>>931-932
なんとなく表記揺れをまとめると

X(旧Twitter)
X(Twitter)
Twitter(X)
TwitterX
x=Twitter (従来通りTwitter表記呼称、あるいは Xと書いて 読みはツイッター)
Twitter/X
X/Twitter
x.com (https://www.affility.co.jp/?p=1770 )
0956192.168.0.774
垢版 |
2023/10/06(金) 10:37:09.47ID:iu8iKKZW0
昨夜あたりから、archive.isで ウェブ魚拓(トップページ)を保存しようとすると、

「Welcome to nginx!」画面になって、再アクセスすると

「このサイトにアクセスできません archive.is からの応答時間が長すぎます。」

と、一定時間アクセスできなくなる気がする。

例: https://archive.is/submit/?submitid=sxIrd9y3YbEtDKkLjC8I3IfsId506PIYo1H3XOT5fjyjpXszt70KHIOege2rgiV3&url=http%3A%2F%2Fmegalodon.jp%2F


もしかしたら、archive.isの使用者ごと弾かれるNGなサイトURLでもあって、archive.is側は判定しているんだろうか?

しかし、5chも重いなあ…最近。
0957192.168.0.774
垢版 |
2023/10/10(火) 14:48:25.08ID:AfINMwgb0
>>943
まNitterのほうがX(Twitter)本体のUIよか圧倒的に挙動も軽いから、訴訟以外のバックアップ取りなら最強だけどな
0958192.168.0.774
垢版 |
2023/10/11(水) 18:05:55.84ID:xUx5SPHW0
Archive todayに削除依頼を送っているんだけど、こいつほんまに通さないな。
良い方法ない?
0959192.168.0.774
垢版 |
2023/10/11(水) 20:18:18.45ID:jHEB4zsh0
archive.todayの削除に成功したのってはるかぜちゃんの新しい方の弁護士と尊師だけなんじゃなかったっけ
確か現地の弁護士経由かつかなりしっかり動かないと全部突っぱねられるんじゃなかった?
0960192.168.0.774
垢版 |
2023/10/11(水) 20:55:34.32ID:xUx5SPHW0
>>956
このまま潰れてくんねぇかな。
0961192.168.0.774
垢版 |
2023/10/11(水) 20:56:39.25ID:xUx5SPHW0
>>959
流石にふざけてると思うわ。
0962192.168.0.774
垢版 |
2023/10/11(水) 20:57:58.76ID:xUx5SPHW0
法的手順をチラつかせたら削除されたってヤフー知恵遅れを見たが、どうなんだろうな。
0963192.168.0.774
垢版 |
2023/10/11(水) 21:06:00.49ID:EL8C4Tol0
ドメインも著作権も全部自分に帰属してるんだがな。
ウェイバックマシンは、テキストファイルを用意して、サイトにアドレス置いたら消してくれたんだが。
こいつは、手順も不明確且つ削除してくれる望みが薄そう。
どうかしてるぜ。
0964192.168.0.774
垢版 |
2023/10/11(水) 21:07:44.35ID:xUx5SPHW0
DMCAとかで検索エンジンから表示は消せても、ウェブサイトの削除依頼はできないんだからなぁ
どうにかならんもんかね。
0965192.168.0.774
垢版 |
2023/10/11(水) 21:32:14.34ID:xUx5SPHW0
ISPに通報するのが有用とも聞いたけどどうなの?
0966192.168.0.774
垢版 |
2023/10/12(木) 02:18:23.64ID:7bMyoE320
サービスが終了しそうになっても、誰かしら引き継いだり売ったりするんじゃないのか?
まぁそもそもインターネットアーカイブのサービス終了ってのは想像がつかないが。
0967192.168.0.774
垢版 |
2023/10/12(木) 02:21:30.42ID:7bMyoE320
実際、運営は個人レベルだったはずだから、寿命を迎えれば消えてなくなるかもな。
それ相応の団体化するとそう簡単には行かないが。
それこそ寄付金があるからな。あれが潰れるってのはあまり考えれられない。
0968192.168.0.774
垢版 |
2023/10/12(木) 22:24:19.71ID:Cc0NPZ9j0
>>965
todayは何度もドメイン変えたり、過去に児ポ通報攻撃にあっても生き残ってるので無理じゃないかな
まぁURL分からなきゃまず誰もアクセス出来ないし、諦めて忘れた方が良いと思う
0969192.168.0.774
垢版 |
2023/10/14(土) 17:33:19.38ID:Jcc+eBcl0
早い話、日本人のnitterサーバー管理者を証拠申請すれば済むような
0971192.168.0.774
垢版 |
2023/10/16(月) 11:41:38.02ID:azdWzTrc0
セルフホストしたらええんちゃう
tps://matoken.org/blog/2021/02/17/self-hosting-the-lightweight-twitter-front-end-nitter/ ↩
0972192.168.0.774
垢版 |
2023/10/16(月) 17:36:48.55ID:BkCyhBrA0
.orgだとイスラエル首相がツイートした焼死赤子の写真が全部"Hmm...this page doesn’t exist. Try searching for something else."
.todayで1件だけ見れる
0973192.168.0.774
垢版 |
2023/10/18(水) 16:16:06.14ID:RIuGCdRE0
今気づいたんだけどツイートの直リンクだとログインなしで見れるのね
Nitter からスクレイプして直リンク取得でwaybackmachineに打ち込めるやん!
0974192.168.0.774
垢版 |
2023/10/19(木) 17:03:11.12ID:YZO3LNYf0
>>973
一部見れないツイートがあるのと(おそらくR18認定)、リプライが見れなくなったから一つひとつアーカイブしなきゃいけないけどね
0975192.168.0.774
垢版 |
2023/10/19(木) 18:32:56.68ID:BbSSQwx/0
nitterはシクブラとか職場でR18突破するために見つけたんだよね、イーロン以前
0976192.168.0.774
垢版 |
2023/10/20(金) 05:27:28.98ID:MWss6HyY0
Nitterのスクレイプ試したけど2万ツイートぐらいで取得できなくなる?
インスタンスにもよるのかな一度だけ三万ツイート取得できたけど
0979192.168.0.774
垢版 |
2023/10/22(日) 17:52:16.71ID:hiS5hxVm0
Twitter公式が旧UI完全廃止で重ったるい現行UI強制来た時にnitterを発掘した。
0980192.168.0.774
垢版 |
2023/10/24(火) 17:22:09.42ID:ZAGhQ3u+0
衆議院議員が陰部ポロリXに.orgも.todayも役立たず
0981192.168.0.774
垢版 |
2023/10/29(日) 22:21:48.35ID:Ft9/6eOi0
todayのpixivアカウント消えたっぽいな
0982192.168.0.774
垢版 |
2023/11/02(木) 00:41:26.94ID:zMOd/xdd0
『どっとうpろだ』が 2023/11/30 を持ってサービス終了
サービス終了と同時に全データも削除とのこと
0984192.168.0.774
垢版 |
2023/11/05(日) 19:40:01.13ID:IXzGmb0O0
TVでた蔵(https://datazoo.jp/ )が重い 最近。

消失すると地味に困るかも。
0985192.168.0.774
垢版 |
2023/11/05(日) 20:05:07.55ID:k4gYNeRG0
※「価格com テレビ紹介情報」は株式会社ワイヤーアクションが提供するTV放送ログを掲載しています。
https://kakaku.com/tv/

まあ会社が飛んだら提供も止まるし削除だろうけどな
0986984
垢版 |
2023/11/06(月) 15:39:04.93ID:hjrGk5W/0
いや、でた蔵が重い要因や理由は何だろう?っていう話。


----

「電波ログテキストマイニング(録画バカ一代)」(http://dnptxt.com/)が、消えてしまった。

もうちょっと持つかと思ったがダメだったか。


こういうサービスや記録のサイトって、意外と需要が無く誰もサイト丸ごと保存やIAとかに公開しないんだろうか。


----

gooテレビ番組って関西の番組内容の抄録もあって、でた蔵より充実してたな…。これも誰も丸ごと保存してなさそうだし。

関西版でた蔵って無いんだろうか。
0987192.168.0.774
垢版 |
2023/11/07(火) 05:21:16.35ID:OLRw/jQk0
Way backだとツイート直リンクでアーカイブできなくなってるのか
白い画面しか表示されない、todayは大丈夫だけど
0989192.168.0.774
垢版 |
2023/11/07(火) 14:58:27.31ID:2Phbl9ID0
>>987
ちょっと前から表示は出来なくなってる
ソースを見るとツイート内容の保存はされてるらしい
0990192.168.0.774
垢版 |
2023/11/08(水) 20:24:56.72ID:FYJKvk760
面倒だからtwitter直じゃなくてnitterリンクでwayback にプッシュした方がいいな
Todayはキャプチャまみれで大量に取りにくいんだよな
0992192.168.0.774
垢版 |
2023/11/15(水) 11:57:08.59ID:Ip7omGo40
ghostはURLの最後に*付けて芋づる式検索が出来なかったり容量オーバー名目で記録拒否されたリする
0995192.168.0.774
垢版 |
2023/11/20(月) 17:59:00.89ID:pAClgikJ0
もし自分が次スレを立てるなら、

次スレのスレタイは

【保存・記録】ウェブアーカイブ総合 page.02

という表記にしようかと思ってる。(これでもピリオドの部分も微妙な感じがするが。)

上記などに異議が無いなら上記で次スレを立ててるかも。(万が一、規制に巻き込まれてとかで次スレを立てられなかったらごめん。)



それで「いや自分が次スレ立てたい」という人がいるなら、任せた。

そもそも次スレの需要があるかどうか不明だが。
0998192.168.0.774
垢版 |
2023/11/22(水) 10:46:01.18ID:QZxCudHS0
>>997
じゃあ「Page.01」のそのピリオドは何の意味なんだ?
例えば「p.52 (52ページ)」というような略記法な使い方とも違うじゃん。

そんな表記だと、キャピタライゼーションルールとも違うわけだし、そんなんだったら「Page」は「page」になる方が好ましいだろうが。


>>996
この無知者め
1000192.168.0.774
垢版 |
2023/11/22(水) 11:24:01.44ID:eA83YbWK0
無意味な煽り合いはやめてね
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 1690日 13時間 52分 39秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。

▼ UPLIFT会員登録はこちら ▼
https://uplift.5ch.net/

▼ UPLIFTログインはこちら ▼
https://uplift.5ch.net/login
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況