X



ウェブ魚拓 Part2

■ このスレッドは過去ログ倉庫に格納されています
2012/06/23(土) 20:25:17.45
ウェブ魚拓について語ろう
ttp://megalodon.jp/

前スレ
ウェブ魚拓
http://toro.2ch.net/test/read.cgi/esite/1260814156/
2013/09/28(土) 20:12:59.41
>>243
報告乙
245名無しさん@お腹いっぱい。
垢版 |
2013/09/29(日) 05:17:14.64
Perma.cc

http://perma.cc/about

After the paper has been submitted to a journal, the journal staff checks that
the provided Perma.cc link actually represents the cited material.
If it does, the staff “vests” the link and it is forever preserved.
Links that are not “vested” will be preserved for two years,
at which point the author will have the option to renew the link for another two years.

               ↑

要するに、キャッシュの保存期間が2年間(ただし更新可能)
ということだな。
2013/10/02(水) 15:53:48.64
Peeep.us終わったな
早晩Backupurlと同じ運命をたどると思ったが以外と早かった
海外のサービスは予告なしに閉鎖するから怖い
2013/10/02(水) 16:37:55.40
http://www.peeep.us/6b5f5134
2013/10/02(水) 16:38:25.82
普通に取れてるが
249名無しさん@お腹いっぱい。
垢版 |
2013/10/02(水) 17:31:52.12
Backupurlがなくなったのは地道に痛い
2013/10/02(水) 19:41:43.76
すまんPeeep.us復活したようだ
251名無しさん@お腹いっぱい。
垢版 |
2013/10/03(木) 17:46:30.77
WebCiteは日本時間の本日午後ずっとメンテナンスやっている
252名無しさん@お腹いっぱい。
垢版 |
2013/10/04(金) 13:53:57.84
>>250
ここ2〜3日は、14〜16時辺りに落ちてるね。
14〜16時という時間帯はいつも、土日になると落ちてるんだけど。

で、今日は12時台から落ちてるんだが…
253名無しさん@お腹いっぱい。
垢版 |
2013/10/04(金) 18:42:56.31
Peeep.us 16時過ぎに戻った。
いずれにせよ、14〜16時は鬼門だな。
2013/10/04(金) 22:32:38.04
数時間や数日程度の鯖落ちでいちいち報告レスしてる奴滅茶苦茶ウザいんだけど
1ヶ月ぐらい連続して落ちてから騒げよ
2013/10/04(金) 23:47:32.35
いや、その「数時間や数日程度」使えないのが、命取りになったりするから。

ニュースサイトなんて刻々と変わってるわけだしね。
数時間いや数分間、目を離してるうちに、見出しが変わってたり、
記事そのものが消えてることだってある。
256名無しさん@お腹いっぱい。
垢版 |
2013/10/05(土) 06:02:40.07
>>255

同意する。
2013/10/05(土) 09:14:27.54
昔は情報発信者の側が一方的な強者だった訳だが
一個人がおかしな点を指摘して声を上げられる良い時代になった

そこで問題となるのが「言った言わない」の問題
この点を解消するのが不偏不党のバックアップサービス
258名無しさん@お腹いっぱい。
垢版 |
2013/10/09(水) 10:54:27.95
今日は若干開くのが遅い感じ
2013/10/10(木) 00:26:35.93
朝から重かったが、落ちてるのかな?
2013/10/10(木) 07:20:56.79
魚拓運営の公式見解が出てたな。誰かが大きな負荷をかけていたようだ。
昨日は「表示に妙に時間がかかるが、魚拓が取れないこともない」といった感じだったが。
たぶん個人で、バナーが異様に貼られたような重めのページを取ろうとしたのかな。
2013/10/10(木) 07:54:14.53
ウェブ魚拓でわいせつなページを取得する事は禁止されています | 株式会社アフィリティー
http://www.affility.co.jp/archives/1359

投稿日:2013年10月10日

ウェブ魚拓で非常に高負荷が続いておりましたが、原因を捕捉し、削除、該当ページ、またサイトドメインごと禁止処置を行いました。
非常に接続しづらい状況になっていたため、ご利用者にご迷惑おかけ致しましたことお詫び申し上げます。

ウェブ魚拓において、利用規約にございますとおり、わいせつ物、ポルノの取得・公開による取得者特定の捜査協力要請が来た場合、
取得者がわいせつ物のアップロード者と見なされ、取得者情報の提供が行われます。

以上よろしくお願い致します。
2013/10/10(木) 08:46:24.72
たぶんあの事件関係のエロサイトだろうなw
2013/10/10(木) 09:16:13.45
>>262
え?何かあったの?流出事件とか?
2013/10/10(木) 09:58:34.64
>>263
おそらく、もうこの世にいない人の…
いや、該当ページを取っても、画像等は欠ける可能性が高いんだけどね。
2013/10/10(木) 13:38:26.55
ここ数日、peeep usの休止時間が長い。
12時台か13時台にはもう落ちてる。
2013/10/12(土) 20:24:12.23
Peeep.us経由で二重撮りした魚拓が片っ端から消されてる件
この手法はもう使えないな
2013/10/12(土) 20:33:18.96
詳しく
2013/10/13(日) 00:41:54.54
Peeep.usで取得したページのURLで魚拓とったやつが全て消えてる
Facebookのような魚拓不可のページでの Peeep.us → 魚拓 が無意味になる
269名無しさん@お腹いっぱい。
垢版 |
2013/10/13(日) 06:05:29.35
>>268
> Peeep.usで取得したページのURLで魚拓とったやつが全て消えてる


?????
2013/10/13(日) 07:13:48.73
>>268
Facebookの魚拓バックアップ→取れない

「FacebookのPeeep.usバックアップ」の魚拓バックアップ→取れる

魚拓運営がそのような魚拓バックアップのあぼーんを開始

これで合ってる?
2013/10/13(日) 07:25:35.22
>>268 の日本語がイマイチわからん
2013/10/13(日) 14:44:41.42
>>270
あってる

@ Facebook、Yahoo!ニュースなどは魚拓不可

A よってPeeep.usなど他のサービスに頼ることになる
↓ でも海外のサービスは突然閉鎖することがあるから心配

B だからAでとったページ(http://www.peeep.us/********)を魚拓でとり直す
↓ これで元ページ@が魚拓不可でもロンダされて魚拓に収めることができる

C Bでとった魚拓(http://megalodon.jp/20**-****-****-**/www.peeep.us/********)が削除されてる

https://www.google.co.jp/search?q=peeep.us&;amp;ie=UTF-8&oe=UTF-8&hl=ja&btnG=Google+%E6%A4%9C%E7%B4%A2&domains=megalodon.jp&sitesearch=megalodon.jp
つい最近とられたページは削除が追いつかないのか残ってる
2013/10/13(日) 14:53:23.86
>272の最後のURLは(&amp)が入って表示されなかったわ
これは魚拓トップページ右上の検索窓から Peeep.us で検索した結果
274名無しさん@お腹いっぱい。
垢版 |
2013/10/13(日) 22:58:14.34
児ポ画像を魚拓とった奴はいつ逮捕されてもおかしくないな
275名無しさん@お腹いっぱい。
垢版 |
2013/10/14(月) 08:38:38.06
消すなら最初からこんなサービスやるな
2013/10/15(火) 08:55:59.67
魚拓の画像が見れません
同じものを見ている他の人は見れているようです
どうしたら見られるようになりますか?
2013/10/15(火) 13:47:09.69
違うブラウザ使ってみたら
2013/10/15(火) 19:40:56.05
>>270 >>275
自主的に削除ってのは、本来なら魚拓のポリシーに反することなので、
よほどのことがなけりゃやらないはず。外部からの削除要請を疑うべきじゃ…

そういや>>261について「過去の魚拓」をあたったが、やっぱり…
魚拓を使うのに慣れてない奴が、うまく取れない(画像が欠落するとか)ので、
「何で取れねえんだ!」と逆上した末、躍起になって取り続けたんじゃないかと邪推。

>>276-277
IEで「HTTP 404 未検出」になるものが、GoogleChromeを通してだと見られるケースもあるよ。
2013/10/15(火) 20:56:41.38
>>277 >>278
ありがとうございます
2013/10/16(水) 05:33:17.97
画(ryが単独でないと取れなくなってる?
281名無しさん@お腹いっぱい。
垢版 |
2013/10/16(水) 07:08:22.47
いい魚拓サービスがあればお金払うのも考えるし
海外製だったらウェブマネーでも入れたいけど
結局著作権がーで難しいんだろうなあ

しこしこローカルに保存してるよ
効率悪い

archive.isもpeeep.usもいつまで無事かわからないものねえ。
3年後どころか1年後半年後も存続しているか不安。
2013/10/16(水) 08:02:44.67
>>281
魚拓の類を介してでないと、保存できないページもあるしねえ…
283名無しさん@お腹いっぱい。
垢版 |
2013/10/21(月) 20:22:41.49
取りきれていなかった魚拓です。と著作権絡みの削除ばっかり、魚拓も有名無実
いざというときのための魚拓なのにエラーと削除ばかりで全く使いものにならない
2013/10/21(月) 20:23:48.09
アノニマスやウィキリークの協力者がその手のサービスを展開してくれないもんかねえ
2013/10/22(火) 21:34:15.92
>>283
そんな事するくらいなら…

元のページを、バナー広告に左右されずに簡単に保存できるようにしろ!
ページを1週間程度で消してんじゃねえ!
字の間違いでもないのに、見出しをこっそり変えてんじゃねえ!

その他諸々…ま、そういう話だな。他にも言おうと思えば文句は尽きないのだが。
2013/10/23(水) 16:30:14.36
//www.t○ky○-sp○rts.c○.jp/category/sports/page/2/

いよいよこれが取れなくなった。
「robots.txtによってキャッシュが禁止されており取得できません。」
…って、いったい何が原因だ!?
2013/10/24(木) 07:15:20.29
ggr
2013/10/24(木) 08:20:02.15
ググってもわかんねえんだよ
2013/10/24(木) 15:53:42.41
これはひどい
2013/10/28(月) 20:40:42.65
>>288
Bingれ
291名無しさん@お腹いっぱい。
垢版 |
2013/11/06(水) 15:14:48.04
久々に故障

ついでに先週あたりから、peeep usでdai○yのトップページが取れない。
hoc○iと同様に文字化けして、UTF-8に直さないと読めない。
292名無しさん@お腹いっぱい。
垢版 |
2013/11/10(日) 09:45:03.28
直接魚拓しても削除されないのに、
他のキャッシュサービスを経由すると著作権違反で削除されている例があるが
どういう削除基準で削除してるんだろう
2013/11/11(月) 00:23:14.20
キャッシュをキャッシュされたら同業者全体で商売あがったり
294名無しさん@お腹いっぱい。
垢版 |
2013/11/15(金) 07:29:43.15
WebCite will stop accepting new submissions end of 2013, unless we reach our fundraising goals to
modernize and expand this service.

Please support our crowdfunding campaign. If you are interested in keeping this service alive, please give
generously - or at least share our campaign on Facebook. Funders supporting us with $250 or more
will be acknowledged by name on our redesigned website.

              ↑

     これは結局どうなりそうなの?
2013/11/15(金) 19:16:53.33
金の切れ目がサービスの切れ目
2013/11/15(金) 19:34:42.21
ttps://archive.org/web/
インターネットアーカイブのWaybackMachineに実質的な魚拓取得機能が付いたけどどうだろう
右下のSave Page NowにURLを入れると、通常はクロール時に取得するスナップショットが即取得される

魚拓の取りにくさや消されやすさはWeb魚拓とあまり変わらないのが難点だが安定性は随一か
297名無しさん@お腹いっぱい。
垢版 |
2013/11/15(金) 20:35:57.81
↑氏ね
298名無しさん@お腹いっぱい。
垢版 |
2013/11/15(金) 20:49:00.17
>>296
お前は何を言ってるんだ
299名無しさん@お腹いっぱい。
垢版 |
2013/11/16(土) 17:19:56.80
>>296

ヤフーニュースで試してみたが、確かに魚拓とれた。
300名無しさん@お腹いっぱい。
垢版 |
2013/11/16(土) 17:36:05.47
Internet ArchiveのWayback Machineが大幅にサービスをリニューアル

Internet Archiveはユーザーのリクエストに応じてウェブサイトにクローラーを走らせ、
ウェブページを保存するサービスを開始しました。

http://code.kzakza.com/2013/10/wayback-machinefixing-broken-links/
301名無しさん@お腹いっぱい。
垢版 |
2013/11/18(月) 15:23:13.32
>>300

使ってみたが、今のところ不都合な点は特にない。

この時間帯も使える。
2013/11/18(月) 17:34:30.19
保存したいURLの前に「https://web.archive.org/save/」を挿入するだけで魚拓が取れるのは良いな
しかも数10MBクラスのファイルも魚拓化できる
303名無しさん@お腹いっぱい。
垢版 |
2013/11/18(月) 17:58:40.32
>>302

> しかも数10MBクラスのファイルも魚拓化できる


それは気づかなかった。まあファイルを魚拓したことはこれまで一度もないのだが。俺は。
304名無しさん@お腹いっぱい。
垢版 |
2013/11/19(火) 08:09:34.12
>>300

新聞電子版の文章は保存できるが、画像は保存できないことがある。
2013/11/28(木) 20:01:08.36
なんだかんだ言って
歴史の長い魚拓とInternet Archiveは安心感がある
306名無しさん@お腹いっぱい。
垢版 |
2013/11/28(木) 20:05:46.71
ウェブ魚拓
2010年11月12日

ウェブ魚拓の古い魚拓が失われました

悪い知らせが続いてしまい言葉もないのですが
バックアップ処理の誤動作で2007年前半以前の魚拓のファイルが失われてしまいました。
古くからウェブ魚拓をご愛用頂いている方々にご迷惑をおかけしてしまって大変申し訳なく思っています。
すみません。
http://www.affility.co.jp/archives/category/info/megalodon

信頼ねえ。。。
307名無しさん@お腹いっぱい。
垢版 |
2013/11/30(土) 00:17:02.34
一回じゃないですからね
308名無しさん@お腹いっぱい。
垢版 |
2013/11/30(土) 17:52:41.48
WebCite は存続資金の調達ができたのか?
309名無しさん@お腹いっぱい。
垢版 |
2013/12/09(月) 05:23:39.27
>>300

使っているが、今のところ特に問題はない。
310309
垢版 |
2013/12/09(月) 05:43:49.08
あー、でもTBSニュースはうまく魚拓がとれない

http://news.tbs.co.jp/
311名無しさん@お腹いっぱい。
垢版 |
2013/12/20(金) 08:48:55.17
Internet ArchiveのWayback Machineで
ヤフーのビジネスニュース
http://newsbiz.yahoo.co.jp/
を魚拓しようとしたら弾かれた。
312名無しさん@お腹いっぱい。
垢版 |
2013/12/20(金) 16:22:06.40
12/20夜、ウェブ魚拓の緊急メンテナンスを行います
投稿日:2013年12月20日

ウェブ魚拓をご利用戴き、ありがとうございます。
表題の通り、ウェブ魚拓の緊急メンテナンスを行います。
時間は6時間程を予定しております。
お手数をおかけ致しますがよろしくお願い致します。
313名無しさん@お腹いっぱい。
垢版 |
2013/12/20(金) 16:32:50.27
>>312

お役立ち情報 乙です
2013/12/21(土) 14:21:57.35
メンテナンスに時間がかかってるようだ。
今のところ17:00再開を予定とか。

関係ないが、peeep usも不定期休止が多い。
最近は休止なしの時もあるが、夕方に休む時は30分になったり
2時間余になったりと、時間が不定になってる。
2013/12/21(土) 14:28:15.99
だから、使わせてもらってるおまえらは寄付しろよ、な?
2013/12/21(土) 15:16:01.83
↑あんたが毎日、俺の代わりに魚拓を取る作業をやってくれたらな。
2013/12/21(土) 15:29:35.19
>>314
「12/22 の午後17:00までに終了する予定です。」とあるじゃねえか。
じゃあ今日は全然使えんな。
318名無しさん@お腹いっぱい。
垢版 |
2013/12/21(土) 17:28:48.11
>>314

> 関係ないが、peeep usも不定期休止が多い。


ただ、長時間(4時間以上)使えないことは今までなかったと思う。
2013/12/21(土) 18:03:46.74
魚拓はメンテナンスの時にデータ消えちゃいました、とかやりそうでマジ怖い
2013/12/22(日) 02:19:48.94
2007年以前のデータが消えたもんなぁ……。
321名無しさん@お腹いっぱい。
垢版 |
2013/12/22(日) 17:07:47.35
・ 12月22日 15時
ウェブ魚拓のメンテナンスが終了致しました

現在、正常に動作しているのを確認しております。
予定を大幅に超過してしまいましたことお詫び申し上げます。

ご協力どうもありがとうございました。
これからもウェブ魚拓をよろしくお願い致します。
2013/12/23(月) 17:27:04.57
自分で撮ったデータをいくつか確認したが、いつまで保つのかな?
323名無しさん@お腹いっぱい。
垢版 |
2013/12/23(月) 19:08:42.04
エラー

取りきれていなかった魚拓か、当該サーバーはメンテナンス中です。
324名無しさん@お腹いっぱい。
垢版 |
2013/12/23(月) 20:44:05.24
メンテ前よりも、反応が鈍くなったような気がする。
特に画像やその類について、1回取っただけだと殆どが反映されず、
骨組だけの状態になっちゃうことがしばしば。

>>323
そのエラーメッセージ見たよ。いろいろと謎が。
325名無しさん@お腹いっぱい。
垢版 |
2013/12/24(火) 04:36:55.59
アメブロの魚拓とったら画像の類が全部抜けてやがるorz
326名無しさん@お腹いっぱい。
垢版 |
2013/12/24(火) 08:26:03.72
>>325
それだ! gifとかもそうだ。
そして今日も同様の状態が続いてる…
327名無しさん@お腹いっぱい。
垢版 |
2013/12/24(火) 08:58:24.62
昨日分の「過去の魚拓」を見てみたが、特に何かで荒らされてる形跡はないな。

ただ、反応が遅いんで何度もクリックしてしまうからなのか、同じ記事等が
二重か三重に取られてるケースが多い。
2013/12/24(火) 09:31:21.06
>>325
取得後にそう表示されるが、ちゃんと取得できてたよ
2013/12/24(火) 10:30:45.25
>>328
更新ボタンで、表示されなかったものが現れる場合もあるが、
逆に辛うじて表示されていたものが“消える”場合もある。

あと、画像が抜けてテキストの状態でしか取れてないものでも、
そのまま触らない状態でローカルに保存したほうがいい。
うっかりページを更新してしまうと
「取りきれていなかった魚拓か、当該サーバーはメンテナンス中です」(>>323
となって、元の状態に戻らないケースがある。
330名無しさん@お腹いっぱい。
垢版 |
2013/12/24(火) 23:13:49.45
いろいろレスがあったのでちゃんと見なおしてみたが
文章すら保存できずに

エラー
取りきれていなかった魚拓か、当該サーバーはメンテナンス中です。

がでてた
やはりダメポかorz
331名無しさん@お腹いっぱい。
垢版 |
2013/12/25(水) 00:38:05.93
運営気がついてないのかもね
またいじくって消失させんじゃないのかな
332名無しさん@お腹いっぱい。
垢版 |
2013/12/25(水) 15:30:35.50
まさか運営は、もう冬休みじゃないよね…
333名無しさん@お腹いっぱい。
垢版 |
2013/12/25(水) 17:37:48.82
>>332

明後日あたりまでは業務こなすと思うが
そのあとは休むでしょ
2013/12/25(水) 20:26:02.27
>>330
昼には魚拓が取れていたのを確認したのに、今見たらその表示出てた。
もうこの会社ダメだろ。素人がメンテナンス・経営してんのかな
2013/12/27(金) 20:49:12.45
なおす気無いみたいですね
このまま来月も一週間ぐらい不具合放置でしょ
最悪半月か一月以上放置ですね、
過去の例からもそれくらいはなおらない可能性ありますよ
336名無しさん@お腹いっぱい。
垢版 |
2013/12/28(土) 03:43:24.46
1日1回やってみてるんだが
今日やった分は何とかできたが
コレは明日見てもちゃんと残ってるか不安
2013/12/29(日) 19:50:40.09
ttp://megalodon.jp/pc/history
↑から順番に魚拓開いてみるとあまりの壊滅っぷりに笑える
2013/12/29(日) 21:13:06.30
ちゃんと開けたか!?っと思って再び開くとエラー
数時間前は見れたのにしばらくするとエラー
見れたり見れなかったりするが大半はエラー
ダメだこりゃ
2013/12/29(日) 21:23:44.37
苦情送ったけど、どうなるんすかねえ
340名無しさん@お腹いっぱい。
垢版 |
2013/12/29(日) 22:35:53.86
あーあー
当日保存できたはずのアメブロの魚拓が
2日には画像が消えて半壊してるorz
341名無しさん@お腹いっぱい。
垢版 |
2013/12/30(月) 08:10:46.44
外国の魚拓サービスのほうが無難といえば無難。
342名無しさん@お腹いっぱい。
垢版 |
2013/12/30(月) 20:38:09.61
textmirror.net

on-demand archiver using Lynx behind the scene. It saves only text from
the web page, ignoring images and styles. It ignores robots.txt.

http://textmirror.net/

          ↑

こういうのができたらしい。これから試してみる。
343名無しさん@お腹いっぱい。
垢版 |
2013/12/30(月) 20:42:49.01
textmirror.net を試してみたが、操作方法が複雑怪奇でよくわからん。

スキルのある人にまかせる。
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況