ウェブ魚拓 Part3 ©2ch.net
昨日辺りから、スポニチ公式サイトの一部ページが やたら重くなっている。 サイトのトップページや各カテゴリーのトップなら ウェブ魚拓でも取れるのだが、昨日はサイトトップと 野球のトップページが「ファイルが大きすぎる」みたいな 表示が出て取れなかった。 そして今日はInternetArchiveでも一部の記事が 取れないという状況 サイト自体と、各アーカイブサイトの 双方で何か起きてるのか? Archive.isってIP規制あるっぽい?な 何度やっても取得できなかったが、繋ぎ変えたら大丈夫だった imgurの画像URL(拡張子付き)の魚拓取れなくなってる? archive.vn/submitのLoading…から全く進まないんだが・・・ https://imgur.com/p2yhA4U.jpg Archive isの管理人だか運営だかの なんと馬耳東風なことよ >>307 今やってみたら取れたぞ 今日魚拓を取った時に 初めて見たエラーメッセージがあった 「apikey invalid」 これは何ぞ? >>309 俺もちょうどそれが出たから何かと思ってここに来たw ただ再挑戦したら成功したから特に問題は無い気もするが よく分らんな 新しいエラーメッセージ(>>309 )が出るようになってから いわゆる時間切れが頻発するようになったが あとArchive isはまたも元の木阿弥 「502 Bad Gateway」 先ほどからこれが長め isはメンテ復活以降不具合無くなったが megalodonはここ数日おかしいな 俺もapikey invalid がしょっちゅう出るしさっきも Bad Gateway で取れなかった 新規に取れないのはまあ仕方ないとして今までの魚拓消すとかはやめてくれよ… 「502 Bad Gateway」 が今もって続行中 ずーっとこれが表示されたまんま 本当この状態はないわあ…肝心の『平成最後の日』に >>314 >俺もapikey invalid がしょっちゅう出るし で時間切れエラーが頻発するんだよね 同じページで3〜4回この状態が続くと いい加減辟易してくるんだけど あとisに関しては環境にもよるのかな? こちらでは一時期は調子よかったけど このところは長い時間使ってるとエラーになってしまう (エラーから復帰までの時間は20分程度になったけど) あとisの件でいえば スポー○報○の公式サイトが取りにくくなってる あまりisでは出ない時間切れエラーが起きる 結局ウェブ魚拓はいまだに使えないまま (本日17時30分現在) 株式会社アフィリティーも連休中なのか 何もコメントを出してない というか魚拓が使えないだけで作業について ペースというか調子が狂っちゃうもんなのかい… >>315 俺はisが長期メンテ?でしばらく繋がらなくなる前はアクセス出来ない事が多かったが 復活して以降1回も不具合は無いな それなのにさっきTwitter取るのに異常に時間がかかって空白ページになってたからTwitter側の仕様変更もあるのか? megalodonは相変わらずBad Gatewayで繋がらず しかしWaybackは特に問題無くTwitterも取れるな もうここしか頼れなくなったがURL長いのと検索が少し不便なのが難点 書いたそばからisがアクセス不能になったな 今までの例だとまた復活するだろうが大丈夫か? ウェブ魚拓は30日からずっと502で死んでるねえ・・・ 昨日午後から一応復帰したが 今日も「502」が頻発で立ち往生だ>魚拓 Waybackの検索 その際アドレスの末尾に誤って半角スペース入れてると ページが取得されててもノーヒット扱い Hrm. になること多いね isは自動補完修正してくれる 2019年5月1日 ウェブ魚拓に発生しておりました502問題につきまして https://www.affility.co.jp/?p=1638 なお、専用サーバーには問題はございませんでした。 >>326 ところが今日も「502 Bad Gateway」が頻発してるんだな… 断続的に立ち往生が起きている感覚 もうこんな立ち往生が続いたら いくら時間とお金があっても足りないぞ!!! そして今日もまた「502」の繰り返し… 一度は数日かけてメンテナンスをやるべきだ チラ裏 ウェブ魚拓・InternetArchive・Archive is 各スポーツ紙の公式サイトを取る際には、 トップページ及び各カテゴリートップについて この3つとも同じ状態になるのが理想。 だからどこかがエラーになると、同日同時間に取ったつもりでも、 3つのサイトの間で「ズレ」が生じる場合がある。 特にデ○リースポーツは、記事が瞬時に続々追加されていく分、 カテゴリートップの内容が馬鹿みたいに変わっていくので、 上記3つのサイトの状態によっては「ズレ」が頻発するので困る!! >>330 > ウェブ魚拓・InternetArchive・Archive is この3つ以外にどこかないの? 他のものがあるのに越したことはないが、 本音を言えば、使うサイトはあまり増やしたくないんだな。 あっちもこっちも、ってなるとかえって心情的にもキツくなるし。 むしろ1つか2つに絞り込みたいんだけどねえ。 >>331 WebCiteってのがあるが色々と面倒 「Cookieが無効な状態」での取得は禁止されています。 ↑のエラーが出始めた いつもはページを更新すると直るんが今日は直らないな >>335 自分も10分ぐらい前からそれだ サイトのページも画像も どっちも結果が「まっしろしろすけ」で返ってくる 同じ不具合だな 自分も真っ白になった魚拓が一つあって それ以降は取得すら出来ず いやこれまでに取った魚拓も真っ白になってるのか なんだこれ、怖いな isの方は今日はもうずっとダメだなこれ #1 in queue って取得する素振りは見せるんだけどそこから一切進まず応答なしになる それをずっと繰り返してる >>339 過去ログ追ってみたら 数十分程度で直っていたみたい 因みに自分が取って真っ白になった 「スポーツ報○」と「日○スポーツ」のトップページは 今日見てもまっしろしろすけのまんま >>340 .isはこのところ夕方辺りになると 決まって力尽きたかのようにエラーになる 以前の1時間ほどではないといえ それでも10分から20分くらいは復帰まで待たされる 本当に前にはなかったことだけに困っている 数日休んでもいいから改めてメンテナンスをやってほしいが .isの運営だか管理人は聞く耳がないのか?とも思う InternetArchive 検索結果 Fail with status: 400 もう.isはどうしようもないな 一番使いたい夕方(18〜19時台)に必ずエラーになる 中日スポーツ公式 昨日から「ドラゴンズ」に続いて「芸能・社会」でも 速報を挿入するようになった 他サイトのように速報を入れる度に更新というのが少ない 貴重なサイトだったのに余計なことを またisがダメになってる・・・ 向こうの鯖側のエラーだからまた半日以上は使い物にならんコースかな >>341 1時間待たされるだけで使えてた頃のがまだマシだったよ 復帰まで半日以上じゃもうどうしようもないし とうとう.isは寄付の募集を始めたか (募集のバナーがトップページ右上隅に) それよりもちゃんとしたメンテナンスをやってくれや! .isは夕方恒例のエラー祭り 結局.isの管理人ってメンテナンスの要望も無視するの!? 昨日あたりからか ウェブ魚拓の反応が鈍くなった気がする 何度もエラーが出たり「503」になったり .isは毎日夕方に、 こんな状態が恒例となった。 https://i.imgur.com/xRGdhft.jpg (Archive isのblogに書き込もうとしたら リンク貼るのは禁止とのことなので) いつまで.isはこんな状態を放置しておくのか…! 今日はInternetArchiveが久方ぶりの長時間メンテナンス(今現在も継続中) そこへ18時台にはArchive isが定期の断線 だから予定がもうメチャクチャ The following error was encountered while trying to retrieve the URL:(略) 5.196.68.232 への接続に失敗しました。 システムが以下のエラーを返しました: (110) Connection timed out The remote host or network may be down. Please try the request again. Your cache administrator is root. ↑.isが1時間近くつながらなくなって やっと復旧したと思ったら結局これ! .isの手抜きっぷりはあまりにも異常 .isはいい加減にメンテナンスやってくれよ… 夕方は決まってつながらなくなるし 今日は今現在早め(?)のアクセス不可状態 以前はむしろ一番安定していただけに この状態を放置している管理者の神経が分からんわ 今日.isは全く使えないのか!? サイトに今朝から全然アクセスが出来ない さっき一瞬使えたけどすぐに駄目になったなarchiveis もしかしたら日本からだけ弾いたりしてないかしら やっぱまったく繋がらんなarchiveis 10分間隔なら分かるがこうも制限されるとむかつくわ 問題ない人もいるっぽいけど 昨日は普通につながってたぞ くっきー消してみたら? cookie消しても駄目だな 検索サイトからアクセスしても サイトそのものにつながらない メンテやっているならその旨を示すべきだけど 結局あそこのサイトお得意の手抜きかよ!? 昨日も今日も普通に使えてたけど クッキーでダメならIPアドレス変わらないとだめそうだね ひとまず復帰(?)を確認できた>.is …しかし昨日も今日も昼夜問わず使えていた 人もいるということは環境に左右されてるってこと!? 決して変な使い方はしていないが IPで弾いている可能性もあるのかな 仮にIPで弾いているとしても そうなる原因が分からない それほど多量に取っているわけでもなし 一瞬で表示内容が変わるのを逃したくないから 間隔を空けないことは確かにあるけど… 一応archiveis使えるけど一旦制限されると30分以上使えなくなる まともにアーカイブ取得できんわこりゃ 魚拓サービスは海外でも少ないからなあ。不便だなあ。 チラシの裏 中日スポーツ(東京中日スポーツ)の公式が先月辺りから、 やたら速報記事を上乗せするようになったので、 魚拓を取るのが非常に厄介になった。 当初は「ドラゴンズ」と「芸能・社会」のカテゴリーだけだったのが、 気がつけば「プロ野球」とか「スポーツ」とかにも広がっている。 しかも何気に、一般スポーツを中心にカテゴリーが細分化されている。 他社並みになったと言えばそれまでだが、今までは項目が比較的少なく、 さほど更新も無かったので、魚拓を取る作業も慌てずにやれたのに…。 いまやデイ○ースポーツに次いでトチ狂ったように、トップページや カテゴリーのトップを目まぐるしく更新してるので、ちょっと目を離したら ズレやら遅れやらが生じてしまう。 今までなら前述の事情から、あがった記事を全部取ることも目指せたが、 これからは他紙同様に、カテゴリートップと(その時の)筆頭記事だけを取るという、 いわば手抜きの魚拓作業を行う他ないのか…。 あと中日スポーツの公式といえば、少し前からchrome使ってると、 広告バナーとして「DAZN」の短い動画が入るようになったんだけど、 この動画を隠す方法はないのかな!? ublock origin使ってるんだが、それでもなぜか消えないんだよ。 激レアさんを連れてきた。★1 創業者は怪力プログラマー ダメ出し感強まった第4打席 スタメン復帰の周平:編集日誌:中日スポーツ ... https://www.chunichi.co.jp/chuspo/article/deskn/CK2019081902100002.ht... 10 時間前 - 1面は「スタメン高橋」でスタート。ややパンチに欠け、 「奥川温存でも星稜4強」もありかと思ったが、大チャンスの4打席目でも凡退したことで、 かえってダメ出し感が強まるという皮肉。あぁ…。 ↑こんな記事さえも現在は削除。しかも誰一人魚拓をとっていない。このこと自体があぁ…。 ということで再度 ttps://cache.yahoofs.jp/search/cache?c=X6HV-sL14ykJ&p=https%3A%2F%2Fwww.chunichi.co.jp%2Fchuspo%2Farticle%2Fdeskn%2FCK2019081902100002.html&u=https%3A%2F%2Fwww.chunichi.co.jp%2Fchuspo%2Farticle%2Fdeskn%2FCK2019081902100002.html Archive.fo/njifu ttps://webcache.googleusercontent.com/search?q=cache:X6HV-sL14ykJ:https://www.chunichi.co.jp/chuspo/article/deskn/CK2019081902100002.html+& ;cd=1&hl=ja&ct=clnk&gl=jp Archive.fo/7Fm45 【編集日誌】 ダメ出し感強まった第4打席 スタメン復帰の周平 2019年8月19日 ☆…1面は「スタメン高橋」でスタート。 ややパンチに欠け、「奥川温存でも星稜4強」もありかと思ったが、 大チャンスの4打席目でも凡退したことで、かえってダメ出し感が 強まるという皮肉。あぁ…。 ☆…18日付1面のリードと表に誤りがあり、表の再掲載も考えたが、 適当な乗せる場所がなく、訂正文のみ掲載した。 中日スポーツ公式 「ラグビー」カテゴリーのトップページに、本日より 外部から(?)、W杯関係のバナーを導入。 ttp://i.imgur.com/2IsK0nB.jpg これによってファイルサイズ超過のため、魚拓取得が不可。 なお同様の現象は、スポニチアネックスのトップページでも 起きている。 https://web.archive.org/web/20190828020549/https ://www.chunichi.co.jp/chuspo/article/npb/news/CK2019082702100066.html こんな他愛もない記事でさえ中日スポーツは削除 ウェブ担当者が先月下旬からやたら記事を上乗せしまくっているが こういう削除はお粗末過ぎる 何気に.isの不調が痛い。じわじわと影響が出てきてるというか。 以前はむしろ不具合が殆どなかったので、安心して使えたのだが、 逆に今は毎日、いや毎夕のようにエラーが出ている。 しかもその不具合を管理者側が完全に放置しまくりという、信じられない状況。 ウェブ魚拓に、取得回数の緩和とか、せめて複数(2つ以上)の同時進行の復活を 要望したいところだが…。 つい最近、過去ログを覗いたら、以前にもあったような荒らしがまたぞろ出没して いるので(同じ画像を何十回も魚拓を取ってるとか)、望むべくもなさそうか。 isくんは、投げ銭かsubscriptionを用意してくれればなぁ 広告linkを仕込んできたときにダメな子になった Internet Archive 終日落ちてるけどもう直らないのかな・・・ >>382 5秒ほど待ってページ更新 慌てると余計ひどくなる 一応、取得時に3段階に分かれてたのが、 切れ目がなくなったというのが改善点か。 ウェブ魚拓のアップデートにつきまして https://affility.co.jp/?p=1647 ウェブ魚拓をご利用いただき、ありがとうございます。 近年のコンテンツにおきまして、取得時間と容量に 問題があるご意見やデータが多く寄せられておりましたため、 取得を強化いたしました。 最大で540秒の取得となっており、 ほぼすべてのHTMLコンテンツを取得可能であると考えられます。 その他、魚拓リスト画面を変更いたしました。 以上どうぞよろしくお願いいたします。 >>383 いや慌てるも何も数日経った現在でもこのサイトにアクセスできませんって言われるぞ トップは表示されるけどそれ以外は表示できない 早く繋がるよう直してほしいんだが・・・他の人は同じ状況じゃないの? コピペレベルの実装だが、Web Archiveとarchive.isのそれぞれに魚拓させるSiri Shortcutsいる? >>387 それはいらないと思うなあ。 それより Web Archiveとarchive.is 以外に良い海外サービスないかどうか探索してほしい。 海外魚拓サービス「FreezePage」は定期的にログインしないと 保存したキャッシュ(URL)を削除されるみたいだな。 これではちょっと使いにくい 登録したら届いたメールより ↓ Welcome to FreezePage Please notice that we ask you to log in at least once a month (every 30 days). Otherwise, your account will expire and your frozen pages may be deleted to free up space for other users. 容量10MBの保管スペースあり「FreezePage」 海外では著名なアーカイブサービス。個人向けに容量10MBの フォルダが提供され、その中にアーカイブを保存するという、プ ライベートな保管庫としての性格が強いことが特徴。ログインな しで3日間アクセスしないと削除されるため、長期のアーカイブ には不向き。 https://news.mynavi.jp/article/20180421-archive/ WebCite が (涙) ↓ We are currently not accepting archiving requests. The archival state/snapshots of websites that have been archived with WebCite in the past can still be accessed and cited. Internet Archive は繋がるようになったけど今度はisがずっと503だな 早く直ってくれよ・・・ >>392 過去に取得したWebCite見たら文字化けしてたクソワロ 国産サービスの「ひよっ」で消滅しそうで消滅しないな。 ここを使うのはどうなんだろ。 あと、自分はYahooニュースの魚拓を取ることが多いので。 Yahooニュースの魚拓を取れるサービスが少なすぎて悲しい。 >>395 ヤフトピについては、魚拓が取れるところは.isくらいしかないのかな? ただ、今はヤフトピの方がユーザーの目には留まりやすいみたいだから、 意外と魚拓が取られてるケースが多い気がする。 それに比べて新聞社のニュースサイトときたら… (というかヤフトピの元ネタも、こういうところからのものが多いのに) おーい!見出しの誤字に気がついたなら、 誰か魚拓くらいとっておいてくれや!手抜きか! https://i.imgur.com/izx52gv.jpg https://i.imgur.com/KHPYb0c.jpg isがまた終日使えねえ・・・もう >>395 ひよっはTOPページがあるだけで機能してないからなあ 消滅してるのと同じようなものだ マイナーチェンジがあったようだね。 ブラウザに「秒数」が表示されるようになった。 >>399 待って... タスクトレイにいるのって、ウイルスバスターぢゃ? >>389 ttps://www.icloud.com/shortcuts/78e7207219564d0b8be79e94d95d644b Siri Shortcuts.appに食わせれば、拙いsourceが丸見えだから、適宜よろしくしておくれ 特に、本当は不要な?なんちゃら以降のreferなんぞ削ってやればいいのだが、siteによっては目印になりそうな.htmlなり.htmがないところもあるので放置してある 今日は.isが一日中駄目なのか… ひょっとして環境にもよるのか? read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる