X



【保存・記録】ウェブアーカイブ総合 Page.01
■ このスレッドは過去ログ倉庫に格納されています
0001192.168.0.774
垢版 |
2019/04/06(土) 21:31:22.29ID:KqAD+H9+0
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
https://archive,org/
archive,today
https://archive,fo/
ウェブ魚拓
https://megalodon,jp/
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web,archive,org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズでの失敗から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう
0055192.168.0.774
垢版 |
2019/04/08(月) 13:23:24.39ID:Gn50FMSd0
>>49

最初の設定は誰かが単独で行うだろ。
0056192.168.0.774
垢版 |
2019/04/08(月) 13:23:40.54ID:Gn50FMSd0
>>54

同意
0058192.168.0.774
垢版 |
2019/04/08(月) 13:54:47.88ID:csp1RLRO0
>>53
Internet Archiveのスレと間違われそう

誰かwikiの管理をできる時間がある人がいたらwiki作成宜しく
自分は管理者業務とか無理だわ
0059192.168.0.774
垢版 |
2019/04/08(月) 14:42:32.50ID:kuGZ5jM70
どこか既存のwikiに専用のページを作るっていう方法もある
アーカイブ関係のwikiがすでにあればそういうところがいいんだけど
0060192.168.0.774
垢版 |
2019/04/08(月) 17:21:50.82ID:7Gb6dlTw0
一分に一件ずつ保存しても一日1440頁しか保存できない。
0061192.168.0.774
垢版 |
2019/04/08(月) 18:46:46.19ID:csp1RLRO0
これで立てようとしたけどホスト規制に引っ掛かってしまったので誰か頼んだ

タイトル:ウェブアーカイブ総合【Internet Archive・魚拓】#1
内容:
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク
Wayback Machine
https://archive.org/
archive is
http://Archive.is/
ウェブ魚拓
https://megalodon.jp/
WebCite
https://www.webcitation.org/archive
Archive.st
http://archive.st
Archive Team
https://archiveteam.org/

・関連スレ
Internet Archive総合 (web.archive.org) #2
http://mevius.5ch.net/test/read.cgi/esite/1475246713/
ウェブ魚拓 Part3
http://mevius.5ch.net/test/read.cgi/esite/1498902308/
【和塩】geocitiesスレ10【ジオシティーズ】
http://mevius.5ch.net/test/read.cgi/hosting/1554115546/
【ヤフー】Yahoo!ブログ【アーカイブ】
http://mevius.5ch.net/test/read.cgi/blog/1554380939/

・ジオシティーズの件から学んだアーカイブにあたっての注意事項
1. 早めに行動しましょう
2. まずは既存のプロジェクトや遺産を探しましょう
3. 単独ではなく組織的に動きましょう
4. 呼びかけや情報共有を積極的に行いましょう

・旧スレ
http://mevius.5ch.net/test/read.cgi/internet/1554553882
0062192.168.0.774
垢版 |
2019/04/08(月) 20:23:02.60ID:IXy1N+9U0
正直そんなに慌てて次スレ建てなくてもいい
このスレでwikiの作成や話し合いを十分にやってから立てればいい
0063192.168.0.774
垢版 |
2019/04/08(月) 21:41:07.95ID:csp1RLRO0
それもそうか
Wiki作るって言っても無計画にやったら瓦解するだろうし、具体的に何を書く(書いていい)Wikiなのか決めとかないと
0064192.168.0.774
垢版 |
2019/04/08(月) 23:09:47.96ID:73UxGWOW0
規律と理念、主要なアーカイブサイトのアーカイブリクエスト方法と見方、主要なツールの使い方、アーカイブに便利なソフトウェア一覧、関連リンク集、サービス終了が告知されている中で保存に公益性がありそうなサイト一覧、将来的に保存が必要になりそうなサイト一覧
とか?
多少ArchiveTeamに倣ったほうがよさそう
0065192.168.0.774
垢版 |
2019/04/09(火) 00:37:25.02ID:qC7dF5bK0
他力本願で技術力が足りない人が多すぎるから、人を集めることも重要だな
0066192.168.0.774
垢版 |
2019/04/09(火) 01:27:21.91ID:vAsLhlqU0
【12日まで】500円を貰える春のばらまきキャンペーン開催中です     

@ スマホのApp Storeから「プリン(pring)」をインストールする  
A 会員登録を済ませる    
B 下図の通りに進む    
https://pbs.twimg.com/media/D3pIexoU0AY4_so.jpg 
C コードを登録 [5gAYSz]  
    
これで五百円を貰えます  
スマホでセブンATMからお金を下ろせたり便利なアプリですので是非お試し下さい。   
0067192.168.0.774
垢版 |
2019/04/09(火) 02:14:18.12ID:Xrq4p9iW0
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか?
0068192.168.0.774
垢版 |
2019/04/09(火) 06:11:46.94ID:bDBZAOBP0
>>67

その二択なのか?
0069192.168.0.774
垢版 |
2019/04/09(火) 07:35:20.06ID:aX1j4Hrw0
MediaWiki 一択でしょ
0070192.168.0.774
垢版 |
2019/04/09(火) 07:42:31.88ID:aX1j4Hrw0
>>64
というか ArchiveTeam の日本語版を作ったほうがいいな
向こうが全てにおいて優れているから自分達で1から始める理由がない
日本支部的な感じで翻訳から始めよう
0071192.168.0.774
垢版 |
2019/04/09(火) 10:44:41.80ID:47CWuxog0
そのまま日本語化は無理だろうね、法律違うし
アーカイブをまとめてtorrentで配布とかそもそもサイトをアーカイブして勝手に公開することとか
禁止しないといけないこと、解釈を変えないといけないこと色々あるでしょう
0072192.168.0.774
垢版 |
2019/04/09(火) 12:18:20.83ID:j/bARIBT0
Torrent配布は日本では完全に無理だな
Archive Teamはインターネットアーカイブをデータを提供しているらしいから、それに倣った方がいい
0073192.168.0.774
垢版 |
2019/04/09(火) 17:30:25.36ID:ilhSCREf0
そういえば少し前にググルマップがゼンリン切ったけど、ゼンリンが提供してた部分以外で何か独自の消失したものってあった?
0074192.168.0.774
垢版 |
2019/04/09(火) 20:25:46.98ID:R0ew9YH30
このスレってパソコン初心者感がすごいな
このまま進んでも上手くいかないだろうな、というのが見てて分かる
0075192.168.0.774
垢版 |
2019/04/09(火) 20:40:23.16ID:TX2XtJeD0
随分ふんわりとした否定だな
0076192.168.0.774
垢版 |
2019/04/09(火) 21:42:02.72ID:j/bARIBT0
初心者っぽいポイントを挙げてみろよ
出来ないならそれは単にイチャモン付けてるだけだぞ
0077192.168.0.774
垢版 |
2019/04/09(火) 21:51:39.41ID:j/bARIBT0
×初心者っぽいポイント
○上手くいかないであろう根拠

逆に聞くが>>74はどうやったら上手くいくと思うよ?
0078192.168.0.774
垢版 |
2019/04/09(火) 22:06:36.56ID:Ybc45mGn0
適当に作ったブックマークレット各種
google cache化
javascript:{window.open('http://webcache.googleusercontent.com/search?q=cache:'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}

保存 WayBackMachine (web.archive.org)
javascript:{window.open('https://web.archive.org/save/'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}

WayBackMachine最新
javascript:{window.open('https://web.archive.org/web/submit/?url='+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'&type=replay');eval();}

GeoLog化
javascript:{window.open('https://thaliana.mydns.jp/GeoLog/'+escape(window.location.href.replace(/^https?:\/\//,'')).replace('http://','')+'');eval();}
0079192.168.0.774
垢版 |
2019/04/09(火) 22:34:51.34ID:Ybc45mGn0
適当に作ったブックマークレット各種(2)
Save to Archive.today
javascript:void(open('http://archive.today/?run=1&;url='+encodeURIComponent(document.location)))

Web魚拓化
javascript:{window.open('http://gyo.tc/'+escape(window.location.href.replace(/^https?:\/\//,''))+'');eval();}
0080192.168.0.774
垢版 |
2019/04/09(火) 23:12:16.41ID:thZOPaUB0
グッジョブ
0081192.168.0.774
垢版 |
2019/04/10(水) 14:33:20.20ID:0KzfqGnC0
>>78
google cacheをWayBackMachineに保存するときに保存のブックマークレット使うと失敗しますね。
最新の方で開いてから「Save this url in the Wayback Machine」をクリックで成功。
一度失敗してしまった場合はgoogle cacheのURLの後ろに「&hl=ja」等をつけてから最新で開いて「Save This URL」。
0084192.168.0.774
垢版 |
2019/04/10(水) 22:12:15.15ID:5UKQiW/z0
/web/2/ってのは/web/*/の勘違いかタイポなんだろうな
/web/*/使えばもっと簡潔に書けると思うよ
0085192.168.0.774
垢版 |
2019/04/10(水) 22:14:34.68ID:Qi/9tnuY0
/web/*/だと一覧に飛んで/web/2/だと最新のに飛ぶんでないの
0087192.168.0.774
垢版 |
2019/04/11(木) 00:46:30.73ID:2s+xSUEt0
/web/URLでも最新に飛べるけどな
0088192.168.0.774
垢版 |
2019/04/11(木) 10:08:33.22ID:NcP8kiVw0
このスレ見つけらんねえよ
魚拓,archive,waybackとかスレタイに含まれてなきゃ
0089192.168.0.774
垢版 |
2019/04/11(木) 10:41:01.74ID:zpHmesQE0
上の方で話してたけどスレタイの文字数制限厳し目だからウェブアーカイブ総合の横にInternetArchiveと魚拓入れただけでカツカツになっちゃうんだよね
板設定変更依頼スレッド見ると簡単には設定変更してくれないようだしなんか削らないと
いっそ魚拓・InternetArchive総合にすりゃいいのか?
0090192.168.0.774
垢版 |
2019/04/11(木) 11:12:44.61ID:JiNXg/cV0
良スレだな。応援してるわ
日本のサイトもサービス終了対策しないと空白になってしまうので
管理人が全員生きてて引っ越し出来るとも限らんし、消された情報が将来誰かに必要・不要なんて分からんのよね

日本の法律から、終了するサイトは丸ごと個人のローカルへ保存する方法が有ると良いな
分散バックアップにもなると思う
0091192.168.0.774
垢版 |
2019/04/11(木) 11:26:31.44ID:3yDWyDnm0
>>89
タイトル案

【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】ウェブアーカイブ1【InternetArchive】
【魚拓】ウェブアーカイブ1【IA】
【魚拓】ウェブアーカイブ1【Internet Archive】
【魚拓】アーカイブ1【Internet Archive】
【魚拓】Web archiving1【Internet Archive】
魚拓:ウェブアーカイブ1:Internet Archive
ウェブアーカイブ1【Wayback Machine,魚拓】
ウェブアーカイブ1【Internet Archive,魚拓】
ウェブアーカイブ1【魚拓】
ウェブアーカイブ1😂InternetArchive魚拓
ウェブアーカイブInternetArchive魚拓1
archive 1【魚拓】
魚拓 1
0092192.168.0.774
垢版 |
2019/04/11(木) 12:00:59.64ID:aWNM129m0
魚拓やWayback Machine以外のツールも扱うよ、ってことで「総合」は付けておきたい
0093192.168.0.774
垢版 |
2019/04/11(木) 12:04:19.18ID:aWNM129m0
>>91
追加

ウェブアーカイブ総合【Internet Archive・魚拓】#1
【ウェブ魚拓】インターネットアーカイブ総合 #1

>>1にリンクがあるウェブ魚拓スレやIA専用スレと間違われないようなスレタイが望ましい
0094192.168.0.774
垢版 |
2019/04/11(木) 12:18:42.95ID:zpHmesQE0
となるとやっぱりウェブアーカイブ総合は外せないか?
魚拓、InternetArchiveの他にウェブページを保存したい人が調べそうな単語ってあるんかな
収集、保存、保管、ダウンロード、キャプチャ、スクラップ
うーん・・・
0095192.168.0.774
垢版 |
2019/04/11(木) 12:26:06.26ID:D+Yqkgbv0
魚拓もウェブ魚拓って完全にスレタイに含めないと話にならない
0096192.168.0.774
垢版 |
2019/04/11(木) 13:18:54.90ID:aWNM129m0
ウェブ魚拓は固有名詞としても使うだろ
https://info.5ch.net/index.php/魚拓
このサイトでも「魚拓」とだけ紹介してるし、何よりスレタイ制限の48バイトって結構カツカツだし、魚拓だけで良いんじゃないかな
0097192.168.0.774
垢版 |
2019/04/11(木) 13:20:20.32ID:aWNM129m0
>>96
×魚拓だけで良いんじゃないかな
○「ウェブ魚拓」と完全にスレタイに含める必要は無いんじゃないかな
0098192.168.0.774
垢版 |
2019/04/11(木) 13:59:00.00ID:D+Yqkgbv0
そんなにこだわってないならIAは略していいってことになるけどそうはならないのと同じ
ウェブ魚拓とスレタイに含めないと立てる意味がない
0099192.168.0.774
垢版 |
2019/04/11(木) 14:44:54.16ID:zpHmesQE0
【ウェブ魚拓】ウェブアーカイブ総合 Page.1【InternetArchive】
sjisで60バイト
ウェブ魚拓をweb魚拓にすれば57バイト
ウェブアーカイブもwebアーカイブにすれば54バイト
64バイトまで引き上げてもらえば全部入る
【ウェブ魚拓】を抜けば48バイトに収まる
とりあえずウェブ魚拓抜いて立て直して申請通ったら次のスレからウェブ魚拓も入れるのがいいんじゃないか
なぜIAじゃなくてウェブ魚拓を抜くのかについてはGoogleの検索トレンドを参考にした
https://i.imgur.com/cNx29z9.png
0100192.168.0.774
垢版 |
2019/04/11(木) 15:23:27.94ID:rHrFPNjW0
大抵「Archive」でスレタイ検索するなあ自分は
0101192.168.0.774
垢版 |
2019/04/11(木) 16:54:04.85ID:aWNM129m0
「ウェブ魚拓」と「魚拓」のどちらでも、Googleなら上手いこと検索に引っ掛かってくれそうではある
Bingは知らん
0102192.168.0.774
垢版 |
2019/04/11(木) 18:36:21.34ID:3yDWyDnm0
「魚拓」 でも引っかかるから「ウェブ」は要らないね
https://www.google.com/search?q=%E9%AD%9A%E6%8B%93+site%3A5ch.net

というか普通にスレあった
https://mevius.5ch.net/test/read.cgi/esite/1498902308

>>92
「ウェブアーカイブ」だけで全てを説明できてるから「総合」も要らないと思う
Internet Archive, Wayback Machine, archive.is, 魚拓, ArchiveTeam は全部「ウェブアーカイブ」で説明できる 👀
Rock54: Caution(BBR-MD5:1322b9cf791dd10729e510ca36a73322)
0103192.168.0.774
垢版 |
2019/04/11(木) 18:59:21.43ID:zpHmesQE0
ウェブアーカイブ(に関するものを)総合(したスレッド)
ていうかそれ総合格闘技とか格闘技で空手やら柔道やら説明できるから総合いらないじゃんって言ってるようなもんでしょ
総合とわざわざ表記することによって一つではなく全体であることを暗に示してるんだよ
0104192.168.0.774
垢版 |
2019/04/11(木) 19:37:27.64ID:3yDWyDnm0
いや、どっちかというと「空手 part1」でも十分なのに「空手総合 part1」 にしてる感じ
ウェブアーカイブの技術としては1つにまとまるから総合しなくてもいい
「ウェブアーカイブサービス総合」なら自然だね
文字列制限があるなら省いても問題ない
0105192.168.0.774
垢版 |
2019/04/11(木) 19:55:40.33ID:3yDWyDnm0
今気づいたけど「ウェブアーカイブ」が何を指すかの認識の違いだね

@ ウェブアーカイブ → アーカイブのサービス (digital archive or archive site)
A ウェブアーカイブ → アーカイブ技術 (web archive or web archiving)

アーカイブ技術という意味で使っても良いかと思う
0106192.168.0.774
垢版 |
2019/04/11(木) 23:09:34.96ID:L2Qvrxob0
>>78-79
window.open()の後ろにeval()付けたり、void()の引数にしたり、
未定義値を返したいだけなのに方法がバラバラ。
同じ人が作ったにしては変な話だな。
0107192.168.0.774
垢版 |
2019/04/12(金) 00:06:00.46ID:dU8Shh4A0
公式が公開しているものをコピペしたのも含まれてるのかな
0108192.168.0.774
垢版 |
2019/04/12(金) 03:12:04.19ID:IEOgrIFJ0
todayは公式のやつだったかも。てへぺろッ
0109192.168.0.774
垢版 |
2019/04/12(金) 07:27:14.62ID:SClfSpUI0
67 名前:192.168.0.774
投稿日:2019/04/09(火) 02:14:18.12 ID:Xrq4p9iW0
結局wikiはどこに作るんだ
atwikiかwikiwiki辺りか?


69 名前:192.168.0.774
投稿日:2019/04/09(火) 07:35:20.06 ID:aX1j4Hrw0
MediaWiki 一択でしょ



まずここから考えよう
0110192.168.0.774
垢版 |
2019/04/12(金) 07:30:12.18ID:SClfSpUI0
シーサーブログのシーサーウィキというのもあるらしいが。
0112192.168.0.774
垢版 |
2019/04/12(金) 07:36:46.55ID:SClfSpUI0
Seesaa Wiki(シーサーウィキ)とはシーサー
株式会社が運営するレンタルウィキサービスである。

@wiki(あっとうぃき、atwiki)とは、和歌山県の有限会社アット
フリークスが提供するレンタルウィキ。2ちゃんねる掲示板のパート
スレッド(パートスレ)まとめに用いられることが多い。

(以上ウィキペディアより)
0113192.168.0.774
垢版 |
2019/04/12(金) 12:28:44.53ID:xJcFOgmj0
MediaWikiはきちんとしたシステムが作れるのはメリットだけど管理が面倒
Pukiwikiはどうだろう
https://pukiwiki.osdn.jp
0114192.168.0.774
垢版 |
2019/04/12(金) 16:01:45.26ID:U3RvVBMo0
ミクシィもSNSはお荷物事業だからそろそろたたむ準備してそうだな
0115192.168.0.774
垢版 |
2019/04/12(金) 16:32:28.92ID:zTEegk2Q0
相変わらずパソコン初心者感が満載
おかげさまで、パクりの寄せ集めを「作った」と詐称しても
その不自然さに気付けないという

>>113
この流れだと、セットアップ済みのレンタルWikiの方が無難だと思うよ
0116192.168.0.774
垢版 |
2019/04/12(金) 17:13:46.28ID:OzOD5/Ux0
高圧的に的確な指示出しててワロタ
0118192.168.0.774
垢版 |
2019/04/12(金) 19:44:52.10ID:IEOgrIFJ0
初心者とかどうでも良い。使えさえすれば。
0119192.168.0.774
垢版 |
2019/04/12(金) 19:48:37.42ID:3kWgI93v0
今必要なのは初心者じゃないけどな
0120192.168.0.774
垢版 |
2019/04/12(金) 23:04:13.37ID:6eRxenyu0
使えりゃ何でも良いから不自然だろうが気にしないけどな
使ってて問題がありゃ自分で作り直すまでだ
0121192.168.0.774
垢版 |
2019/04/12(金) 23:06:32.84ID:6eRxenyu0
>>115
>セットアップ済みのレンタルWikiの方が無難
確かにな、一からサーバ立てて設定しなきゃいけないWikiだと結局グダりそうだ
そうなるとポピュラーなatwikiあたりかな
0122192.168.0.774
垢版 |
2019/04/13(土) 04:31:44.74ID:PBKRoLHf0
ShoutWiki なら無料で MediaWiki 使えるね
とりあえず有能な人が来るまではこれでいいでしょ
0123192.168.0.774
垢版 |
2019/04/13(土) 05:50:27.39ID:oa76VPkq0
>>122

それで異存はない。
0124192.168.0.774
垢版 |
2019/04/13(土) 10:15:26.73ID:ybhQs0Es0
そしてwikiサービス終了するんですね分かります
0125192.168.0.774
垢版 |
2019/04/13(土) 14:37:20.47ID:BP9fC9wY0
終了したらどこか別のところへ移転すれば良い
0126192.168.0.774
垢版 |
2019/04/13(土) 17:53:03.37ID:BP9fC9wY0
>>104
「総合」を付けることを発案した者です
単に「ウェブアーカイブ」というとIAやArchive.is等のウェブサービスを使うことを連想している人が多かったようなので、
ウェブアーカイブはそれだけじゃないよ、wget等のツールや自作ソフトを使うのも立派なウェブアーカイブなんだよ、ということを強調したかった
そして、IA専用スレやウェブ魚拓スレで扱われないウェブアーカイブ技術関連の話題の受け皿にしたかった
>>105の言う通り認識にズレがあるみたいだね
0127192.168.0.774
垢版 |
2019/04/13(土) 19:36:41.35ID:LxikEBfR0
>>126
126名無しさん@お腹いっぱい。2019/04/06(土) 09:24:43.110
インターネット遺産のアーカイブ系総合スレみたいなところってどこ?
そういうところは5chに無いのかな

総合ってはじめに使い出したのは俺なんだけどな
0128192.168.0.774
垢版 |
2019/04/13(土) 20:07:13.70ID:HJ17KfG20
>>127
すまん、ここのスレタイを考えたのは自分だったので思い違いをしてた
0130192.168.0.774
垢版 |
2019/04/14(日) 01:04:52.71ID:CM5+hhVJ0
日本だとウェブアーカイブは著作権侵害(犯罪)になるからこのスレ危ないよね?
逮捕されたくないので消えます
0131192.168.0.774
垢版 |
2019/04/14(日) 01:25:36.52ID:nTd5PtnI0
実際その辺は心配ではある
弁護士に聞いてもやめとけで終わりそう
個人でDLしての私的利用ならアリなのかな
とりあえずツール中心の紹介にとどめておくべきかもね
0132192.168.0.774
垢版 |
2019/04/14(日) 02:56:48.93ID:v+D0MDAi0
まだ親告罪だから訴えられなければセーフ
0133192.168.0.774
垢版 |
2019/04/14(日) 03:08:40.08ID:v+D0MDAi0
ちゃんと説明すると、非親告罪化された著作物は金銭的な利益が絡むものに限られてるので、
大体のウェブアーカイブの場合問答無用で捕まることはないはず(多分)
あと著作権法に抵触するのはウェブアーカイブを無断で公開した場合のみであって、
各個人でサイトを保存して私的に取っておくこと自体は違法でもなんでもない

Archive Team経由でInternet Archiveにデータを寄付してしまえば日本の法律では手が出せないはず
0134192.168.0.774
垢版 |
2019/04/14(日) 03:17:25.65ID:SqtAvvkZ0
ウェブ魚拓の運営も捕まってないよね
0135192.168.0.774
垢版 |
2019/04/14(日) 03:26:04.24ID:qw07bbn30
削除依頼無視でもしない限りは大丈夫なんじゃないの
アーカイブしたサイトに違法なコンテンツがあったらどうなるかわからんけど
0136192.168.0.774
垢版 |
2019/04/14(日) 03:44:40.89ID:v+D0MDAi0
>>134
そうなんだよね
パッと見完全にアウトなサービスだけどちゃんと続いてるってことは、上手くやれば訴訟を起こされるようなことにはならないってことだし
それにあそこの運営は企業だから、事業の一つにもなりうるってことでもある
0137192.168.0.774
垢版 |
2019/04/15(月) 03:23:24.42ID:zgYzoRmr0
Shoutwikiでサイト立てるのは誰がやる?
暇だったら自分がやってたんだが正直管理業務とかやってる余裕がない
0138192.168.0.774
垢版 |
2019/04/15(月) 22:12:08.31ID:k4EioB070
いっそ最初はwikiじゃなくて各々が個人サイトとかブログで情報まとめたりしてそれらのサイトをリスト化すればいいんじゃないか
0139192.168.0.774
垢版 |
2019/04/15(月) 22:26:55.43ID:+QZpIriz0
>>138
全員が個人サイトやらブログやらを持っている訳じゃないし、持ってても手間がかかって面倒だって人間もいるだろう
各々が直接情報を書き込んで行く方が手間がかからない
そうなると、きちんとした体制さえ構築できるのならWikiが一番良い
0140192.168.0.774
垢版 |
2019/04/15(月) 22:40:37.04ID:k4EioB070
それはわかってるけどwikiを管理する技術と時間がある人いるのかって話なんすわ・・・
0141192.168.0.774
垢版 |
2019/04/15(月) 23:09:48.42ID:OIWksCm90
wikiが必要なほどの量の情報が集まるのかが疑問
アーカイブに関することと言ってもツールの使い方を翻訳するくらいしかできないだろう

本格的なアーカイブ作業をするのならArchiveTeamに入るべき
日本支部を作るにしても結局はArchiveTeam本部の力が必要

日本のサイトは英語圏から見逃されやすいから日本人の注目を集めることでArchiveTeamに貢献することもできるかもしれない
ただし本当に技術がある人は既に英語圏のコミュニティに参加しているからどれほど効果があるかは分からない
0142192.168.0.774
垢版 |
2019/04/15(月) 23:10:03.44ID:+QZpIriz0
それは確かになぁ
正直>>115がやれば良いんじゃないかという感じがする
0143192.168.0.774
垢版 |
2019/04/15(月) 23:17:05.99ID:+QZpIriz0
ArchiveTeamって多くの日本人は入りづらい所があると思うんだ
だからArchiveTeam本部と一般の日本人ネットユーザーの架け橋になるような組織はあって損はないと思う
ArchiveTeamのサイトにはアーカイブについての知見がまとめられているから、MediaWikiなんて大仰なものが必要かは疑問ではあるけど、
彼らの知見を翻訳して日本人向けに公開する場所はそれなりに有意義じゃないだろうか
0144192.168.0.774
垢版 |
2019/04/15(月) 23:19:08.03ID:d2BbUiX90
とりあえず最初はgoogleドキュメントみたいな手軽なところでやってみれば
0145192.168.0.774
垢版 |
2019/04/15(月) 23:20:08.99ID:+QZpIriz0
日本でウェブアーカイブというと既存のウェブサービスを利用するイメージが強いからね
英語コミュニティで活動する日本人エンジニアはある程度いるが、そうした人の中でもウェブアーカイブについて詳しい人はそんなにいないと思うよ
0146192.168.0.774
垢版 |
2019/04/17(水) 12:15:06.93ID:KC94xqUc0
英語コミュニティで活動する日本人エンジニアで、ウェブアーカイブについて詳しい人は結構いると思うが
ウェブアーカイブに関する活動に多くのリソースを使おうと考える人は非常に少ないだろうね
0147192.168.0.774
垢版 |
2019/04/17(水) 13:25:55.62ID:pBKnwE2u0
ウェブアーカイブ専門の日本人は、国内コミュニティ・英語コミュニティ問わずかなり少ない
機械学習用のデータ収集やWebサービスの構築などの目的で、クローラを動かしてスクレイピングすることはエンジニアの間でかなり一般的になってきた感じがある
(ウェブアーカイブについての知識があるエンジニアにはこういう事をやってる人が多い)
でもそれは「データ収集手段としての保存」であって、ウェブアーカイブという「目的としての保存」を専門にしている人はほんの一握りよ
0148192.168.0.774
垢版 |
2019/04/18(木) 20:54:33.70ID:231mhavm0
Webスクレイピングは仕事になるけどWebアーカイブは仕事にならんものな
専門家が少ないのも道理
0149192.168.0.774
垢版 |
2019/04/19(金) 12:33:49.48ID:Sck2kHkT0
結局サイトはどうするよ
Googleドキュメントはお手軽だけど検索エンジンで見つからないし、Wikiサービスがいいと思う
Wikiの選択肢はatwikiかShoutWikiになるのかな
0150192.168.0.774
垢版 |
2019/04/20(土) 01:32:08.39ID:nlnJtIGb0
完全に人が消えてるな
>>74の予言が順調に実現して来てて笑う
0151192.168.0.774
垢版 |
2019/04/20(土) 02:38:53.71ID:EOflkhQE0
ネット上のデータを残し続けることに皆そこまで意義感じてないんじゃね
0152192.168.0.774
垢版 |
2019/04/20(土) 03:32:20.14ID:j74qt4l90
全部のリンクたどると凄い数になる。
数が多いと絞り込むのも大変だし、応答なしになるし、全部処理するということ自体出来るのか?と不安になるくらい次から次へとアドレスが出てくる。
過去に処理したやつ除外すれば…と思ったがかえって遅くなった。
あとURLが一部壊れてしまうのも原因不明。
0153192.168.0.774
垢版 |
2019/04/20(土) 10:06:44.64ID:uNdtbvPn0
あまりにも膨大で途方もないから
大抵の人は投げてしまうのさ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況