青空文庫 11棚目
■ このスレッドは過去ログ倉庫に格納されています
>>707
編集著作権については『青空文庫作業マニュアル』の「3.底本を選ぶ 2)出版社の許諾は必要か」で触れてる
青空文庫作業マニュアル【本という財産とどう向き合うか】
https://www.aozora.gr.jp/aozora-manual/ >>434
これまだ何の返事もないんだけど、やっぱ届いてないのかな?
ちなGmail 真実は点検さんに聞かないとなんとも
ちなみ私がgmailで7月に送ったある作品は届いていなかったらしく
その後gmailでないアドレスから送り直したよ。
同じく7月にgmailから送った他の作品はちゃんと届いていたんだけど。
gmailの不具合なのか点検作業が大変なのかこちらは判断がつかないから、青空文庫用のやり取りにgmail を使うこと自体をやめたな システムから受け取り確認の自動返信をもらえるようになると安心なんだけど 申請メールが多すぎてスパムに埋もれてしまってるんだろうね、きっと スパムに埋もれるとはつまりランチョンミートに埋もれるということか
なかなか羨ましい状況にも思える 最近校了のペースより作品公開のペースのほうが早そうなんだけど、ストックがゼロになったことって今まであるんかな 公開ペースを一定にする(毎日なにかしらが公開されるという魅力を持たせる)ためにストックするのは
なにか商業主義的駆け引きを感じて自分としてはあまり好ましく思っていない
そもそも毎日新作?を楽しみにしている層と
そんなこと関係なく必要に応じて検索して青空文庫に公開されてれば嬉しい!という層とでは
後者の方が多いんじゃないかって思うんだよね(個人の感想です)
誕生日や命日まで温存しておかなくたって
完成し次第公開してもらえたほうが
ボランティアも利用者もありがたいと思うのだけどな むしろ定期(毎日)更新って公開するための締切を自ら課してるだけじゃないの
パブリックドメインをウェブ上で公開する仕組みも入力や校正のデータも独占・奪取してるわけでもないし
青空文庫での公開の作業を担ってるスタッフだって他の工作員と同様に飽くまでボランティアなんだから
究極的には1年間に1作品以下の頻度の公開でも文句言える立場の人って別に居ないわけで 公開日を誕生日や命日とかにするのは公平で良いと思う。 2022-12-01 山本 周五郎『だんまり伝九』
2022-12-02 ホワイト フレッド・M『トリガーセンの妻 コーンウォール物語』
2022-12-03 池田 勇人『政府を拘束しない』※誕生日
2022-12-03 佐藤 春夫『「珊瑚集」解説』※「珊瑚集」著者は永井荷風
2022-12-03 永井 荷風『歓楽』※誕生日
2022-12-03 室生 犀星『〈我が愛する詩人の伝記〉(補遺)』※佐藤惣之助誕生日
2022-12-04 山本 周五郎『伝四郎兄妹』
2022-12-05 作者不詳『現代語訳 平家物語 12 第十二巻』
2022-12-06 時枝 誠記『文学教育と言語教育』※誕生日
2022-12-07 坂口 安吾『光を覆うものなし ――競輪不正事件――』※競輪不正事件の不起訴処分決定が報道される
2022-12-08 山本 周五郎『峠の手毬唄』
2022-12-09 夏目 漱石『三四郎』※命日
2022-12-10 大田 洋子『いまだ癒えぬ傷あと ――放射線火傷で右手をうしなつた木挽きの妻と河原にうつ伏せて死んでいた幼女に――』※命日
2022-12-11 山本 周五郎『初午試合討ち』
2022-12-12 中谷 宇吉郎『日本の将来』
2022-12-13 田山 花袋『晩秋の頃』※誕生日(旧暦)
2022-12-14 尾崎 士郎『生きている忠臣蔵 ――忠臣蔵は何故流行するか――』※忠臣蔵の日
2022-12-15 山本 周五郎『春いくたび』 2022-12-16 グリム兄弟『天国へいった仕立屋さん』※ヴィルヘルム・グリム(弟)命日
2022-12-17 山本 周五郎『梟谷物語』
2022-12-18 佐藤 春夫『愉快な教室』
2022-12-19 山本 周五郎『武道宵節句』
2022-12-20 小泉 八雲『お貞のはなし』※翻訳者(田部隆次)命日
2022-12-21 山本 周五郎『蒲生鶴千代』
2022-12-22 柳田 国男『私生児の方言』
2022-12-23 徳田 秋声『青い風』『閾』※誕生日(旧暦)
2022-12-24 ドストエフスキー フィヨードル・ミハイロヴィチ『クリスマスと結婚式 ――無名氏の手記より――』※クリスマスイブ
2022-12-25 矢内原 忠雄『イエス伝 マルコ伝による』※命日
2022-12-26 菊池 寛『たちあな姫』『世に出る前後』※誕生日
2022-12-27 山本 周五郎『半化け又平』
2022-12-28 作者不詳『現代語訳 平家物語 13 灌頂の巻』
2022-12-29 三木 露風『明治詩壇の回顧』※命日
2022-12-30 横光 利一『自慢山ほど』※命日
2022-12-31 寺田 寅彦『宇宙の二大星流』※命日
2022-12-31 中谷 宇吉郎『「寺田寅彦の追想」後書』 新年の挨拶とかお正月に関するエッセイとかを入力すると1月1日に公開されるかな? 作家別校了作品の比率から妥当かどうか検討してみてよ 作業数多いがゆえに校了して結構経ってるのに公開されてない作品を見るとなんかこの「間」もったいねえなと思うこともあるからガンガン公開して言ってほしい
一時期同じ作家の公開が続いたって無限に作品があるわけじゃないからいずれなくんだしなる ガンガン公開しろってガンガン公開準備しろってことになると思うけどそんな厚かましいこと言うほど何か貢献してんの? 少なくとも毎月毎月「山周ばかり」って文句いうよりはいいと思う 種類に文句言ってるか量に文句言ってるかという違いだけでどちらも人任せなのは結局同じ
ただし他人により重い負担と労力を課そうとしているのは後者 >>727
割合に応じて案分した結果の数字なのか意図的に配分してるような数字なのか出せって話であって、どっちを選んだら問題あるかないかなんて話はしてないでしょ >>728
校了した翌日でも公開は可能な仕組みならともかく校了後ファイルも点検してるって言ってるし、その「間」とやらは作品ごとに差があるとしても公開に必要な期間なのでは? いまいち分かってないんですが公開のタイミングって
そもそも誰が決めてるんでしょうか?
校正者の意向なんでしょうか?
誕生日目指して公開できるように頑張るとかの
モチベーションになってるってことであれば意味はあると思うのですが。 質問させてください
割り注に最大長とかみたいな制約ありますか? >>733
いやだから、どっちか数字を出せ!って言われるような潜在的問題はなにもないから、出せって言うなという話でしょ。 >>736
ここで質問するより点検さんに訊くのが良いと思うよ。
点検さんの手を煩わせるのは申し訳ないと思ってここで訊くのだろうけど、
点検さんとしても訊いてくれたほうが後々の点検が楽になるわけだから、丁寧に質問に答えてくれるよ。 たしかに電子図書の割注の表示って
結局はユーザの表示する環境次第だから、複数行にわたる長い割注の場合どう表示されるんだろうね
我々の作業ではそこは意識するところではないんだけど
最大長の件、点検さんから答えがあったら、ここで共有してくれると嬉しいが >>734
ですね。
公開用XHTMLファイルに変換する作業も人手も必要ですし
出来たXHTMLも公開用サーバに上げるからには表示チェック(校正ほどの厳しい目ではないにしろ通読する)必要もあるんじゃないかと思います。 あくまで提示されてる情報からの推測だけど、
注記一覧のページを見た限りだと、ルビ、縦中横、行右(左)小書き、上(下)付き小文字、罫囲み、横組み、文字サイズの注記については、
>対象文字が長めの場合や、外字注記が用いられているとき、前方参照型では期待通りに変換されない場合は、始まりと終わりを特定する開始/終了型で、次のように注記してください。
という旨の説明があって、2種類の注記方式を用意してるから、
【[#割り注]○○[#割り注終わり]】だけで【○○[#「○○」は割り注]】みたいな注記を用意していない以上は割り注の注記に文字数の制約はないんじゃないでしょうか
注記一覧 その他 - 青空文庫
https://aozora.gr.jp/annotation/etc.html まだ入力者登録してないので、点検の方に質問するのは後回しにします。
>>741
やはり制限はなさそうですね。
Windows用ビューワーであるPageOneやOyaziViewerでエラー発生するのは確認しているんですが、青空文庫と関係ない話なので厄介そうです 二段組に対応してるビューワーってあるんだろうか。
大して調べてるわけじゃないけど二段組は再現できない仕様が多いよね >>744
記念日に公開したいって思惑は分かるんですがそれが校正者の意図なのか
公開者の一存なのかが知りたいです >>745
校正者の意図か公開者の意図かという話になれば、それは概ね公開者の意図ということになると思う
ほとんどの作業ボランティアは点検グループの大変さや校正テキストファイルを提出してからその先の時間的長さと人的負担を理解していると思うので、いついつ公開してくれという希望は余程のことがなければ出さない(出せない)と思う 10校正したら1入稿というような何らかの制限つけたほういいと思う
そうしなきゃ自由気楽にきる入力ばかりやってしまう 発想面白いね
ただそこは作業者次第よ
だって自分は入力よりずっと校正してたいもん、達成感あるしね
だけど校正は点検グループの手を確実に煩わせるから
今は大量申請できないんだ 校正は自分の作業が確実に近い未来の公開につながるのが魅力よね 10校正したご褒美に1入力だと今の校正待ちが余ってる状態では成り立つけど最終的に校正待ちファイルが枯渇してさらに入力もできなるなるやで だが待ってほしい
入力はOCRの仕事で、校正は人間の仕事になるのではないか AI様が次世代デジタルライブラリーのocrと国会図書館デジタルコレクションの底本画像を組み合わせて、片っ端から自動で青空文庫注記をつけてくれた上で青空文庫のデータベース上に勝手に登録してくれて、あとは人が校正するだけになったら相当面白いかも >>753
OCRの出力結果が正しいかどうか判断するAIが正しいかどうか判断するAIが正しいかどうか判断する人間のひと手間は避けられない >>750
まさかの山川方夫短編が上位
おそるべしYouTube >>757
YouTubeで、青空文庫の作品を要約してアニメにして紹介してる方が居て、おそらくその影響で上位になったと思われる
個人的に山川方夫さんは好きな作家だから嬉しい なるほど、ありがとう
青空文庫をもとに制作しているYouTubeチャンネルも色々あるけど
それきっかけで青空文庫本家にユーザが来てくれるのは嬉しいね 1話目でいつものパターンそのままでいらんと思ったので
今回はつられないぜ 教養が無いし翻訳作品はあまり読んでないから普通に知らんかった…… 子どもの頃「少年少女世界の名作文学」で「にんじん」を読んで、これは何を伝えたいんだろうと真剣に悩んだ 青空文庫読者なので工作員の悲喜こもごもを楽しく見させていただいております 「JIS X 0213にはないがUnicodeにある漢字」を左ルビに使えるかどうかはビューワーの実装次第? Windows用アプリの左ルビ対応状況を調べてみた
[アプリ名(バージョン)] [JIS X 0213に規定された第3第4水準にある漢字] [JIS X 0213にないがUnicodeにある漢字]
えあ草紙(ver1.3.0) OK OK
PageOne(ver4.00) OK NG
OyaziViewer(ver2.6.5.0) NG NG PageOneはU+1F130からU+1F189までの四角囲みアルファベットを表示できないっぽい そらもようにあった25周年記念のイベント?ってまだ期待してでもいいのかな UTF-8に移行すれば、難しい字句のWeb検索で青空文庫のhtmlファイルがヒットする確率があがるんだが だからずっとutf-8に移行して欲しいってずっと言ってきてる訳ですが
逆にsjisにこだわってる理由があるなら教えて下さい 中途半端に漢字をJIS X 0213の異体字に置き換える行為って、善意のようにみえて実は作品を蹂躙してるのと同じなんだよなあ
怖いよ、善意の破壊者 >>780
萩原朔太郎が「ローマ字論者への質疑」で
蝶は「てふ」でなくしてはならないなんていってるけど
現在の日本で蝶と「てふ」として読む日本人が果たして何人いるのか?
言葉は時代とともに移り変わっていくものであり
より良いものが提示されてるのに、検討もされないで思考停止してるのは
残念としか思えない。 そもそも今のコメントで引っ張ってくる漢字がutf-8の文字なら
そこにひと手間かける意味は何なんでしょうかと小一時間問いただしたい >>781
それだと、底本がどんな表現を使っていたかを知りたい、流行の変遷を知りたい、っていう需要に答えられないんだよね
電子化テキストのほうで勝手に情報を捨てたら、復元できないわけで 「言葉は時代とともに移り変わっていく」のなら、なおのこと勝手にその時代の情報を捨てたらダメでしょ
著作権が切れてるのを良いことに踏みにじりまくってるね
怖いよ、善意の破壊者 なまじ外字フォントやら注記で置き換えられているのは、がんばれば元のデータを復元できる
問題は、勝手にJIS X 0213に収まる異体字に置き換えてしまうケース
復元できないんだから、文化大革命も同然だよ スペインでキリストのフレスコ画をムンクのような絵に変えた事件あったじゃん?もう10年経ってたね
世界中で話題になった「おばあちゃんによる最悪の芸術品修復」から10年、町とおばあちゃんに起こった変化とは? - GIGAZINE
https://gigazine.net/news/20220818-ecce-homo-worst-artistic-restoration/ 「諭」(「言+兪」, U+2F9D0)はわりとよく見かけると思うんだが、包摂適用で「諭」にしていいか議論の余地がある。
ちなみにWindows環境だと、Meiryo UIフォントとか使わないと「諭」(「言+兪」, U+2F9D0)は表示できないので不便。 これと萩原朔太郎の言をを一緒にするのは流石におかしい。
その時代の異字体を大切にしたいなら、その方向での注釈をつけるべきで
utf-8の字体を全面的に拒む理由にはならない。
今後も機会あるごとに青空文庫のユニコード化は訴えっていこうと思います。 共産主義者が多いのかな、青空文庫の利用者って
賢いフリするのが好きなだけで頭悪そうな感じ Google先生に拾ってもらえなくなったらおしまいだよ 頭悪いは否定しませんが頭悪くっちゃ青空文庫利用しちゃいけないんですか?
というかワッチョイつけて欲しい >>778 以降の書き込みは、>>779,781,782,789,792 以外全部同じ人だよ
書いた本人が言うんだから間違いない
外字フォントや注記のままだと、いつまでたってもGoogle先生を始めとするWeb検索エンジンに拾ってもらえない。
Unicode化をぜひやってもらいたい。 >>779,781,782,789,792 は全部自分なんで、結局二人で言い合ってたわけかorz
この話題は広く議論してもらって、できるならutf-8化の方向で前に進めてもらいたいです。 突然始まって唐突に終わった気がする
とにかく何が言いたいかというと屁のツッパリはいらんですよ 仮名遣いはともかく、漢字に関しては出版社や印刷所や編集者の都合なり意向なりでいくらでも変わるし変えざるを得ないので異体字の包括表記はそこまで重要ではないと思う
それでもなお必要と思うなら「自分でやれば?」って感じ
自分でサイト作らなくてもWikisourceとかがあるしね 包摂適用についてはまあその通りで実用に問題ないレベルだと思う
じゃないと今まで放置されてない 正直自分はUTF-8に対応してくれたほうが嬉しいけど
そもそも現状の青空文庫一強みたいな風潮も変だし、違うアーカイブがもっと増えてもいいんだよねぇ
自分も青空文庫用に作った作品ファイルを自サイトで公開してるけど、その時は極力字を底本通りに直してるわ 単に電子テキストをアーカイブ化したいって言うなら、青空文庫で入力校正の手続きを踏むより
電子テキストをepub形式にしてKDPやkoboで出版→国会図書館の電子書籍納本、とかのが一人で完結するし手っ取り早いかもしれない 青空文庫は今のSJIS仕様のままだと、鬼門・地雷原ともいうべき旧字の多い作品の入力校正を皆が避けるようになってしまうから、良くないんじゃないかな 字形や表記にこだわる人は編集行為を嫌悪していると思う。
しかし編集があるから本になるし青空文庫にも載る。
包摂適用も編集行為のうちで、問題があるとは思わない。 本当にこの件を議論したい(動かしたい)ならば
ここより、そらもようでコメントしたほうが現実的かもね。
別にここではその話するなって意味じゃないよ。
いろんな考え方聞けて面白い 包摂適用はやむを得ずそうしてるだけで
青空文庫の基本的なスタンスは底本の尊重にあると思ってるから
SJISよりUTF-8のほうがそのスタンスにかなうならそうした方がいいとは思う
でも結局UTF-8にしたところですべての漢字が表示できるわけではないから、どこかで妥協する必要があるのは同じなのよね
運営も割と長年このことは議論してるんじゃなかったっけ
今のところSJISで行くんだろうけど、そのうちUTF-8対応になっても驚きはしないかな https://forest.watch.impress.co.jp/docs/bookwatch/digipub/1090529.html
「質疑応答では、青空文庫のデータにはシフトJISコードが用いられているため、海外の方がファイルを開くと文字化けしてしまうなどの問題が指摘された。Unicodeを採用すると、旧字をどうするか? などのルール変更が必要なので、これからの青空文庫の課題として考えていきますという回答がなされた。」
2017年の講演でこういう話は出てるから、運営もSJISのままでいることが最善最適とは思っていないとは思う。だからって将来的に変わるかどうかまではわからないけど。 >>802
誰も編集を嫌悪してなどいない
工作員が無難に編集できる作品しか選べない現状の仕様が問題なんだよ
熟練の工作員ほど無意識のうちに避ける習慣ができてしまっている ■ このスレッドは過去ログ倉庫に格納されています