X



青空文庫 11棚目
レス数が1000を超えています。これ以上書き込みはできません。
0001無名草子さん垢版2022/05/03(火) 21:14:18.76
青空文庫
https://www.aozora.gr.jp/

【前スレ】
青空文庫 10棚目
https://mevius.5ch.net/test/read.cgi/books/1556609356/

【過去スレ】
青空文庫
http://book.5ch.net/test/read.cgi/books/1053625425/
※青空文庫 2冊目※
http://book3.5ch.net/test/read.cgi/books/1073138957/
【※】青空文庫 3棚目【※】
https://book3.5ch.net/test/read.cgi/books/1090913506/
【※】青空文庫4棚目【通りすがり】
https://book3.5ch.net/test/read.cgi/books/1107162580/
青空文庫 5棚目
https://love6.5ch.net/test/read.cgi/books/1152838732/
青空文庫 6棚目
https://kamome.5ch.net/test/read.cgi/books/1272024810/
青空文庫6.5棚目
https://toro.5ch.net/test/read.cgi/books/1284042704/
青空文庫 7.5棚目
https://toro.5ch.net/test/read.cgi/books/1330433965/
青空文庫 8棚目
https://peace.5ch.net/test/read.cgi/books/1349105770/
青空文庫 8.5棚目
https://mevius.5ch.net/test/read.cgi/books/1427638306/
青空文庫 9棚目
https://mevius.5ch.net/test/read.cgi/books/1507638527/
0002無名草子さん垢版2022/05/03(火) 21:14:51.14
【青空文庫について】

青空文庫早わかり
https://www.aozora.gr.jp/guide/aozora_bunko_hayawakari.html

青空文庫のしくみ
https://www.aozora.gr.jp/aozora_bunkono_shikumi.html

青空文庫収録ファイルの取り扱い規準
https://www.aozora.gr.jp/guide/kijyunn.html

青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html

耕作員を志願される皆さんへ
https://www.aozora.gr.jp/guide/kousakuin.html

青空文庫への作品収録を望まれる方へ
https://www.aozora.gr.jp/guide/shuuroku.html

図書カード:青空文庫の提案 (青空文庫)
https://www.aozora.gr.jp/cards/001790/card56572.html

図書カード:「天に積む宝」のふやし方、へらし方 (富田 倫生)
https://www.aozora.gr.jp/cards/000055/card59489.html

青空文庫 - Wikipedia
https://ja.wikipedia.org/wiki/%E9%9D%92%E7%A9%BA%E6%96%87%E5%BA%AB
0007無名草子さん垢版2022/05/15(日) 17:11:39.20
アメリカで著作権保護期間を短縮する法案(遡及適用あり)が提出されたらしい
まぁ日本の保護期間延長はアメリカ云々ではなく欧州に歩調を合わせたもの(日欧EPAによる取り決め)だが


米国:「Woke」したディズニーへの報復として著作権保護期間を56年に短縮する法案が提出される | P2Pとかその辺のお話R
https://p2ptk.org/copyright/3582

ディズニーの著作権の特別保護を剥奪する法案をアメリカ上院議員が提出、2022年内にミッキーが「フリー素材」化する可能性 - GIGAZINE
https://gigazine.net/news/20220513-disney-copyright-hawley/
0008無名草子さん垢版2022/05/15(日) 18:11:47.16
これで十分だ。

> 1970年にアメリカで初めて成立した著作権法は、「14年間」の保護期間という短いものでした。
0009無名草子さん垢版2022/05/15(日) 20:52:31.27
というか没後何年じゃなくて公開後何年にしてほしい
存命中は延長申請可とかの特例措置で折り合いを付けて

「没年が重要な基準なのに著作者がいつ亡くなったのかが必ずしも分かるわけじゃない」というのが著作権上の問題の1つなので


あと保護期間中に著作者が亡くなったらどうするのかという「著作者や著作権承継者の連絡先が分からない」問題については著作権情報センターあたりで管理・仲介をしてほしいな
0010無名草子さん垢版2022/05/16(月) 20:30:42.46
アメリカだと、一定の年数の作品だと公開後95年じゃなかったっけ?
(だから日本だと保護期間がある作家や画家の作品がWikipediaとかで公開されてたりする)
0011無名草子さん垢版2022/05/17(火) 02:47:42.02
したらば、爆 サ イは企業(パチンコ店など)と提携してステマをしてる可能性が高い(ステマ掲示板)。
5ちゃん(2ちゃん)も?
掲示板は企業がステマするためのサイトになってる。
したらば、爆サイ、5ちゃんの管理人はユーザーをハッキングして個人情報を覗き見してる。
したらば、爆サイ、5ちゃんの管理人はユーザーを特定しようと自宅やネカフェまで探しに来る。
管理人はユーザーが掲示板を見てるだけでも今どこを見てるか分かります。
掲示板を見るだけのときも必ず匿名性の高いプロキシを使ってください(低いのは意味ないです)。

爆サイ管理人=したらば管理人=ネット工作会社ピットクルー=パチンコ店(パチンコ業界)。
爆サイ管理人(したらば管理人)、ネット工作会社ピットクルー、パチンコ店社員は連絡取り合いながら連携してパチンコ店スレに書き込んでるようです。
「客の悪口荒らし」「長文荒らし」をしてるのは爆サイ管理人(したらば管理人)やピットクルーやパチンコ店社員です。
それを削除してるのも同じ爆サイ管理人です。
ニコニコは5ちゃん管理人と情報を交換していたから安全ではない。

ピットクルーなどが爆サイ管理人もしてます。
爆サイ、したらば、5ちゃんはパチンコ業界などの資金で運営されてるようです。

パチンコ店は無抽選台に遠隔大当たり信号を送って大当たりさせてるだけです。
大当たり確率は嘘です。
パチンコ店は営業中に確率を自由に変えています。
パチンコ、スロットは詐欺です。
そして店は暴力団配下のサクラ軍団の台に遠隔大当たりをさせ、サクラ軍団は違法に年間数億円、数10億円を稼いでいます。
大手パチンコ店でも大勝ちしてるのはこのサクラ軍団ばかりです。

マルハン、楽園などの大手パチンコ店は顔認証データを交換していて、勝たせた客が他店で勝てないようにしてます(最後は全員負けるようになってる)。
嫌がらせ対象に選ばれた客の顔認証データも交換していて、その客が来店して席に着いた瞬間に隣や後ろの台を大当たりさせる嫌がらせをしてきます。
この客は他の席に移動してもすぐに隣や後ろの台を大当たりさせる。
これはパチンコ店の違法行為、犯罪です
パチンコ店の社員は偏差値40くらいしかないです。
0013無名草子さん垢版2022/05/26(木) 12:42:36.42
DLは1月からだからそれまでは手持ちの底本で作業しよう。
しかしありがたいことだ
0014無名草子さん垢版2022/05/26(木) 19:42:05.93
>>12のニュースは青空文庫とは直接関係ないのでは?
著作権保護期間中であっても一定条件を満たせば閲覧やダウンロードが可能になるということだけど
これはあくまでも国会図書館と個人利用者との間のやりとりの話であって、第三者へのデータ再配布が許可されたわけではないでしょ
0015無名草子さん垢版2022/05/26(木) 20:44:47.36
図書館に行ったり国会図書館に複写送付頼まなくても、家から底本が確認できるってことじゃない?
0016無名草子さん垢版2022/05/26(木) 20:51:02.35
>>14
国立国会図書館デジタルコレクションの限定公開の基準だと序文や挿絵とか装幀とかで1人でも著作権保護期間中の人が居たら裁定か限定公開になるから
(※ちなみに完全に著作権保護期間が満了してても復刻版が市販されてたら限定公開になる場合がある)
本文を書いた人は著作権保護期間満了してるとか分担執筆で第○章だけは著作権保護期間満了してるとかの部分は普通にパブリックドメインなので青空文庫に収録できる


そしてそういう再版も復刻もしてないような入手が困難な古い作品(しかも全く同じ底本)を
入力者も校正者も青空文庫の運営側も簡単に閲覧出来る状況になったわけだから入力や校正のやりやすさは格段に上がった

古い本だと仮に古書店で手に入れられてもコピーやスキャンが大変なレベルで劣化してたり元の所蔵者の書き込みがあったりするし
そもそも国立国会図書館以外の所蔵がほとんど確認できない本も少なくない
001714垢版2022/05/26(木) 22:09:44.43
>>16
なるほどそういうことか
言われてみればたしかに「著作権が切れてるはずなのに、なんで限定公開なの?」って作品がありました
0018無名草子さん垢版2022/05/26(木) 22:39:31.76
デジタルコレクションの図書館・個人送信限定のやつって
国立国会図書館の転載に関する利用規約を読むと複写物の(つまり画像としての)話しかしてない気がするけど
青空文庫みたいに文字起こしにして公開するのは問題ないのかな

国立国会図書館ウェブサイトからのコンテンツの転載 |国立国会図書館
https://www.ndl.go.jp/jp/use/reproduction/index.html

掲載/展示/放映/インターネット・ホームページ等への掲載のための国立国会図書館デジタルコレクションの画像データ提供(試行)|国立国会図書館
https://www.ndl.go.jp/jp/copy/reproduction/index.html
青空文庫側は前々から備考欄に
>国立国会図書館デジタルコレクション(https://dl.ndl.go.jp/)で公開されている当該書籍画像に基づいて、作業しました。
って書くようにしてるっぽいけど

青空文庫編 青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html
0019無名草子さん垢版2022/05/27(金) 12:18:57.86
国立国会図書館デジタルコレクションは本単位で公開/限定公開が決められてるっぽいけど
青空文庫は著者単位で収録されるからそこだけ抜き出して読んでも面白いもの作品は入力されるかもね

特に雑誌の寄稿なんかは分量も多くないし本を出してないような人でも書いてる場合があるから
「この人って作家や学者じゃないけど文章を遺してたんだ」みたいな人が収録されるかもしれない
002019垢版2022/05/27(金) 12:29:32.63
人任せみたいになってしまったけど自分は自分でこの話題が出る前から入力中/校正中の作品があるので……
0021無名草子さん垢版2022/05/27(金) 15:29:56.44
個人送信のものは権利者からの除外申請で今後見れなくなる可能性もあるのね。
アクセスしやすいから底本にしたのに、デジコレで見れなくなって逆にアクセスの難易度が上がることもあるかも
0022無名草子さん垢版2022/05/27(金) 16:12:26.02
かつて夢野久作の犬神博士は青空文庫で公開されていまいたが、今は作業中かつ非公開になっているようです。
過去に公開された版になにか問題があってそれは今公開することは不適切なのでしょうか?
0023無名草子さん垢版2022/05/27(金) 19:22:08.89
>>22
入力者がYahoo!ジオシティーズで青空文庫と同じフォーマット(ただし校正者欄等は空白)で公開してたらしいのでそれと混同してるのではないでしょうか

https://web.archive.org/web/20190330051028/http://www.geocities.jp/tamiyagi2/inugami_hakase.html
※インターネットアーカイブ


青空文庫内を検索しても2005年のそらもようの

>入力中としてきた、夢野久作「犬神博士」(新字新仮名)、横光利一「寝園」(新字新仮名)、幸田露伴「五重塔」(新字新仮名)、矢田津世子「仮面」(新字新仮名)を、入力取り消しに変更しました。

https://www.aozora.gr.jp/soramoyou/soramoyou2005.html

という報告しか見当たらなかったので青空文庫では公開されてなかったと思います
002423垢版2022/05/27(金) 19:39:19.60
一応過去スレも確認したけど

>夢野久作の犬神博士.
>1998/09/14入力開始として2004/04/08現在で5年半ほど放置されたまんまですねぇ......
>どうするつもりなんだろ?

https://mevius.5ch.net/test/read.cgi/books/1073138957/369

という書き込みを発見しただけで終わった
0026無名草子さん垢版2022/05/28(土) 01:09:15.20
2004年のスレを流し読みしたけど色んな意味で時代を感じるな……
0027無名草子さん垢版2022/05/28(土) 06:48:24.95
>>19
私は実際に、とある女性画家の画集(展覧会図録)に、「掲載先不明」って扱いで載ってた文章が気になって、その画家の事を調べていたら地元の図書館で閲覧できる国会図書館のサイトで偶然掲載元を発見して、そこから青空文庫に載せました。
0028無名草子さん垢版2022/05/28(土) 19:05:34.33
前スレで『コロロッチョ』って何だよみたいなこと書いたけど
「コロロッチョ」は登場人物の名前で原文(下記参照)では"Grillino"だった

というか何の救いもない理不尽な童話だな……

Il raccontafiabe/Grillino - Wikisource
https://it.wikisource.org/wiki/Il_raccontafiabe/Grillino
0029無名草子さん垢版2022/05/30(月) 23:56:16.50
本文を書いた著者の著作権が切れてない本で別の著作権が切れた人の書いた序文とかは
本文を書いた著者の作品が収録できなくて苦渋を嘗めた工作員への手慰みになる
00302022年6月公開予定作品一覧垢版2022/05/31(火) 18:27:15.93
2022-06-01 ホワイト フレッド・M『悪の帝王 12 第12話 マルコス将軍』
2022-06-02 柳田 国男『おばけの声』
2022-06-03 山本 周五郎『艶妖記 忍術千一夜 第一話』
2022-06-04 李 箱『街衢ノ寒サ ――一九三三 二月十七日ノ室内ノコト――』
2022-06-05 中谷 宇吉郎『大阪人と科学精神』
2022-06-06 グリム兄弟『三つのことば』
2022-06-07 管野 須賀子『肱鉄砲』※誕生日
2022-06-08 作者不詳『現代語訳 平家物語 06 第六巻』
2022-06-09 有島 武郎『小さき影』※命日(星座忌)
2022-06-10 大町 桂月『鎌倉大仏論』※命日
2022-06-11 山本 周五郎『三悪人物語 忍術千一夜 第二話』
2022-06-12 小川 未明『雪くる前の高原の話』
2022-06-13 田山 花袋『月明夜々』
2022-06-14 チェスタートン ギルバート・キース『共産主義者の犯罪』※命日
2022-06-15 中谷 宇吉郎『九谷の皿』
2022-06-16 芳賀 矢一『鎌倉』※誕生日
00312022年6月公開予定作品一覧垢版2022/05/31(火) 18:27:54.88
2022-06-17 寺田 寅彦『赤』
2022-06-18 坂口 安吾『豊島さんのこと』※豊島与志雄命日
2022-06-19 パスカル ブレーズ『パスカルの言葉』※誕生日
2022-06-20 永井 荷風『枯葉の記』
2022-06-21 岡本 かの子『ひばりの子』
2022-06-22 山本 周五郎『おさん』『日日平安』※誕生日
2022-06-23 壺井 栄『風』※命日
2022-06-23 三木 露風『修道院の月』※誕生日
2022-06-24 中谷 宇吉郎『御馳走の話』
2022-06-25 オーウェル ジョージ『あなたと原子爆弾』※誕生日
2022-06-26 山川 健次郎『マルクス主義は科学にあらず』※命日
2022-06-27 石川 善助『仙台の夏』※命日
2022-06-28 山本 周五郎『四日のあやめ』
2022-06-29 寺田 寅彦『「万年筆」欄より』
2022-06-30 田山 花袋『夏』
0032無名草子さん垢版2022/05/31(火) 22:26:03.85
来月は
・管野須賀子(1881-1911、幸徳事件で処刑された死刑囚)
・パスカル(1623-1662、フランスの哲学者)
・山川健次郎(1854-1931、元東大・九大・京大総長)
が新しく入るのか

中々に濃いメンツだ
0033無名草子さん垢版2022/06/01(水) 17:06:39.71
それにしても、幸徳秋水は真っ先に入ったのに他の処刑された人物は今に至るまでそんなに入らなかったのは何故なのか……
0034無名草子さん垢版2022/06/01(水) 19:34:44.01
・誰もその人に興味がない
・その人に興味を持つ層が青空文庫工作員に居ない
・その人に興味がある青空文庫工作員の居住地では底本の入手が困難

今回は該当しないけど場合によっては「そもそも(活版印刷による)著作物がない」という可能性もある
0035無名草子さん垢版2022/06/01(水) 20:47:21.42
Twitterとかだと、いろいろ政治的な話をしてる人や戦前または戦時中の日本の話題を良かれ悪かれしてる人がいっぱいいるのに、あんまりその時代の思想家や政治家の文章が青空文庫に入らないのも不思議だよね
(知ってる限りだと、石原莞爾や北一輝があるくらい…)
0036無名草子さん垢版2022/06/01(水) 21:49:37.70
良かれ側の層は出版された専門書とか論文を読むだろうし
悪かれ側の層は電子とか紙とか専門性とか以前にそもそも本なんか進んで読まないでしょ
0037無名草子さん垢版2022/06/01(水) 22:04:42.96
僅かではあるけど専門書的な作品は一応あるよね
0038無名草子さん垢版2022/06/01(水) 23:56:32.94
あと単純に有名な作品(または広めたい作品)がまだ著作権切れてないから入力出来ないってパターンもある
0040無名草子さん垢版2022/06/04(土) 07:39:18.53
戦前や戦後すぐの首相はだいたいパブリックドメインだと思うけど、何割ぐらい網羅されてるんだろう?
(有名な東条英機もページすらできてないような……)
0041無名草子さん垢版2022/06/04(土) 15:29:02.75
>>40
せっかくだから調べてみた
今ある校了作品が全員公開されると約1割(34人中4人)になるね

1967年以前死亡の内閣総理大臣は34人

公開中の作品があるのは2人(5.9%)
→大隈重信、吉田茂

作業中の作品だけがあるのは6人(17.6%)
→伊藤博文、松方正義、西園寺公望、山本権兵衛、高橋是清、池田勇人
※高橋是清と池田勇人は校了作品あり
※山県有朋は校正待ち作品あり

ページのみあるのは1人(2.9%)
→原敬
0042無名草子さん垢版2022/06/04(土) 16:32:15.68
大隈重信→早稲田出身か佐賀出身が頑張った?
吉田茂→1967年没だから2018年1月1日のパブリックドメインデイに合わせて頑張った?

あたりかな?
0043無名草子さん垢版2022/06/05(日) 10:43:21.90
>>41
幣原喜重郎も公開されてるから3人じゃない?
それから、校了の高橋是清作品は秘書官の上塚司の編集等が入ってるから2049年まで公開できない。
0045無名草子さん垢版2022/06/05(日) 18:29:41.10
>>43
見落としてた
失敬
0048無名草子さん垢版2022/06/09(木) 22:19:23.49
早稲田創立者の大隈重信や慶應義塾創立者の福沢諭吉は結構あるけど他の大学創立者はほとんど網羅されてない……みたいなのもある
0049無名草子さん垢版2022/06/12(日) 13:49:53.97
>>48
津田塾大学の津田梅子さんは校了してるからそのうち入るよ
0050無名草子さん垢版2022/06/12(日) 15:59:15.47
新紙幣つながりで北里大学学祖の北里柴三郎も考えなきゃな
(※渋沢栄一は作業中作品あり)
0051無名草子さん垢版2022/06/12(日) 22:13:33.07
>>49
なるほど
ググったらデジタルコレクションでも読めるっぽいけど良い流れですな
0052無名草子さん垢版2022/06/12(日) 23:51:43.10
新紙幣とか時代劇とか何かしらのきっかけで急に話題性が出た時に「この人青空文庫に作品載ってるじゃん!!」って形の話題に出るように先手に回りたいねぇ
(それで話題になるのは自叙伝とか回顧録とかに限定されそうだけど……)
0053無名草子さん垢版2022/06/14(火) 22:09:34.50
人なり作品なりの種類を増やしたいのは分かるがまずは目の前の作業中作品を公開作品にすることを考えよう
特に「校正中」でいくつかストップさせてる俺
0054無名草子さん垢版2022/06/19(日) 22:21:05.50
ある作品を入力しようかと考えてるんだけど底本候補が初出誌、単行本、作品集、著作集、選集、全集……と色々あって有名な作品は底本を選ぶのが難しいね
文字遣いの別や総ルビ/パラルビの別、後の発行による加筆訂正の有無があれば複数の底本を収録するという道も残るらしいけど
0055無名草子さん垢版2022/06/20(月) 22:48:50.79
「VSCode」を縦書きビューや文字数カウントを備えた原稿エディターにする拡張機能「novel-writer」/青空文庫注記法の注記やルビにも対応。品詞の色分け表示やPDF出力もできる【レビュー】 - 窓の杜
https://forest.watch.impress.co.jp/docs/review/1417878.html

>本拡張機能を「Visual Studio Code」に導入すると、テキストファイルを開いた際に、青空文庫注記法のルビや傍点などが強調表示されるほか、単語が品詞ごとに色分けされて表示される。
0056無名草子さん垢版2022/06/23(木) 11:54:06.14
どこかで曇天文庫がひっそりと復活してる、とかはないか…
0058無名草子さん垢版2022/06/25(土) 14:40:21.79
>>56
yahooブログ終わる前に全部DLして曇天文庫読むためにkindle端末を買ったよ
0061無名草子さん垢版2022/06/26(日) 15:47:14.61
曇天文庫みたいな活動それ自体についてはまたやりたいと思ったとしても
それを悪用する輩の存在を考えると活動そのものへのモチベーションとは別にやりたくなくなるだろうってことでしょ
0062無名草子さん垢版2022/06/26(日) 16:24:03.02
青空文庫作品の利権を奪ったわけじゃないんでしょう?
kindleに廉価版のドストエフスキーとかあるけど
青空文庫で校正待ちになるより販売して収益を得ても
それはそれで利用者側としてもメリットがあるんだし。
0064無名草子さん垢版2022/06/26(日) 17:19:50.55
青空文庫の作品を朗読して自分のホームページとかYouTubeあたりに公開してたら勝手にCDにされて売られてたみたいな話でしょ
0065無名草子さん垢版2022/06/27(月) 22:03:24.74
Kindle化されたときはtxt配布やめてmobiとepubで続けてたんじゃなかったっけ?
発表待ちで作っておいたのが、70年になって気持ちが折れたような気がする
0066無名草子さん垢版2022/06/27(月) 23:09:07.28
>>65
収録作品選んで目次作って表紙作ってmobiやepubに変換して、手間ひまかけて電子書籍にしたのに、それをそのまんま勝手にkindleストアとかで売られたらもうやめよってなるんじゃないの
0067無名草子さん垢版2022/06/28(火) 03:28:29.54
>>66
もちろんそれも大きな要因だと思うけど、パクられてたあともいくつかアップしてくれてたんだよね
著作権の延長の年に止まったんで、これで完全にやる気なくしてしまったのかなと
00682022年7月公開予定作品一覧垢版2022/06/30(木) 19:06:12.44
2022-07-01 稲生 正令『三次実録物語』※作品初公開
2022-07-02 ホワイト フレッド・M『ドレントン・デン特派員の冒険 01 第一回 黄蛾』
2022-07-03 山本 周五郎『青竹』
2022-07-04 中谷 宇吉郎『科学の限界』※誕生日
2022-07-05 山本 周五郎『葦は見ていた』
2022-07-06 作者不詳『現代語訳 平家物語 07 第七巻』
2022-07-07 寺田 寅彦『天河と星の数』※七夕
2022-07-07 ドイル アーサー・コナン『最後の事件』※誕生日
2022-07-08 山本 周五郎『荒法師』
2022-07-09 アーヴィング ワシントン『新浦島』※翻訳者(森鴎外)命日(鴎外忌)
2022-07-10 賀川 豊彦『死線を越えて 01 死線を越えて』※誕生日
2022-07-10 熊平 武二『告・原民喜』※誕生日、作品初公開
2022-07-11 山本 周五郎『石ころ』
2022-07-12 岡本 かの子『智慧に埋れて』
2022-07-13 山本 周五郎『一人ならじ』
2022-07-14 中谷 宇吉郎『人工衛星へ汲取舟が行く話』
2022-07-15 植木 枝盛『官僚は減るべし、役人は増えるべし』
00692022年7月公開予定作品一覧垢版2022/06/30(木) 19:07:02.73
2022-07-16 山本 周五郎『艶書』
2022-07-17 司馬 遷『国訳史記列伝 05 孫子呉起列伝第五』※翻訳者(箭内亙)誕生日
2022-07-18 寺田 寅彦『蚊帳の研究』
2022-07-19 永井 荷風『夏すがた』
2022-07-20 山本 周五郎『危し? 潜水艦の秘密』
2022-07-21 坂口 安吾『選後感〔第二十六回芥川賞選後評〕』※第167回芥川龍之介賞受賞作発表日
2022-07-22 山本 周五郎『黒襟飾組の魔手』
2022-07-23 葛西 善蔵『呪はれた手』※命日
2022-07-24 芥川 竜之介『読書の態度』※命日(河童忌)
2022-07-24 谷崎 潤一郎『文壇昔ばなし』※誕生日
2022-07-25 山本 周五郎『幽霊屋敷の殺人』
2022-07-26 中谷 宇吉郎『校正の話』
2022-07-27 山本 周五郎『骸骨島の大冒険』
2022-07-28 江戸川 乱歩『薔薇夫人』『魔術師』※命日(石榴忌)
2022-07-29 山本 周五郎『謎の頸飾事件』
2022-07-30 伊藤 左千夫『竹乃里人』※命日(左千夫忌)
2022-07-30 谷崎 潤一郎『日本に於けるクリップン事件』※命日(潤一郎忌)
2022-07-30 新美 南吉『空気ポンプ』※誕生日
2022-07-31 柳田 国男『幻覚の実験』『忘れ難い郷里のたべ物』※誕生日
0070無名草子さん垢版2022/06/30(木) 22:36:59.32
7月に新しく収録されるのは2人か

稲生正令(1735-1803)…江戸時代中期の武士
熊平武二(1906-1960)…原民喜の旧友でもある詩人
0071無名草子さん垢版2022/06/30(木) 22:53:48.28
妖怪文献界の古典が公開されるとは、珍しい……
0072無名草子さん垢版2022/07/01(金) 15:28:09.81
山本周五郎はどれ読んでもおもしろいのすごい
0074無名草子さん垢版2022/07/02(土) 06:50:31.33
山本周五郎だけでも青空文庫の存在意義がある...と言ったら怒られるかなw
0075無名草子さん垢版2022/07/02(土) 10:29:00.52
山本周五郎読んでないままだけどそんなに面白いのか
0076無名草子さん垢版2022/07/02(土) 11:10:22.51
青空文庫呼びかけ人の1人である富田倫生さんは
自身のTwitterアカウントを『あおべか物語』から取って「aobeka」 にしたり
「周五郎さんの公開に立ちあえたら、本望だなあ」(朝日新聞2011年6月10日)と語ったりしていたが
山本周五郎が公開される2018年1月1日を待たずして2013年に病気で亡くなってしまった
0077無名草子さん垢版2022/07/02(土) 13:04:47.44
富田倫生の怨霊が時を遡り、山本周五郎を5年早く呪殺する怪談を、誰か書かないかな。
0080無名草子さん垢版2022/07/06(水) 21:03:32.49
>>74
吉川英治さんとかも人気じゃない?
あと宮本百合子さんと小川未明さんの充実ぶり
0083無名草子さん垢版2022/07/07(木) 15:02:30.09
作業した作品が初めて校了になってた
気長に待ってたけど嬉しいね
0084無名草子さん垢版2022/07/07(木) 21:19:17.84
>>83
おめでとう(?)
0085無名草子さん垢版2022/07/07(木) 21:38:27.38
やっぱりGmailで不具合が起こってたんだなぁ
自分もGmailだけど、うまく送れるように設定するのはどうすれば……
0086無名草子さん垢版2022/07/07(木) 23:27:30.33
>>83
おめでとうございます。

ちなみに点検していただいて校了まで、どれくらいかかるものですか?

とはいえ作品サイズやいろんな条件で、けっして一律でも受領順でもないのでしょうけれども
0091無名草子さん垢版2022/07/24(日) 15:31:28.02
新しい入力・校正申請をどの程度にしてすればいいのか迷う……
0092無名草子さん垢版2022/07/24(日) 18:21:39.94
点検さんたちの底本の収集が難しい事情もわかるけれど
ボランティア側からすると
ステイホーム(半ば死語)な時勢だからこそ作業が捗るというのもあって

点検や校了、公開がかなり遅くなっても構わないから
作業受付だけはしてもらえないだろうか
と思ったりする
0093無名草子さん垢版2022/07/24(日) 19:01:46.39
作業受付自体は既に再開してるんだよね(下記参照)
問題は「複数の底本にわたる大量の入力・校正申請を控える」の「大量」がどれくらいを想定してるのか

2020年07月07日 受付・点検の制限付き再開のお知らせ(そらもよう)
https://www.aozora.gr.jp/soramoyou/soramoyou2020.html#000516
0094無名草子さん垢版2022/07/24(日) 19:12:40.17
そう、それなんです
作業状況ページを見ると、日々まとまった申請はあるようだけど
どれくらいを受け付けてもらえるかは
ボランティアさんのスキルにもよるのだろうかと考えたり
0095無名草子さん垢版2022/07/24(日) 19:24:59.78
ここでの問題って図書館に行って底本を確認出来ないことにあるから
底本の画像データも申請と同時に送れば大抵の申請は認められるのかもしれない

知らんけど
0096無名草子さん垢版2022/07/24(日) 21:17:36.07
Wikipediaの央端社の話を知ってふと思ったんだけど
実在しない本を捏造して入力する工作員(スパイ?)とかいるのかな
0097無名草子さん垢版2022/07/24(日) 21:22:44.90
そのための点検グループなんじゃないかな?
0098無名草子さん垢版2022/07/24(日) 21:33:01.13
でも今は入力者から送られてきた画像データを元に点検してるわけでしょ?
国立国会図書館サーチやCinii booksの検索に引っ掛からない本だって少なからずあるし、古い新聞や雑誌の記事ならGoogle検索すら厳しくなるから、場合によっては捏造でもバレない可能性が……
……とは言え愉快犯だとしても何が目的でそんなことするんだという疑問は当然あるけどね
0099無名草子さん垢版2022/07/24(日) 22:12:42.67
著作権者の権利問題がクリアできないと
(著作権者の実在性と、没後70年が確認できないと)
青空文庫としてのGOはでないと思う

それとも実在の作家の作品と称して捏造してもわからないんじゃないかって話?
0100無名草子さん垢版2022/07/24(日) 22:43:16.49
イメージとしては
「当時自分の地元に旅行に来ていた夏目漱石が地元の○○新聞に寄稿しているのを発見して、タイトルを調べると全集には未収録のようだから是非とも青空文庫に収録したい」
みたいな感じかな

流石に夏目漱石レベルの作家なら、未発見作品が実在するのか、本当に全集未収録作品か(初出不明で改題収録されてるだけではないか)とか、青空文庫とは別に研究家が検証するだろうけど
本格的な人物研究の伝記が出版されてなかったり、そもそも作品集の類が出版されてないレベルの人なら「マイナーな作家のマイナーな作品を入力してるねぇ」で済まされるんじゃないかと

一応言っておくけどあくまでも「もしかして気付けないのでは?」って話であって、これをして誰がどういう風に得するのかとかは考慮してないからね
0101無名草子さん垢版2022/07/24(日) 23:26:28.21
なるほどね。
もしかするとその意味もあってこれまで、
基本的に底本の確保は各自というルールがあったのかもね。

いやもちろん勝手な想像です。
0102無名草子さん垢版2022/07/24(日) 23:37:33.76
「そういえば」と言うほど関連してるか微妙だが坂口安吾の全集未収録作品が発見されたとかいうニュースがあったな
一昨年くらいだったと思って調べたら2018年だった

川端・安吾、埋もれた小説発掘 新聞に発表、全集未収録 あす発売「新潮」掲載:朝日新聞デジタル
ttps://www.asahi.com/articles/DA3S13388989.html
0103無名草子さん垢版2022/07/25(月) 01:52:29.84
>>93
他の工作員の動きも関わってくるので各々具体的に何作品までというと難しいですよね。
点検する側は確保すべき底本の冊数が増えると大変ということらしいので
1冊ずつ申請したほうがいいのは間違いないと思いますが
0104無名草子さん垢版2022/07/25(月) 20:51:43.62
昨日作業申請が通った量の膨大さにびっくり
0105無名草子さん垢版2022/07/25(月) 20:54:28.75
底本一冊の70作品以上の校正申請が一括で通ってるね
やはり底本をしぼることこそがポイントなのかな?
0106無名草子さん垢版2022/07/25(月) 21:20:02.06
【底本画像有】というのも大きいのかな?
0107無名草子さん垢版2022/07/25(月) 21:31:04.09
なるほど
校正完了時じゃなくて申請時に送ってしまうのか
0108無名草子さん垢版2022/07/25(月) 21:32:56.01
羨ましくてたまらない
0109無名草子さん垢版2022/07/25(月) 21:55:39.08
校正者も数年に渡って百数十作品の校正をしてるという実績がある人のようだね
経験の多さで申請受理の優先劣後の区分がされてるかどうかは知らないけど
0110無名草子さん垢版2022/07/25(月) 22:02:59.98
たしかに、経験豊富なボランティアさんなら
点検グループの負担はずいぶん軽減されるだろうね
0111無名草子さん垢版2022/07/25(月) 22:30:35.23
なんなら必要事項を説明すれば校正作業に加えて(一部の)点検作業も任せられるだろうしね
0112無名草子さん垢版2022/07/25(月) 22:33:48.90
>>111訂正追記

校正申請を受け付けてる時点で点検は終わってるか……
0113無名草子さん垢版2022/07/26(火) 19:51:10.29
そういや「江戸川乱歩」も同姓同名で作品書いてた作家がいるって話聞いたことあるなぁ
政治家の「吉田茂」も同姓同名で2人いたらしいし、青空文庫の登録上はどうなるんだろ?
0114無名草子さん垢版2022/07/26(火) 19:51:36.62
ハンセン病、もっと知って 国立療養所を小中学生が見学 | 共同通信
https://nordot.app/924562691536502784


北条民雄(1914-1937)の「いのちの初夜」は
ハンセン病を発病した北条が自信の入院直後を描いた作品

作家別作品リスト:北条 民雄
https://www.aozora.gr.jp/index_pages/person997.html

図書カード:いのちの初夜
https://www.aozora.gr.jp/cards/000997/card398.html
0115無名草子さん垢版2022/07/26(火) 20:42:34.28
>>113
同一作家での作品の名前被りは副題の所に作品の冒頭を〔〕で書いて区別してるっぽいけど、そうしてないのもあるし普通に載せるんじゃないの
どのみち名前だけじゃなく生没年や登録番号のデータでも管理してるはずだしね
0117無名草子さん垢版2022/07/29(金) 19:39:25.97
山本周五郎ってミステリーも書いてんの?!
知らんかったわ~
01202022年8月公開予定作品一覧垢版2022/07/31(日) 18:00:03.32
2022-08-01 佐藤 春夫『若き日の室生犀星』
2022-08-01 萩原 朔太郎『室生犀星君の人物について』
2022-08-01 室生 犀星『ふたりのおばさん』※誕生日
2022-08-02 三富 朽葉『水のほとりに』『ピアノ』※命日
2022-08-03 山本 周五郎『殺生谷の鬼火』
2022-08-04 木下 夕爾『晩夏』※命日
2022-08-05 壺井 栄『暦』『日めくり』※誕生日
2022-08-06 木下 夕爾『火の記憶 広島原爆忌にあたり』※広島原爆忌
2022-08-07 山本 周五郎『亡霊ホテル』
2022-08-08 柳田 国男『かはたれ時』『狸とムジナ』※命日
2022-08-09 作者不詳『現代語訳 平家物語 08 第八巻』
2022-08-10 山本 周五郎『天狗岩の殺人魔』
2022-08-11 中谷 宇吉郎『八幡馬と墨の研究』
2022-08-12 山本 周五郎『劇団「笑う妖魔」』
2022-08-13 古川 緑波『売薬ファン』※誕生日
2022-08-14 三富 朽葉『深夜』『メランコリア』※誕生日
2022-08-15 釈 迢空『鵠が音 03 追ひ書き』
01212022年8月公開予定作品一覧垢版2022/07/31(日) 18:00:30.83
2022-08-16 津田 梅子『女教邇言』※命日
2022-08-17 山本 周五郎『花咲かぬリラ』
2022-08-18 ホワイト フレッド・M『ドレントン・デン特派員の冒険 02 第二回 赤い斑点』
2022-08-19 永井 荷風『虫の声』
2022-08-20 山本 周五郎『海浜荘の殺人』
2022-08-21 中谷 宇吉郎『永久凍土地帯』
2022-08-22 山本 周五郎『水中の怪人』
2022-08-23 坂口 安吾『選後感〔第二十七回芥川賞選後評〕』
2022-08-24 若山 牧水『沼津千本松原』※誕生日
2022-08-25 山本 周五郎『廃灯台の怪鳥』
2022-08-26 平野 零児『丹波篠山』※命日
2022-08-27 山本 周五郎『流血船西へ行く』
2022-08-28 岡本 かの子『花子』
2022-08-29 山本 周五郎『鵜』
2022-08-30 中谷 宇吉郎『紙の洪水』
2022-08-31 山本 周五郎『月の松山』
01222022年8月公開予定作品一覧垢版2022/07/31(日) 18:18:50.08
【訂正】
どれくらい皆の興味の対象か知りませんが、
先月から「作品初公開」の注釈付け足すことにしたの忘れてました。

2022-08-02 三富 朽葉『水のほとりに』『ピアノ』※命日、作品初公開
2022-08-04 木下 夕爾『晩夏』※命日、作品初公開
2022-08-16 津田 梅子『女教邇言』※命日、作品初公開
0123無名草子さん垢版2022/07/31(日) 19:44:29.99
松本清張が青空文庫入りするまであと40年か
生きてるかなおれ
0124無名草子さん垢版2022/07/31(日) 20:11:13.15
いい作品を読むと感動の次にすぐ
この本を入力公開できる日を自分が迎えられるか考えちゃう自分がいる
0125無名草子さん垢版2022/07/31(日) 20:16:07.05
俺の目の黒い内に星新一の作品を入力出来る日は来るのだろうか
0127無名草子さん垢版2022/07/31(日) 20:32:18.69
太宰治とか中島敦とか青空文庫入りしてるのに生年では彼らより以前の
井上靖が入ってなくてお前とっとと死んどけよなんて一瞬思ったけど
そうなるとそもそも井上靖の作品全てが読めなくなるわけで
申し訳ありませんでしたって即座にあやまったわ。
0130無名草子さん垢版2022/07/31(日) 20:57:46.02
>>127
逆に自殺とか不慮の事故や災害で早世した人って現在で傑作だと評価されている作品よりも優れた作品を書き上げることなく亡くなった可能性があるんだよな
0131無名草子さん垢版2022/07/31(日) 21:19:54.15
自分の目の黒いうちに世界一周旅行したい

俺の目の黒いうちはそんなことはさせない

上のような使い方は変だよ
0132無名草子さん垢版2022/07/31(日) 21:35:39.97
それは単に下の(拒絶や否定などのマイナスイメージを彷彿とさせる)言い回しの時に聞き馴染みがある慣用句だからそう感じるだけでしょう

「全然」は否定を伴う副詞だと勝手に思ってるようなもの
0133無名草子さん垢版2022/07/31(日) 22:14:36.10
古い作品を読んでると言葉の意味を間違って使ってるのかなってのが結構ある
んで調べるとそれもありらしいってわかる
0136無名草子さん垢版2022/08/01(月) 21:54:38.68
山川方夫さんのショートショートも勿論とても良いが
独特のSF風味の強い、しかも先見の明ある星新一さんの世界観を青空文庫で見たい気持ちはわかる
0137無名草子さん垢版2022/08/04(木) 21:11:25.93
【新文化】 - 最新号(22年8月4日号)案内:日販王子DC、トラック待機時間30分以内に/注文品トラック予約システム導入/ESGの取組みで実効/CO2削減量年間10トン《1面特集》
https://www.shinbunka.co.jp/saishin.htm


>最終面特集は、【インターネット図書館「青空文庫」の25年/著作権切れ&著者が公開同意した作品/1万7000点以上を登録・公開】

>著作権の保護期間を過ぎた著者の作品を電子化して公開するインターネット上の図書館「青空文庫」がこの7月、開始から25年を迎えた。
>登録作品数1万7000点以上にのぼり、パソコンのほかスマホや電子書籍リーダーなどで読まれるとともに、商業出版や朗読に利用されている。
>この青空文庫の立ち上げの経緯から現状、今後の展望について関係者に取材した。(南陀楼綾繁)
0139無名草子さん垢版2022/08/05(金) 12:17:02.22
こんな新聞があるんですね.
面白そう.昨年度縮刷版を買おうかと思ってしまいました.
読む時間なさそうなので買いませんけど.
0140無名草子さん垢版2022/08/05(金) 12:32:37.74
「新聞?」って思ったけど雑誌じゃなくて新聞(業界紙)という扱いなのね
0141無名草子さん垢版2022/08/06(土) 01:01:49.56
コンビニのコピー機で専門紙を印刷して読めるなんて初めて知りましたわ
0145無名草子さん垢版2022/08/24(水) 23:02:18.40
スキャナーが古いせいで入力作業よりスキャンに時間がかかってる気がする
0146無名草子さん垢版2022/08/25(木) 22:07:53.76
>>145
自分もスキャナーだとたまに読み込みが遅かったり不具合が出るから、急ぎで入れたい時はスマホ使ってる
0147無名草子さん垢版2022/08/25(木) 23:17:07.29
分厚くてあまり貸し出しがない全集ものだと
本がしっかり開かなくてノドが影になるし
文字も読み取りにくいからCCDスキャナー買った

でもそうか、スマホを使うという手があったね
0148無名草子さん垢版2022/08/25(木) 23:54:08.86
本→スキャン
よりも
本→コピー(画質調整あり)→スキャン
の方が古い本のシミとか分厚い本のノドとかがマシになる

まぁ特に理由がない限りはスマホ直撮りでも良いんだが
(青空文庫に送る時はPDF化とかしなくてもスマホのデータでも良いと言ってるし)
0149無名草子さん垢版2022/08/29(月) 19:51:55.21
入力中 で何年も作業状況が止まっている作品って
ほんとうに入力者が投げ出しているものもあるかもしれないけれど
入力は終わっていて青空文庫に納品されてるけど
点検の人手が足りなくて「校正待ち」になれないものが実は多いんじゃないかという希ガス
0150無名草子さん垢版2022/08/29(月) 20:00:25.28
「校正待ち(点検前)」という作業状態が設けられてるからそれはないんじゃなかろうか
0151無名草子さん垢版2022/08/29(月) 20:51:53.39
校正待ち(点検前)はそういう意味ではないと思う
入力ファイルが古く、現行の注記ルールに倣っていないもののこと
0152無名草子さん垢版2022/08/29(月) 20:54:13.21
と、校正待ち検索のサイトに書いてあったと思う
0154153垢版2022/08/29(月) 22:32:15.10
ちょっと語気が強いような書き方になってしまった
申し訳ない
0155無名草子さん垢版2022/08/29(月) 23:38:13.61
ほーう参考になるありがとう
01562022年9月公開予定作品一覧垢版2022/08/31(水) 18:59:03.73
2022-09-01 佐藤 春夫『サーベル礼讃』※関東大震災
2022-09-02 山本 周五郎『蘭』
2022-09-03 木下 夕爾『新秋の記』
2022-09-04 山本 周五郎『柘榴』
2022-09-05 吉江 喬松『海潮の響』※誕生日
2022-09-06 山本 周五郎『合歓木の蔭』
2022-09-07 泉 鏡花『浅茅生』※命日
2022-09-07 平野 零児『吉川さんの声と眼』※吉川英治命日(英治忌)
2022-09-08 山本 周五郎『山椿』
2022-09-09 作者不詳『現代語訳 平家物語 09 第九巻』
2022-09-10 田山 花袋『中秋の頃』※中秋(旧暦8月15日)
2022-09-11 山本 周五郎『女は同じ物語』
2022-09-12 中谷 宇吉郎『ツンドラへの旅』
2022-09-13 山本 周五郎『しじみ河岸』
2022-09-14 小泉 八雲『おしどり』
2022-09-15 山本 周五郎『初夜』
01572022年9月公開予定作品一覧垢版2022/08/31(水) 18:59:39.38
2022-09-16 大杉 栄『お別れ』※命日
2022-09-16 菊池 寛『競馬の一日に就いて』※競馬の日
2022-09-17 山本 周五郎『みずぐるま』
2022-09-18 ホワイト フレッド・M『ドレントン・デン特派員の冒険 03 第三回 放火団』
2022-09-19 田山 花袋『水源を思ふ』
2022-09-20 山本 周五郎『豹』
2022-09-21 中谷 宇吉郎『墨流しの物理的研究』
2022-09-22 山本 周五郎『蕗問答』
2022-09-23 坂口 安吾『花田清輝論』※花田清輝命日
2022-09-24 山本 周五郎『溜息の部屋』
2022-09-25 寺田 寅彦『卵の形』
2022-09-26 小泉 八雲『術数』『無法な火葬』※命日(八雲忌)
2022-09-27 山本 周五郎『城中の霜』
2022-09-28 永井 荷風『独居雑感』
2022-09-29 山本 周五郎『柿』
2022-09-30 中谷 宇吉郎『墨並びに硯の物理学的研究』
0158無名草子さん垢版2022/09/02(金) 17:17:14.74
>>149
「校正待ち」の日付には、基本的に入力者が提出した日が入っているはずで、
よっぽど底本確認が大変なもの以外で点検で何年も遅れているのはなさそう
初作業の人のファイルは優先的に進めてくれるし

初作業でそのまま投げ出してる人は多い
入力は別にいいけど、校正は当たった入力者が気の毒だなと思っている
0159無名草子さん垢版2022/09/02(金) 17:28:34.96
>>158

とてもやりとげられないと思ったら遠慮なく、と言ってくれてはいるが
やりとげるも何も作業者がそのまま忘れているケースも中にはあるんだろうな

動きがないまま二年経ったら引き継ぎ申請していいんだっけ

入力はともかく、校正は二年経ったら自動でシステムから進捗問い合わせメールが届くようになってたら
忘れてた人も思い出してくれたり、できないなら取消申請してくれるいいきっかけとタイミングになると思うから嬉しいのだけど
0160無名草子さん垢版2022/09/02(金) 19:33:11.59
普通に2年以上放置してるわ
まだ1章まで(全体の1割未満)しか校正してない

すまん
0161無名草子さん垢版2022/09/02(金) 19:36:56.28
>>160
単純計算で、20年計画で草。
0162無名草子さん垢版2022/09/02(金) 20:28:54.35
>>161
1日1ページやれば1年以内に終わるはずだったが「やったー1章まで終わったー」あたりで止まってしまった
(運営側から校正者変更の打診は来てないのでどちらにせよ公開が本来より遅れたということにはなってないと信じたい)

逆に邪魔かもしれんが校正意欲は一応まだ持ってる
0163無名草子さん垢版2022/09/02(金) 20:38:55.09
応援してる∩(´∀`∩)
0164無名草子さん垢版2022/09/02(金) 23:01:09.15
一通り校正するのに1年かかるという意味なら300ページを超えるし、校正は4回やるということを混みで1年としても100ページ近いことになる
入力にせよ校正にせよ全集の片隅に載ってるような数ページの短編でもヒーコラ言ってる身としては申請するだけでも凄いと感じる
0165無名草子さん垢版2022/09/03(土) 10:27:36.35
ちょっとずつコツコツやろうってのが間違いの元
むしろある程度集中して一気にやったほうがやれる
0166無名草子さん垢版2022/09/03(土) 12:55:00.34
たしかに。
0167無名草子さん垢版2022/09/03(土) 13:08:27.06
>>165
本1冊レベルの分量になると話は変わるのかもしれんが
基本的にはマジでこれだと思う
0168無名草子さん垢版2022/09/04(日) 02:36:12.13
作業着手連絡システムの自動応答メールが来ないな
0169無名草子さん垢版2022/09/04(日) 02:45:57.29
>>168
そらもよう(>>81)で少し触れてたけどgmailなら多分届かない
0170無名草子さん垢版2022/09/04(日) 11:17:22.92
長年の校正待ちの中にある
南洲手抄言志録 00 題字(山県有朋)
っていうのはほんとうに題字だけなんだろうか

本文のほうはすでに公開されているようだが
0171無名草子さん垢版2022/09/04(日) 13:55:15.50
よく分からんが校正受付システムのデータベースではサイズが288,664バイトとなってるな

底本見てもそんなことないと思うけど
https://dl.ndl.go.jp/info:ndljp/pid/756228
0172無名草子さん垢版2022/09/04(日) 17:45:28.91
>>169
ありがとう
そらもよう読んでたけど先月まで届いてたから油断してた
0173無名草子さん垢版2022/09/04(日) 18:03:17.03
>>171
そのバイト数の見方はいつも正直良く解らんのだが
画像込みなんだろうか?
テキストだけで36メガあるようには思えぬが

というか
NDL見たが、これどう校正したらいいのww
0174無名草子さん垢版2022/09/04(日) 18:58:45.76
>>173
バイト数は単純にテキスト・ファイルとしての容量じゃないの?

多分「感慨係之矣/明治廿年六月/有朋題」って書いてるから
そう書いてるかどうかだけ確認する簡単なお仕事な気がする
(一部の漢字は外字注記にしてる気もするけど)
0179無名草子さん垢版2022/09/06(火) 06:49:54.82
狂ったように山周ばっかなのはなじぇ?
銭平やってほしい
0180無名草子さん垢版2022/09/06(火) 07:46:04.10
入力する人と校正する人がいるから
0181無名草子さん垢版2022/09/06(火) 10:13:19.32
山があるからみたいなw
0182無名草子さん垢版2022/09/06(火) 19:28:03.95
甲「なぜ公開されるんですか?」
乙「そこに校了作品があるから」

たしかに
0184無名草子さん垢版2022/09/07(水) 08:18:37.37
テキスト版新規公開作品一日当たりアクセス数ランキング
1位から11位まで山本周五郎が独占、流石だな
>>179 需要があるのだよ
0185無名草子さん垢版2022/09/07(水) 18:40:13.59
(200超過アクセス/日)

200を一律に引いているのは何故?

表示テストその他で、どの作品も200程度はアクセス数から差し引く必要があるということ?
0186無名草子さん垢版2022/09/07(水) 21:49:18.33
俺も気になってたのでちょうどいい機会だから過去のブログを調べてみた。
公開日のズレを埋めて比較できるようにと2013年頃に試行錯誤した結果っぽいね。

>公開日が新しい作品ほどランクが上位にあるから、一日あたりのアクセス数というのは、実はあまり良い指標ではないのかもしれない。
青空文庫’13/04月-’13/05月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=2221

>新規公開作品は一日当たりアクセス数という指標の計算方法がどうも適切でないようなので、該当作品のアクセス数から500位のアクセス数を引いたアクセス数を公開日からの日数で割った値で順位付けしてみた。
青空文庫’13/05月-’13/06月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=2264

>ランキングの指数としている超過分アクセス数/日は、またまた計算方法を変えて、該当作品のアクセス数からアクセス数200を引いたアクセス数を公開日からの日数で割った値とすることにした。
>毎月、ベースの数値を変えるのは遷移を考える際に難しいと思ったからである。
青空文庫'13/07月-'13/08月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=2337
0187無名草子さん垢版2022/09/08(木) 01:02:51.15
なるほどなぁ。

>公開日が新しい作品ほどランクが上位にあるから

どの作品も公開直後はアクセスが集中する(いわばボーナスタイム)であるから、
月の初めに公開された作品の30(31)日と
月の終わりに公開されたボーナスタイムのみの作品の数日とでは
「一日の重みと意味」が違うであろう、ということか。

9年以上この200アクセスを引く計算式で落ち着いているということは、
統計的におおむね200アクセス程度が、
ボーナスタイムに得られるアクセス数の平均値ということなんだろうな。

今度から注目してみよう。

>>186 ありがとう。
0188無名草子さん垢版2022/09/08(木) 08:05:33.51
漱石ばっかり読んでるオレ
全く進歩なし
それも猫ばっかり
0189無名草子さん垢版2022/09/08(木) 08:28:30.95
タダで読めるとこでもなんか既読のばっかり読んじゃうってあるな…
0190無名草子さん垢版2022/09/08(木) 11:17:59.17
青空文庫ブラウザで、既読の作品にはチェックマークがつけられるようなのあったら使いたい

自分はコンプリート欲が強いので、コンプ経過が目に見えるとうれしくなる
0192無名草子さん垢版2022/09/08(木) 13:11:58.46
私はその人の事を先生とよんでいる

だったっけ?
0193無名草子さん垢版2022/09/08(木) 23:35:26.97
aozorablog、初期の頃はアクセス分析以外にも色々書いてたんだね
0198無名草子さん垢版2022/09/13(火) 08:21:13.38
隙あらば山周、時々中宇でウケル(´・ω・`)
0199無名草子さん垢版2022/09/13(火) 23:28:56.53
やっぱり校正者が出てくるのが強い
0200無名草子さん垢版2022/09/14(水) 21:00:38.94
結局そこにかかってくる
0201無名草子さん垢版2022/09/14(水) 21:58:39.46
1の壁…収録したい作品の著作権保護期間が満了している
(※原則として、個人は著作者の死後70年、無名/変名/団体名義は公表後70年。
 ただし、1967(昭和42)年12月31日以前に死亡/公表している場合は保護期間満了済み。
また、本文の著者だけでなく、編集や校訂、翻訳などをした人の没年も必要に応じて要確認)

2の壁…入力者が存在する

3の壁…校正者が登場する


1の壁も法改正のせいで最近高くなったし色々確認する必要があるんだけど、文章にすると滅茶苦茶シンプルな2と3の壁(特に3の壁)が高すぎるんだよな

俺も入力した作品がいくつ校正待ちのままになっているか……
0203無名草子さん垢版2022/09/15(木) 12:09:32.91
「嫌なら読むな」じゃなくて「嫌なら工作員になれ」だな
0204無名草子さん垢版2022/09/15(木) 12:41:24.36
山本周五郎、公開作品数160で21位か(6作品が今月公開予定なので今月中に20位になる)
パブリックドメインになった時期が遅いことを考えるとやっぱり人気なんだろうな

青空文庫 公開中の作品数(作家別)一覧
https://yozora.main.jp/inp/klist1.html
0205無名草子さん垢版2022/09/15(木) 22:39:04.26
2018年から4年足らずで160作品ということになるから毎年40作品以上公開されてるのか
山本周五郎の波を止めたいなら別の作家で年間40作品以上の作業をしなければならない
0206無名草子さん垢版2022/09/15(木) 23:13:57.42
それは公開中の作品数だけの話だしな。

水面下(作業中)はそんなのメじゃない数の山周作品が進行している。

あれほどの数を作業進行中にできるかっていうとなかなか
0207無名草子さん垢版2022/09/15(木) 23:16:29.96
実際のところ、青空文庫における山周ムーブメントには
富田倫生さんの遺志を残された者たちが継ぐ!という意識が関係していると思う?
0208無名草子さん垢版2022/09/15(木) 23:27:25.58
山本周五郎の作品が公開された時に作品名でググると青空文庫公開前からアップロードされてる朗読動画とか出てくるし普通に人気なんだと思う

もっとも公開/作業中の作品の入力者や校正者を見ると数人が大量に作業してるっぽいから中にはそう考えて頑張ってる人もいるかもしれないけど
0209無名草子さん垢版2022/09/15(木) 23:38:43.08
>>201
自分は校正やりたいマンなんだけど
このご時世も手伝ってなかなか申請が進まないでいる。

頑張るから待ってて。
0210無名草子さん垢版2022/09/16(金) 00:08:01.31
青空文庫校正待ち作品検索(※何故かURLが貼れない)の原稿用紙換算の数字が1桁の作品を片っ端から校正すれば、少ない負担で山周ムーブメントに待ったをかけられるかもしれない
0211無名草子さん垢版2022/09/16(金) 01:15:52.33
校正は公開に直結するのが魅力だね
他者の作業を見るわけだから勉強にもなるし
0213無名草子さん垢版2022/09/16(金) 12:30:08.25
入力者校正と点検を経てなお残る誤字って、要するに見落とされやすいということだから、今後自分が入力者校正する際に注意する指標が増やせる
0215無名草子さん垢版2022/09/16(金) 12:47:57.60
>>213
なるほど、我がふり直せ的な良い視点。

……とはいえ具体的には思い浮かばないな、
よくあるものでいえば注記漏れだろうか
0216無名草子さん垢版2022/09/16(金) 19:04:03.27
経験則だと

・当用漢字の変換ミス(例:「游泳」が「遊泳」、「熔岩」が「溶岩」になってる)
・濁点と半濁点の間違い(例:「びっくり」が「ぴっくり」になってる)
・門構えの中(例:「時間」が「時問」や「時聞」になってる)

あたりがパッと思い付くかな
最後のはほぼ確実にOCRを介してる入力だろう
0217無名草子さん垢版2022/09/16(金) 19:42:36.13
三連休でいくつか校正を終わらせたいなぁ
0218無名草子さん垢版2022/09/17(土) 00:23:23.48
左翼爺の宮本百合子ちゃんラッシュは終わったね
0219無名草子さん垢版2022/09/17(土) 00:37:25.82
短篇の入力1件終えたー
いつか校正者さまの降臨がありますように!
0220無名草子さん垢版2022/09/17(土) 01:38:41.09
>>218
マイナーだけどプロレタリア系だと中野鈴子が大量校了してるから、そのうちラッシュ来るで
0221無名草子さん垢版2022/09/17(土) 01:53:10.55
保守主義的な作品を入力してバランスを取るか(?)
0222無名草子さん垢版2022/09/17(土) 02:22:52.99
作品の内容や著者でフィルターをかけることは青空文庫の趣旨にもとるわけだが、
あまりにもイデオロギー色が強く出過ぎた作品のラッシュが続くと
(保守、リベラルにかかわらず)
青空文庫自体がそういう思想団体と思われそうで、愉快ではない
0223無名草子さん垢版2022/09/17(土) 02:29:09.25
だからこそ「著作権切れてるかどうかだけが判断基準なんだな」と思われるようにしなければならない(?)

まぁマジな話をすると興味の皆無な分野の作品にモチベーション沸く気がしないから申請しないけど
0224無名草子さん垢版2022/09/17(土) 02:49:10.55
昔は芥川の比率が高すぎて芥川文庫とか呼ばれてたんだっけ

ワイの入力したマイナー作家も誰か大量校正しちくり~
0225無名草子さん垢版2022/09/17(土) 08:35:21.11
隙あらば山周、時々中宇予報


2022-09-20 山本 周五郎『豹』
2022-09-21 中谷 宇吉郎『墨流しの物理的研究』
2022-09-22 山本 周五郎『蕗問答』
2022-09-24 山本 周五郎『溜息の部屋』
2022-09-27 山本 周五郎『城中の霜』
2022-09-29 山本 周五郎『柿』
2022-09-30 中谷 宇吉郎『墨並びに硯の物理学的研究』
0226無名草子さん垢版2022/09/17(土) 09:12:19.88
校正したい作品がずっと校正待ち(点検前)になってる
どうしたら?
0227無名草子さん垢版2022/09/17(土) 09:30:03.09
>>226
校正申請すれば点検してくれるよ
底本画像を送っとくと早い
0228無名草子さん垢版2022/09/17(土) 11:19:27.49
校正待ち(点検前) : 790件 (内訳)
校正待ち(点検済み) : 1,959件 (内訳)

内訳見たら最近は減ってるっぽいが割とあるのね
0229無名草子さん垢版2022/09/17(土) 13:50:56.62
校正申請があるその時その時に点検をしてると折角の校正が中々始められなくなる(その分公開も遅れる)というデメリットがあるんだろうけど
早い内に点検までしてくれたのに何年も校正待ちのままっていうのも悲しいね
0230無名草子さん垢版2022/09/17(土) 14:50:56.39
>>224
作家名晒しちゃおう
0231無名草子さん垢版2022/09/17(土) 16:18:41.75
宮本百合子はウヨサヨ関係なくすごい作家じゃないか?
佐多稲子のほうが上だとは思うが
0232無名草子さん垢版2022/09/17(土) 21:29:58.10
ふと思ったけど、耕作員のフォーラムみたいなものって存在しないよね。

とくに青空文庫が出来た頃はインターネット黎明期で、
「ホームページ」に設置の掲示板でやり取りするのがスタンダードだった時代

少数精鋭ではじめた当時にはそういうものがあったのかあるいは無かったのか知らないけれど、
どうして無いのだろう?と思った。

それなりに大きい組織の統制のためだろうか?
0233無名草子さん垢版2022/09/17(土) 21:32:31.03
たとえば
点検グループでない者が私見で指導したり可否を談じたりすることがないように、
相談事の生じるであろう場は作らないとかの。
0234無名草子さん垢版2022/09/17(土) 21:57:18.14
青空文庫の掲示板や情報交換フォーラムは「みずたまり」とか「よぞら」とか「こもれび」とか「むしとりあみ」とか「AOZORAX」とか色々あったんですよ……
0236無名草子さん垢版2022/09/17(土) 22:42:27.42
その疑問こそが答えでは
0237無名草子さん垢版2022/09/17(土) 22:50:59.58
aozorahack に参加したいなんて思ってたけど
github も動いてないしどうしたものか。

前にも言ったことあるけど青空文庫のテキストを
sjisからutf8とかにすると使える漢字が増えて
注釈を減らせるしホームページにそのまま載せれるし
メリットが大きい(と思う)。

移行しない理由が作業が大変ってだけなら
一発変換のスクリプトとか提供できるのに。
0238無名草子さん垢版2022/09/18(日) 00:10:45.48
>>236
よくわからんが、

「自治厨が、私見で間違った指導」
「運営を差し置いた相談事とその決定」
「フォーラム乱立によるローカルルールの発生、ひいては作業ルールに対する解釈のブレ」

そして
「そうしたトラブルや不都合を防ぐためには、点検グループの中の人のように公式な管理者を常駐させる必要がある」→肝心の点検作業に差し支えるようになる

といったような解釈で良いのかな?

昔はそんなにあったんだね……フォーラム。
それがどれも存続してないという結果が全てな感じがする。
0239無名草子さん垢版2022/09/18(日) 00:12:19.95
>>237
すごい
0240無名草子さん垢版2022/09/18(日) 00:44:14.59
昔のそらもよう調べたら掲示板とかについても触れてるよ
0241無名草子さん垢版2022/09/18(日) 01:34:03.40
それが答えって知名度的な意味?
0242無名草子さん垢版2022/09/18(日) 08:49:05.19
>>237
一括置換で済めばいいけど、底本尊重だから、これまで包括判定していた漢字を底本に戻って確認しなきゃならないみたいな文を読んだ気がする
0243無名草子さん垢版2022/09/18(日) 09:47:16.13
なるほどなあ。

であればこそ、いまの「空白の(著作権消滅待ちの)20年」の間に
utf8化に向けてできることがありそうな気がするが……

包摂文字をマークアップするプログラム組んで、
底本再確認の負担を減らせないかとか……

まあ、言うは易しなのだろうな
0244237垢版2022/09/18(日) 11:30:03.80
ruby を使ったスクリプトで半年ほど前に作りました
バッチファイル自体は三十数行の短いものです
いくつか課題があったはずですが詳しくは忘れました

・文字をsjisからutf8に変換する
・ユニコードのコード表と注記の番号を照合し取り込み可能な漢字を取り込む
・バッチファイルをダブルクリックすると処理を開始
・バッチファイルのあるフォルダ以下のテキストファイルを加工し、バックアップをとる
というものです。以下に置いてあるので興味のある方は試して見て下さい

ttp://pansy.s1010.xrea.com/2022/03/05/sjis%e3%81%8b%e3%82%89utf8%e3%81%ab%e5%a4%89%e6%8f%9b/
0245無名草子さん垢版2022/09/18(日) 11:52:35.79
いっそウィキソースとかに置いたほうがいいのかもな
0246無名草子さん垢版2022/09/18(日) 13:07:32.39
「えあ草紙」や「ソラリ」みたいに外字注記を自動でUnicodeに置き換えてくれるアプリがすでにあるよね。
個人的にはそれで充分だから青空文庫本体の元データまでUnicodeに移行すべきとは思わないな。
0247無名草子さん垢版2022/09/19(月) 11:53:35.55
>>244
すごい

aozorahackはいま稼動していないのか
0248無名草子さん垢版2022/09/19(月) 16:21:01.92
aozorahackって経常的に活動してるの?
0249無名草子さん垢版2022/09/20(火) 18:21:31.81
藤沢周平が青空文庫に登場するまで長生きしたい。
0250無名草子さん垢版2022/09/20(火) 18:29:40.44
立川市図書館が日本トップレベルの電子図書館に!東京立川こぶしロータリークラブが青空文庫500タイトル・電子伊能図を寄贈、市内の小中学生を対象にレビュワー大賞も開催!|東京立川こぶしロータリークラブのプレスリリース
https://prtimes.jp/main/html/rd/p/000000002.000011282.html
0251無名草子さん垢版2022/09/20(火) 18:40:44.29
柳田国男の炭焼日記とか戦争中に書いていた日記を追加してくれ
ぜひとも読んでみたい
0253無名草子さん垢版2022/09/21(水) 21:19:16.65
Twitterで「#青空特務司書」や「#広がれ特務司書工作員の輪」の工作員交流用ハッシュタグがあるけど余り使われてないね
0255無名草子さん垢版2022/09/22(木) 07:28:45.47
>>253
文アル齧ってるけどなかなか交流はし辛い
0258無名草子さん垢版2022/09/22(木) 11:39:32.00
>>255
文アル知らないけど、特務司書の名を借りてるだけで文アル関係なさそうじゃない?

まあ見つけにくいタグではあるよなぁ、耕作員用のタグないかな?と思った人が見つけられる名前ではないな。

校正依頼PRもできて、上手く使えば便利そうなのに
0259無名草子さん垢版2022/09/22(木) 18:10:59.29
稲垣足穂が1冊も登録されてないように見えるんだけど
この方の小説ものすごく良いのにもったいない
0260無名草子さん垢版2022/09/22(木) 18:55:49.35
入力しろ定期
0261無名草子さん垢版2022/09/22(木) 19:24:22.21
入力しても良いんですか?
そのための小説を僕にください
まさかここ10年で小説がこんな高騰するなんて思わなくて
断捨離してほぼ全て捨てたんだよ
なんで1200円とかするのよ
0262無名草子さん垢版2022/09/22(木) 20:06:01.03
没後50年すら経ってない作家なのか
ひとつも登録がないとかあたりまえの話じゃないか
出直して来い
0263無名草子さん垢版2022/09/22(木) 20:07:26.43
半年ROMれ
0264無名草子さん垢版2022/09/22(木) 20:08:15.64
1977年10月25日没って改正前ですら2023年1月1日からじゃん
0266無名草子さん垢版2022/09/22(木) 20:10:40.76
それな

青空文庫を、乞食の巣窟にはしたくないものだ
0267無名草子さん垢版2022/09/22(木) 21:15:58.87
>>265
そうだったか
皆ありがとう
一千一秒物語好きだから注文した
0268無名草子さん垢版2022/09/22(木) 21:33:29.98
著作権切れの官能小説って無いん?
広義でじゃなくて、もうひたすら抜け!って感じの
0269無名草子さん垢版2022/09/22(木) 21:47:08.42
墨東綺譚がそんな感じかと思ってたのに期待してたのと違った
0270無名草子さん垢版2022/09/22(木) 22:39:23.58
Wikipediaの官能小説のページには

>近代的な小説のジャンルとして、読者の性欲を刺激することを目的に据え、性愛を描いた作品は明治時代から存在した。

とあるけど具体的な作品名は殆んど出されてない
0271無名草子さん垢版2022/09/22(木) 22:55:02.05
別に著作権保護期間が法改正で70年に延長されたの知らなくてもいいよ
それこそ知的財産権に関わらないなら何年間かも知らなくても別にいいよ
でも青空文庫にあるかどうか確認するならせめて自分で調べようよ
0273無名草子さん垢版2022/09/22(木) 23:18:04.59
戦中戦後の作品なら
××を×って××××たり×××××××
みたいな伏せ字で妄想がはかどるぞ。
0274無名草子さん垢版2022/09/22(木) 23:26:55.26
NDLのデジコレをそれらしい単語で検索すると性生活や性教育についての本は山ほど出てくるね
カストリ雑誌なんかもかなりあけすけなものも載ってるな
0275無名草子さん垢版2022/09/24(土) 06:59:02.31
稲垣足穂はないけど、
「一千一秒物語」の序文(佐藤春夫)は校正待ちになってるよ。
0276無名草子さん垢版2022/09/24(土) 16:33:34.90
底本に明らかなへんな誤字みつけると、ママ注記にするか、訂正の上「底本では」注記にするかで悩む。
0277無名草子さん垢版2022/09/24(土) 16:45:59.22
>>276
>青空文庫での入力校正作業は、原稿の誤りをただす「校閲」でも、最善と思われる本文を編集する「校訂」でもありません。
>つい底本の全文を初出や親本と突き合わせてみたくなる気持ちも、テキストに対する積極的な愛情のひとつではあります。
>とはいえ作業の上では、別底本が参照できて客観的に訂正可能なもののみを誤植注記し、辞書や用例等に鑑みて疑わしいと思われるだけのときは、ママ注記にとどめてください。

青空文庫編 青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html
0278無名草子さん垢版2022/09/24(土) 16:54:36.28
ありがとう。
FAQ、耕作員になったときに目を通したはずだが、
実際の作業をいくつも経験してから改めて読むと、深いな。
0279無名草子さん垢版2022/09/24(土) 17:38:38.00

皆協力する姿勢に感動した
俺もそのうち工作員になりたい
しかし工作員ってイメージ悪いなw
0280無名草子さん垢版2022/09/24(土) 19:56:56.65
「耕作員」もあるよ
0281無名草子さん垢版2022/09/24(土) 22:21:44.03
佐藤春夫と幸田露伴ってどっちが日中の古典に造詣が深かったのですか?
0282無名草子さん垢版2022/09/25(日) 22:44:51.33
も~山本周五郎ばっかりじゃん!!!
山本周五郎死ね!!!!
0283無名草子さん垢版2022/09/25(日) 23:42:00.71
お前が死んだことにして工作員に生まれ変わるんやで
0285無名草子さん垢版2022/09/25(日) 23:59:07.48
>>284
すまんちゃ
はりなおし
https://i.imgur.com/93G5f49.jpg
久々に文庫本読んでるけれどスマホの画面になれてると文字が小さいしページ中央辺りが読みづらくて辛い
昔はこんなのを朝から晩まで熱中して読んでたんだな
0286無名草子さん垢版2022/09/26(月) 00:01:34.25
今のうちに予言しておくと’22/08月-’22/09月の月間アクセス増率分析では知里幸恵が躍進。
「100分de名著」で「アイヌ神謡集」が取り上げられた効果が見られるでしょう。
0287無名草子さん垢版2022/09/26(月) 01:35:16.10
>>282 もう死んでるww
0289無名草子さん垢版2022/09/26(月) 03:45:42.05
工作員に転生させられた。が、そこは青空文庫のない異世界だった。続く...
0292無名草子さん垢版2022/09/26(月) 13:09:17.44
工作員に転生って背乗りとかの話じゃないのか
いや青空文庫で入力校正作業するのに戸籍の偽造をする必要は当然ないけど……
0293無名草子さん垢版2022/09/26(月) 19:07:47.87
私は青空文庫の工作員。
北の黒電話のお陰で嫌な印象が付いたけれど言葉だけれどパンチドランカーの私にはとても誇らしい名称です。
パンチドランカーというのはボクシングじゃなくて保護期間が切れた小説を入力公開する人の二つ名です。
なんせ青空文庫の8割は私が入力したんだから。
私は地震で倒れてきた書棚の下敷きとなり呆気なく異世界転生。
転生先はとても貧しい家族の末娘。
私の異世界青空文庫ビブリアファンタジーの始まりだ。

こんな感じ?
0294無名草子さん垢版2022/09/26(月) 19:13:20.35
↑「著作権存続中」で登録申請してください
0295無名草子さん垢版2022/09/26(月) 19:18:08.64
>>294
いやいやまってよ
異世界だと日本の著作権関係ないから
あとビブリアファンタジーってのが何なのか分からん
ビブリアってなに?
0296無名草子さん垢版2022/09/26(月) 20:02:07.47
ギリシャ語で本(複数形)、ラテン語で聖書

『ビブリア古書堂の事件手帖』を御存知でない?
0297無名草子さん垢版2022/09/26(月) 20:03:22.28
>>281
どういう指標で優劣つけるの?
0298無名草子さん垢版2022/09/26(月) 20:19:12.80
>>296
ありゃーした
タイトルだけは知ってる
そうかスコップとシャベルみたいなもんか
0299無名草子さん垢版2022/09/27(火) 05:38:39.48
高見順は最近解禁だからあんまり作品数ない感じ?
なんか過小評価されてねえかい。左翼転向組だからかな
あと武田麟太郎は戦前めちゃくちゃ人気だったし46年没だからどんどん追加して
0300無名草子さん垢版2022/09/27(火) 06:36:47.17
没後50年なら椎名麟三とか来年来たはずなのにな
TTPだかTPPだかPPTだか知らんが死ね!
0301無名草子さん垢版2022/09/27(火) 08:02:30.02
>>299
校正待ちが待ってるよ
0302無名草子さん垢版2022/09/27(火) 18:42:59.10
> TTP
知らん
> TPP
ターボパスカル
> PPT
パワーポイント
0303無名草子さん垢版2022/09/27(火) 20:13:36.92
TPP11よりも日欧EPAの方が……
0305無名草子さん垢版2022/09/29(木) 23:33:50.88
「某のアレを入力したいけどこの御時世だと顰蹙を買いそう……」と思ってしまう
0306無名草子さん垢版2022/09/30(金) 12:38:01.00
著作権切れてるか切れてないか以外の基準なんて設けるだけ無駄
公開も作業もされてないから入力する、校正待ちだから校正する

もちろん全部やるのは不可能なので底本が入手出来るかどうかとか分量とか好みとか作者との縁(同じ出身地とか)による取捨選別はあるけどね
03072022年10月公開予定作品一覧垢版2022/09/30(金) 18:10:12.09
2022-10-01 山本 周五郎『入婿十万両』
2022-10-02 佐藤 春夫『二つの愛国型』
2022-10-03 山本 周五郎『暗がりの乙松』
2022-10-04 ホワイト フレッド・M『ドレントン・デン特派員の冒険 04 第四回 灰』
2022-10-05 山本 周五郎『正体』
2022-10-06 坂口 安吾『「大国主命」』
2022-10-07 作者不詳『現代語訳 平家物語 10 第十巻』
2022-10-08 山本 鼎『「槐多の歌へる」序』※命日、作品初公開
2022-10-09 山本 周五郎『蛮人』
2022-10-10 中谷 宇吉郎『無知』
2022-10-11 岡本 一平『怪物取組画譜 出羽ヶ嶽その日その日』※命日
2022-10-11 片山 敏彦『暗い時間に』※命日
2022-10-12 浅沼 稲次郎『休養を取る日を』※命日
2022-10-13 山本 周五郎『松風の門』
2022-10-14 正岡 子規『牡丹句録 子規病中記』※誕生日
2022-10-15 岡本 綺堂『河鹿』※誕生日(旧暦)
2022-10-15 木下 杢太郎『伊豆伊東』※命日
2022-10-16 山本 周五郎『嫁取り二代記』
03082022年10月公開予定作品一覧垢版2022/09/30(金) 18:10:45.15
2022-10-17 柳田 国男『産婆を意味する方言』
2022-10-18 尾崎 士郎『風蕭々』
2022-10-19 山本 周五郎『あすなろう』
2022-10-20 九条 武子『六甲山上の夏』※誕生日、初公開
2022-10-20 坂口 安吾『私の探偵小説』※誕生日
2022-10-21 江戸川 乱歩『暗黒星』※誕生日
2022-10-21 尾崎 士郎『早稲田大学』※早稲田大学創立記念日
2022-10-22 坂口 安吾『神童でなかったラムボオの詩 中原中也訳『学校時代の詩』に就て』※中原中也命日
2022-10-23 山本 周五郎『榎物語』
2022-10-24 中谷 宇吉郎『紙の行方』
2022-10-25 原 杞憂『追悼記』
2022-10-25 原 民喜『追悼記』
2022-10-26 山本 周五郎『改訂御定法』
2022-10-27 尾崎 士郎『叛骨・中野正剛 ――主観的な覚え書き』※中野正剛命日
2022-10-27 木下 夕爾『夜学生』※誕生日
2022-10-28 正宗 白鳥『ペンクラブと芸術院』※命日
2022-10-29 山本 周五郎『源蔵ヶ原』
2022-10-30 永井 荷風『心づくし』
2022-10-31 ポリドリ ジョン・ウィリアム『吸血鬼』
0310無名草子さん垢版2022/09/30(金) 19:18:36.07
単純に時代錯誤な作品というだけならいくらでもあるだろうけど
「この御時世」がもっと狭い期間を指すなら山口二矢の供述調書あたりかな
0311無名草子さん垢版2022/09/30(金) 19:27:58.38
来月の公開作品に浅沼稲次郎いるじゃん
0312無名草子さん垢版2022/09/30(金) 20:45:59.62
ハロウィンに「吸血鬼」公開はなるほどと思った
0316無名草子さん垢版2022/09/30(金) 21:29:22.49
ちょっと上にめっちゃ大ヒントあるやん……

と思ったが最近来た人なら1ヶ月分の公開予定作品の一覧が前月末に定期保守代わりとして書き込まれるのは知らないか
0317無名草子さん垢版2022/09/30(金) 22:56:36.90
入力申請しようかどうか迷ってると他の人に入力はおろか校正まで済まされて公開まで話が進んでしまう(※もちろん良いことではある)
その一方で同じ程度の知名度があるはずの作品を入力したらしたで何故か校正待ちの状態が長く続いてしまう

なんでだろ~なんでだろ~
0318無名草子さん垢版2022/09/30(金) 23:49:20.04
>>316
別だけど長文は自動的にあぼーんしてるので最初から見てない俺がいる
青空文庫スレは落ち着いてるのですが
他のスレが危なくてこういう設定入ってるやつもいると頭の片隅にでも入れておいてもらえると嬉しいです
0319無名草子さん垢版2022/09/30(金) 23:57:45.75
既に組んだことのある人がいたら
その人の癖や作業の信頼度が分かっているから
自然とそういう相手(の入力テキスト)を選んでしまうということはあるんだろうか

「この方とこの方のペア、よく見かける気がする」というのがある

だとすれば、作品そのものや申請タイミングなどの要素よりも、
属人的要素によりそのマーフィーの法則的なのが発動している可能性あり
0320無名草子さん垢版2022/09/30(金) 23:59:49.63
>>318
それはあくまでもあなたの嗜好から来る選択(都合)であって
合理的とはいえない

皆に配慮を求めることではない
0321無名草子さん垢版2022/10/01(土) 00:06:07.98
むしろ意図的に見てない書き込みがあるなら話の流れがありそうな時くらい確認しそうだが
0322無名草子さん垢版2022/10/01(土) 00:16:59.70
>>319
大前提としてアクティブユーザーが少ないから常連で組んでる印象が強くなるのでは?

文アル文スト経由で工作員になった人達は特定の作家の作業で固まってるかもしれないけど
0323無名草子さん垢版2022/10/01(土) 00:27:23.66
>>320
他人に配慮しろなんて一切書かれてないので過剰反応するな
落ち着け
自分自身が馬鹿だというレスはいくらでもしてよいが
他人へのヘイトレスは控えようぜ
0324無名草子さん垢版2022/10/01(土) 00:36:30.59
他人をヘイトはしていないし
そんな言葉を使ってはいないから
あなたこそ落ち着いて読んでくれ

なにかを頭の片隅に置いてほしいということは
それを踏まえて考えてくれということ

それを配慮を求めると言わなかったらなんだと言うのかなあ


「こういう環境で見ている人は、気づけないこともある」
という事実だけが提示されてれば、そういうこともあるのかーと思うだけだったが

それを身体的理由でもないのに
自分の勝手で見ないようにしているものを
頭の隅に置いてくれと言われても、
それはいかがなものですか?
と感じたにすぎない
0326無名草子さん垢版2022/10/01(土) 00:56:07.42
>>322
文アル文ストから耕作員ってコース、あるんだ?

文アル文ストから文豪本人に興味を持つまではありかもなと思ってたが
実際問題、世界観はまるで別物だし
そこまでのめり込めないかと思ってた
0327無名草子さん垢版2022/10/01(土) 01:46:17.95
文ストは知らないけど文アルから工作員は結構いると思う、というか、以前はもっといた
何人か要領のいい人がいて、いろんな作家の入力校正をやっていたから
少し前までは今よりも誕生日とか命日の公開が充実していた気がする
最近は動きがないみたいだけど……
0328無名草子さん垢版2022/10/01(土) 02:04:23.82
自分は入力も校正もやる方だけど、自分の入力作品を校正してくれた人の入力作品を
お返しの気持ちで校正することは確かにある(※お互い面識はない)
ただし手を出すのは興味のある作家・作品だけですね
知らない作家の校正はミスしそうで、ハードルが高く感じる
0329無名草子さん垢版2022/10/01(土) 02:13:49.94
>>326
文ストか文アルかは知らんが佐藤春夫あたりはその辺のファンが布教活動の一環で作業してるのが如実に現れてると思う
0330無名草子さん垢版2022/10/01(土) 02:20:46.79
むしろ少なくとも第一印象では著者にも内容にも興味ないくらいの方が「いつもの感じだろうと何となく読んでしまう」ということが起こらないので間違いを見つけやすい気がする
0331無名草子さん垢版2022/10/01(土) 11:30:08.04
文スト文アル関係者で一番貢献してたのは、花袋の校正を黙々と片づけてくれてた人たちだと思う
(本人に直接確認したわけではないから関係者というのは推測だけど)
春夫は……まあ声が大きい工作員がいるな、とは思う……
0332無名草子さん垢版2022/10/01(土) 11:37:43.75
知らない作家の入力校正をすると、たとえば「一見して誤記っぽいけどその作家ではよく見られる表現」みたいなものに
気づかず誤記注記とかママ注記とかをつけてしまって、後の作業をする人に迷惑をかけたりするから
まあ作家の知識はあるに越したことはない
0333無名草子さん垢版2022/10/01(土) 13:07:14.34
>>331
花袋、そうなんだ

自分はキャラ設定画くらいしか知らんのだけど
ほかの文豪の格好よさに比べて
蒲団キャラはあんまりにもあんまりじゃないかwwと思っていたので
何か安心したw
0334無名草子さん垢版2022/10/01(土) 13:09:17.90
ワイの入力してるマイナー作家もイケメン擬人化しないかな
0335無名草子さん垢版2022/10/01(土) 13:12:48.18
何きっかけだろうと何年かかろうと
最後までやりきれるならどんな人でも嬉しい
0336無名草子さん垢版2022/10/01(土) 18:59:48.11
10月も隙あらば山周なんだな・・・
中宇が減ったな
0337無名草子さん垢版2022/10/01(土) 19:23:22.56
隙を見せてるのは山本周五郎作品の作業してる方じゃなくて他の作家の作品の作業をしてない方
0338無名草子さん垢版2022/10/01(土) 19:27:27.26
著作権切れしていて作業未定の作者名と作品名一覧とかあるのだろうか
参加出来るようなの有ればと思うんだが
0339無名草子さん垢版2022/10/01(土) 19:32:02.80
>>338
作者の一覧はあるけど(青空文庫のトップページから見られたはず)
さすがに作品名はないから各自お調べヨロってところじゃないかな?
0340無名草子さん垢版2022/10/01(土) 19:41:20.55
アクティブ耕作員さんはそんなに少ないのだろうか?

yozoraで見られる作業状況(最近4週間の動き)を見るとたしかに
耕作員名が限られた常連だけにしか見えないけれど、

入力テキストや校正テキストが点検済みや校了になる時の日付が
点検チームに送ったメールの日付になることをあわせて考えると、
点検済みや校了に進んでも「最近の動き」に載らないものの方がたぶん多い思うんだ

常連さんのは品質が安定していて点検も早くすむだろうから、「最近の動き」に載りやすいというか
0341無名草子さん垢版2022/10/01(土) 19:46:54.64
>>338
青空文庫の「登録全作家インデックス」なら「公開中:0、作業中:0」が載ってる
具体的な作品一覧はない(Wikipediaやコトバンクを調べたら載ってるかも)
https://www.aozora.gr.jp/index_pages/index_all.html

校正だけでいいなら「青空文庫校正待ち作品検索」がある
ここのURLは何が引っかかってるか分からないけど何故か書き込めない

「死せる作家の会」は没年別に作家の生没年と一部の作品名が載ってるが青空文庫との直接的なリンクはしてない
ちなみに2004年で更新が止まってる
http://www.jca.apc.org/~earthian/aozora/dead.html

あとWikipediaには没年カテゴリがあるので1967年以前の没年カテゴリをちまちま調べたら良い作家に巡り会えるかもしれない
例:Category:1967年没
https://ja.wikipedia.org/wiki/Category:1967%E5%B9%B4%E6%B2%A1
0342無名草子さん垢版2022/10/01(土) 20:03:21.88
今月の公開作品でいえば
山本周五郎は10作品公開に3人が関わってる
(※1つは法人名義なので複数人いるかもしれないが)
尾崎士郎は4作品公開に5人が関わってる
坂口安吾は3作品公開に4人が関わってる

入力者と校正者さえ見つかればいくらでも作品が公開されるというだけのこと
0343無名草子さん垢版2022/10/01(土) 21:21:35.01
>点検済みや校了に進んでも「最近の動き」に載らないものの方がたぶん多い

受け取り報告メール、どれくらい来なかったら問い合わせする?
それとも問い合わせはいっさいしない?
点検が忙しいのだろうことは想像に難くないし、催促するつもりもまったくない
けれど、ファイルが届いてないのでは(または見逃されてしまったのでは)と心配になること、ない?
0344無名草子さん垢版2022/10/01(土) 21:58:06.42
>>343
>受付の確認やファイルの点検について

>入力ファイル受領時、校正ファイル送付時の「点検作業」は、少数の点検チーム(ボランティア)によって担われています。
>作業待ちのタスクが重なっている場合、返信や送付・確認にしばらく時間がかかることがあります。こちらも気長にお待ちください。

作業着手連絡システム
https://reception.aozora.gr.jp/


俺も8月末に入力ファイルをいくつか送って1ヶ月くらい待ってる
Gmailで送ったのもあるから1ヶ月超えると受理されてないかもという心配も出てくるけど
別に校正者確保したわけでもないし残りの作業中作品を送る際にも受領メールが届いてなかったら確認すればいいかなって思ってる
0345無名草子さん垢版2022/10/01(土) 22:00:34.70
一ヶ月くらい確認メール遅れるのはざらって大久保さんもツイートしてたな
0346無名草子さん垢版2022/10/01(土) 22:02:31.12
最近の動きに載らなくても舞台裏には載るから、それで大体の動き(今は●月提出の辺り処理してくれてるんだなとか)はわかるので、問い合わせたことはないな
半年音沙汰なかったら、次の提出の時にでも軽く訊くかも
0347無名草子さん垢版2022/10/01(土) 22:03:56.65
>>339
反応早っ
以降の皆さんも有難う

>>342 さんも
んー作者名分かれば検索に突っ込んで作品名探せばいいしな
ぼちぼち見て行きます

山本周五郎繋がりですが「殺生谷の鬼火」で表示されない文字があるようにみえるのですが
これはandroidビューアー側の問題かな
読書尚友Freeという青空文庫ビューアーだと「……」のような表示になるのです
例えば以下のように「…」で出てきます
怨霊の呻声、鬼火、……立派な道具立てだ、

これはFONT問題とかビューアー側の問題なんだろうか?
分かりづらかったらすまん
0349無名草子さん垢版2022/10/01(土) 22:18:07.24
点検グループって何人くらいいるんだろう。入力校正とは違う苦労がかなりあるんだろうな。
0350無名草子さん垢版2022/10/01(土) 22:35:05.14
>>347
『殺生谷の鬼火』の話がよく分からん
ブラウザで見てもテキストファイルで見ても三点リーダーだし
「・・・」っぽく見えるか「...」っぽく見えるか、みたいな話?
0352無名草子さん垢版2022/10/01(土) 22:54:02.86
↑何かへんな書き方になってしまった
以前、ここだったかおーぷんだったかで
中の人はふたりくらいしかいないのではないか(二人としかやり取りしたことがない)というレスを見たことがあったから

それよりは多いよ、という意味であって、すくなくとも五人もいるのだから十分だという意味ではないよ

ほんとうはまだほかにもいらっしゃると思うし
こなす作業量と苦労の数々からしたら少数精鋭の極み、とても大変だと思う
0354無名草子さん垢版2022/10/01(土) 23:07:06.88
>>350
ありがと
テキストビューアーはうっかり忘れてました
見てきます
0356無名草子さん垢版2022/10/02(日) 00:10:53.85
この間の「新文化」の記事には「現在の運営メンバーは6、7人」と記載があります。
0357無名草子さん垢版2022/10/02(日) 02:48:04.19
>>356
そういえば>>137で気になってたのに買うのすっかり忘れてたわ
ファミマでプリントしてきた
サンクス
0359無名草子さん垢版2022/10/02(日) 15:48:21.83
連絡遅いのはしょうがないからどうでもいいけど、連絡来ないと次の入力や校正の申請していいかどうか分からないのよね
連絡来ない状況で新規に申請したところで受付の負担を増やすだけなんだけど
0360無名草子さん垢版2022/10/02(日) 16:50:52.86
だいたい青空文庫の話題が出るときって「青空文庫で読めるおすすめ作品!」みたいなのが多いのにここだけは工作員多くてなんか面白い
0361無名草子さん垢版2022/10/02(日) 18:33:51.76
ネット掲示板見るかどうかとか抜きに対象者が少なすぎるので、長期間書き込みがなくても落ちないスレくらいしか作業関連の相談や雑談が出来る場所がないんですわ

Twitterとかでもいいんだけど、名前が出た状態で交流しようとすると
「(青空文庫関係かどうかに関わらず)相談に乗ってもらったから、恩返し代わりにこの人の校正やった方がいいかな」
みたいな気遣いも出ちゃって交流が密にならない懸念もある
0362無名草子さん垢版2022/10/02(日) 21:20:30.82
>>359
自分はいつも完了前に次の校正申請と底本画像送ってるな
入力は断られたり被ったりしそうもない作品しかやらないから、申請前に着手することもある
作業できる余裕があるときに、待ちの期間をなるべく作りたくないもんで
0363無名草子さん垢版2022/10/02(日) 21:51:07.82
>>362
ワイも

作業はじめた後で断られることがあるとしても
ルール違反をしているのは自分だから
自業自得と割り切ってる

ワイも申請するのは(作業人気度的には)マイナー作家だから
実際断られたことはないですが
0365無名草子さん垢版2022/10/02(日) 22:11:29.07
入力申請が被るのは分からないでもないけど、それと別枠で断られることってあるの?
0367無名草子さん垢版2022/10/03(月) 05:55:07.11
>>365
とある作家さんの和歌を一首だけ作業しようとした(全集等が刊行されてないマイナーな作家)ら、文化財指定されている短冊の翻刻(豊臣秀吉等)の例外を除き、和歌や俳句の1作品のみでの登録はページ数や作業量の関係上認められない、って感じで断られたことあるよ
0369無名草子さん垢版2022/10/03(月) 14:21:32.01
一々、入力・校正w
そら、時間がかかる。
0370無名草子さん垢版2022/10/03(月) 19:56:45.82
>>368
その基準をクリアするために例えば『藤野古白句集』は
一度同人誌として句集を編纂して刊行した後に、その刊行した同人誌を底本として、その同人誌を編纂した編集著作権者が著作権存続作品として青空文庫に収録する
という形を取ってるな
0373無名草子さん垢版2022/10/03(月) 22:48:37.13
ジャンルや利害が合致すれば載せてくれる既存の文藝同人サークルに出会えるかもしれない
やったことないから分からんけど
0374無名草子さん垢版2022/10/04(火) 00:20:12.08
どんな程度の同人誌ならOKなんだろうな

底本よりも親本がしっかりしてないとダメそうだが
0375無名草子さん垢版2022/10/04(火) 00:21:26.80
親本というか
初出情報がはっきりしているというか
0377無名草子さん垢版2022/10/06(木) 01:08:06.08
めちゃくちゃ変則的な組版を前に途方に暮れたりしたことある?

いままでの公開作品のなかで一番変態な組版の作品ってどれなんだろ
0378無名草子さん垢版2022/10/06(木) 09:00:07.60
ホワイトブレッド作品の図版入りの多さは異常
偉い!
0379無名草子さん垢版2022/10/06(木) 23:46:49.03
>>286
『アイヌ神謡集』のXHTML版のアクセスランキング見てみたけど

1月 250位 748アクセス
2月 159位 924アクセス
3月 295位 585アクセス
4月 147位 983アクセス
5月 144位 1,075アクセス
6月 175位 948アクセス
7月 227位 869アクセス
8月 236位 767アクセス
9月 66位 2,240アクセス

確かに前月の3倍近いアクセス数だし今年の他の月で一番多い5月と比べてもダブルスコアだな
0380無名草子さん垢版2022/10/08(土) 07:59:19.07
【「100分de名著」出演】「ゴールデンカムイ」アイヌ語監修者が教えるアイヌ文学「不朽の名著」その本当の魅力
https://news.yahoo.co.jp/articles/043c3976f03855aa32b0859f4a40f62e8f68483a

9月のNHK・Eテレ『100分de名著』では、4週にわたって、知里幸恵(ちりゆきえ)さんが遺した
『アイヌ神謡集』(岩波文庫)が取り上げられました。解説を担当されている中川裕さん
(千葉大学名誉教授)は、大人気漫画『ゴールデンカムイ』のアイヌ語監修を務め、
好評発売中のヤマケイ文庫『アイヌと神々の物語』『アイヌと神々の謡』(山と溪谷社)の
推薦者でもあります。あらためて、アイヌ文化の魅力と関連書籍の楽しみ方について聞きました。
0381無名草子さん垢版2022/10/08(土) 14:44:43.40
アイヌの回全部見たけれどよくわからなかったな
若くして亡くなったアイヌ女性の話が少しとアイヌ神話の解説に終始したよ
0382無名草子さん垢版2022/10/08(土) 17:45:59.42
めちゃくちゃ今更ながら曇天文庫が終わってたというかYahooが終わらせていたことを知ってめちゃくちゃ悲しい
0383無名草子さん垢版2022/10/09(日) 20:29:06.94
今日偶然知ったけど芥川龍之介の『羅生門』の最後の一文って改稿されてるんだな

『羅生門』の「最後の一文」は一度改稿されていた! 名文が多い小説の“ラスト”を楽しむ方法 | ダ・ヴィンチWeb
https://ddnavi.com/review/585674/

>下人は、既に、雨《あめ》を冐《をか》して、京都の町へ強盗を働きに急いでゐた。
https://www.aozora.gr.jp/cards/000879/card128.html

>下人の行方《ゆくえ》は、誰も知らない。
https://www.aozora.gr.jp/cards/000879/card127.html
0387無名草子さん垢版2022/10/09(日) 22:20:10.16
>>383
落として読むリストに入れてたけれど知らなかった
ありがとう
0388無名草子さん垢版2022/10/09(日) 22:23:39.05
知里幸恵ってアイヌとして生まれて和人の教育を受けて
クリスチャンとして西欧文化にも馴染んで
そうした女性だったからこそ「アイヌ民謡」を
普遍的な文学作品として残せたんじゃないかって思う。

病身で若くして亡くなった薄幸の女性ではあるけど
家族に宛てた手紙とかには茶目っ気たっぷりの
愛らしい姿が見受けられる。

まさかプライベートな日記や手紙が後世
青空文庫で公開されるとは思ってなかったろうけど。
0389無名草子さん垢版2022/10/09(日) 22:25:50.32
> まさかプライベートな日記や手紙が後世
> 青空文庫で公開されるとは思ってなかったろうけど。

凡人に生まれてよかったと今心から思ったw
0390無名草子さん垢版2022/10/09(日) 22:32:38.67
山周、山周、雨、山周だよ
どうなっとんじゃワレ~
0391無名草子さん垢版2022/10/09(日) 22:38:54.94
今月のアクセスランキングテキスト版
1位から14位まで山本周五郎独占かと思いけや
9位に「独居雑感」やるな、永井荷風、山周旋風を阻止するとは
0392無名草子さん垢版2022/10/09(日) 22:44:06.06
死んだらそれで終わりだから
後世に残るというのはそれだけで凄い
ただNHKの特集は面白くなかった
0393無名草子さん垢版2022/10/09(日) 23:16:26.30
>>389
油断するな「二十歳の原点」の高野悦子だって生前は一大学生だからな
若い時に読んで衝撃を受けて当時書き綴ってた日記のディスクを
フォーマットしたんだけど今になってみれば
一応残しとけば良かったなんて思ってもいる
0394無名草子さん垢版2022/10/09(日) 23:42:53.21
芥川龍之介の遺書は「右の条件の実行せられたる後は火中することを忘るべからず。」と書いたのに
内容(本文)はちゃっかり後世に残されてる(青空文庫にも収録)上に更に遺書も普通に残存してる
そりゃ他人からすれば内容も原本も残ってたっていいし死人に口無しだけど本人的にはどうなんだろうな
0396無名草子さん垢版2022/10/10(月) 00:10:56.44
死んだら全て終わりだから関係するのは生きている間のみ
あの世あるとかは心のよりどころなだけ
だが弱ってるときは頼りにするし付きあいの潤滑剤にもなるので宗教ってすごいね
0397無名草子さん垢版2022/10/10(月) 02:36:15.34
逆に日本画家の奥村土牛の子供が相続税を増やしたくないからとデッサンを焼却処分するなんてエピソードもあるし
0398無名草子さん垢版2022/10/10(月) 07:06:28.96
>>394
芥川の場合はそれすらもポーズというか演出で
絶対に後世に残ることを意識して書いてる気がする。
自らの死に対しての演出という点では芥川とか太宰とかは特に
周到に準備していて生き様自体をひとつの作品として
残したかったのではなかろうか。
0399無名草子さん垢版2022/10/10(月) 13:20:40.96
日記も人が読むことを前提に書いているものが多いな。
もっとも、元々家の覚というルーツを考えれば、それが本来なのかもしれないが。
0400無名草子さん垢版2022/10/10(月) 14:49:14.54
日記を外部に見せる予定のない個人的な備忘録と考えても、本人すら忘れてる時に中身を確認することになるんだから、何も知らない赤の他人でも読めるような書き方になっててもおかしくないわな
0401無名草子さん垢版2022/10/10(月) 14:55:50.50
去年田辺聖子の女学生時代の日記が出版されたけど、自分の友人に日記を読ませて感想を聞いたりしてるんだよね
まあ読ませても大丈夫なところだけと書いてるけど
作家を生業にしようというくらいの人って、いつも読者を意識してるんだなと思った
アンネの日記のアンネも後年出版するつもりで書いてた日記があった
0402無名草子さん垢版2022/10/10(月) 15:07:31.04
石川啄木は、遊郭等での女遊びの詳細を妻に読まれたくなくてローマ字でこっそり日記に書いてたなぁ
(すさまじい内容だから、青空文庫に入れる猛者は現れるのか……?)
0403無名草子さん垢版2022/10/10(月) 15:35:28.44
ローマ字日記が全集とかに普通の漢字かな混じり文で収録されてて、編集後記とかに「誰々が(または編集部が)日本語表記に改めました」とあったら編集者や翻訳者としての著作権が発生するんだろうか
0405403垢版2022/10/10(月) 16:49:35.59
近所の図書館に確認しに行ったけど『啄木全集 第六巻 日記(二)』(筑摩書房、1967年12月25日初版第1刷)にはローマ字の原文と漢字かな混じり文の両方が載ってた
解題に「本巻の校訂は石川政雄氏と筑摩書房編集部が主としてこれにあたり、……」と書いてあるが誰が漢字かな混じり文を担当したかは分からぬ
まぁ編集部名義だけなら公開後50年で通せたけど大人しくローマ字の原文だけ入力すりゃいい話か

まぁ今入力申請したらここ見てると思われちゃうな
0406無名草子さん垢版2022/10/10(月) 18:31:48.23
ここみてると思われても問題なくない?
ここは紳士淑女のスレだし
0409無名草子さん垢版2022/10/11(火) 18:17:25.02
( ・∀・)へぇー

>スメラギ[#「天皇」の左に「オホキミ(?)」のルビ]

こういう注記(ハテナ注記)もはじめて見た。
古い(といっても8年前)テキストファイルのようだから注記も古いのかもしれないが
今だったら「判読不可」になるんじゃないかと思われるが
0410無名草子さん垢版2022/10/11(火) 18:56:45.05
昔のように漢字にカタカナの原型の漢字ルビ付けてるのを青空文庫で見たいな
既にあるなら良いんだけど
0411無名草子さん垢版2022/10/11(火) 19:24:32.71
>>409
国立国会図書館デジタルコレクションで公開されてるやつでも「天皇」の右に「スメラギ」、左に「オホキミ(?)」とあるから
引用文が書かれた当時の読み方が正確には分からないから2種類ルビ振りました的な話じゃないかな

橘曙覧評伝 - 国立国会図書館デジタルコレクション
https://dl.ndl.go.jp/info:ndljp/pid/1111722
0412無名草子さん垢版2022/10/11(火) 19:56:15.47
なるほど、
元々のルビが「(?)」と表記されてるケースなんだね
そういうのもあるのか

自分だったらどうするだろう、
小心者だからファイル末に「(?)は底本通り」と書いてしまうかもしれん
0414無名草子さん垢版2022/10/11(火) 20:01:19.21
>>412
そもそも仮に入力者、校正者、点検者が本文内に本文以外の文字を書き込む(打ち込む)なら

[#「○○」はママ]

みたいな注記スタイルになるはずだしな
0416無名草子さん垢版2022/10/11(火) 21:07:51.92
>>415
もう一声!
へんたいする以前の漢字に漢字ルビのやつがデジタル画面で綺麗に見たいなという素朴なネタでした
0417無名草子さん垢版2022/10/11(火) 21:32:27.95
大正時代に出た『変態性欲』って雑誌が青空文庫入りせんかな
0418無名草子さん垢版2022/10/11(火) 21:55:02.98
稲垣足穂ネタ引きずってすまん
文庫本読むの面倒になって楽天koboで500円割引あったのでこっちで買って読んでる
スマホで読みやすい文字サイズで読むのほんま楽
0420無名草子さん垢版2022/10/11(火) 22:21:41.66
ちなみに石川啄木「詩」に載ってる「一年ばかりの間、いや一と月でも」から始まる無題の詩は、『ローマ字日記』の明治42年4月10日の記述が初出らしく、初音ミクの楽曲にもなってるっぽい
0422無名草子さん垢版2022/10/12(水) 11:33:29.99
今月の「100分de名著」がちょうど折口信夫だけど
先月の知里幸恵よりちょっとかたい感じがする
アクセス増率的にはどうだろう
0428無名草子さん垢版2022/10/14(金) 03:39:02.23
レジス・メサックの滅びの島って入力したらおk貰えんのかな
0429無名草子さん垢版2022/10/14(金) 03:53:35.00
点検する人の方が精神的金銭的負担大きいわ
やりたいわけでもない作品確認するなんて金もらってやらないと大変よね
0431無名草子さん垢版2022/10/14(金) 14:03:02.11
やりたいわけでもない作品、かあ

自分は特にやりたい作品って無くて
とにかくコンプリート欲求が強いので、
「自分がこれ作業したらシリーズ完結するよなぁ」とか
「作業中ファイルが片付くよなぁ」とかを基準に作品を選んでる。

もしも中の人がわたしみたいなタイプだったら、点検というものはかなり遣り甲斐あると思う(※個人の感想です)。
0433無名草子さん垢版2022/10/14(金) 18:44:36.63
>>423
入力申請と底本画像送って、メール待ち
校正は8月辺りに全部送ったけど、まだ受け取りのメールが届いてない(いちおう届いてはいて確認中との事)
0434無名草子さん垢版2022/10/14(金) 18:56:24.04
俺も送って1ヶ月以上経ってるな
まぁそれでなくても分量がそこそこあるので気長に待ってる
0435無名草子さん垢版2022/10/14(金) 19:35:08.51
入力作品だけ送って校正作品は入力のが返事来てからでいいかと思ったけど公開のことも考えたら逆が良かったかな
今追加で送るのは流石に迷惑だろうけど
0437無名草子さん垢版2022/10/16(日) 13:49:04.51
OCR使っても校訂は苦行に近い
まるで写経しているかのようなご利益がありそう
0438無名草子さん垢版2022/10/16(日) 18:04:39.51
それゆえに間違い見つけたとき、お宝見つけたような醍醐味を得られるんやで
0439無名草子さん垢版2022/10/16(日) 18:08:51.62
最終的には目視が重要とはいえ、OCR校正がより効くのはやはり手入力ファイルなんだろうな。
OCR入力 VS OCR校正だと、校正用比較ファイル作る手間のほうが大きそうに思える。
特に近年のはOCR入力増えてるだろうし。
0440無名草子さん垢版2022/10/16(日) 18:37:13.04
元の文章が手入力かOCRかに関わらず簡単な誤字は「校正ツール2.0化ひとりプロジェクト」で解決しそう
0443無名草子さん垢版2022/10/18(火) 07:30:45.92
今日公開の尾崎士郎の小説『風蕭々』、1889(明治22)年10月18日に来島恒喜が当時外務大臣だった大隈重信に爆弾を投げた事件が元ネタなのか
大隈重信は右足を切断することにはなったけど生き残って来島恒喜は殺害に成功したと思って自殺したんだよな
0444437垢版2022/10/18(火) 08:04:32.13
校正と校訂を間違えた
青空文庫の工作員に求められるのは校正ですね

【校正】
1. 文字、文章をくらべあわせ、誤りを正すこと。きょうせい。校合(きょうごう)。
2. 印刷物を印刷する前の過程で、校正刷りを原稿に照らし合わせて、誤りを正すこと。また、校正刷り。「校正が出る」

【校訂】
書物の文字、語句などの誤りをなおすこと。特に、古書の本文をいろいろの伝本と比べ合わせて誤りを訂正すること。校。
0447無名草子さん垢版2022/10/18(火) 18:50:55.50
>>444
とはいってもやはりある程度、「この漢字遣いは今まで見たことないけど、正しいのだろうか?」っていうのは念のため確認しちゃわない?
(これは本来校閲、校訂にあたる作業)
0449無名草子さん垢版2022/10/18(火) 19:17:04.51
ここでいう「校訂」って、記念館にあるような直筆原稿と見比べて初出誌以降の刊行物の誤植を指摘したり、品詞分解して文法的な誤りを訂正したりするような研究然とした話であって、
「底本通りだけど青空文庫の作業過程で誤植が発生したと思われるかもしれないから」とママ注記するのは青空文庫の校正作業の延長でしょ
0450無名草子さん垢版2022/10/18(火) 19:49:24.30
うん、言わんとすることはわかる

ただ、前に出たコメントの流れで言うと
ママ注記は校正の範囲だけど
底本では○○注記になると校訂校閲に近くなるわけよね

そこの境目の見極めが難しいというか

ウィキソースがやってるようなむやみやたらなママ注記乱発は青空文庫ではやってないし
明らかな誤植を除いて、本当にママ注記の対象とするかっていうのは耕作員の匙加減みたいなところない?
0451無名草子さん垢版2022/10/18(火) 19:51:49.67
入力も校正も、自分はわりとその点にに力と時間を割いてる感がある。
0452無名草子さん垢版2022/10/18(火) 19:59:15.65
「これは誤字だ!」と思うか「これは誤字か?」と思うか「珍しい表記方使うねぇ」と思うか何も思わないかは各工作員の知識や教養や感受性次第だからなぁ
0453無名草子さん垢版2022/10/18(火) 20:10:58.92
ママ注記って点検ではどれくらい修正されるんだろう
0454無名草子さん垢版2022/10/18(火) 21:07:31.40
今日公開のやつにママ注記あるかなと思って検索したら

>貴様にはまた[#「また」は底本では「まだ」]別に命を捨てるに適当な時期がある、

>※誤植を疑った箇所を、底本の親本の表記にそって、あらためました。

とだけあった
入力者は底本の親本(旧字旧仮名のもの)も入力しているようだから気付けたのだろう


今月公開の他の作品だと『現代語訳 平家物語』には(どっちも尾崎士郎だな)

>与三左衛門|影康《かげやす》[#「与三左衛門影康」はママ]、

という注記もあった(※ググった限りだと一般的には「与三左衛門景康」か「与三左衛門景安」らしい)
0457449垢版2022/10/19(水) 00:12:56.40
>>450
確かにそれはそう


レアケースになるけど、例えば>>454の前者みたいに旧字旧仮名の本が新字新仮名で再刊されているような場合については
{新/旧}字{新/旧}仮名の別があれば同じ作品を収録できるというルールを使って、旧字旧仮名と新字新仮名を両方収録して
その中で差異があれば青空文庫内の整合性のために、間違ってそうな方に(これもあやふやだな)「○○は底本では××」注記を入れるということもできなくはないかな
対象となる作品(あるいは作家)は限られるだろうし、それでなくても本文が旧字旧仮名のままで再刊されるという可能性だって十分あるけど

結局は入力者(場合によっては校正者)次第なのかな
0458449垢版2022/10/19(水) 00:31:21.41
色々考えたけど色々考えた故に思考が取っ散らかって訳の分からない返事になってしまった気がする
すまぬ
0462無名草子さん垢版2022/10/19(水) 12:46:57.02
何度も書き込んでるけど普通に入力校正作業した工作員に対する侮辱だよな
0463無名草子さん垢版2022/10/19(水) 13:02:41.27
>>462
わかる
字面通りに読めばその通りだ

わかるが、
山周を敬愛していた富田さん、山周、それぞれへの一種の愛着や親しみを込めた、ここならではの山周ジョークとも言える

山周大杉→山周○ね→既に○んでますが
までがセットの
0464無名草子さん垢版2022/10/19(水) 13:08:55.88
いわばイジリだな。

いじめじゃないよイジリだよ~が当事者に通用しないのとおなじで
言われて快く思わない耕作員がいるかもしれんのは否定しないよ
0467無名草子さん垢版2022/10/19(水) 18:25:10.03
山本周五郎が公開されるまでは生きたいと言って闘病生活を送っていた富田氏に絡ませた上で死ねだの死んでるだのと言うのが愛着故の発言とは到底思えない
0468無名草子さん垢版2022/10/19(水) 18:33:07.67
おーぷんのほうじゃフリーOCRに旧仮名学習させる話してるぜ

不毛な会話やめて有意義な話しよう
0469無名草子さん垢版2022/10/19(水) 18:39:37.13
俺が最近思ってるのは、注記の実例集みたいなのできたらいいなって

もちろん点検グループさんにこれ以上負担はかけたくないから
公式に伺いをたてながら有志を募ったり何らかの形で

FAQや入力校正作業手引きで
「この場合こうする」っていう大まかなことはわかるけど
実際作業してみると、手引きで見たことないケースに遭遇することもある

前例をあたるのを楽にする実例集ね
0470無名草子さん垢版2022/10/19(水) 18:45:46.37
人の作業に文句言ってる訳だから感心しないよな
何もせずに文句たれるくらいなら山周ラッシュは俺が終わらせてやるくらいの気概を見せてくれたほうがかっこいい
山周だって公開が続けばいつかは新着がなくなるわけだし、次期山周の座を狙うくらいにがんばってくれ
0471無名草子さん垢版2022/10/19(水) 18:46:03.52
もちろん個人が外部サイトでやってもいいのだろうけど

「こういうケースで、こう注記した、こう注記するよう指導もらった」等の情報は個人だけで持っててももったいないな、
共有できたら良いなと思ったんだよね

そういう意味で有志で力と知恵、経験を合わせられればと思ったんだ
0475無名草子さん垢版2022/10/19(水) 20:09:16.65
スレ違いだったらすまないのだが

くの字点と言いながら、横書きのテキストデータでは「く」の字と山が逆向きの/\が使われることにいつも違和感を覚えるんだ

なぜ\/が採用されなかったのかな
(これもこれで見慣れないぶん違和感あるが)

基本的に横書きでは用いられない文字なのだよね
それとも横書きで使われている底本ってあるのだろうか
0476無名草子さん垢版2022/10/19(水) 20:34:46.57
文字コードでは、「/」(に似た形状の記号)を「くの字点上」、「\」(に似た形状の記号)を「くの字点下」としているからそれに順番を合わせているんだと思う
Wikipediaの「踊り字」のページ参照
0477無名草子さん垢版2022/10/19(水) 21:16:09.86
そうかそういうことなのか

Unicode文字のくの字上と下は見たことあったがセットで並べる固定観念から横組みになるところしか想像してなかった

長いくの字を上下に分けたものを、順番どおり前後(左右?)に並べた結果、山が逆に見えるというわけだね

長いくの字が横になることしか考えてなかった
これからは、/\に対する見方がかわるなあ

どうもありがとう
0479無名草子さん垢版2022/10/19(水) 21:19:19.85
表を底本のスキャン画像ですますか、ちゃんとエクセル等で入力し直すか迷う
せっかくだから綺麗にしたいけど、もし画像に力ミスがあったら校正の人の作業が大変になるよな
0480無名草子さん垢版2022/10/19(水) 21:27:32.81
両方送ろう(無責任)

それはそれとしてページを跨いでる図表って扱いに困るよね
0481無名草子さん垢版2022/10/19(水) 21:30:28.83
むしろ表の作り直しっていうのも有りなんですか。
表つきの作品を作業したことも読んだこともまだないので知りませんでした。
どんなふうか見てみたいです。
0482無名草子さん垢版2022/10/19(水) 21:33:54.50
校正待ちの作品が3000件以上あって、古いもので2003年から待ち状態になってるみたいだけど、どういう作品が放置されがちなのかな?
2003年からほったらかしとか少し可哀そうなんだが、同情したらダメな感じ?
0483無名草子さん垢版2022/10/19(水) 21:55:14.04
2005年以前から校正待ちの作品一覧

佐藤紅緑『あゝ玉杯に花うけて』…133,444バイト(※旧字旧仮名)
范曄『後漢書 皇后記』…11,782バイト(※なぜか底本情報がない)
范曄『後漢書 光武伝』…60,748バイト(※なぜか底本情報がない)
宮本百合子『書簡・書簡補遺』…350,117バイト
宮本百合子『婦人と文学(初出稿)』…113,002バイト
宮本百合子『湯浅芳子宛書簡』…341,209バイト
森本六爾『日本農耕文化の起原』…117,150バイト(※旧字旧仮名)
山路愛山『勝海舟』…152,519バイト(※唯一の点検済み)
※サイズは、zip圧縮をかけたテキスト版のもので、単位はバイト(byte)です。
 この値を1000で割ると、キロバイト(KB)に換算できます。
 解凍後はおよそ、倍の大きさになります。

みんなで校正待ちを解消しよう!!
0484無名草子さん垢版2022/10/19(水) 22:13:33.17
点検前のものは申し込めなくない?
できちゃうの?
0485無名草子さん垢版2022/10/19(水) 22:15:00.07
圧縮して半分になってるっぽいけど全角1文字で2バイトになるから書かれてるバイト数≒文字数になるのかな
書誌情報も込みのバイト数だろうけどまぁ誤差だろうし、となると後漢書以外は全部10万字以上の作品になるのか

文庫本は1ページあたり600字だから本文が10万字だとしても文庫本167ページ分くらいか
0486無名草子さん垢版2022/10/19(水) 22:16:23.60
山路愛山のは点検済んでることだしずっと気になってた
しかしこれはスキル的にはもちろんボリューム的にも自分にはなかなかにハードルが高いと感じて手が出せないでいる
0487無名草子さん垢版2022/10/19(水) 22:19:52.21
それに点検が昔すぎて注記形式とか変わってるはずだから、もしかして再点検されるのかな
0488無名草子さん垢版2022/10/19(水) 22:24:04.46
>>484
点検前のものは点検作業が完了してから校正申請を受理する(「校正待ち」から「校正予約」の状態になる)というだけで校正申請が不可というわけではないはず
0489無名草子さん垢版2022/10/19(水) 22:25:37.46
「ご注文内容によってお出しする順番が前後する場合がございます。」みたいなものか?
0490無名草子さん垢版2022/10/19(水) 22:27:13.69
いつかは誰かが点検しなければならないとはいえ点検さん大変だな
0491無名草子さん垢版2022/10/19(水) 22:32:59.21
校正の予約はないけどすぐ点検済みになるのと
校正申請されるまで点検前状態で待機になるのがあんのね。
0493無名草子さん垢版2022/10/19(水) 22:46:47.21
インターネッツ時代になってかれこれ20数年余
著者だけではなく工作員が人知れず鬼籍に入っていてもおかしくない年月
0494無名草子さん垢版2022/10/19(水) 23:11:50.99
自分はもし死んだときのために
うちの家族にその後の手続きを頼んである

死んだ旨を伝えること
未完成であっても作業ファイルの最新版を青空文庫に送ってもらうこと
どこまで作業したかがわかるメモ(たとえば何回目校正までやった、とか)も作品ごとに書いているのでその内容も伝えること

幸いまだそのときは来てない
0495無名草子さん垢版2022/10/19(水) 23:13:17.05
じゃないと、誰かから引き継ぎ交替申請が来るまで
作業中作品が死蔵状態になっちゃうから
0496無名草子さん垢版2022/10/19(水) 23:35:26.45
>>491
最近耕作員になっていくつか入力したけど、自分の入力作品は受領メールが来た翌日には校正待ちの点検済み扱いになってるから、恐らくある時期を境に(自分が耕作員を始める前に)原則として入力ファイルを受け取った時点で点検まで終わらせるように方向転換したんだと思う

それで次々に届く新しい入力ファイル(つまり点検前の作品)を点検してて、昔の点検前の作品は校正申請が来るまでは手を着ける余裕がないのかなと思う
0497496垢版2022/10/20(木) 00:04:43.29
作業状態を年別で見ると最近の点検前は何人かに絞られてるし、恐らく点検グループのメンバーとかが入力してる作品が中心なんだと思う
他のボランティアを優先しようぜ的な感じで

他の理由があるかもしれないけど

青空文庫の作業状況
https://yozora.main.jp/inp/index.html
※下の方に載ってる
0498無名草子さん垢版2022/10/20(木) 10:38:04.27
>>469、471
自分も欲しいし、実例出しに協力したい
前例探すために青空文庫の全文検索をよくやるんだけど
底本がどうなっているかわからないから確信が持てないんだよね
0499無名草子さん垢版2022/10/20(木) 22:15:49.81
いまいち使い方知らないから的外れなこと言ってるかもしれないけどGitHubにある青空文庫のデータ一式から注記の箇所だけ抜き取ったりできるんじゃないの?
0501無名草子さん垢版2022/10/21(金) 06:40:35.36
問題は、その注記が為されたとき底本がどうなってるかなんだよね。

底本画像の部分切り取り画像とセットになってはじめて役に立つ感じかな。
0502無名草子さん垢版2022/10/21(金) 06:41:26.80
>>498
うん、まさにそれ。
0503無名草子さん垢版2022/10/21(金) 12:28:51.85
今日公開された作品の注記はこんな感じだな(※別にここでシリーズ化するつもりではない)


江戸川乱歩『暗黒星』

>できなかったが。[#「できなかったが。」はママ]
(句点ではなく読点が正しいのだと思う)


尾崎士郎『早稲田大学』

>高田早苗《たかださなえ》[#ルビの「たかださなえ」はママ]
(正しくは「たかたさなえ」らしい)

>民間に[#「民間に」は底本では「民間の」]
>自刃した[#「自刃した」は底本では「白刃した」]
(底本の親本に合わせたものらしい)
0504無名草子さん垢版2022/10/21(金) 12:43:06.67
複製権や編集著作権で概ねカバーできるとはいえ出版物原版権(印刷物のレイアウトなどに関する著作権、いわゆる版面権)って法整備されてないんだよな
0505無名草子さん垢版2022/10/21(金) 12:47:54.96
そうなのか
うーん、そうなると攻略wiki立ち上げは、たとえ青空文庫本体とは別運営するとしても難しいかな?

青空文庫のスタンスは、グレーは黒とみなす厳密さだからなぁ
0506無名草子さん垢版2022/10/21(金) 15:40:11.38
底本画像そのものじゃなく底本を模して自分で作ったものだったり
NDLにある場合はそのリンクだったりでも駄目かなあ
0507無名草子さん垢版2022/10/21(金) 17:23:03.47
国立国会図書館デジタルコレクションに所蔵された作品は青空文庫化の需要はないの?
底本の写真画像だけだと文字列検索できないから少しは需要あると思ったんだけどなあ
0508無名草子さん垢版2022/10/21(金) 17:41:51.64
需要があるかは知らないけど、自分はデジコレで読める作品を中心に入力作業してるよ。
デジコレを底本にしてるのは古い本でも校正しやすそうだからだけど

現状デジコレは快適に読書できるUIではなく、
デジコレ本を高精度のocrでテキスト化した次世代デジタルライブラリーも、今のところ全文検索には役立っても読書のためのものではない
デジコレは無料で貴重な本を読めてたいへんありがたいサービスけど、実際あそこで読書するのは厳しい。デジコレでは読まなくても青空文庫化したら読む人はいるだろうね。

気軽に読むには青空文庫のようにもっとテキストを整形しないと難しい。だからどんどんやろう。
0509507垢版2022/10/21(金) 19:13:20.56
>>508
情報ありがとう
次世代デジタルライブラリーの存在、知らなかった
0510無名草子さん垢版2022/10/21(金) 19:27:21.88
>>506
むしろ底本を模すのが駄目だからこそ著作権者が明確な文章の部分のみを電子テキスト化して公開してるんだが……

(逆に著者の死没も著書の刊行も1967年12月31日以前で著作権保護期間満了のものはうわづら文庫が画像で公開してる)
0511無名草子さん垢版2022/10/22(土) 16:02:31.67
むしろデジコレ公開作品のテキスト化(単純なOCR化ではない)こそ積極的にやるべきだよな
0513無名草子さん垢版2022/10/22(土) 22:16:57.36
次世代デジタルライブラリーの文字起こしデータ、市販の読取革命よりはOCR精度が高いのかな、とは思うけど、
それでもやはり人間が読むためのデータじゃなくて計算機に検索されることに特化してる感じはする
0514無名草子さん垢版2022/10/22(土) 22:24:39.53
Google booksとかも割と滅茶苦茶だからな
そりゃ調べものがあるのに検索しても手掛かりがゼロだった時代よりは十分ありがたいけど参考にしていい水準かというと……
0515無名草子さん垢版2022/10/22(土) 22:36:19.22
google booksの本文検索は著作権保護期間内の作品も大量に扱ってるから意図的に文章をバラしてるはず
昨今のAIの進化見てると識字率も組版の再現もいい感じにしてくれる技術がそろそろ出てきていいんじゃないかと思っちゃう
入力校正まで完璧にやってくれる青空文庫ロボ来てくれ
0516無名草子さん垢版2022/10/23(日) 08:50:40.81
日本語文献じゃないんだが『元朝秘史』という中世モンゴル語を明代初期の漢字音で転写した歴史書があるんだけど、読取革命にかけたらかなりの精度で文字起こしできていたので驚いたわ
読取革命の開発者がOCRのテスト用データに『元朝秘史』を使ったのではと思えるほどだった
0517無名草子さん垢版2022/10/23(日) 08:59:22.87
出版物に牽引が添えられている作品は、積極的に青空文庫化してほしいよ
著作権者らが牽引の需要が高いと考えたからこそ牽引が出版物に含まれているわけで、
電子化されれば牽引を使うよりはるかに楽に検索できるようになるね
昔の人は、パソコンもないのに牽引を自力で作ったのはすごいと思う。ま、そんなこというと活版印刷した職人はもっとすごいけど。
0518無名草子さん垢版2022/10/23(日) 17:36:21.99
アプリで読むと便利すぎる。種類もいっぱいあるから自分好みのが見つかるし
0519無名草子さん垢版2022/10/23(日) 18:21:26.04
電子テキストの検索の弊害というほどでもないけど、昔の一般的表記と今の一般的表記が違うと検索しても引っ掛かるかどうか分からないという問題があるんだよね
0520無名草子さん垢版2022/10/23(日) 18:49:21.24
通読ではなく拾い読みする使い方が多い歴史文書は人名や地名がどこに登場してくるかすぐに検索できるってのがかなり恩恵が大きい
0521無名草子さん垢版2022/10/23(日) 18:50:27.26
そこは自分で検索を試行錯誤するしかないね。
0523無名草子さん垢版2022/10/23(日) 23:33:21.51
>>517
牽引ってなんだろう……ってわからなくったけど
もしかして索引(さくいん)のこと?
0524517垢版2022/10/24(月) 07:28:51.45
>>523
素で間違えてたわ、指摘ありがとう
がっつりと索引を牽引と思い込んでたし読みもケンインと思い込んでた
0525無名草子さん垢版2022/10/24(月) 07:34:23.45
例えだけど、徳川家康のルビのふり方を徳川と家康でわけると、ブラウザなどで文字列検索した時に徳川家康でヒットしないので困るね
多少ルビの原本再現性が悪くなっても徳川と家康をわけずに徳川家康でルビ振ったほうがよさそう
0526無名草子さん垢版2022/10/24(月) 07:58:52.56
>姓と名のルビは「夏目漱石《なつめそうせき》」のように、分割しない。

>名前と肩書、敬称なども、「千田実画伯《せんだみのるがはく》」、「内海紀伊様《うつみきいさま》」のように原則としてまとめる。

入力ファイルを「テキスト版」に仕上げるために
https://www.aozora.gr.jp/KOSAKU/textfile_checklist/index.html
0527無名草子さん垢版2022/10/24(月) 12:19:38.29
「徳川《とくがわ》家康」だと「徳川家康」で検索しても引っ掛からないから「徳川家康《とくがわ》」にしようという話では?
0528無名草子さん垢版2022/10/24(月) 12:29:40.98
>>527
イエス、イエヤス。
工作員には、検索する人の需要を意識してルビを振るセンスが求められると思ふ
0529無名草子さん垢版2022/10/24(月) 12:45:24.84
そもそも青空文庫は著作権の切れた作品を電子書籍として金銭や会員登録などの制約なく自由に読めるようにするのが主目的であって
検索機能を使って過去の言葉の用法の変遷を調べるとか、朗読や漫画などの原作にするとか、作品の舞台となる地域や主役となる人物の宣伝の1つにするとか、読書以外のそれ以外の利用は想定内ではあるけどあくまで副次的なんだよな
副次的な利用のために本来の目的に支障が出たら本末転倒
青空文庫のルビや注記の表記法が視覚障碍者読書支援協会の表記法を踏襲したことも踏まえて考えてみると良い
0530無名草子さん垢版2022/10/24(月) 12:59:56.17
古い辞書データ使って形態素解析すると井伊直虎の読みがイイチョクトラになってしまうのよ
0533無名草子さん垢版2022/10/24(月) 23:28:49.77
ブラウザ版って試読版の延長みたいなもんだしルビや注記を無視したデータベースにしたいなら青空文庫のデータを元に自分で作らなきゃ
0534無名草子さん垢版2022/10/25(火) 08:17:41.16
堅苦しい挨拶も何なので平易な文にて失礼しますね
青空文庫の発展に尽力されているみなさんお疲れ様です
益々のご活躍を
0535無名草子さん垢版2022/10/25(火) 19:59:11.10
ルビ問題なら青空文庫対応のアプリを色々使ってみるのもあり
中には文章から文字を範囲選択してそのまま検索できるものもあったりする
0536無名草子さん垢版2022/10/25(火) 20:57:58.82
山本有三(1887-1974)よろしく「近頃私はルビを見ると、黒い虫の行列のやうな気がしてたまりません。」的なノリで
青空文庫のデータからルビや注記を取っ払ったミラー風サイトを作れば良いんじゃなかろうか
0537無名草子さん垢版2022/10/25(火) 21:11:17.75
そもそも徳川家康について調べたい人が「徳川家康」のワードだけで調べて見つからないからと諦めるかっていうとそうはならない気がするのよね

「徳川 家康」「徳川」「とくがわ」「とくかは」などなど表記の違いの可能性をあれこれあたるだろう

検索利用を想定して体裁を整えてあげたものを作るまでする必要あるのかなあ?って思った
0539無名草子さん垢版2022/10/25(火) 21:58:05.94
1つの単語のルビを集めてデータベースにしてるふりがな文庫みたいに
表記が違うけど同じ固有名詞を指してる単語のデータベースみたいなのは面白そうだな

ただこれはそれなりに知識のある人が全て目を通さないと作れないか……
0540無名草子さん垢版2022/10/26(水) 22:15:07.35
これしか知らないから具体名出すけど「Wiki版『早稲田大学百年史』」みたいなのが理想的なのかもな
図表以外が全部テキスト化されており図表も画像で公開されているという青空文庫と同様のテキスト公開に加えて
原本の画像も公開されている(写真は著作権の都合で非公開)

あと上で出ていた要望に答えるという意味で(正直これは青空文庫にはそぐわないかもしれないが)
本文中の大学関係者の名前(本名・筆名不問)が大学の人名データベースとリンクしている機能もある
【参考】
早稲田大学百年史
https://chronicle100.waseda.jp/index.php
0541無名草子さん垢版2022/10/26(水) 22:31:16.11
理想的とはどの意味において?

普通のhtmlサイトと何ら変わりないと思うが……
むしろ青空文庫みたいに表示を変えたりできないから読みづらいくらいに感じるのだが
0542無名草子さん垢版2022/10/26(水) 22:40:14.32
話の流れとしては、電子テキストと底本画像の両方が公開されてる点と、表記の異なる固有名詞を一元管理してる点じゃない?
ここ最近ずっと読書的な視点の話とデータベース的な視点の話が混同してる気がする
0544無名草子さん垢版2022/10/27(木) 02:31:39.17
いいトコどりは難し
二兎を追う者は一兎をも得ず、とかいうやらん
0545無名草子さん垢版2022/10/27(木) 02:39:04.05
まあでもどっちもあれば助かるから両方やればいいんだよほんとは
リソースさえあればね……
0547無名草子さん垢版2022/10/27(木) 21:51:31.12
いつも気になっているけれど
わざわざ手を取ってまで訊くことでもない気がして訊けないでいるのは点検グループさんたちは底本画像をどう保管してるのだろうかということ
0548無名草子さん垢版2022/10/27(木) 21:53:14.23
データベースよりテキストより、サーバのほとんどが画像保存に使われてしまいそうだが
どう捻出してるのかなと
0550無名草子さん垢版2022/10/27(木) 22:30:14.34
画像データのサイズなんて大したことないと思うけど
0551無名草子さん垢版2022/10/27(木) 23:06:57.75
Twitterで大長編を共同作業しよう的な動きが出てるな
0552無名草子さん垢版2022/10/27(木) 23:39:13.24
テキストデータなら数十キロバイトで済むものでも画像データならPDFにせよPNGにせよ数メガバイト~数十メガバイトになるけど……

最低でもルビの濁点半濁点(つまり「ば」か「ぱ」か)が判別できる程度の解像度でな
0553無名草子さん垢版2022/10/28(金) 00:09:58.94
じゃけんみんなはよ校了させましょうね~
校了したら底本画像は削除してるのかな
0554無名草子さん垢版2022/10/28(金) 07:53:38.87
>>553
削除してないと思う
誤植指摘の問い合わせに備えて
だから心配なんだよ
0555無名草子さん垢版2022/10/28(金) 12:11:37.18
青空文庫FAQの誤植の指摘に関する回答では

>「やはり入力時のミスである」と確認できたものだけを、底本の該当箇所のキャプチャ画像とともにご報告いただけると、助かります。

とあるから公開した後は消してるんじゃないかな

流石に全部をクラウドストレージで残してたら無料分では賄えなさそうだしコストがヤバそう
残してたとしてもデジタルコレクションになくて点検スタッフの家の近くの公立図書館にもない本とかだけじゃないかな
0556無名草子さん垢版2022/10/28(金) 13:11:41.61
>>552
一冊につき画像データが50MBあったとして1TBで2万冊
実際には短編も多いから平均は50MBよりはるかに少ないだろうし
その程度ならなんとかなるんじゃね
ローカルで保存して必要な時だけクラウドにあげてもいいだろうし
0557無名草子さん垢版2022/10/28(金) 13:15:17.42
>>555
まあそのへんが妥当だと思う
特に初期は入力も校正も紙の本からというケースがほとんどだったんじゃないかな
0559無名草子さん垢版2022/10/28(金) 20:18:39.87
青空文庫の「最新」の外字フォント一覧を見たいんだけどどうすればいい
txt2xhtml(t2hs.rb)に付属された2012年当時から更新ありそうなもんだけど
0561無名草子さん垢版2022/10/29(土) 12:05:29.89
なるほど、試しにやってみたけど、間違ってたらごめん

ttp://pansy.s1010.xrea.com/2022/10/29/%e5%a4%96%e5%ad%97%e9%9b%86%e8%a8%88/
0562無名草子さん垢版2022/10/29(土) 17:33:39.66
>>561
さっそくallkanji.txtを拝見させてもらいました。
どうも青空文庫はいまもtxt2xhtmlに付属の外字ファイル群しか使ってないようですね。
唯一見つけたかと思った「鹵,U+9E75,1-83-35,1,1」は外字を使わなくても表示できる文字でした。
0563無名草子さん垢版2022/10/29(土) 19:13:02.34
鹵獲の鹵(しお)は普通にJIS2だけど、それとは違う?

>>561
なるほど元がtsvになってるわけか。さらっとRuby書けるの凄いな
0564無名草子さん垢版2022/10/30(日) 00:24:26.77
青空文庫見れるAppStoreアプリ10種ほどインストールしてみた
こういうのでパッと気軽に見れたり、連携辞書で熟語を調べられたりするのは隔世の感を感じる
・ソラリ (無料、課金で広告消。有料版も有)
・Yom!青空文庫 (有料プラン月額100円)
・読書尚友 (無料。課金で広告消)
・i読書   (無料。課金で広告消)
・青空本棚1・2 (2は広告枠だけ有)
・neo文庫  (有料。豊平文庫の後継版)
・bReader  (有料)
・名作小説  (無料だが広告有)
・巣ごもり青空文庫 (無料だが広告有)
・巻丸    (無料。基本は小説サイトビューアだが青空文庫対応)
性能に興味があるなら感想レスする
0565無名草子さん垢版2022/10/30(日) 00:43:39.88
アプリに関しては、工作員的に関心があるのは「自作のファイルが読めるか否か」ぐらいかな
読めるなら自分の作業で使えるけど、できなかったら用は無い
で、表示できるアプリは基本的に少ない……
0566無名草子さん垢版2022/10/30(日) 12:39:34.59
校正の際には読書尚友に読み込ませてるわ
[#縦中横]とか一部の注記が機能してないけどそこまで不便ではない

ちなみに、底本を再現して脱字や衍字を確認するのに、今は表示設定で1行あたりの文字数を調整してるのだけど、
フォントサイズや余白の広さによる間接的な設定じゃなくて、1行の文字数を直接設定できるアプリとかあったりする?

まぁ仮にこの設定機能を実装したアプリがあったとしても、
本によっては句読点や括弧が半角状態だったり、行頭に句読点が来ないように調整されてたりするから、
完璧に再現しようとするならテキストデータを改行して読み込むのが確実にはなるんだけど、流石に二度手間で面倒臭い
0567無名草子さん垢版2022/10/30(日) 12:58:27.50
moon+ reader pro だと加工したテキストファイルも読み込めるし
読み上げさせることもできて便利なのでこれを推したい。
OCRソフトで読み込んで漢数字の〇と記号の○とが間違ってる場合でも
読み上げさせるとすぐに気がつけて音読お勧め。
0568無名草子さん垢版2022/10/30(日) 13:02:21.32
行文字設定可能なアプリ↓
i読書 14文字〜38文字 (課金でも160円、課金なしでも気になる広告は出ない)
青空本棚2 9文字〜42文字(青空本棚ではなくて2の方です)
ソラリ 8文字〜62文字(ただしフリー版は不定期に動画広告出るので、校正不向きかも)

こんなところ
0570無名草子さん垢版2022/10/30(日) 13:31:01.71
Android専用も試したいけどWin10ユーザーなんでまだ無理す
青空文庫Ad、青空読書、読書家あたりは興味ある
0571566垢版2022/10/30(日) 15:41:37.24
>>568
Android勢だけど「読書尚友があるなら他のもあるのかな~」くらいで聞いたらどれも無かった……
折角教えてくれたのにごめん……
0572無名草子さん垢版2022/10/30(日) 17:56:53.11
androidならファイル管理しやすいMHE novel viewerを長年愛用してるけど一般的には読書尚友が使いやすいと思う
0573無名草子さん垢版2022/10/30(日) 23:36:54.36
iPhone/iPad限定だけど「縦式」ってエディタアプリが青空文庫形式に対応してて
1行当たりの文字数も指定できるから、校正で使ってる
05742022年11月公開予定作品一覧垢版2022/10/31(月) 13:29:06.02
2022-11-01 萩原 朔太郎『室生犀星君の飛躍』※誕生日
2022-11-01 室生 犀星『純情小曲集 01 珍らしいものをかくしてゐる人への序文』※『純情小曲集』作者(萩原朔太郎)誕生日
2022-11-02 ホワイト フレッド・M『ドレントン・デン特派員の冒険 05 第五回 巨大純白蛾』
2022-11-03 山本 周五郎『霜柱』
2022-11-04 泉 鏡花『三人の盲の話』※誕生日
2022-11-04 大石 誠之助『太平洋食堂』※誕生日(旧暦)、作品初公開
2022-11-04 楠山 正雄『しっぺい太郎』※誕生日
2022-11-05 片山 敏彦『或る時の詩』『泉』※誕生日
2022-11-06 山本 周五郎『饒舌りすぎる』
2022-11-07 作者不詳『現代語訳 平家物語 11 第十一巻』
2022-11-08 山本 周五郎『十八条乙』
2022-11-09 岡本 かの子『食魔に贈る』※登場人物(エドワール・ニニョン)誕生日
2022-11-10 畑中 武夫『太陽を呑む赤い老星の秘密』※命日、作品初公開
2022-11-11 佐佐木 茂索『散歩』※誕生日
2022-11-12 山本 周五郎『醜聞』
2022-11-13 中谷 宇吉郎『日食記』
2022-11-14 山本 周五郎『滝口』
2022-11-15 大下 宇陀児『偽悪病患者』※誕生日
2022-11-15 原 民喜『もぐらとコスモス』※誕生日
05752022年11月公開予定作品一覧垢版2022/10/31(月) 13:29:27.27
2022-11-16 大町 桂月『酒に死せる押川春浪』※押川春浪命日
2022-11-17 中野 鈴子『許南麒の詩のように』※許南麒命日
2022-11-18 徳田 秋声『背負揚』『復讐』※命日(秋声忌)
2022-11-19 吉井 勇『ゴンドラの唄』※命日
2022-11-20 大田 洋子『「屍の街」序』※誕生日、作品初公開
2022-11-21 山本 周五郎『超過勤務』
2022-11-22 ラヴクラフト ハワード・フィリップス『錬金術師』
2022-11-23 菊池 寛『神の如く弱し』※モデル(久米正雄)誕生日
2022-11-23 佐藤 春夫『若き日の久米正雄』※久米正雄誕生日
2022-11-24 山本 周五郎『燕(つばくろ)』
2022-11-25 柳田 国男『私生児を意味する方言』
2022-11-26 楠山 正雄『鉢かつぎ』※命日
2022-11-27 山本 周五郎『ばちあたり』
2022-11-28 寺田 寅彦『猫六題』※誕生日
2022-11-28 中谷 宇吉郎『実験室の思い出』
2022-11-29 大石 誠之助『文明の強売 (断じて不正なり)』※誕生日
2022-11-30 嘉村 礒多『故郷に帰りゆくこころ』※命日
0576無名草子さん垢版2022/10/31(月) 14:17:10.35
大下宇陀児とラヴクラフトがあるな
たのしみ
あと朔太郎って言うとおぎやはぎ矢作の子供が一番に浮かぶようになってしまった俺
0577無名草子さん垢版2022/10/31(月) 14:43:50.30
ちょうど最近読んだ「名前の話」(萩原朔太郎)からの引用

中には「朔太郎」といふのが本名か雅号かなどと問ふ人もあるが、紛れもなく、親のつけてくれた本名である。僕は十一月一日に生れた。長男で朔日ついたち生れの太郎であるから、簡単に朔太郎と命名されたので、まことに単純明白、二二ヶ四的に合理的で平凡の名前である。
0579無名草子さん垢版2022/11/01(火) 13:34:40.63
>>578
記事内に

>普通に「走れメロス」を読みたい方は、青空文庫で全文読めますので、そちらをどうぞ。

とあるから多分ギリギリセーフ
0580無名草子さん垢版2022/11/01(火) 20:30:09.57
>>540
少し前の話を掘り起こして悪いが
渋沢栄一記念財団も「デジタル版『渋沢栄一伝記資料』」で電子テキストと画像の両方を公開してる
もっとも渋沢栄一や他の保護期間満了となった著作権者以外に著作権が及ぶ箇所については一部非公開となっているが……

TOP|デジタル版『渋沢栄一伝記資料』|渋沢栄一|公益財団法人渋沢栄一記念財団
https://eiichi.shibusawa.or.jp/denkishiryo/digital/main/index.php

ついでにいうと国立国会図書館の著作者情報公開調査みたいなこともしてる

著作権者に関する情報を捜しています|デジタル版『渋沢栄一伝記資料』|渋沢栄一|公益財団法人渋沢栄一記念財団
https://eiichi.shibusawa.or.jp/denkishiryo/digital/main/authors_request.html
0583無名草子さん垢版2022/11/02(水) 20:52:02.12
OCR校正の話は何度も出てるけど
みんなはそれを「校正一回」に数えてる?

(うまく言えないけど)

比較用OCRテキストを作るにももちろん手間と時間がかかるけど
それにしたって目視で全文チェックする校正と比べると
あまりにあっけなくて

入力者のテキストが完璧であればあるほど
OCRを以て一回に数えるのが不安になっちゃうというパラドックスがあるんだ

そんなわけで結局は目視で最低限三回
それに加えてOCR
って感じだ、自分は
0585無名草子さん垢版2022/11/02(水) 21:06:40.19
二段組底本の例だと思って読んでくれ

自分の手順だが

見開きスキャン画像に黒い余白がある場合、フリーソフトで一括トリミングして純粋なページ部分だけの画像にする→
自分の使ってるOCRが段組を認識しないので、段ごとの画像にするため、画像を一括で四分割するフリーソフトにかける→
出力連番が望む順番と違うのでこれもフリーソフトで一括リネーム→
OCR→
コピーペーストして一つのテキストに→
比較作業

自分は全てフリーソフトで賄っているのでこんな感じ
段組を認識できるOCRを使えばもっと早いだろうね

二段組見開き18ページ程度の作品で全工程が40分満たないくらいだ
早すぎて不安なんだ
0587無名草子さん垢版2022/11/03(木) 00:20:34.90
>>583,585
ルビはどうしてるの?
0589無名草子さん垢版2022/11/03(木) 11:37:23.36
人の目を通さない作業は事前準備で校正とは見做さないキリッ
0590無名草子さん垢版2022/11/03(木) 12:24:24.74
>>587

比較ツールにかけるとき
OCRではつかないルビや注記は
どうしてるの?という話かな?

あくまでも自分の感覚ではだけど、
OCR校正では主に、入力者の変換ミスや助詞や助動詞の間違いを検出するのに秀でてる手法と思う

だからルビ、傍点、入力者注記はやはり底本画像を見て追うことになるね

それでもOCRが生んだテキストをツールに通すと、その追うべき部分がマークアップされて(もしくはマークアップされるはずなのにされなくて)明示的になるので分かりやすい
0591無名草子さん垢版2022/11/03(木) 12:27:46.02
>>589
うん、
全く人の目を通さないわけではないのだけど
あくまでも補助的なものと思った方がいいのかなあって気がして
みんなどうしてるか訊いてみた。
0592無名草子さん垢版2022/11/03(木) 12:30:00.91
>>590

自己レス

> それでもOCRが生んだテキストをツールに通すと、その追うべき部分がマークアップされて

OCRが生んだテキスト「と入力者テキストと」をツールに通すと



スマヌ
0593無名草子さん垢版2022/11/03(木) 16:02:34.70
OCRを比較に使う人よりもOCRを文字起こしの始点として利用する人がむしろ多いんじゃないの?
0594無名草子さん垢版2022/11/03(木) 18:15:36.20
いろいろなやり方試してて、もっと効率的な方法ないかなーって質問してるだけじゃないのかな?
俺のやり方はこうだ、お前らのは違うって言いに来たのではないと思うが
0595583垢版2022/11/03(木) 18:34:57.15
あー
もしなにか、書き方の感じ悪かったのならごめんね

昔だけど公式ブログ「そらもよう」でも
OCR校正の圧倒的な時間効率の良さについて記事になっていたこともあったから
参考にして校正に取り入れてる人たちいるだろうと思ってたけど
やっぱりOCRといえば入力補助であって、校正での利用はまだまだそうでもないのかな?


>>594
うん、ありがとう、そういう意味です
0596無名草子さん垢版2022/11/03(木) 19:25:17.44
OCR校正補助に使ってるけど、マニアックな異体字は拾ってくれない
あと促音を大書きにしているような底本誤植が勝手に小書きに修正されちゃう場合とかもある
(底本の誤植を見落とす可能性がある)
目視が重要であることに変わりはない と思う
0597無名草子さん垢版2022/11/03(木) 19:27:55.08
最近30年ほどのワープロソフトで書かれた印刷物ならOCRの信頼性は高いだろうけど、
青空文庫は活版印刷全盛の印刷物が対象だからOCRの信頼性低いので校正に使うという発想は到底出てこないと思うんだが
0598無名草子さん垢版2022/11/03(木) 19:31:05.29
新字新仮名に改めて改版されたものが底本のパターンも少なくないけどね
0599583垢版2022/11/03(木) 19:34:45.01
>>597
そうでもないよ
これ見てみて

>校正を担う人が少ないために、青空文庫は公開に至れない入力済みファイルをたくさん抱えています。
こうした現状に風穴をあけたいと、点検グループの門田裕志さんは、OCRを校正に利用する実験を重ね、精度の向上と作業時間の短縮を同時に達成できるとの感触をつかまれたと言います。

「校正をやりやすくするために」
https://www.aozora.gr.jp/aozorablog/?p=565

2012年の記事だよ
0600無名草子さん垢版2022/11/03(木) 19:45:13.86
>>599
10年前から進捗がないってことは、うまくいかなかったってことだよ
OCRを校正じゃなくて入力原点として使うのが最適解ってこと
何もないところから手入力で文字起こしするんじゃなくて、OCRの出力テキストに手を加えていく方式ね
0602無名草子さん垢版2022/11/03(木) 20:30:08.04
OCRで出した文章と入力ファイルを比較して違いがあったら底本を確認するってこと?

そもそも入力者がOCR使ってたら入力者が一回通った道をまた歩いてるだけでしょ?
自分の使ってるOCRが特別高性能とか入力者が手入力したと分かってる状態じゃなきゃ二度手間過ぎない?
0603無名草子さん垢版2022/11/03(木) 20:35:29.57
筆算の結果とエクセル計算の結果を照合します的な二度手間感を楽しみたい人もいるんだと思う
数独みたいな
0604無名草子さん垢版2022/11/03(木) 20:39:07.61
ちなみにOCR校正の話が出てたのはおーぷんのほうだ。
0605無名草子さん垢版2022/11/03(木) 20:50:13.15
おーぷんの1棚目で出ている。

入力テキストを作るほどのことまではせず
ただOCR通して比較にかけるだけで軽く下チェックができるわけね。

徹底突き合わせの前にひとつでもあらかじめ潰しておくくらいの気楽さでやるぶんにはいいと思う。
入力テキスト作るほどの手間ではないし。

「一回には数えない」ほうがいいね。
0606無名草子さん垢版2022/11/03(木) 20:53:39.74
心血を注いでゼロから手入力文字起こししたこと無駄だったと受け入れたくない人にとっては、OCR校訂は意味があると思う
それ以外の人にとってはただの二度手間な宗教儀式
0607無名草子さん垢版2022/11/03(木) 20:55:31.19
本人の手入力の正確性、速度もあるだろうね、そこは個人差あるかも
0608無名草子さん垢版2022/11/03(木) 21:00:17.83
なんだろう、大根の皮を包丁でむいた後、ピーラーでむいた大根と、皮の厚さを比較する自己満足の世界
0611無名草子さん垢版2022/11/03(木) 21:29:18.07
>>608
喩えはよくわからないが、つまりやらなくていい自己満足だという意味だよね。

最終的には目視が絶対重要というところさえ揺るがなければ、
やってる人がメリット(誤字脱字検出)を得ている以上、
やらない人が全否定することでもないと思うよ。

みんなでやりやすいように、やろう!
0612無名草子さん垢版2022/11/03(木) 21:47:26.84
皮をむいただけでは織田氏の浸みた美味しい大根になる道のりはまだまだ遠い田楽狭間よ
0613583垢版2022/11/03(木) 21:52:42.81
さいごに
みなさんどうもご意見ありがとう
いろんな意見聞けて良かった!

だけどもし私の書き込みきっかけで
傷ついたり不愉快になったりした人がいたらごめんなさい

入力も校正もがんばります。
0615無名草子さん垢版2022/11/03(木) 22:02:41.01
今更だけど、上の流れ、
前提の誤解で話が食い違ってるんじゃない?

質問者は「入力者からもらったテキストを校正者として校正する」作業のことを言ってるが

回答者の何人か(?)は
「自分が入力者として入力したテキストを、入力者校正する」作業のことと考えてない?

そう考えると
「心血注いで~」の意味や大根の例えが解る
0617無名草子さん垢版2022/11/03(木) 22:39:23.24
第三者から見てると不快に思えるレスする人が何人かいる
0618無名草子さん垢版2022/11/03(木) 22:50:13.63
ごめん不快にさせたのなら
>>609は自分
悪気はなかったんだが
そぐわなく感じてぶっきらぼうになってしまった申し訳ない

でも感じた理由が前提の食い違いだと解ったいまは、喩えの意味もわかるが
なんにしてもすまなかった
0619無名草子さん垢版2022/11/04(金) 01:06:45.73
手入力したファイルとOCRのファイルなら、手入力したファイルのほうがはるかに信頼できる。
OCRをべた褒めするのは初心者のダニングクルーガー効果だから、適当にからかっとけばいい。
0620無名草子さん垢版2022/11/04(金) 03:34:34.57
長編の入力だとocrがあるといざ作業に取り掛かる心理的ハードルが低くなる
0621無名草子さん垢版2022/11/04(金) 08:33:01.27
>>620
なんとなくわかる

OCRの出力テキストがお粗末だと、人間さまの出番なので俄然やる気が出る効果があるし、
OCRの出力テキストが立派だと、苦しい作業から解放されてやる気が出る効果がある
0623無名草子さん垢版2022/11/04(金) 18:49:17.14
OCR出力テキストを起点にすると、クロスワードパズルとか倉庫番とかテトリスやってるようなゲーム感を楽しめるよ
0624無名草子さん垢版2022/11/04(金) 19:05:26.69
OCRの吐き出したひどいテキストを綺麗にせずにいられない心理効果があるので、パズル好きとか掃除好きな人はOCRと相性良いと思う
0626無名草子さん垢版2022/11/04(金) 20:16:35.98
ペンシルパズル好き自分、校正好きな理由をここにて知る
0630無名草子さん垢版2022/11/06(日) 14:40:27.09
ここ一二週間体調がすぐれなくて
PCの前にあまり座れないでいる

そのために校正が滞ってしまい
なんとかならないのか……
と悩んでる自分にビックリした

本来紙と紙と突き合わせるのが校正の原点なんだから
修正はともかく
チェック作業にはPC要らんやん

スキャン画像を必要に応じて拡大したりしながら作業するのが当然になってて
PCないとできないと思い込んでる自分に草
0632無名草子さん垢版2022/11/06(日) 14:55:36.73
それ以前に思考が活字に依存してるから安心しなよ
手書き文書の崩し文字の読みづらさに耐えて文字起こした先人に感謝しないと
0634無名草子さん垢版2022/11/06(日) 19:43:03.43
とは言っても、当時の手書き文字は当時の人からすれば書き手の癖はあっても概ね第三者も読める程度に一般認知されてた(草書体のように法則に従って崩されてた)文字だったわけで、
さらに和文タイプライターは大正時代からあったと言っても日本語ワープロが普及する昭和50年代までは日常生活では基本的に手書きだっただろうし、
まだ忍耐というレベルの労力が割かれる程に時代の断絶はなかったんじゃないかな
0635無名草子さん垢版2022/11/06(日) 20:26:32.11
文豪の手書き生原稿みるとなかなかにエグいもんな

あれを活字に起こしていくのが当たり前のようにできてた先人
俺たちが退化しているのか
0636無名草子さん垢版2022/11/06(日) 20:46:31.98
それ以上、原稿の手書きセリフ「ひでえ」を誤読して「ひでぶ」と文字起こしして新ワードが生まれたマンガ『北斗の拳』をディスらないで
0637無名草子さん垢版2022/11/06(日) 20:47:24.59
戦前は義務教育だって旧字旧仮名がデフォルトだったしな
0638無名草子さん垢版2022/11/06(日) 20:49:52.24
まぁ校訂という作業が存在する程度には手書き文字の読み間違いや書き間違いも存在するけどね
0639無名草子さん垢版2022/11/06(日) 21:12:14.72
文豪の手書き原稿とかみてもクセが強くって何書いてか分かんなくって
かつての編集者とか作家を缶詰めにしてとにかく書かせてその後
解読作業してなんとか雑誌掲載に間に合わせてたのかって思うと
ものすごく大変そう
ひと癖ある坂口安吾の担当にされた半藤一利の苦労とか
想像すると忍びない
0640無名草子さん垢版2022/11/06(日) 23:35:05.21
遺稿集とかだと稀に直筆原稿の写真が載ってたりするけど7~8割しか読めない
残りの半分は推測の域を出ないもの、もう半分はマジで何か分からないもの

あとお偉いさんに序文を書いてもらって恐らくお偉いさん故にそのまま直筆で載せられてることもあるけど楷書以外は本当に分からん
0641無名草子さん垢版2022/11/06(日) 23:38:37.52
スレチだけど江戸時代のテキストを翻刻してるみん翻の人たちのことは同じ電子テキスト化ボランティアとして応援してるな
0644無名草子さん垢版2022/11/08(火) 21:27:12.89
>>636
くお~!!ぶつかる~!!ここでアクセル全開、インド人を右に!
0648無名草子さん垢版2022/11/10(木) 14:45:11.43
漫☆画太郎に普通を期待したアタシがバカでした
0650無名草子さん垢版2022/11/11(金) 11:01:12.01
こんな投げ捨て漫画をいつまでもネタにする程度の低さに嘆く
0651無名草子さん垢版2022/11/11(金) 12:13:25.74
早押しクイズで「オイジゴ」と読まれたら「蟹工船」と答える
0652無名草子さん垢版2022/11/11(金) 19:55:57.12
じゃあ青空文庫冒頭4文字超イントロ
ここならわかる人いそう


「ではみな

石炭をば

ある日の

えたいの

私は、その

吾輩は

隴西の李

「こいさん
0653無名草子さん垢版2022/11/11(金) 21:55:43.21
>>652
銀河鉄道の夜

舞姫

蜘蛛の糸

檸檬

人間失格

吾輩は猫である

山月記

細雪

で、あってるかな?
(人間失格と細雪は最初わからなかった)
0655無名草子さん垢版2022/11/11(金) 23:48:50.92
「ある日の」
曲れる者(アーサー・コナン・ドイル)
羅生門(芥川龍之介)
蜘蛛の糸(芥川龍之介)
芸術統制是非(辰野隆)

「私は、その」
人間失格(太宰治)
婦人の過去と将来の予期(小川未明)
0656無名草子さん垢版2022/11/12(土) 08:50:21.08
>>653
正解です、やっぱりすごいな。

似た文の指摘もありがとう。そう言えば蜘蛛の糸もある日始まりで結構有名な書き出しですよね。
0657無名草子さん垢版2022/11/12(土) 13:55:48.50
クイズネタはクイズスレ立ててやってくれ
こういうのされるの困る
0658無名草子さん垢版2022/11/12(土) 15:35:22.53
ごめん、ちょっとした出来心で。
もうやらないよ。
0659無名草子さん垢版2022/11/12(土) 16:11:48.05
一回クイズやって答えただけで
別スレたててそこでやれ とは
657こそどこぞいけばいいのでは?
0662無名草子さん垢版2022/11/13(日) 23:45:57.78
どこぞの音ゲーで夢野久作の『ドグラ・マグラ』をイメージした新曲が公表されたらしくTwitterのトレンドにドグラ・マグラが載ってた
0663無名草子さん垢版2022/11/15(火) 19:22:57.78
周りに「中高のときに電子辞書に入ってる青空文庫の本を読んでた」みたいな人が結構いて、やっぱ意義ある取り組みなんだなとしみじみした
0664無名草子さん垢版2022/11/15(火) 19:54:51.90
授業中電子辞書でドグラ・マグラ読んで俺カッケーしてたわwダセェ
0665無名草子さん垢版2022/11/15(火) 20:00:29.65
「趣味は青空文庫の入力ボランティアです」みたいなこと言うと割と好反応が返ってくる
たまに「卒論書く時に活用しました」みたいなのも文理問わずある
0666無名草子さん垢版2022/11/15(火) 20:12:45.15
意義はあるのかもしれないけど、出版社は文庫本で稼ぐ機会を失っている。
古典名著で出版社が稼いだお金が新人を支えるのに役立ってたのかもしれないと思うと、複雑じゃね?
0667無名草子さん垢版2022/11/15(火) 20:18:08.62
青空文庫入りするみたいな古典文学って出版社にとってお荷物だったんじゃない?
0668無名草子さん垢版2022/11/15(火) 20:30:59.51
青空文庫で無料で読める作品でも有名漫画家が表紙を描いたり文豪なんちゃらとコラボすればコレクターズアイテムとして売れるからね
0669無名草子さん垢版2022/11/15(火) 20:44:25.44
むしろ営利企業なんだからこそ現在や将来の作家の育成をメインにしろよと思う
そもそも古典作品の出版だって校訂、現代語訳、解題、編集、翻案(漫画化)、裁定制度の利用とかで青空文庫との差別化は十分可能だからな
0670無名草子さん垢版2022/11/15(火) 20:45:47.95
コレクターズアイテムって価値は数百円程度でも所有していることに意味があるからな
0671無名草子さん垢版2022/11/15(火) 20:48:39.35
テレビに出て名を馳せた芸能人がYouTuber始めたら「ファンは嬉しいかもしれないけど、テレビ局は彼(女)を番組に出演させて稼ぐ機会を失っている」ってなる?
0672無名草子さん垢版2022/11/15(火) 20:53:15.35
小中学生が学校から水洗されて読む古典文学なら収入は手堅いだろう。ポケモンみたいな位置づけ?
0673無名草子さん垢版2022/11/15(火) 20:57:29.08
「私たち、日本の漫画を愛しているんです」といいながら著作権者に無断で中国語訳をつけた海賊版をネット公開する中国伝統の焼畑文化と差別化してかないと
0674無名草子さん垢版2022/11/15(火) 21:15:30.56
そもそも文庫化や復刊すらされてない作品も沢山あるよね
しばらくして、どっかの文庫から文学アンソロジーが出て読んでみたら、出典に青空文庫と書いてあるという……
0675無名草子さん垢版2022/11/15(火) 21:17:14.41
なんにせよ著作権は切れているのだから「出版社が稼ぐはずのお金」というのも変な話
出版社が出すならせっかくなら解説や挿絵で付加価値をつけてほしいよね
0676無名草子さん垢版2022/11/15(火) 21:22:56.52
>>675
恩恵を得ていたのは出版社だけじゃないよ、卸売業者や書店もだよ
それを既得権とみなして破壊するか、紙の本の文化として守るかは、個々人の価値観次第
0677無名草子さん垢版2022/11/15(火) 21:34:40.12
印刷や輸送や在庫管理や店頭陳列まで視野に入れるなら古典作品の商業流通は現役の文筆家が割を喰うことになるよな
0678無名草子さん垢版2022/11/15(火) 21:40:15.47
打倒アンパンマンみたいな?
0679無名草子さん垢版2022/11/15(火) 22:15:59.90
>>675
正しくは著作者の収益じゃないかな
出版社は代理販売業だよね
現実は力関係から権力入れ替わってるにせよ
0680無名草子さん垢版2022/11/15(火) 22:18:01.79
20年前ライトノベルが1200円!!?
はっゴミのような読み捨て小説で1000円超え!!!?
と驚いてたけど
今は普通の文庫本ですら800円台で更にファッ!!?
となってる
漫画とかも全部凄く値上がりしてるし

きがつきゃう物価全部値上がりで
6畳用エアコンが12万円とか信じられないよ
0681無名草子さん垢版2022/11/15(火) 22:31:52.03
定価1円と印字された戦前の本が古本屋で数万円
0682無名草子さん垢版2022/11/15(火) 23:42:57.59
紙の本は字が小さくていけねえ
歳は取りたくないのう
0683無名草子さん垢版2022/11/16(水) 09:05:57.54
>>675
紙の本の場合著作者に支払われるのは価格の一割に過ぎない
残りの九割は出版社、印刷、製本、運輸、卸、小売などの利益に
0684無名草子さん垢版2022/11/16(水) 17:46:54.88
来年1月から電子書籍の国会図書館納本が始まるから、青空文庫で手入力しなくちゃならない本の数は将来的には減りそうだな。まだ電子書籍化してない本も沢山あるけど。
0685無名草子さん垢版2022/11/16(水) 17:54:38.22
そうなんだよな。
ほぼ同時に電子書籍になるのがデフォになっていくと
デジタル化という概念自体がこれからは希薄になっていく。

そんな時代の流れの中で青空文庫の将来を思うと少し寂しいときもあるが、
それでも一時代の役割を果たしていることには変わりないと思いたい。
0686無名草子さん垢版2022/11/16(水) 18:14:41.54
まあでもこのペースだとあと百年かかっても昭和時代の書籍の青空文庫入り作業も終わらないだろうけどね
ああでもそのうちAIイラストみたいにocrのブレイクスルーが起きて人の手作業なしで組版再現までできるようになるのかな。
0688無名草子さん垢版2022/11/16(水) 20:37:48.49
青空文庫は「自由に使えるように一番単純な(互換性の高い)テキストファイル形式で電子化する」という役割もあるのでそこが全部機械任せに出来るかどうかで変わってくる気がするな

半世紀以上先の話だけど国立国会図書館って電子書籍の著作権が切れたらどう公開するんだろうか
0689無名草子さん垢版2022/11/16(水) 20:55:25.09
青空文庫読書アプリとFirefox、頼むからルビ検索できるようにしてクレメンス
0692無名草子さん垢版2022/11/16(水) 21:02:30.26
少し脱線してWebブラウザの話するとSafari、Chrome、Edgeはルビ検索できるんだがFirefoxはいまだにルビ検索できない
文学作品などはくせのあるルビがその作品の作風の重要な要素だったりするから
例をあげると「強敵」と書いて「とも」とルビふる『北斗の拳』みたいな高い文学性
0694無名草子さん垢版2022/11/17(木) 00:27:55.19
活字ファンの季節になった
銀杏の落ち葉集めて書棚の落ち葉と交換する時期だわ
0695無名草子さん垢版2022/11/18(金) 12:37:04.31
食欲の秋、スポーツの秋、入力の秋、校正の秋
0697無名草子さん垢版2022/11/20(日) 12:28:23.43
校正ファイルを普段使いとは別のテキストエディタに移し替えて作業したり、違うビューワーで見てみたりすると誤字発見率が上がる気がする
0698無名草子さん垢版2022/11/20(日) 13:01:42.84
同じエディタでもフォント変えるだけで変わリそう
○と〇とか紛らわしいけどフォントによっては区別つく
0700無名草子さん垢版2022/11/20(日) 18:08:42.65
googleドライブのOCR
急に使いにくくなったような気がするのだけど
最近アップデートがあったのだろうか

今まではあたりまえに読み取れていた同じ底本がなぜか変なアウトプットに
同じ現象の人いる?
0701無名草子さん垢版2022/11/20(日) 23:00:02.75
Twitterで「#青空文庫で一番好きな作品を教えて」というハッシュタグが生まれてる
0703無名草子さん垢版2022/11/22(火) 08:34:36.14
かといって10番目に好きな作品と言われるともっと困る
読みたいときにそこにあるってのが青空文庫の良さじゃない?
0706無名草子さん垢版2022/11/24(木) 01:58:23.29
ハッシュタグでないけどTwitter繋がりということで。

Twitterで最近『青空文庫から抜粋するbot』っての見つけてフォローしてるけど、知らない作品を読むきっかけになっていい。
0707無名草子さん垢版2022/11/25(金) 02:18:01.66
青空文庫等が詩集を除いて「単行本を一冊」単位ではなく短編なりの「文章を一冊」として収録してるのって単行本の編集著作権に配慮してのことかな
0708無名草子さん垢版2022/11/25(金) 04:09:24.08
>>707
単行本の編集著作権と聞いて「ツェッペリン飛行船と黙想」を思い出した
ちなみに「ツェッペリン飛行船と黙想」は著者没後に出た未発表短編集
0711無名草子さん垢版2022/11/25(金) 20:02:41.26
>>434
これまだ何の返事もないんだけど、やっぱ届いてないのかな?
ちなGmail
0712無名草子さん垢版2022/11/25(金) 23:47:35.85
真実は点検さんに聞かないとなんとも
ちなみ私がgmailで7月に送ったある作品は届いていなかったらしく
その後gmailでないアドレスから送り直したよ。
同じく7月にgmailから送った他の作品はちゃんと届いていたんだけど。
gmailの不具合なのか点検作業が大変なのかこちらは判断がつかないから、青空文庫用のやり取りにgmail を使うこと自体をやめたな
0713無名草子さん垢版2022/11/26(土) 12:13:09.37
システムから受け取り確認の自動返信をもらえるようになると安心なんだけど
0714無名草子さん垢版2022/11/26(土) 15:07:24.68
申請メールが多すぎてスパムに埋もれてしまってるんだろうね、きっと
0715無名草子さん垢版2022/11/27(日) 13:24:55.01
スパムに埋もれるとはつまりランチョンミートに埋もれるということか
なかなか羨ましい状況にも思える
0716無名草子さん垢版2022/11/27(日) 22:01:52.11
最近校了のペースより作品公開のペースのほうが早そうなんだけど、ストックがゼロになったことって今まであるんかな
0717無名草子さん垢版2022/11/27(日) 22:36:45.22
公開ペースを一定にする(毎日なにかしらが公開されるという魅力を持たせる)ためにストックするのは
なにか商業主義的駆け引きを感じて自分としてはあまり好ましく思っていない

そもそも毎日新作?を楽しみにしている層と
そんなこと関係なく必要に応じて検索して青空文庫に公開されてれば嬉しい!という層とでは
後者の方が多いんじゃないかって思うんだよね(個人の感想です)

誕生日や命日まで温存しておかなくたって
完成し次第公開してもらえたほうが
ボランティアも利用者もありがたいと思うのだけどな
0718無名草子さん垢版2022/11/27(日) 22:47:44.52
むしろ定期(毎日)更新って公開するための締切を自ら課してるだけじゃないの

パブリックドメインをウェブ上で公開する仕組みも入力や校正のデータも独占・奪取してるわけでもないし
青空文庫での公開の作業を担ってるスタッフだって他の工作員と同様に飽くまでボランティアなんだから
究極的には1年間に1作品以下の頻度の公開でも文句言える立場の人って別に居ないわけで
0719無名草子さん垢版2022/11/29(火) 22:23:27.41
公開日を誕生日や命日とかにするのは公平で良いと思う。
0720無名草子さん垢版2022/11/30(水) 20:13:07.98
正月公開は何になるのかちょっと楽しみにしてる
07212022年12月公開予定作品一覧垢版2022/11/30(水) 20:28:44.76
2022-12-01 山本 周五郎『だんまり伝九』
2022-12-02 ホワイト フレッド・M『トリガーセンの妻 コーンウォール物語』
2022-12-03 池田 勇人『政府を拘束しない』※誕生日
2022-12-03 佐藤 春夫『「珊瑚集」解説』※「珊瑚集」著者は永井荷風
2022-12-03 永井 荷風『歓楽』※誕生日
2022-12-03 室生 犀星『〈我が愛する詩人の伝記〉(補遺)』※佐藤惣之助誕生日
2022-12-04 山本 周五郎『伝四郎兄妹』
2022-12-05 作者不詳『現代語訳 平家物語 12 第十二巻』
2022-12-06 時枝 誠記『文学教育と言語教育』※誕生日
2022-12-07 坂口 安吾『光を覆うものなし ――競輪不正事件――』※競輪不正事件の不起訴処分決定が報道される
2022-12-08 山本 周五郎『峠の手毬唄』
2022-12-09 夏目 漱石『三四郎』※命日
2022-12-10 大田 洋子『いまだ癒えぬ傷あと ――放射線火傷で右手をうしなつた木挽きの妻と河原にうつ伏せて死んでいた幼女に――』※命日
2022-12-11 山本 周五郎『初午試合討ち』
2022-12-12 中谷 宇吉郎『日本の将来』
2022-12-13 田山 花袋『晩秋の頃』※誕生日(旧暦)
2022-12-14 尾崎 士郎『生きている忠臣蔵 ――忠臣蔵は何故流行するか――』※忠臣蔵の日
2022-12-15 山本 周五郎『春いくたび』
07222022年12月公開予定作品一覧垢版2022/11/30(水) 20:29:06.29
2022-12-16 グリム兄弟『天国へいった仕立屋さん』※ヴィルヘルム・グリム(弟)命日
2022-12-17 山本 周五郎『梟谷物語』
2022-12-18 佐藤 春夫『愉快な教室』
2022-12-19 山本 周五郎『武道宵節句』
2022-12-20 小泉 八雲『お貞のはなし』※翻訳者(田部隆次)命日
2022-12-21 山本 周五郎『蒲生鶴千代』
2022-12-22 柳田 国男『私生児の方言』
2022-12-23 徳田 秋声『青い風』『閾』※誕生日(旧暦)
2022-12-24 ドストエフスキー フィヨードル・ミハイロヴィチ『クリスマスと結婚式 ――無名氏の手記より――』※クリスマスイブ
2022-12-25 矢内原 忠雄『イエス伝 マルコ伝による』※命日
2022-12-26 菊池 寛『たちあな姫』『世に出る前後』※誕生日
2022-12-27 山本 周五郎『半化け又平』
2022-12-28 作者不詳『現代語訳 平家物語 13 灌頂の巻』
2022-12-29 三木 露風『明治詩壇の回顧』※命日
2022-12-30 横光 利一『自慢山ほど』※命日
2022-12-31 寺田 寅彦『宇宙の二大星流』※命日
2022-12-31 中谷 宇吉郎『「寺田寅彦の追想」後書』
0723無名草子さん垢版2022/11/30(水) 20:48:32.46
新年の挨拶とかお正月に関するエッセイとかを入力すると1月1日に公開されるかな?
0726無名草子さん垢版2022/12/03(土) 21:12:58.55
作家別校了作品の比率から妥当かどうか検討してみてよ
0728無名草子さん垢版2022/12/03(土) 23:30:12.99
作業数多いがゆえに校了して結構経ってるのに公開されてない作品を見るとなんかこの「間」もったいねえなと思うこともあるからガンガン公開して言ってほしい
一時期同じ作家の公開が続いたって無限に作品があるわけじゃないからいずれなくんだしなる
0729無名草子さん垢版2022/12/04(日) 03:37:45.27
ガンガン公開しろってガンガン公開準備しろってことになると思うけどそんな厚かましいこと言うほど何か貢献してんの?
0730無名草子さん垢版2022/12/04(日) 08:46:28.56
少なくとも毎月毎月「山周ばかり」って文句いうよりはいいと思う
0731無名草子さん垢版2022/12/04(日) 11:15:21.78
種類に文句言ってるか量に文句言ってるかという違いだけでどちらも人任せなのは結局同じ
ただし他人により重い負担と労力を課そうとしているのは後者
0733無名草子さん垢版2022/12/04(日) 13:15:21.77
>>727
割合に応じて案分した結果の数字なのか意図的に配分してるような数字なのか出せって話であって、どっちを選んだら問題あるかないかなんて話はしてないでしょ
0734無名草子さん垢版2022/12/04(日) 13:25:29.36
>>728
校了した翌日でも公開は可能な仕組みならともかく校了後ファイルも点検してるって言ってるし、その「間」とやらは作品ごとに差があるとしても公開に必要な期間なのでは?
0735無名草子さん垢版2022/12/04(日) 13:40:29.22
いまいち分かってないんですが公開のタイミングって
そもそも誰が決めてるんでしょうか?
校正者の意向なんでしょうか?
誕生日目指して公開できるように頑張るとかの
モチベーションになってるってことであれば意味はあると思うのですが。
0736無名草子さん垢版2022/12/04(日) 14:13:43.59
質問させてください
割り注に最大長とかみたいな制約ありますか?
0737無名草子さん垢版2022/12/04(日) 14:50:35.94
>>733
いやだから、どっちか数字を出せ!って言われるような潜在的問題はなにもないから、出せって言うなという話でしょ。
0738無名草子さん垢版2022/12/04(日) 14:57:55.28
>>736
ここで質問するより点検さんに訊くのが良いと思うよ。
点検さんの手を煩わせるのは申し訳ないと思ってここで訊くのだろうけど、
点検さんとしても訊いてくれたほうが後々の点検が楽になるわけだから、丁寧に質問に答えてくれるよ。
0739無名草子さん垢版2022/12/04(日) 15:06:44.26
たしかに電子図書の割注の表示って
結局はユーザの表示する環境次第だから、複数行にわたる長い割注の場合どう表示されるんだろうね

我々の作業ではそこは意識するところではないんだけど

最大長の件、点検さんから答えがあったら、ここで共有してくれると嬉しいが
0740無名草子さん垢版2022/12/04(日) 15:13:54.09
>>734
ですね。

公開用XHTMLファイルに変換する作業も人手も必要ですし
出来たXHTMLも公開用サーバに上げるからには表示チェック(校正ほどの厳しい目ではないにしろ通読する)必要もあるんじゃないかと思います。
0741無名草子さん垢版2022/12/04(日) 15:32:04.09
あくまで提示されてる情報からの推測だけど、
注記一覧のページを見た限りだと、ルビ、縦中横、行右(左)小書き、上(下)付き小文字、罫囲み、横組み、文字サイズの注記については、
>対象文字が長めの場合や、外字注記が用いられているとき、前方参照型では期待通りに変換されない場合は、始まりと終わりを特定する開始/終了型で、次のように注記してください。
という旨の説明があって、2種類の注記方式を用意してるから、
【[#割り注]○○[#割り注終わり]】だけで【○○[#「○○」は割り注]】みたいな注記を用意していない以上は割り注の注記に文字数の制約はないんじゃないでしょうか

注記一覧 その他 - 青空文庫
https://aozora.gr.jp/annotation/etc.html
0742736垢版2022/12/04(日) 15:55:26.44
まだ入力者登録してないので、点検の方に質問するのは後回しにします。

>>741
やはり制限はなさそうですね。
Windows用ビューワーであるPageOneやOyaziViewerでエラー発生するのは確認しているんですが、青空文庫と関係ない話なので厄介そうです
0743無名草子さん垢版2022/12/04(日) 22:29:29.61
二段組に対応してるビューワーってあるんだろうか。
大して調べてるわけじゃないけど二段組は再現できない仕様が多いよね
0745無名草子さん垢版2022/12/05(月) 12:45:58.85
>>744
記念日に公開したいって思惑は分かるんですがそれが校正者の意図なのか
公開者の一存なのかが知りたいです
0746無名草子さん垢版2022/12/05(月) 16:34:38.57
>>745
校正者の意図か公開者の意図かという話になれば、それは概ね公開者の意図ということになると思う

ほとんどの作業ボランティアは点検グループの大変さや校正テキストファイルを提出してからその先の時間的長さと人的負担を理解していると思うので、いついつ公開してくれという希望は余程のことがなければ出さない(出せない)と思う
0747無名草子さん垢版2022/12/05(月) 19:51:55.02
10校正したら1入稿というような何らかの制限つけたほういいと思う
そうしなきゃ自由気楽にきる入力ばかりやってしまう
0748無名草子さん垢版2022/12/05(月) 20:01:43.56
発想面白いね

ただそこは作業者次第よ
だって自分は入力よりずっと校正してたいもん、達成感あるしね

だけど校正は点検グループの手を確実に煩わせるから
今は大量申請できないんだ
0749無名草子さん垢版2022/12/05(月) 21:38:35.42
校正は自分の作業が確実に近い未来の公開につながるのが魅力よね
0751無名草子さん垢版2022/12/06(火) 09:28:56.97
10校正したご褒美に1入力だと今の校正待ちが余ってる状態では成り立つけど最終的に校正待ちファイルが枯渇してさらに入力もできなるなるやで
0752無名草子さん垢版2022/12/06(火) 09:51:09.57
だが待ってほしい
入力はOCRの仕事で、校正は人間の仕事になるのではないか
0753無名草子さん垢版2022/12/06(火) 11:40:11.36
AI様が次世代デジタルライブラリーのocrと国会図書館デジタルコレクションの底本画像を組み合わせて、片っ端から自動で青空文庫注記をつけてくれた上で青空文庫のデータベース上に勝手に登録してくれて、あとは人が校正するだけになったら相当面白いかも
0754無名草子さん垢版2022/12/06(火) 11:56:22.82
>>753
OCRの出力結果が正しいかどうか判断するAIが正しいかどうか判断するAIが正しいかどうか判断する人間のひと手間は避けられない
0756無名草子さん垢版2022/12/06(火) 18:07:23.19
>>750
まさかの山川方夫短編が上位
おそるべしYouTube
0758無名草子さん垢版2022/12/06(火) 20:01:42.27
>>757
YouTubeで、青空文庫の作品を要約してアニメにして紹介してる方が居て、おそらくその影響で上位になったと思われる
個人的に山川方夫さんは好きな作家だから嬉しい
0759無名草子さん垢版2022/12/06(火) 20:34:11.53
なるほど、ありがとう
青空文庫をもとに制作しているYouTubeチャンネルも色々あるけど
それきっかけで青空文庫本家にユーザが来てくれるのは嬉しいね
0764無名草子さん垢版2022/12/08(木) 23:37:32.37
1話目でいつものパターンそのままでいらんと思ったので
今回はつられないぜ
0765無名草子さん垢版2022/12/08(木) 23:52:03.13
教養が無いし翻訳作品はあまり読んでないから普通に知らんかった……
0766無名草子さん垢版2022/12/11(日) 11:58:41.29
子どもの頃「少年少女世界の名作文学」で「にんじん」を読んで、これは何を伝えたいんだろうと真剣に悩んだ
0767無名草子さん垢版2022/12/12(月) 00:57:59.07
あーおーぞーらーうーんーこー
0769無名草子さん垢版2022/12/12(月) 20:09:45.32
青空文庫読者なので工作員の悲喜こもごもを楽しく見させていただいております
0774無名草子さん垢版2022/12/13(火) 06:59:19.63
「JIS X 0213にはないがUnicodeにある漢字」を左ルビに使えるかどうかはビューワーの実装次第?
0775774垢版2022/12/13(火) 07:17:10.22
Windows用アプリの左ルビ対応状況を調べてみた
[アプリ名(バージョン)] [JIS X 0213に規定された第3第4水準にある漢字] [JIS X 0213にないがUnicodeにある漢字]

えあ草紙(ver1.3.0) OK OK
PageOne(ver4.00) OK NG
OyaziViewer(ver2.6.5.0) NG NG
0776774垢版2022/12/13(火) 11:17:35.42
PageOneはU+1F130からU+1F189までの四角囲みアルファベットを表示できないっぽい
0777無名草子さん垢版2022/12/13(火) 15:02:34.25
そらもようにあった25周年記念のイベント?ってまだ期待してでもいいのかな
0778無名草子さん垢版2022/12/15(木) 08:55:50.81
UTF-8に移行すれば、難しい字句のWeb検索で青空文庫のhtmlファイルがヒットする確率があがるんだが
0779無名草子さん垢版2022/12/15(木) 09:06:48.29
だからずっとutf-8に移行して欲しいってずっと言ってきてる訳ですが
逆にsjisにこだわってる理由があるなら教えて下さい
0780無名草子さん垢版2022/12/15(木) 09:18:08.46
中途半端に漢字をJIS X 0213の異体字に置き換える行為って、善意のようにみえて実は作品を蹂躙してるのと同じなんだよなあ
怖いよ、善意の破壊者
0781無名草子さん垢版2022/12/15(木) 09:30:25.20
>>780
萩原朔太郎が「ローマ字論者への質疑」で
蝶は「てふ」でなくしてはならないなんていってるけど
現在の日本で蝶と「てふ」として読む日本人が果たして何人いるのか?
言葉は時代とともに移り変わっていくものであり
より良いものが提示されてるのに、検討もされないで思考停止してるのは
残念としか思えない。
0782無名草子さん垢版2022/12/15(木) 09:38:55.13
そもそも今のコメントで引っ張ってくる漢字がutf-8の文字なら
そこにひと手間かける意味は何なんでしょうかと小一時間問いただしたい
0783無名草子さん垢版2022/12/15(木) 09:39:55.43
>>781
それだと、底本がどんな表現を使っていたかを知りたい、流行の変遷を知りたい、っていう需要に答えられないんだよね
電子化テキストのほうで勝手に情報を捨てたら、復元できないわけで
0784無名草子さん垢版2022/12/15(木) 09:41:42.08
「言葉は時代とともに移り変わっていく」のなら、なおのこと勝手にその時代の情報を捨てたらダメでしょ
著作権が切れてるのを良いことに踏みにじりまくってるね
怖いよ、善意の破壊者
0785無名草子さん垢版2022/12/15(木) 09:46:22.75
なまじ外字フォントやら注記で置き換えられているのは、がんばれば元のデータを復元できる
問題は、勝手にJIS X 0213に収まる異体字に置き換えてしまうケース
復元できないんだから、文化大革命も同然だよ
0786無名草子さん垢版2022/12/15(木) 09:55:29.39
スペインでキリストのフレスコ画をムンクのような絵に変えた事件あったじゃん?もう10年経ってたね


世界中で話題になった「おばあちゃんによる最悪の芸術品修復」から10年、町とおばあちゃんに起こった変化とは? - GIGAZINE
https://gigazine.net/news/20220818-ecce-homo-worst-artistic-restoration/
0787無名草子さん垢版2022/12/15(木) 09:59:14.96
さて思考停止しているのはどっちかな
0788無名草子さん垢版2022/12/15(木) 10:22:13.21
「諭」(「言+兪」, U+2F9D0)はわりとよく見かけると思うんだが、包摂適用で「諭」にしていいか議論の余地がある。
ちなみにWindows環境だと、Meiryo UIフォントとか使わないと「諭」(「言+兪」, U+2F9D0)は表示できないので不便。
0789無名草子さん垢版2022/12/15(木) 10:29:38.40
これと萩原朔太郎の言をを一緒にするのは流石におかしい。
その時代の異字体を大切にしたいなら、その方向での注釈をつけるべきで
utf-8の字体を全面的に拒む理由にはならない。
今後も機会あるごとに青空文庫のユニコード化は訴えっていこうと思います。
0790無名草子さん垢版2022/12/15(木) 10:46:40.91
共産主義者が多いのかな、青空文庫の利用者って
賢いフリするのが好きなだけで頭悪そうな感じ
0791無名草子さん垢版2022/12/15(木) 10:49:00.00
Google先生に拾ってもらえなくなったらおしまいだよ
0792無名草子さん垢版2022/12/15(木) 10:49:52.06
頭悪いは否定しませんが頭悪くっちゃ青空文庫利用しちゃいけないんですか?
というかワッチョイつけて欲しい
0793無名草子さん垢版2022/12/15(木) 11:04:49.43
>>778 以降の書き込みは、>>779,781,782,789,792 以外全部同じ人だよ
書いた本人が言うんだから間違いない

外字フォントや注記のままだと、いつまでたってもGoogle先生を始めとするWeb検索エンジンに拾ってもらえない。
Unicode化をぜひやってもらいたい。
0794無名草子さん垢版2022/12/15(木) 11:36:23.23
>>779,781,782,789,792 は全部自分なんで、結局二人で言い合ってたわけかorz
この話題は広く議論してもらって、できるならutf-8化の方向で前に進めてもらいたいです。
0795無名草子さん垢版2022/12/15(木) 12:02:59.56
突然始まって唐突に終わった気がする
とにかく何が言いたいかというと屁のツッパリはいらんですよ
0797796垢版2022/12/15(木) 12:36:25.66
仮名遣いはともかく、漢字に関しては出版社や印刷所や編集者の都合なり意向なりでいくらでも変わるし変えざるを得ないので異体字の包括表記はそこまで重要ではないと思う
それでもなお必要と思うなら「自分でやれば?」って感じ
自分でサイト作らなくてもWikisourceとかがあるしね
0798無名草子さん垢版2022/12/15(木) 12:53:07.17
包摂適用についてはまあその通りで実用に問題ないレベルだと思う
じゃないと今まで放置されてない
0799無名草子さん垢版2022/12/15(木) 17:06:07.13
正直自分はUTF-8に対応してくれたほうが嬉しいけど
そもそも現状の青空文庫一強みたいな風潮も変だし、違うアーカイブがもっと増えてもいいんだよねぇ
自分も青空文庫用に作った作品ファイルを自サイトで公開してるけど、その時は極力字を底本通りに直してるわ
0800無名草子さん垢版2022/12/15(木) 17:11:03.93
単に電子テキストをアーカイブ化したいって言うなら、青空文庫で入力校正の手続きを踏むより

電子テキストをepub形式にしてKDPやkoboで出版→国会図書館の電子書籍納本、とかのが一人で完結するし手っ取り早いかもしれない
0801無名草子さん垢版2022/12/15(木) 17:40:59.57
青空文庫は今のSJIS仕様のままだと、鬼門・地雷原ともいうべき旧字の多い作品の入力校正を皆が避けるようになってしまうから、良くないんじゃないかな
0802無名草子さん垢版2022/12/15(木) 22:43:06.96
字形や表記にこだわる人は編集行為を嫌悪していると思う。
しかし編集があるから本になるし青空文庫にも載る。
包摂適用も編集行為のうちで、問題があるとは思わない。
0803無名草子さん垢版2022/12/15(木) 22:58:32.39
本当にこの件を議論したい(動かしたい)ならば
ここより、そらもようでコメントしたほうが現実的かもね。
別にここではその話するなって意味じゃないよ。
いろんな考え方聞けて面白い
0805無名草子さん垢版2022/12/15(木) 23:44:46.92
包摂適用はやむを得ずそうしてるだけで
青空文庫の基本的なスタンスは底本の尊重にあると思ってるから
SJISよりUTF-8のほうがそのスタンスにかなうならそうした方がいいとは思う
でも結局UTF-8にしたところですべての漢字が表示できるわけではないから、どこかで妥協する必要があるのは同じなのよね

運営も割と長年このことは議論してるんじゃなかったっけ
今のところSJISで行くんだろうけど、そのうちUTF-8対応になっても驚きはしないかな
0807無名草子さん垢版2022/12/16(金) 00:07:35.72
https://forest.watch.impress.co.jp/docs/bookwatch/digipub/1090529.html

「質疑応答では、青空文庫のデータにはシフトJISコードが用いられているため、海外の方がファイルを開くと文字化けしてしまうなどの問題が指摘された。Unicodeを採用すると、旧字をどうするか? などのルール変更が必要なので、これからの青空文庫の課題として考えていきますという回答がなされた。」

2017年の講演でこういう話は出てるから、運営もSJISのままでいることが最善最適とは思っていないとは思う。だからって将来的に変わるかどうかまではわからないけど。
0808無名草子さん垢版2022/12/16(金) 06:23:38.82
>>802
誰も編集を嫌悪してなどいない
工作員が無難に編集できる作品しか選べない現状の仕様が問題なんだよ
熟練の工作員ほど無意識のうちに避ける習慣ができてしまっている
0809無名草子さん垢版2022/12/16(金) 06:40:18.78
底本のある文字を青空文庫で利用可能な異体字に変えた場合は、変えたことを認識できる仕組みがないと、情報を捨てる破壊行為に貢献する皮肉な結果になる
たとえそれが善意だったとしても
0810無名草子さん垢版2022/12/16(金) 07:00:36.70
モリカケ問題からもわかるように、改ざんしたことではなく改ざん履歴が失われることが問題の本質
0811794垢版2022/12/16(金) 08:58:58.18
>>803
そらもようにコメントつけられるんですか?
青空文庫の将来について一番活発かつオープンに議論できる場って
ここだって思ってるんですが他にもアプローチの仕方があるなら
教えて欲しいです
0812無名草子さん垢版2022/12/17(土) 13:57:35.88
包摂適用による字の改変が問題なら今まで包摂適用してた字も外字扱いにして注記でなんとかすれば文字コードのシステム変えなくても対応はできるな(工作員の作業量は増える)
0813無名草子さん垢版2022/12/17(土) 17:47:57.67
そこまで厳格にしていくと「そもそも(複数ある場合に)その底本の選別は正しいのか」という問題にまで発展していく
少なくとも現時点で青空文庫に収録されてる作家のほとんどは直筆原稿がオリジナルであって、初出誌の時点で多かれ少なかれ出版用に改変されたものでしょ
それで活字状態のオリジナルとして初出誌に限定しようとしても誤植のリスクがあるし全ての作品で直筆原稿まで直接確認できるとは限らない
0816無名草子さん垢版2022/12/21(水) 17:42:59.41
>>814
話題にすればいいじゃない

ついでなので関連質問させてください
青空文庫・外字注記辞書【第八版】にある、合字の「シテ(U+2CF00)」は、本来は「〆(U+3006)」とは別のものらしいんだけど、青空文庫では同じ?
0818無名草子さん垢版2022/12/21(水) 19:52:47.49
※「シテ」「トモ」の合字は、仮名にあらためました。

図書カード:蟻説 (高木 貞治)
ttps://www.aozora.gr.jp/cards/001398/card53028.html

※「シテ」の合字は、仮名にあらためました。

図書カード:北越雪譜 (鈴木 牧之 山東 京山)
ttps://www.aozora.gr.jp/cards/001930/card58401.html

合字を仮名に改めるパターンが少ないから〆で代用してるのかね
代用というか誤字だろうけど
0819無名草子さん垢版2022/12/22(木) 12:54:41.67
2023年1月1日に1927年以降の著作物がアメリカのパブリックドメインに、「シャーロック・ホームズ」短編集・映画「メトロポリス」・ヒッチコック作品などなど - GIGAZINE
ttps://gigazine.net/news/20221221-public-domain-from-2023/

Public Domain Day 2023 | Duke University School of Law
ttps://web.law.duke.edu/cspd/publicdomainday/2023/
0821無名草子さん垢版2022/12/23(金) 10:38:23.94
入力申請は今年中に、ということかな
0823無名草子さん垢版2022/12/23(金) 13:06:41.82
別にいいんじゃないの、来年の1月1日からだからまだ間に合う
ダメだったらダメって書くだろうし
0824無名草子さん垢版2022/12/23(金) 15:51:48.65
1月1日から新プロジェクトに本腰入れたいって話だろうから、
今から受付作業が来年へずれ込む程の大量申請が押し寄せたら意味がないよ
0825無名草子さん垢版2022/12/23(金) 20:50:51.07
>>820
わらった。
事業は休んだら終わり。このまま無くなるだろうに1ユーロ。
0827無名草子さん垢版2022/12/23(金) 21:15:21.00
>>823
ダメだったらダメって書く
じゃなくて
申請は年内にお早めにって書いてない
って解釈しなよそこは
0828無名草子さん垢版2022/12/23(金) 21:27:00.94
新たな特務チームってどんなんだろうな。
したっぱ新入り工作員だからノウハウ教えてもらえるならありがたい
0829無名草子さん垢版2022/12/23(金) 21:28:38.48
出す・・・・・・!出すが・・・・・・今回まだその時と場所の指定まではしていない
そのことをどうか諸君らも思い出していただきたい つまり・・・・
我々がその気になれば金の受け渡しは10年20年後ということも可能だろう・・・ということ・・・・!
0830無名草子さん垢版2022/12/24(土) 01:11:28.33
運営が「通常の作業ペースが保てなくなっている」って訴えるほどだから
もう申請しないほうがいいんじゃないの
0831無名草子さん垢版2022/12/24(土) 01:47:55.36
>>823
1月1日に言えば済むことをわざわざ1週間前に色々と事情を説明して通告してる時点で気付けよ
0834無名草子さん垢版2022/12/24(土) 03:18:01.92
そらもようで告知を出す前に届いた申請やファイルの処理の途中で今年が終わるだろうから、1日で点検と公開準備が終わるような短編の校了作品が駆け込みで届けば来年の公開作品が増やせてラッキー、くらいの猶予期間でしょ

それこそ現状では対応が間に合わないとちゃんと言ってるし、12月31日までに全部対応するとは言ってないんだから、他は放置でも全く問題ない
0835無名草子さん垢版2022/12/24(土) 06:21:04.28
入力申請は他の人と被らないようにする宣言みたいなもんだから、ひとりで長編作品とかやるつもりならちゃんと入力申請しとけばいいと思うよ
0836無名草子さん垢版2022/12/24(土) 13:06:04.92
今年工作員になったんやけど今思えば滑り込みでいろんな作業やれたんやなと思う
休止期間の特務チームって教育係みたいなのがつくのかな。年明けの詳細が気になる
0837無名草子さん垢版2022/12/24(土) 13:06:13.13
>>828
自分の知識のためだけで
組織のために働けない冷やかしならやめて欲しい
0838無名草子さん垢版2022/12/24(土) 13:29:48.34
工作員やってる時点で「自分の知識のためだけ」ではないやろ
青空文庫のノウハウとか青空文庫以外では使おうにも使えないし
なんでかここもギスギスしてるね。急な発表だったからかな
0839無名草子さん垢版2022/12/24(土) 13:36:05.06
特務チームのことを読んで最初に思ったのがそれなんだよ

受付点検グループへの門戸はずっと開かれていたんだよ、今までも
でも叩くものが(多分ほとんど)いなかった

それを特務チーム結成と聞いてガヤガヤと集まる人々にどれだけの熱意と継続力があるのか
鍛えるだけ鍛えたチームメンバーがある日突然なしのつぶてじゃ、組織のためにならない

滅私奉公で名前も知られず継続的に仕事をしている点検グループ
興味は持ったけど内容を聞いてやっぱり自分には無理です、とはっきり辞退するならいいが
頭数だけ増えて幽霊メンバーじゃ意味ないから
加わるならしっかり責任もって加わりたい
0840無名草子さん垢版2022/12/24(土) 13:36:37.87
【3回目】 追加接種 =⇒ 死者増加 【4回目】
//kizuna.5ch.net/test/read.cgi/hikky/1667019659/l50
0842無名草子さん垢版2022/12/24(土) 13:42:31.60
第一現役工作員自体がそんなに居ないんだからガヤガヤ集まるというほど集まりはしないだろう
そこまでの熱意ある人だけじゃ先細るから裾野を開くためにこういうことしてるんじゃないかと思ったけどな。
0843無名草子さん垢版2022/12/24(土) 13:45:12.97
むしろただ門を開いてるだけじゃ入らないからこそ改めて宣伝してるんでしょ
0844無名草子さん垢版2022/12/24(土) 13:55:05.66
ギスギスも何も、「もう手が回らないので来年から休みます」って年末になってようやくNOやSOSを言えるようになった人に対して「今年はまだ残ってるな」で相手に負担をかけようとするのは、単純にブラック企業顔負けの発想過ぎるし、それに対して批難する奴が出るのは自然の流れだと思う
0846無名草子さん垢版2022/12/24(土) 14:32:43.32
好きにすりゃいいさ
そもそも金は絡まず名前が付くという名誉しかないんだ
0847無名草子さん垢版2022/12/24(土) 14:43:16.11
点検さんはそれ(名前がつく名誉)すらないのにやってくれてるのに
0848無名草子さん垢版2022/12/24(土) 14:44:54.91
金が絡まなきゃ好きに振る舞っていいわけじゃない
0849無名草子さん垢版2022/12/24(土) 14:49:15.02
>>844
一個人が運営してるわけじゃないので、そんな配慮は無用だよ
なんか勝手に青空文庫の管理グループを一個人に人格化してる人いるみたいだけど、
むしろそういう人は自身の心の病気を疑ったほうがいい。自己投影なのかもしれんが
0850無名草子さん垢版2022/12/24(土) 14:52:00.41
マナー奉行みたいな書き込みしてる人、心病んでるんじゃないの?マジで
0851無名草子さん垢版2022/12/24(土) 14:58:49.09
>>848
常識はずれがタマにこうして現れるから
電子レンジでネコを乾燥させないでくださいとか取説に書く必要があるんだな
日本人でもこうした程度が低いやつが現れると困る
0852無名草子さん垢版2022/12/24(土) 15:01:14.13
>>847
客観的に見て作業の大変さは点検の方だから連名したらと思うが
どの程度点検してるのかわからないから難しそう
自己申告系はほんま難しいな
0853無名草子さん垢版2022/12/24(土) 15:02:19.75
好きに振る舞っているのはむしろ青空文庫のほうなんだが
なんか教祖を擁護するM信者みたいな書き込みしてる人、マジでヤバい
0854無名草子さん垢版2022/12/24(土) 15:04:14.59
>>853
暖簾に腕押し見たいな何言ってるのかわからん
ある意味白昼夢みたいな主語置いてきぼりな言葉はこのスレに合いませんよ
0855無名草子さん垢版2022/12/24(土) 15:06:14.95
未着手タスクの山になっても平然としていられるような手合いが青空文庫の中の人たちなんだが、
なんかこのスレに忖度要求を書き込む人は、自分が繊細だから青空文庫の中の人も繊細なはず、と勝手に思い込んでてキモイ
0856無名草子さん垢版2022/12/24(土) 15:31:06.11
青空文庫の中の人たちを直接的に知ってて言ってるのかイメージで言ってるのかが気になるところ
0857無名草子さん垢版2022/12/24(土) 15:38:44.43
>>855
平然としてると思ってるのか……
それこそ自分の面の皮が厚いから
中の人も厚いはずと思ってるのね
0858無名草子さん垢版2022/12/24(土) 15:47:23.15
>>857
入力者への影響が大きい「充電期間の設定」の告知をわずか1週間前に行うくらいだから、中の人はメンタル強者そのものだよ
中の人だけじゃなく入力者もボランティアなわけで、それをわかったうえでやるのだから
0859無名草子さん垢版2022/12/24(土) 15:50:01.66
まぁ一般工作員にとっては点検作業や点検グループって謎な部分は大きかったから
休止期間の施策として点検について教えてくれるならありがたい話だな
点検グループにとって何が迷惑で迷惑じゃないのかとかは想像するしかない部分も多いし
点検グループに回らない工作員にとっても、点検グループがどんなふうに作業を回してるのか分かれば気を遣いやすくなると思う
0860無名草子さん垢版2022/12/24(土) 15:51:48.88
>>849
むしろ集団が分担してやってるのに全然間に合ってないんだから個人でやってるより問題は深刻だろ
0861無名草子さん垢版2022/12/24(土) 15:57:09.43
>>860
いきなり倒産を発表する企業とかはまさにそんな感じだね
0862無名草子さん垢版2022/12/24(土) 16:00:08.00
そもそも「大量申請は控える」って公式に明文化されていますし
無視するわけにいかんでしょ
0863無名草子さん垢版2022/12/24(土) 16:01:01.87
正直年単位で参加しててここ半年くらいにも連絡を取った工作員なら何となく運営チームが限界を迎えてそうという察しはついてたよな
0864無名草子さん垢版2022/12/24(土) 16:09:17.33
突如夜逃げして債権者に迷惑かける人を面の皮が厚いとみなすかどうかだね
夜逃げした本人は面の皮が厚いとは思っておらずむしろ、自己憐憫してたりする
0865無名草子さん垢版2022/12/24(土) 16:17:08.82
そもそも青空文庫は紙の出版物と違ってWebなのだから公開しながら適宜修正していけるはずなんだよ
点検グループはなにを点検しているのか、という話にもなるわけで
0866無名草子さん垢版2022/12/24(土) 16:22:37.48
テキストファイルの管理はGithubでしてPR受け付ければよくね?、みたいな話は出てこないもんなのかな
中の人の思考様式が、時代遅れになってないか?
0867無名草子さん垢版2022/12/24(土) 17:01:08.51
>>865
「とりあえず公開して、間違いや不備に気付いた段階で適宜修正すればいい」という手法の妥当性や有効性はWikipedia見てたら何となくは分かると思うけど
0868無名草子さん垢版2022/12/24(土) 17:16:06.41
>>867
Wikipediaは誰でも彼でも書き換えできてしまうので論外
修正を受理するか確認できるGithubのPR(Pull Request)機能を使えばそういった問題は起きない

時代遅れな人は時代遅れであることに気づけない
0869無名草子さん垢版2022/12/24(土) 17:21:16.03
どこかでgithub自体がもはや時代遅れって見て
一時は真面目に学んでみようかなんて思ってた気持ちが
一気に萎んだんですが実際のところはどうなんでしょうか?
0870無名草子さん垢版2022/12/24(土) 17:25:42.33
Githubを使えば、一般ユーザーは管理者ユーザーから修正内容を却下されてもめげずに独自に修正作業しつづけることができる
このプログラミング業界のソース管理技術を青空文庫が応用しない手はないよ
バックアップや履歴管理の負担はかなり減るからね

たぶん充電期間に、そういう話されるはず、と思いたい
0871無名草子さん垢版2022/12/24(土) 17:43:48.29
>>869
Githubが時代遅れという情報源はどこでしょうか
いまやマイクロソフト社までもがGithub使っています
個人的には、有力な代替手段が見つからないうちはGithubは時代遅れではないと思いますよ
0872無名草子さん垢版2022/12/24(土) 17:47:58.58
どなたもメリークリスマス
来年は吉報があるよ
0873無名草子さん垢版2022/12/24(土) 17:50:38.43
>>865
点検グループは情報や権利の正当性も合わせてチェックしている
ただ底本にそったテキストを作るだけのわれわれとは作業の性質が違うのだからそんな風に言わないで欲しい
0874無名草子さん垢版2022/12/24(土) 18:07:45.21
>>873
点検グループへの同情や忖度なんて一切必要ない
点検グループが作業を可視化しければ、無能な貴族呼ばわりされる。それだけ
0875無名草子さん垢版2022/12/24(土) 18:13:12.88
>>868
それを公開前に前倒しで全文を対象として1回やってるのが今の「公開前に入力者と点検者以外による校正作業を入れる」という手法だよね
それでも漏れがあるから誤植があったら底本の画像付きで連絡くれって言ってるんだし
0876無名草子さん垢版2022/12/24(土) 18:44:43.17
>>874
点検作業で何をしているかについては既に可視化されてるけどね
相手が情報を公開しても確認しない調べもしない人は何て呼ばれるのかな?

青空文庫はこうやって運営され、こうやって活用されてます - 鷹野凌のデジタル出版最前線 - 窓の杜
ttps://forest.watch.impress.co.jp/docs/bookwatch/digipub/1090529.html

青空文庫20周年記念シンポジウム「青空文庫の今とこれから」:チュートリアルセッション 青空文庫の仕組みとボランティア入門 - YouTube
ttps://www.youtube.com/watch?v=0VW7HG-vQlY

青空文庫20周年記念シンポジウム「青空文庫の今とこれから」
ttps://www.aozora.gr.jp/houkokusyo/aozora20anniv.html
0877無名草子さん垢版2022/12/24(土) 18:52:18.97
>>876
言葉遊びしたいの?
スローガンを見せることが可視化ではないよ
日々の点検の進捗を可視化しなければ意味がないでしょ
0880無名草子さん垢版2022/12/24(土) 19:49:43.59
アプリ開発できるような人が参加してくれると良いな
それか
青空文庫アプリ会社に向けて文字ミス通報機能追加してもらうとか
こういうのを読者にも頼めればずいぶん楽になると思う
0881無名草子さん垢版2022/12/24(土) 19:50:25.73
ミス
青空文庫アプリ会社 → 青空文庫対応アプリ開発者
0882無名草子さん垢版2022/12/24(土) 20:17:07.54
>>871
github でググった時に検索候補に危険性って出てきて
記事を読んでる中にそのようなことが書かれてたんです
便利そうで覚えたいと思っていたのですが
0883無名草子さん垢版2022/12/24(土) 21:14:52.54
>>878
「入力予約」の状態ってどうなってんの?

入力予約 : 3件
2008年:1件
2003年:1件
2002年:1件
0885無名草子さん垢版2022/12/24(土) 21:46:58.74
>>861
状況としてはこれに近いと思う
厳密に言うと青空文庫は本の未来基金とかもあって経済的には一応余裕があるけど運営の人手が圧倒的に足りないというのが根本的な問題だから倒産(≒サイト閉鎖)の危機はないんだが
0886無名草子さん垢版2022/12/24(土) 21:47:04.84
校了後が長すぎる作品についてはどういう理由があるのか疑問視する意味はあるが
ほかのステイタス、それも著作権切れ延長に係るような作家作品でもないのなら、想像するだけ無駄
0887無名草子さん垢版2022/12/24(土) 21:53:10.78
少なくとも2010年以前に校了状態になってる作品は公開前までに共著者や戦時加算の都合で著作権法保護期間中と判明されてるものだよ
それ以降は公開準備中のものと法改正で保護期間延長になったものが入り交じってる
0888無名草子さん垢版2022/12/24(土) 21:58:41.09
>>887
だったよね。

ほかのステイタスについては個人か運営の都合としか言えない。

誰かが代打を申し出ることはできるし、長期放置が気になるなら代わってあげてもいいんじゃ?

二十年も前となると可能性としては本人さんが存命かどうかも疑わしい。
青空文庫の歴史が長くなればこれからこういうことは増えていくと思う。
0890無名草子さん垢版2022/12/24(土) 22:36:33.00
とりあえずマナー奉行と忖度強要奉行は全員氏んでくれ
0892無名草子さん垢版2022/12/24(土) 22:58:33.72
忖度したら死ぬのか
忖度に親を殺されたのか
ってくらいの憤怒
0893無名草子さん垢版2022/12/24(土) 23:13:18.68
来年の公開頻度は毎週日曜日くらいになるのかな
0895無名草子さん垢版2022/12/24(土) 23:43:11.07
入力予約は昔の制度っぽいけどサイト内検索してもいまいち分からんな
0896無名草子さん垢版2022/12/25(日) 00:18:57.77
質問です
なり、ナリの仮名、青空文庫・外字注記辞書(大八版)には見当たらないようなのですが、ご存じの方いませんか?

なり (仮名) - Wikipedia
https://ja.wikipedia.org/wiki/%E3%81%AA%E3%82%8A_(%E4%BB%AE%E5%90%8D)
0898無名草子さん垢版2022/12/25(日) 00:35:31.22
>>896

• 「コト」「より」以外の合字は現代平仮名、カタカナで入力して、ファイル末に下記のように注記してください。
※「シテ」「トモ」「トキ」「こと」「ごと」「まいらせそうろう」の合字は、仮名にあらためました。
• 仮名に書き換えるのではなく、外字注記したい合字は下記を参考にたとえば「※[#シテ、ページ数-行数]」のように本文中に注記してください。


……と外字注記辞書に書いてあるからそれに準ずる
0899896垢版2022/12/25(日) 00:53:21.16
>>898
回答、ありがとうございます
0900無名草子さん垢版2022/12/25(日) 00:59:41.88
外字注記辞書の更新も点検グループの仕事のひとつ。
0903無名草子さん垢版2022/12/25(日) 14:20:22.00
かもね
積年の課題をやっつけるためにはいい機会だ
なにかできることがあったら加わりたい
0904無名草子さん垢版2022/12/25(日) 14:37:38.07
入力中→校正待ち
校正中→校了

この間に、「点検はしていないが受領はした」というモードが欲しいなあ
「校正待ち(点検前)」というモードもあるけれど、これはほとんど機能していなくて
入力者自身が中の人の場合くらいしか使われてないんじゃないかな

耕作員としては自分の手を一旦離れたものなのに
ずっと自分のところで○○中のまま停滞しているように見えるのこそ悲しけれ
0905無名草子さん垢版2022/12/25(日) 18:01:40.00
今はJIS X 0213以外の漢字を含む青空文庫の作品内キーワードはWeb上に存在しないも同然の扱いになってる
Unicode対応するとJIS X 0213以外の漢字を含む作品内キーワードの多くをGoogleなどの検索エンジンが認識できるようになる
0906無名草子さん垢版2022/12/25(日) 18:14:29.25
Googleを引き合いに出してUnicodeを化が必要という話がたまに出るけど
むしろGoogleのほうが青空文庫形式に対応すべきじゃないの
と思う
0907無名草子さん垢版2022/12/25(日) 18:20:01.95
>>906
それやると、かえって逆に青空文庫側が自由に仕様変更できなくなるよ
青空文庫がhtml外字の仕様変更するたびに検索エンジンから見えなくなるからね
そういう二度手間なくすためのUnicodeってこと
0908無名草子さん垢版2022/12/25(日) 18:27:10.66
青空文庫が出版業界と共存できる差別化は、せっかく紙で再版しても旧字旧仮名だらけで一般読者にはとっつきにくくて採算とれそうにない旧作の電子化だからUnicode対応待ったなしなんよ
0909無名草子さん垢版2022/12/25(日) 22:05:27.21
>>811
今さら亀レスですが
そらもようじゃなくてaozorablogの間違いでした
すみません充電してきます
0910無名草子さん垢版2022/12/25(日) 23:20:37.34
ママ注記にUnicode文字注記含んでるとつまりPageOneでエラー扱いになるからさっさとUnicode対応してほしい
0912無名草子さん垢版2022/12/26(月) 21:36:13.63
Unicodeとかもそうなんだけど作家・作品・底本(出版社や時代)を跨いだ全ての文章の一括検索という観点からすると
例えば「ほぼ」と「ほゞ」と「略」と「略々」と「略※[#二の字点、1-2-22]」みたいに表記揺れのある単語や言い回しをそれぞれの底本に準拠させる必要性がどこまであるのかみたいな問題にもなってくると思うんだよね
(他にも小書きかどうかだったり新字と旧字みたいな区別も出てくる)
それを検索サイトやシステム側で一緒にできるならいいんだけど
0913無名草子さん垢版2022/12/26(月) 21:56:54.15
表記揺れはand検索でどうとでもなるからそのために本文を改変する必要はないと思うな
0914無名草子さん垢版2022/12/26(月) 22:12:08.36
それがどこまで網羅できるのかって話だけどね
データベースでも作るなら別の話になるけど
0915無名草子さん垢版2022/12/26(月) 22:42:57.71
当たり前だけどUnicode対応するといままで包摂適用してきた多くの文字をそのまま使えるようになるので外字注記辞書の更新も必須
0916無名草子さん垢版2022/12/26(月) 22:57:50.51
>>912-914
今まで、それを比較検証することすらできなかったわけで、
「HD画質は皺が目立つから良くない」みたいな後ろ向きな現状維持は見苦しい
0917無名草子さん垢版2022/12/27(火) 03:09:19.99
検索ツールの責をデーターに帰してどうすんだ。
0918無名草子さん垢版2022/12/27(火) 03:38:57.56
>>917
誕生から25年経ったのに、青空文庫の書式に対応した検索ツールが皆無という現実がすべてを物語ってるでしょ
0919無名草子さん垢版2022/12/27(火) 03:49:22.35
データーの責を検索ツールに帰してどうすんだ。
0921無名草子さん垢版2022/12/28(水) 01:12:10.34
「大岡政談」は、テキストファイルのサイズが青空文庫唯一の2MB越えで、ルビが75892個もあるんだね
今、未申請ながら入力してる作品もルビ35000個を超えているんだけど、上には上がいるってことでちょっと安心した
0923無名草子さん垢版2022/12/28(水) 12:40:06.43
>>922
タイトルは面白いと思ったが本文くっさ
漫画☆太郎の100%パターンマンガとどちらが下だろうと悩むほどに
0924無名草子さん垢版2022/12/29(木) 18:44:44.53
底本のページ番号に特化した注記があればいいなあ
外部プログラムに底本のページ番号を渡すことで該当する画像ファイルなりPDFなりをすぐに開けると校正が楽になると思うんだが
0926925垢版2022/12/30(金) 16:57:45.24
「来年は」というか「来年こそは」だわ
0927無名草子さん垢版2022/12/30(金) 17:11:21.75
来年は一体どうなるんだろうねぇ
まだ新年の公開作品の情報も出てないから完全に更新止まっちゃうのかな……
0928無名草子さん垢版2022/12/30(金) 19:22:38.00
未申請のまま入力に取りかかろうかと考えている
もしも他の人と作業がダブってしまってふいになったとしても
自己責任、自業自得ってことで

Unicode化や注記の仕方など
大きな仕様変更があるかもしれないが
それでも一年間なにもせずにいられそうもない
0929無名草子さん垢版2022/12/30(金) 20:19:48.47
2022年12月23日に出された充電期間の通知よりも前に申請したんだが、未だに連絡メールが来ない
まだ4週間経ってないから待ってるけど、どうなるのかな

>>928
重複を回避できる仕組みがあればいいんだけど、やたら申請だけしてほったらかしにされると困るので、
青空文庫の中の人による集中管理によらない、入力者間のゆるい情報交換の仕組みがあればいいと思う。
Githubのissue機能(メール通知や状態管理できる2chスレッドみたいなもの)を使えば作品ごとに重複回避や作業分担できそう。
0930無名草子さん垢版2022/12/30(金) 20:25:16.14
ググルのような工程表を用意し
この通りにやらないと優先度が落ちて行って最終的には申し込み自体消滅でいんちゃうの
0931無名草子さん垢版2022/12/30(金) 20:32:17.11
>>930
言いたいことはなんとなくわかるよ
けど、ガントチャートはスケジュールを中央で一元管理する人がいて始めて成り立つものなので、
ガントチャートの逐次更新にこだわると青空文庫の中の人の仕事が逆に増えてしまう恐れがある
毎日のようにたくさんの作品が放り込まれてくる青空文庫には、なじまないかもしれない
0932無名草子さん垢版2022/12/30(金) 20:36:46.66
参加者皆で確認して行く方向が大事だと思う
管理者は10名ほど横繋がりでやり取りできる状態になると良いな
0935無名草子さん垢版2022/12/31(土) 13:35:20.67
中の人もここ見てくれてるのだろうか?
だとすればここでブレインストーミング的にたくさん意見を出しておくと何かに活かされるかもしれんという希望が
0936無名草子さん垢版2022/12/31(土) 16:05:03.93
工作員のみんな今年もお疲れ様
来年は色々変化があるのだろうけどぼちぼちよろしく
0937無名草子さん垢版2022/12/31(土) 20:10:48.61
皆の活動が名作を支えてる
読者として楽しんでます

青空読んでたら何でか文庫本も買うようになって
変な逆転現象も出てる
0940無名草子さん垢版2023/01/01(日) 20:06:27.66
昨年で校了になっている作品は、今「校了」になってるので全部なのだろうか
いま点検グループさんの手元にある作品は、いったん作業中止って扱いになるのだろうか
(入力校正の新規受付がストップするのは分かったけど……)
0941無名草子さん垢版2023/01/01(日) 20:13:25.98
>受領後点検と「校了」ステータスの完全再開は、新データベースシステムの本運用開始と高品質ファイル作成に目処がついてから

そういうことだろうね。
運用システムが万全になるまでは、「校了」に移行することはないということ。

なぜなら高品質ファイルにするために何らかの仕様変更をする可能性があるし、
そうなれば、すでに送ったファイルでも、校正者に再度返す必要がある。
0942無名草子さん垢版2023/01/01(日) 20:16:11.34
校了したら、点検グループは必ず当日中に校正者にお疲れメールをくれる。
それがないということは
昨年中の校了作品は、今データベースで「校了」になったものがすべてで、あとは作業停止と思ってよいはず
0943無名草子さん垢版2023/01/01(日) 20:18:21.64
自己レスごめん

>>942
>それがないということは

上の質問者さんが心配しているのは
「昨年中に自分の送った校正ファイルはどうなっている(どうなる)のか?」
ということだろうと想像して答えた。
0944無名草子さん垢版2023/01/01(日) 21:34:25.53
>>940です。
ありがとうございます。
私は特に自分の担当している作業中作品はありませんが、
(いちおう一作品だけ入力申請していましたが未回答)
昨年の内に校正中になった自分の担当作品が多く、
それらが今後どうなるのか気になってました。

初心者の方が校正している様子も見受けられるので、
混乱が生じないことを祈りたいです……
0946無名草子さん垢版2023/01/01(日) 21:57:33.56
>>944
あまり新人を敬遠する発言はしないでほしい
新人でも精力的な人は精力的だし
点検Gもサポートしてる
0947無名草子さん垢版2023/01/01(日) 21:59:23.15
十年以上校正者がいない作品もあるのに
手を上げて校正してもらえる人が現れただけ幸運だよ
0948無名草子さん垢版2023/01/01(日) 22:08:27.84
厳格にやるべきは著作権など権利の確認で、校正はそれほど厳格にしなくても良いと思うんだが、
「ウォーリーを探せ」よろしく、入力間違いを沢山見つけた強者を月間・年間ランキング表示するゲーム感覚でいいんじゃないの。
ま、暴論だけどさ
0949無名草子さん垢版2023/01/01(日) 22:39:28.25
>>946
そうですね。
申し訳ございません。
私も参加したのは近年からですので、どちらかと申せば初心者です。

今回のリニューアルを機に、
いまだ校正されていない作品に光が当たりますように。
長文作品は「ドグラ・マグラ」のように交流しながらグループで行えるのが理想ですね。
0950無名草子さん垢版2023/01/01(日) 23:14:39.93
>>948
「歴史的仮名遣いを現代仮名遣いに改めた」とか「明らかな誤植を修正した」とか「使用する文字コードに存在しない文字を画像で挿入にした」みたいに
やむを得ない理由がないのに内容を変えて公開したら同一性保持権の侵害になるんだから内容の正確性はそのまま著作権の論点になるよ
同一性保持権などの著作者人格権は保護期間みたいな制限がないからね(著作権法60条参照)
0951無名草子さん垢版2023/01/01(日) 23:36:35.04
>>950
読者の視点でざっと読んで、違和感なかったらOKってことでいいんでないかな。
より細かい間違いを見つける作業は、一般人に委ねたらいいと思う。
参加型や逐次更新というWebの強みを活かさない手はない。
0952無名草子さん垢版2023/01/01(日) 23:49:06.92
古いファイルを見てると、工作員の独断で勝手に校閲したらしき部分を見つけることが時々ある
(底本通りではなく、別な本を見て直したように見えるが誤記注記がない、とか)
あと底本だか親本だかの版が存在しない版(発行日も刷数もでたらめ)だったこともあったな
あんまりゆるくするとそういうのが増えかねないから、校正はそれなりにちゃんとした方がいい、と思う
0953無名草子さん垢版2023/01/01(日) 23:53:58.96
>>951
OKなわけないじゃん
むしろ悪質だろ

調べに調べた上での誤りは致し方無い部分もあるかもしれないが
他人の書いた文章をお前の怠慢で改竄して公開する権利は無い
0954無名草子さん垢版2023/01/01(日) 23:56:48.77
逐次更新と簡単に言うけど
少なくとも従来のシステムでは
技術的にも人手的にも簡単なことではなかった

それに青空文庫は出鱈目で信頼性が低いと酷く叩かれた過去だってある

新システムでファイル差し替えがどの程度容易になるかは分からないが、
それに甘んじず校正はきちんとやって信頼度の高いものを提供した方がいい
0955無名草子さん垢版2023/01/01(日) 23:58:02.24
>>953
え?
すでに次世代デジタルライブラリーでOCRによって改竄(いわゆる誤検出)された作品が大量に公開されてるよ
「悪質」かどうか誰が決めるの?
0956無名草子さん垢版2023/01/02(月) 00:00:25.46
というか951は工作員なのか読者なのかどういう立場で言ってるのか気になる

工作員だったら自分の作業には責任も誇りも持って受け持ってると思うので、なかなかこの発想にはならんと思うんだな
0957無名草子さん垢版2023/01/02(月) 00:03:05.72
>>955
次世代デジタルライブラリーはそれ自体が研究検証目的の実験的取り組みだ

同列には語れん
0958無名草子さん垢版2023/01/02(月) 00:05:00.38
>>951
底本をもたずに無料で読みに来る読者に細かい間違いを指摘させるってどんな無謀な期待よ
0959無名草子さん垢版2023/01/02(月) 00:06:36.71
>>956
誇りを持つのは自己満足で勝手にどうぞって感じだけど、責任はなんにも背負ってないでしょ。
それとも賠償責任とか負うの?
学術論文で引用された作品が間違ってたら署名つきで謝罪するとか?
あまり言葉遊びしないほうがいいと思うよ
0961無名草子さん垢版2023/01/02(月) 00:19:35.24
>>955
次世代デジタルライブラリーは「実験的な検索サービス」と謳ってるように青空文庫みたいな読むためのものではないし
OCRテキストと資料の画像を紐付けることによって内容の正確性を担保(補完)してる

それに公開時点で誤字・脱字・衍字があった時点で単純に悪質なのよ
0962無名草子さん垢版2023/01/02(月) 00:28:34.68
そのへんの感覚が希薄な耕作員がいるとしたら恐ろしい
0963無名草子さん垢版2023/01/02(月) 00:31:27.81
>>961
紙書籍の考えを引きずらなくていいと思うよ
間違ってたら更新すればいいだけ

紙書籍はハードウェアなので配布してしまったものを簡単に修正できないけど、
Web書籍はソフトウェアなので簡単に修正できる

青空文庫はなんの社会的責任も負っていないし、
ましてや君主でもないので「綸言汗の如し」のことわざはまったく当てはまらない
0965無名草子さん垢版2023/01/02(月) 00:40:19.52
>>963
で、その更新(修正)前に読んだ人にはどう対応するつもりなの?
その誤字部分のせいで駄作だと思われたら確認にも来ないよね?
0966無名草子さん垢版2023/01/02(月) 00:43:01.62
間違ってたらデータを更新すればいいだけだからこそ公開までに何人もの目を通して修正を施してるんでしょ
0967無名草子さん垢版2023/01/02(月) 01:00:08.06
>>965
今も対応してないでしょ
てへぺろで十分
0968無名草子さん垢版2023/01/02(月) 02:06:09.13
ocrの認識率が99%だとして、百字に一字も誤字がある文章なんて読めたもんじゃないから、そのまま公開しても「ざっと読める」クオリティには到底ならないと思う
現状は「ざっと読める」ようになるまで結局誰かの校正が必要。だとすると今とそんなに手間は変わらないんじゃないか。
ocrの認識率が今後伸びればまた違うのかもしれないが。

ただ、みん翻みたいな感じでみんなで校正できたらそれはそれで楽しそうだとは思う
けどそのシステムの実装のために式年遷宮が5年くらい伸びそうな気もするな。
0969無名草子さん垢版2023/01/02(月) 07:32:01.37
>>954
の言う通り従来のシステムでは逐次更新そのものが面倒というのもそうだが、
青空文庫本体を更新したとしても、そこから作られて別なサーバに置かれてるファイル、
たとえばKindleで無料でダウンロードできる(赤と黄色の表紙の)ファイルなんかは
古いままだから、そっちを利用してる人は古いファイルを使い続けることになる
という問題もある(実際、青空の方は直ってるのにKindleの方だけ見て誤字がーって
愚痴ってる人を見たことがある)
よく知らんけど、公共図書館の電子図書館とかにあるファイルもそんな感じなんじゃない
だとしたらやはり現時点では公開の前に十分なチェックが必要かと思う
0970無名草子さん垢版2023/01/02(月) 07:58:35.68
>>969
青空文庫の最新版と同期を取る仕組みが必要って話でしょ
いつまでたっても古いままってのはどのみち問題なわけで。
公開前の十分なチェックとかやってるといつまで経っても10~20年物の待ち状態の作品をさばけないと思う
0971無名草子さん垢版2023/01/02(月) 10:24:56.27
複数の工作員が校正を共同で作業してるのはたまにあるよね
0972無名草子さん垢版2023/01/02(月) 12:09:56.37
>>967
十分じゃないから最初の公開までに点検なり校正なりしてるんだけどそれが分からないの?
0973無名草子さん垢版2023/01/02(月) 12:13:37.34
適当でおk派はウィキソースに行ったほうが幸せになれるぞ
0974無名草子さん垢版2023/01/02(月) 12:38:50.63
公開してからバグがあると問題であるとするなら

非公開サイト内で一般人に近い環境でファイルを読む、
テスターあるいはデバッガーとしての耕作員活動を募るというのはどうだろう

いずれにしてもボランティアだから
読みやすいものに査読者が偏るだろうけど
0975無名草子さん垢版2023/01/02(月) 12:54:11.23
OCRから読み取るのと電子ブックからコピペしたのを貼り付けるのと何が違うんだろう
文章が全く同一の場合は何も変わらないのだろうか?
0977無名草子さん垢版2023/01/02(月) 13:13:07.19
漢数字の「二」がカタカナの「ニ」になってたりすると
ocrに読み込ませて失敗したななんてことは思います
0978無名草子さん垢版2023/01/02(月) 13:31:26.32
一般人から、書写者(早口で三度言えたらお前の勝ち)へ誤字をフィードバックする仕組みを作れよ。
0979無名草子さん垢版2023/01/02(月) 13:55:56.90
>>978
それはホントに思う
kindleとかは誤字を簡単に報告する仕組みが出来てるけど
そんな感じで「これ、おかしいんじゃない?」って思うのを
気軽に送信してチェックしてもらえると嬉しい。

ちゃんと底本確認してから報告しろと言われるとハードルが
とてつもなく上がる。
0980無名草子さん垢版2023/01/02(月) 13:56:54.35
たださ、青空文庫ではウィキソースと違ってママ注記を乱発しないんだよ

現代の用法と照らして間違ってるというだけでは、青空文庫ではママ注記しない

誤字通報フォームには、「□利用規約に同意します」よろしく
その旨(青空文庫の公式な「誤字、誤用」に対する考え方)理解を求めないとならんだろう
0982無名草子さん垢版2023/01/02(月) 14:02:14.26
その仕組みがないために誤字だらけの作品を公開し続けるのも
不味いのではないかなんて思うのですが
その辺は皆さんどうお考えでしょうか?
0983無名草子さん垢版2023/01/02(月) 14:03:24.64
自分がその気軽な連絡を受けてチェックする側にいても同じこと言えるの?
0986無名草子さん垢版2023/01/02(月) 14:10:35.10
一般読者は>>980を理解してない

だから同じ件や類似の件に何度でも報告してくる可能性がある

同じだからといってテンプレ対応はできない
報告が本当に単なる誤植なのかどうか、ママなのか、注記なしなのか、底本や親本を探してくるのもこちら、
該当箇所にあたって判断しなくちゃならないのはこちらだ

これを一件ずつな
0989無名草子さん垢版2023/01/02(月) 14:47:19.75
>>986

こちらってのは青空文庫側ってことか?
もちろん厖大な誤字報告に対応できるくらいの人手があればできるだろうけど、ないんだから現実的に無理じゃん。
そもそも底本確認することがハードルになるほど難しい事とは思えないから
報告者が底本まで確認して連絡するのが妥当だと思う。

どんな事だって間違いするときは客観的な根拠を示すのがフェアなんだから。
0991無名草子さん垢版2023/01/02(月) 15:32:42.06
>>989
それほどハードルが高くないって思われるなら
そういう方にその役割を担っていただきたい。

読んで誤字を見つけるのが得意な人もいれば
底本を入手しやすい立場でチェックを得意とする方もいるだろうし
うまく得意分野を合わせて問題解決してほしいです。

誤字だらけの作品を公開されているのは
いくら著作権が切れてるといえ
作者は不本意だとおもうのですが。
0992無名草子さん垢版2023/01/02(月) 16:00:26.64
「作者は不本意」も何も遺族は訴えられるからね
著作者人格権の侵害は500万円以下の罰金だし
0993無名草子さん垢版2023/01/02(月) 16:00:42.10
おお、ここはOCRを校正に使えると思っている幸せな人をたしなめるスレですね
0994無名草子さん垢版2023/01/02(月) 16:04:42.70
誤植確認申請フォーム的なのを作るとしたら図書カードのURLや本文の該当箇所をテキストで入力する以外に
底本画像の該当ページと奥付の添付も必須にすればだいぶマシになるとは思う
(出版後70年経過してない場合の対応に困るんだけど)

流石に捏造する愉快犯は出てこないでしょ
0995989垢版2023/01/02(月) 16:10:39.13
>>991
そもそも自分でチェックせずになぜ誤字と判断できるのかわからんな。

「誤字かも」「誤字な気がする」とかそんなレベルの連絡に対応するのは人手があればやれるのは確かだが
だとしても本来、やる筋合いはない。
0996無名草子さん垢版2023/01/02(月) 16:14:54.20
遺族から「ここがおかしい」と言われたら直せばいいだけでしょ、
回収せずに改修できるのがWeb書籍の強み
回収が容易でない紙書籍とは違うのだよ、紙書籍とは
0997無名草子さん垢版2023/01/02(月) 16:17:58.47
工作員としてやることがなくなるととなんかみんな変な感じになっちゃうな
0998無名草子さん垢版2023/01/02(月) 16:18:11.20
>>993
なにいてんの?
使えるのに使えないと誘導しようとしてるのかね
悪質だねぇ
0999無名草子さん垢版2023/01/02(月) 16:23:16.21
>>996
その杜撰さで運営したら誰も見向きもしなくなるって想像つかないの?
10011001垢版Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 243日 19時間 9分 5秒
10021002垢版Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況