Unix 辞書ソフト総合スレッド 第二版
Unixで辞書ソフトを活用するための情報交換スレッドです。
前スレ:
Unix 辞書ソフト総合スレッド
http://pc5.2ch.net/test/read.cgi/unix/1005185290/
リンク等は>>2-3
すいません。
letmeseeの最新版をCVSからとってきたら、正常に動作いたし真sちあ。 >>297
> あと、とりあえず letmesee-1.1rc3 より letmesee-1.1 の方が新しいから、
> そっちでやってみたら。
letmesee-1.1でも対応してないのですよ。
letmesee.conf.sampleにappendixに関する表記がないので、
CVS版だと表記があるので大丈夫なのでした。
こういうのは作者の方に連絡すれば、対応していただけるのでしょうかね。
とりあえず、ご迷惑おかけしました。
>>299
CVS版で対応してるなら,
無理にリリースしてもらわなくてもいいのでは?
俺は ndtpd で辞書を一元管理したくて forest 使ってる. rdic、正規表現検索の部分だけでも無理にrubyでやらずにgrepか何かにまかせれば
ぐんと軽快になると思うんだけど、だめなのかな。 考えてみりゃ、単にgrep|lessすればいいんだから
別にrdicを通す必要もないか。 letmesee で英単語検索するときに
stemming するラッパー書いた。perl で。
これと firefox の superdragandgo でずいぶん
英文読むのが楽になった。 debian にあった libtext-english-perl という
Porter stem アルゴリズムのライブラリを使って、
cgi で単語を受け取って、stem して、
letmesee の url で refresh しただけというやつです。
ruby がわからんので perl -> ruby という皮肉な受け渡しになってます。 なんかRubyスレの自動生成荒らし文みたいだなぁ。 >>301
> rdic、正規表現検索の部分だけでも無理にrubyでやらずにgrepか何かにまかせれば
> ぐんと軽快になると思うんだけど、だめなのかな。
うひ……うひょほほほ……うぁわは なんでここは過疎化しているのだろう?こんなに便利なツール紹介してるのに。不思議。 使う辞書もソフトも安定してくると、
日常的に使ってても話題がないよ。 EB-lab はいい仕事をしたな。
これがあるから、この板でわざわざ相談するようなことはほとんど出て来ない。
使うだけ。
独自仕様の横行は嘆かわしいが、これはどうにもならんし。 あ、なるほど。そう言われてみればまったく不満はないですね。EPWING対応の買ってくればまず動くし。
革命的な事でも起こらない限り盛り上がらないのも仕方ないのか・・・ パソコンで辞書ってほとんど必須というか、
これこそコンピュータの利点だと思うんだけど、
意外となくても困らない人多いみたいね。
unix ユーザの何割くらいが辞書使ってるんだろ。 unixユーザ≠unixをクライアントとして使う人
であることに留意。
その方面で盛り上げたいなら犬板が向いているぞよ。 unixユーザ=unixをクライアントとして使う人。
クライアントが何を意味しているか知らんが。 俺はプログラミングとかで英文を読む時しか辞書使わないな。
職種や趣味によっては辞書を引かない人も多いと思う。
まあunixユーザは(Windowsとかより)英文を読む機会が多そうな気がするから、
わりかし必須かもしれないけど。 現代用語の基礎知識2005もハードディスクに突っ込むだけでlookupで使えるぜ!ヽ(゜д゜)ノ EPWINGってunicode対応してないの?
だから英語以外の外国語辞書に弱いのかな?
ウムラウト程度で外字扱いとかはさすがに
やばいだろ… EPWINGの規格が定まったのってUnicodeの規格が定まった時期より前じゃないか いやEPWINGって何度も規格拡張なり改定なりされてるじゃん
なんで何時までもunicode対応されないのかなと unicode 対応しても労多くして得るところはそれほど多くない。
それぞれの事情によって違うので好ましいと思う向きもあると思うけど
必要性はそれほど無い。 多言語が外字によってでしか扱えないのは辞書フォーマットとして
先が見えてるよ。 なら使わなければいいだろう。文句言うだけなら誰だって出来る。
おまえの糞みたいな脳内仕様を何かしらの形で具現化してからなんか言えよゴミ。
>>331
おまえのも少なくとも同程度にゴミなんですが。
多言語どころか日本のコード体系で表せないものは全てダメなんで、
中国語とか扱おうと思ったら悪夢ですな。
外字になったら表示はできてもコピペできないからどうやって入力したものかと
また手がかかるし。
いみじくも>>331のいうように、EPWINGはもう捨てるのが正解だと思う。
現在のニーズに合わせた辞書形式を統一しようという機運も出そうにないし(ベンダにうまみがない)。
ベンダにメリットが生じるようにさせるには、個々のユーザが
独自規格の辞書を避けて共通規格の辞書を買うように行動する必要があるな。 >>330
>多言語が外字によってでしか扱えないのは辞書フォーマットとして
私は、perlを使って欧米語や日本語で使われている外字に振られたコードを
Unicodeに変換するテーブルを作成して、EPWINGのデータを、Unicodeに変
換している。Emailでもコピー&ペーストができる。
いろいろ問題があっても、EPWINGは内部構造が事実上公開されているので、
プログラムが少しできる人間には、とても使いやすい。 アクセント記号や発音記号くらいならそれでもいいけど、
大量の漢字などが相手ではその手の対症療法ではどうにもならないと思うよ >>335
>大量の漢字などが相手ではその手の対症療法ではどうにもならないと思うよ
「大量」というのは、平凡社百科事典で使用されている外字の数かな?
平凡社百科事典は利用者が多いから、(不完全な?)外字変換テーブルは、
出ているのでは?
仮に「外字-->Unicode変換テーブル」を自作するとしても、内部構造が公開され
ていないMicrosoftの辞書や百科事典を自己解析して、Unixで使えるようにする労力
(3ヶ月以上かかる?)に比べれば、前者の作業は圧倒的に楽(1週間で終わる!) まあ欠点はあっても共通フォーマットとして認知されてるから
便利だけどね。 何か辞書が出るたびに一週間潰してその辞書にしか使えないテーブル作るか
誰かが公開するのをマダー? (・∀・)っ/凵⌒☆ チソチソ とか言って待つってこと?
やっぱり、そういうのじゃ先がないと思うよ。
それに、これってコンテンツ制作側にしてもいちいち
「その辞書にしか使えない外字テーブル」作らなきゃならない
ということでもあるから、ますますベンダにはメリットがない。
まあこれは辞書に限らず電子出版全体に関わってくる問題なんだけどね。 >>338
>やっぱり、そういうのじゃ先がないと思うよ。
<先>はなくても、<現在>はある?!
内部構造が公開されていないマイクロソフトなどの他の辞書は、
Unixでは使えないのだから、<現在>すらない。ベンダーも
マイクロソフトの辞書の規格で作成することが不可能だから、
ベンダーも同様に<現在>すらない。
>「その辞書にしか使えない外字テーブル」作らなきゃならない
Unicodeにある文字を使うのであれば、1つの共通の変換テーブル
があればOK。Unicodeにない<外字>を使うには、ベンダーごこに
外字テーブルを作成する必要があるだろう。 いや、新しい規格がいいものでみんな乗っかるなら
それは素晴らしいことで、私自身epwingに特に愛着あるわけでは無い。
ただ unicode ということであれば何の解決にもならない。
対症療法の最たるもので、良くなる部分もあるが
辞書を利用する上で現在よりかなり困る部分も出てくる。
(ここら辺はMLや各種論考でも文系の研究者によって挙げられているので
調査、参考にされたし。)
もちろんそれらを解決した新規格の策定には反対などしません。
# 現在、私たちのグループではその予備調査となるかもしれない
# 調査、研究を地道に行っています。 unicode がしょぼい仕様なのは知ってるけど、
あれで CJK の感じの統合問題とかがなければ
かなり理想的なコードだったといえるんでしょうか。 研究を地道にやっている間に世界は独自規格で埋め尽くされていた、
という落ちにならないことを祈ります。 つーかな
いい規格があってもそれに乗っかって辞書を発売してくれるかが全てだし
有志でフリーの優れた規格を作って、ツール類も整備しても、
肝心の辞書を有志で作れないから普及しない そういや、wikipediaってDVDにでも焼いて頒布して資金源にとかできんの?
規格普及もそういうところから攻めていけばいいと思うんだけど。 >>345
それいいね。各言語版が入って5000円切ってたら買えるかな。
するとターゲットは世界標準だな
誰か英語に堪能な奴を連れてきて、フリーの辞書規格を
作るプロジェクトを動かさないと タッグを組むならヨーロッパの小さめの国とかがいいぞ
英語圏は文化なんか向こうから来ると思ってるから、
辞書なんかに真剣になる訳がない 普通に英語圏は辞書の重要性は認識してるよ
辞典類を編纂する態度もフランス(のような大国を自称する小国)
がとる不遜な態度とは違って結構控え目だし
なんにせよEPWINGを規格拡張するなら言語コード拡張以外なにか
思いつく? 結構このスレ見てる人いたんだな。ちょっと安心したよ。 内部構造知らないからなあ
ファイル構成を見る限りでは、外字ファイルうぜーってだけだけど
音声とか画像とか動画も内蔵できるし
あ、数式とか表を画像としてじゃなくて、文字として出せて欲しいかな >>334
>いろいろ問題があっても、EPWINGは内部構造が事実上公開されているので、
その「事実上公開されている」ポインターを教えてもらえませんか?
コンソーシアムに金払わないと無理かと思ってたので。。。
(それとも、有償で公開されている、との意味??)
おお、なるほど。さんきゅー。
1890円か。。。図書館で借りよっと。 Unicodeは手軽に扱おうとすると、
(電子辞書辺りでの)フォントの準備が大変だね。
結局JIS+アルファなら、JISと外字って選択に今のところなるんだろうね。
まあ、どんどんUnicode化が進むでしょうね。
EPWINGはJIS or Unicodeのflagを用意するといいね。
あるみたい。
ttp://www.webstore.jsa.or.jp/webstore/Help/jp/JSAWebStoreUsage.htm#12
>規格・書籍等並びにJSA Web Storeの文章・画像・データは、著作権法により保護されています。 たかだか28ページに1890円はなあ
JSAの著作物としては著作権があっても、規格そのものには
著作権はないのでは ttp://www.geocities.com/mogukun/jis/copyright2.html
この辺の話か
ややこしい 「EBStudioにおけるJIS X4081の実装について」
には、その Core な部分が十分に説明されている。
日本工業標準調査会
http://www.jisc.go.jp/
データベース検索 -> JIS検索 で、
X4081
で検索すれば、PDF が閲覧(のみ)できます。
(そのままでの印刷は不可。)
(しかし、Cache には有る...)
>>これで必要十分?
両方読むべし。
ttp://www.jisc.go.jp/app/pager?%23jps.JPSH0090D:JPSO0020:/JPS/JPSO0090.jsp=&RKKNP_vJISJISNO=X4081 それを、print out したければ、そう言ってくれ。
ヒントくらいは出そう... まあ、プリントアウトくらいハードコピーでなんとでもなるけど、
文字じゃなくて画像データというのが、なんかいじましいな
pdfを何だと思ってるんだ 著作権が有る以上、閲覧だけを許可しているのであって、
本来、保存やプリントは考慮されていないのです。 クリックしたら真っ白なウィンドウが開いて、pdf ファイルのダウンロードが始まったんだけど、
これは想定外? >>365
print outしたいです!!
>>369
記憶もできないんじゃ、誰がどうやって実装しろと。
>>370
著作権で制限するんじゃなくて、著作権法をたてに配布方法を限定
してるだけだよね。けど、これって公益法人がメディアが紙中心だった
時代からの既得権益を必死で守ってるだけな気がするなぁ。
紙もpdfファイルも同じ値段ってとこが。
税金でやってる公共サービスじゃなくて、
誰かが天下って甘い汁を吸ってる利益団体なんだろうな
金が取れなくなると、その人が飢え死にする 規格は広く産業の土壌や肥やしになるものなんだから
こういうところにこそ税金を使って広く公開せにゃならんと思うんだが、
今の財政状況じゃ厳しいだろうなあ。 図書館に行って一部コピーすればいいじゃん
著作権上もOKだよ 既に議論は、あいつらムカツクという次元になってて、
内容を知るという意味では>>360で足りてるけどな
しかも見やすく整理されててJISよりよっぽどマシ letmeseeで、スーパー統合辞書2005だけ引けません(T-T)
rubyeb添付のtest.rbならひけるのに...
failed to open a catalog file (RuntimeError)
./letmesee.rb:71:in `bind'
./letmesee.rb:71:in `initialize'
./letmesee.rb:62:in `each'
./letmesee.rb:62:in `initialize'
/var/www/html/letmesee/index.rb:22:in `new'
/var/www/html/letmesee/index.rb:22
test.rbではbindに成功しています。
どなたか解決方法を教えてくださいm(_ _)m >>378
自己レスです
chcon -R root:object_r:usr_t /usr/local/share/dict/tougo
でいけました! >>362 についてなんですけど, キャッシュが見当たらないんですが...
Windows環境で見てるからでしょうか? キャッシュなんて消えることもあるんだし、素直にPDFを見ればいいじゃん。 Jungle デジタル類語辞典ってEPWING化できる? むしろすべての電子書籍をEPWING化できるスクリプト大募集中。 >>385
あそこのPDFって全部画像だから文字データに変換できないんじゃないの? この規格に関してはそうだが、エンコーディングまわりの規格とかになると
何考えとんじゃヴォケとしか言い様がないぞ