Unix 辞書ソフト総合スレッド 第二版

NGNG
Unixで辞書ソフトを活用するための情報交換スレッドです。


前スレ:
Unix 辞書ソフト総合スレッド
http://pc5.2ch.net/test/read.cgi/unix/1005185290/

リンク等は>>2-3
2006/02/26(日) 00:18:37
>>462>>464の誤爆なの?
自演じゃなければ、何を突然言い出しているんだか、わけわかめ。
2006/02/26(日) 00:25:32
いや、外字部分をちゃんとunicode化する
個別コンバータが要るかもしれないけど、そこは泥臭い作業で乗り切る
2006/02/26(日) 07:44:03
まあ断言してもいいがそんな香具師は出て来んだろうな。
一つやれば全部に使えるならまだしも、現実には外字番号は各辞書バラバラ。
そもそもepwing対応の辞書自体が減る一方だし。

462は早い話が「普及しません」と言ってるわけ。
2006/02/26(日) 12:09:10
一人が一日くらい作業すれば辞書1つくらい対応できるだろ
で、広辞苑とかリーダーズとか主だったところが揃えば既に実用の域だ
2006/02/26(日) 12:34:03
>>462は自分が亀レスであることに気付いてないんじゃないか? > 「つか、」
2006/02/27(月) 02:35:49
>>468
そんなに簡単なら是非自分でやって公開をおながいします。
2006/02/27(月) 03:03:02
辞書版 wikipedia みたいなのがあると良いね。wikipedia と同じ問題を抱えそうだけど。
2006/02/27(月) 04:25:37
wiktionaryというものは既にあるが影は薄い。

私見だが、wikipediaは半可通が語りたがる心理を活かして成長しているので
語彙だけを地道に集める辞書との相性は必ずしも良くないようだ。
2006/02/27(月) 19:04:52
コンバートとマージでいいじゃん
2006/02/27(月) 21:30:31
>>468みたい奴を見るとぶん殴ってやりたくなる。
2006/03/01(水) 02:37:52
epwing形式で自作辞書を作りたいんですけど、書式などはどうすれば
いいですか?いったん別に形式で作成して、なんらかのツールで変換
した方が簡単でしょうか?
いつもはlookupを使っているので、それで検索できる形式ならepwing
にはこだわらないです。

例えば、以下のような形式をepwingで書くとどうなるでしょうか?
(画像、音声も表示、再生されるようにしたいです。)

Ruby
[読み] ルビー るびー
[分野] 鉱物 プログラミング
[意味1] 宝石の一種。
[意味2] プログラミング言語。開発者は日本人。
[例文1]
Rubyはスクリプト言語だよ。
[例文2]
I like Ruby very much.
[発音] /home/hoge/sound/ruby.mp3
[画像] /home/hoge/photo/ruby.jpg
2006/03/01(水) 03:39:04
とりあえずEBStdioのページ見て。
2006/03/01(水) 10:44:44
FreePWINGも
2006/03/01(水) 13:26:02
>>476
>>477
どうもありがとうございます。FreePWINGのドキュメントが参考になりそうです。
なかなか難しそうですね…。たぶんできそうだけど、面倒かも…、って感じです。

これこれこういう書式で書いて、このツールで変換すれば簡単にepwing形式にな
るよ、ってのを期待していたんですけど世の中あまくないですね。

それにしてもEBStdioって検索しても直接出てこないんですね。ちょっとビックリ。
2006/03/01(水) 13:53:28
EBStudio だからじゃないですか?

すたんだーどあいおー じゃないよ
2006/03/01(水) 14:18:02
> これこれこういう書式で書いて、このツールで変換すれば簡単にepwing形式にな
> るよ、ってのを期待していたんですけど世の中あまくないですね。
これがまさにEBStudioだと思うんだが
2006/03/01(水) 15:55:37
>>476はCプログラマ(w
2006/03/01(水) 16:19:22
>>479
>すたんだーどあいおー じゃないよ

ガビ━(゚Д゚;)━ン!
なんの疑いもなくEBStdioで検索してました…。C言語の勉強してたんで
それが影響したか…。

そうですか、EBStudioが簡単に変換できそうですか。できれば、Linux上
でやりたかったのでFreePINGでやろうと思ったんですけど、EBStudioも
いじってみます。wineで動くといいんだけどなぁ。

2006/03/02(木) 08:08:58
>>482
ふりーぴんじゃないよー
2006/03/02(木) 09:35:57
妙にチャンポンになるなぁ
2006/03/02(木) 18:56:13
>>483
>ふりーぴんじゃないよー

たびたびの勘違い、反省します…
(´・ω・`)
2006/03/17(金) 02:13:08
最近のIC電子辞書は安いお値段でアホみたいに大量の辞書が入ってるよなー。
何とかPCでも、できればうにくすでも使えるようにならんものか。
2006/03/17(金) 09:34:49
それができないから、ハード的にプロテクトされているから安く売れる
その代わり、新しくする時はまるごと買い替え
2006/03/20(月) 15:28:29
どうせならIC電子辞書にUNIX/LINUX載せること考えてみないか?
489名無しさん@お腹いっぱい。
垢版 |
2006/04/09(日) 11:21:14
age
2006/04/09(日) 22:04:33
辞書をgrepしたいなあ
perlでふぃるたかけたいなあ
2006/04/09(日) 22:36:48
そうやってしゃぶり尽くしてこその辞書なんだけどな
2006/04/20(木) 11:05:22
例辞郎はどう使ってる?
493492
垢版 |
2006/04/20(木) 22:07:02
EPWINGに変換し、Lookup から

* ndtp+localhost:ryaku/ryaku 略辞郎 =<>^

な風に見えるようにはなったけど、検索メソッドに「部分一致」や「全文検索」
を追加する方法がわからないので今一使い勝手が良くないです。

英辞郎やスーパー統合辞書98では部分一致や全文検索メソッドを有効にするに
はどしたらいいの?



494492
垢版 |
2006/04/20(木) 22:09:53

>>493 のは

* ndtp+localhost:reijiro/reijiro 例辞郎 =<>^

と書くつもりが間違えました。スマソ。
2006/04/20(木) 23:05:35

EPWINGの辞書には「部分一致」や「全文検索」の為のインデックスはないので、
少なくともちょっと設定だけしてできるようになったりはしません。
2006/04/20(木) 23:15:51
袋小路ですな。
497492
垢版 |
2006/04/21(金) 09:32:03

>>495 ありがとうございます。もやが晴れました。

英辞郎 on th Web や、namazu、grep などと併用するのが良さそうですね。
2006/04/21(金) 12:52:49
>>486
> 最近のIC電子辞書は安いお値段でアホみたいに大量の辞書が入ってるよなー。

PCと通信する手段はまったく何もないの?
2006/04/21(金) 13:19:33
>>498
ケーブルでつないで通信とかはできないよ。
2006/04/21(金) 13:32:43
分解してデータ読み出しは?

それなりに数が出ているのなら、ジャンク屋に壊れたのが
100円で転がっていたりしないかな。
2006/04/21(金) 13:51:49
>>500
ぜひやってみてくれ。
2006/04/21(金) 16:36:23
それより最近の電子辞書ってSDカードで辞書追加できるじゃん
あれの解析とかのほうが簡単そうじゃない?

EPWING版だと版が古いのばかりで最新のデータがなかなか
PC向けの媒体じゃ手に入らないのが多い
2006/04/21(金) 18:39:40
ただのマスクROMだしな
簡単な回路で読み出せるよ
電子辞書を読み出してテキスト化してepwing化すると、
なかなかおいしいと思う
2006/04/21(金) 22:29:11
あなあさまし
2006/04/21(金) 23:28:07
だってPC用辞書として売ってないし
新品購入即解体でも構わない
2006/05/05(金) 21:24:23
みんなで英次郎を買おう!
2006/05/05(金) 22:34:20
えいじろーって、たまに腐った訳語があったから、
二度と買わなくなった。
一応、報告だけはいれといたけど、反映されたかどうかは不明。
2006/05/05(金) 22:51:41
英痔瘻は中身は同じなんだろうけど
準フリーにしては驚異的に優れた辞書→プロプラにしてはどうしようもなく使えない辞書
と変化したんだな
2006/05/05(金) 23:03:16
今winnyで出回ってる最新はどれ?
2006/05/05(金) 23:06:59
モレは他の辞書と併用してるな

>>509 winnyで入手するのって違法じゃないの?
2006/05/06(土) 00:35:23
流すのは違法だけど、落として使うのはok
512名無しさん@お腹いっぱい。
垢版 |
2006/05/06(土) 00:54:55
そうだっけ?まあどうでもいいが
2006/05/06(土) 10:44:35
これだけ流出被害があるのに、
マスコミが「ウィニーは違法だから止めましょう」とは言わずに
「ウィニーを使うのはリスクがある」としか言わないのはそのせい
2006/05/06(土) 15:51:26
使うことは違法じゃない場合もあるから
としか言えないな
2006/05/06(土) 19:06:52
>>513
それはウソ。ウィニーそのものには違法性がないというだけ。
まあどうでもいいが。

知っての通り、某辞郎自体も中身はちょっと灰色だから
あまり強くは出られないだろうけどね。
2006/05/07(日) 11:25:50
つーか英辞郎って金出してまで使う辞書じゃないだろ
訳語そのものもパクりだし訳例なんか使えたもんじゃない
2006/05/07(日) 11:42:54
>>516
パクリなの?
例えば間違いがそのままパクられてるってこと?

2006/05/07(日) 12:15:49
>>516
作った人間が金よこせって言ってんだから
金出さないなら使うなってこった
違うか?
2006/05/07(日) 14:11:08
パクってない辞書なんかない
2006/05/07(日) 15:03:29
>517
英語板あたり行くとこれでもかって例があるんじゃないかな?
英語板自体痛いんで、見に行こうと思わんけど(w

用例とか思いっきりパクってますな。間違いもそのまんまってのあったと思う(どの語だったか忘れたが)
521名無しさん@お腹いっぱい。
垢版 |
2006/05/07(日) 22:07:59
Windows版FirefoxとかThunderbirdでebviewのポップアップ検索すると、
ebview落ちない?ウチだけか?
522名無しさん@お腹いっぱい。
垢版 |
2006/06/02(金) 13:12:00
広辞苑第四版 CD-ROM マルチメディア版を ebzip すると
以下のようなエラーにで止まってしまうのですが,
原因がわかる方おられますでしょうか?
ディストリは Gentoo Linux で ebzip は v4.2 です.

$ mount /dev/cdrom /tmp/a
$ cd /tmp/a
$ mkdir /tmp/b
$ ebzip -z -l 5 -k -o /tmp/b
...[snip]...
==> compress /tmp/k/FUROKU/GAIJI/GA48FULL <==
output to /tmp/k2/FUROKU/GAIJI/GA48FULL.ebz
completed (724992 / 724992 bytes)
724992 -> 233106 bytes (32.2%)

ebzip: failed to read the file, Invalid argument: /tmp/a/KOUJIEN/DATA/HONMON
2006/06/06(火) 00:20:22
>>522
こういう時のログはコピペで貼った方がいいよ。
コマンドとログでディレクトリが違う。

それは置いておいて、そのCD-ROMに特有の不具合があるという話は知らない。
・EB libraryを使用したツールでCD-ROMの辞書は直接ひけるのか?
・環境変数EB_DEBUGを指定してから実行した場合の出力は?(膨大な量になるので注意)
・大丈夫という事になっているけど、もしファイル名が全て大文字に
なっていなければどこかにコピーして全て大文字にリネームして実行。
524名無しさん@お腹いっぱい。
垢版 |
2006/06/08(木) 12:04:55
>>522
すいません. k=a, k2=b とみてください.

CD-ROM から直接引くことはできます.
エラーにもかかわらず HONMON.ebz はできていて,
CATALOGS だけがないようなので,
CD-ROM からコピーしてやると引けるようになります.

ファイル名は大文字になっていますし,
念のため CD-ROM の中身を /tmp/a にコピーしてみても
結果は同じでした.

EB_DEBUG を指定して実行してみましたが,
どこが有用な情報かよくわかりませんでした.
ログを抜粋すると以下のようになります.
525名無しさん@お腹いっぱい。
垢版 |
2006/06/08(木) 12:05:29
>>523
ログ

[EB] in: zio_close(zio=45)
[EB] out: zio_close()
[EB] in: zio_finalize(zio=45)
[EB] in: zio_close(zio=45)
[EB] out: zio_close()
[EB] out: zio_finalize()
[EB] in: zio_finalize(zio=-1)
[EB] in: zio_close(zio=-1)
[EB] out: zio_close()
[EB] out: zio_finalize()
[EB] in+out: zio_mode(zio=23) = 0
[EB] in: zio_initialize()
[EB] out: zio_initialize()
[EB] in: zio_open(zio=-1, file_name=/tmp/a/KOUJIEN/DATA/HONMON, zio_code=0)
[EB] in: zio_open_plain(zio=-1, file_name=/tmp/a/KOUJIEN/DATA/HONMON)
[EB] out: zio_open_plain(zio=46) = 5
[EB] out: zio_open() = 5
[EB] in: zio_lseek(zio=46, location=-2048, whence=0)
[EB] out: zio_lseek() = -1
ebzip: failed to read the file, Invalid argument: /tmp/a/KOUJIEN/DATA/HONMON
2006/06/08(木) 16:29:52
ebzipの最後にCATALOGSファイルをコピーするところで何故かHONMONファイルに
アクセスに行っているようなので対処としてはそれでokです。
可能なら4.2.2にバージョンアップして再現するか確認して下さい。

駄目ならCATALOGSファイルをcatdumpして晒して下さい。
527名無しさん@お腹いっぱい。
垢版 |
2006/06/09(金) 15:33:38
>>526
v4.2.2 でも同じでした.
catdump CATALOGS は以下のようになりました.

; 電子ブック/EPWING カタログ内容 (generated by catdump/Perl v1.4.4)

[Catalog]
FileName = CATALOGS
Type = EPWING3
Books = 6
BookSelect = 6

[Book]
BookType = 0003 (00:国語辞典, 03:EPWING3)
Title = "広辞苑 第四版"
Directory = "KOUJIEN"
InfoBlock = 0001
ZenGaiji = "GA16FULLGA24FULLGA30FULLGA48FULL"
HanGaiji = "GA16HALFGA24HALFGA30HALFGA48HALF"
BookFile = "HONMON"
Reserved1 = 002B002B

[Book]
BookType = 0001 (00:国語辞典, 01:EPWING1)
Title = "付属資料"
Directory = "FUROKU"
InfoBlock = 0001
ZenGaiji = "GA16FULLGA24FULLGA30FULLGA48FULL"
HanGaiji = "GA16HALFGA24HALFGA30HALFGA48HALF"
528名無しさん@お腹いっぱい。
垢版 |
2006/06/09(金) 15:34:33
>>527
[Book]
BookType = F003 (F0:ストリーム, 03:EPWING3)
Title = "「広辞苑」紹介"
Directory = "KOUJIEN"
StreamFile = "PLAY"
Reserved1 = 00500050

[Book]
BookType = F003 (F0:ストリーム, 03:EPWING3)
Title = "EPWING 紹介"
Directory = "EPWDEMO"
StreamFile = "PLAY"
Reserved1 = 00500050

[Book]
BookType = 6002 (60:一般書物, 02:EPWING2)
Title = "EPWING電子カタログ"
Directory = "EPWCTLG"
InfoBlock = 0001
ZenGaiji = "GAI16F\0\0GAI24F"
HanGaiji = "GAI16H\0\0GAI24H"
BookFile = "HONMON"
Reserved1 = 00090009

[Book]
BookType = F002 (F0:ストリーム, 02:EPWING2)
Title = "書籍選択"
Directory = "SCREEN"
StreamFile = "SELECT"
Reserved1 = 00100010
529526
垢版 |
2006/06/09(金) 16:22:54
すみません、こっちの推測が間違っていました。
"「広辞苑」紹介"の部分のコピーで止まっているようです。

とりあえずの対処としてはCD-ROMからの直接ebzipはあきらめて
CATALOGSファイルを作り直す必要がありそうです。

・catdumpでできたテキストから"「広辞苑」紹介"の[Book]ブロックを削除。
・先頭の
Books = 6
BookSelect = 6
をそれぞれ1つへらして5に変更してCATALOGSファイルを作ってみて下さい。
・もし、他のストリーム系の書籍の所でもエラーが出る様なら同様に削って
CATALOGSファイルを作ってみてください。
2006/06/09(金) 19:16:10
>>529
ありがとうございます.
おっしゃる通りに作り直したらエラーにはなりませんでした.
結局これは ebzip のバクだったんでしょうか?
531526
垢版 |
2006/06/09(金) 22:18:49
EB libraryのバグです、多分。
ストリームと辞書が同じディレクトリの中に存在する(今回の場合は
"広辞苑 第四版"と"「広辞苑」紹介")という構成を想定していないようです。
そのCD-ROMはおそらくebinfoでもエラーが出る筈です。
532m-kasahr
垢版 |
2006/06/17(土) 01:43:47
ひとまず、>>531 のバグは、手元のソースでは直しました。
で、修正版のリリースのついでに、

http://hishida.pro.tok2.com/bbs_ebppc/wforum.cgi?pastlog=0003&no=1075&act=past&mode=allread#1118

で語られている、データディスクマン DD-S35 の不具合 ([No.1075] のあたり)
についても一緒に直しておきたいのですが、どなたかこの CD か、あるいは
同種の症状を抱えた CD をお持ちで、ご協力頂ける方いらっしゃいませんか?
533名無しさん@お腹いっぱい。
垢版 |
2006/06/19(月) 15:09:06
英辞郎95を買おうと思うのですが、lookupで使えますでしょうか。
2006/06/19(月) 20:31:48
>>533
EBStudio か FreePWing で JIS X4081 形式に変換すると使用できます。
2006/07/09(日) 21:01:07
ロワイヤル仏和をdoze経由でepwing化。
さすがにクラウンじゃキツくなってたんだが、これであと10年はうにくすで過ごせそう。
ありがたや。
2006/07/10(月) 15:03:57
最近、lookupの開発盛んだね。
2006/07/12(水) 16:51:16
どこで?あわててcvsチェックアウトしてみたけど、更新ないみたいなんですが…
2006/07/12(水) 17:40:03
おなじく
2006/07/12(水) 23:20:56
ttp://green.ribbon.to/~ikazuhiro/lookup/lookup.html
ttp://tty0.exblog.jp/3830589/
ttp://tty0.exblog.jp/3839624/
ttp://tty0.exblog.jp/3847674/

eblookへのパッチも必要。
ザウルスでもちゃんと動いてるっぽい。
2006/07/13(木) 22:48:43
神降臨!!
是非メンテナに立候補して、本家でやってほしい。
2006/07/14(金) 00:32:41
げ、もしかしてザウルスってX動いてるの?
時代に取り残されてた。ショック。
2006/07/19(水) 21:12:13
LDOCE、COBUILDをEPWINGに変換するには
EBStudioが必要。つまりWin環境でないと駄目ってことですよね
2006/07/19(水) 23:15:55
FreePWingでもなんとかなるよ。
2006/08/04(金) 16:33:27
なんかもう全部DBに突っ込んでSQLで検索すればいいんじゃねぇかって気になってきた
545名無しさん@お腹いっぱい。
垢版 |
2006/09/11(月) 21:53:12
南山堂のプロメディカと医学書院の医学大辞典を使ってるんですが、UNIXでも使いたくて、何とかEPWINGに変換されないものかと考えています。
そんな方法は今のところないですかねぇ?
Jammingっていう辞書検索ソフトでは一応対応しているみたいなので不可能ではないかとは思うのですが・・・。
2006/09/12(火) 07:53:21
Jammingってプロプラエタリだからなあ。作者はがんばってデータ解析を
しまくってるみたいよ。
電子辞書オープンラボのMLに投げてみて、太田さんが興味を示して
くれたらどうにかなるかもね。

547名無しさん@お腹いっぱい。
垢版 |
2006/09/12(火) 09:05:26
>>545
> そんな方法は今のところないですかねぇ?

っ[それを欲しいものがそれを作る]
2006/09/15(金) 17:10:25
辞書の八苦なんて陳家なことやっとらんで、手っ取り早く翻訳ソフト頼む
2006/09/15(金) 18:10:30
>>548

っ「それを欲しいものがそれを作る」
2006/09/15(金) 19:26:20
辞書の解析と対応ってどちらかといえば開発というよりは土方作業になるから
後になるほどオプソモデルよりもプロプラ・シェアウェアモデルの方が機能するようになるというのは
わかるような気もする。
2006/09/16(土) 01:25:40
おまえら、ちゃんと日本語を喋ってくれ、頼む。
2006/09/16(土) 02:26:19
なんのための辞書だ
2006/09/17(日) 03:41:18
辞書引くアプリは何使ってますか?
自分はemacsではlookup、
firefoxではletmeseeです。
2006/09/17(日) 18:14:17
我輩は コマンドラインからも vi からも ndtpc を使用。
単独アプリとしては ebview を愛用。
2006/09/17(日) 22:52:39
CGI-BIN用perl script, forestをweb browserから。
556名無しさん@お腹いっぱい。
垢版 |
2006/09/27(水) 17:59:23
カタログを編集して辞書をひとつにまとめたいんだけど、EBXAとEPWINGが混在してて困ってます。
EBXAからEPWINGへの変換(もしくはその逆)ってどうやるか知りませんか?
2006/09/28(木) 02:13:31
>>556

http://openlab.jp/edict/epwutil/
2006/09/28(木) 14:47:47
>>カタログを編集して辞書をひとつにまとめたいんだけど
Catalogs ファイルが1つになって、1つの親ディレクトリ
の下に start と data/honmon が置けるだけで、それら
が1つのファイルの辞書になるわけではありません。
どうしてもと言うなら、EBXA と EPWING からデータ(テキスト等)
を取り出して、それらを1つにして、更にそれを EPWING に
変換する必要がありますョ。
559名無しさん@お腹いっぱい。
垢版 |
2006/10/01(日) 09:14:05
>>557-558
レスありがとうございます。説明不足だったようですみません。
ぼくがやろうとしているのは、カタログをひとつにまとめて整理するってだけのことなので、辞書がひとつになってほしいというわけではありません。
で、その為に557さんも教えてくれたEPWUTILですべてのCatalogsをテキストに直したんですが、どうもEBXAのCATALOGSはテキストに直らないみたいだったんで、EPWINGに直せないかなぁと思った次第であります。
EBXAとEPWINGは似たような規格だということだったので、すでにツールがあるのかもしれないと思い、質問させていただきました。
2006/10/02(月) 08:39:09
ebutilsはS-EBXAの非圧縮までは対応している筈。
ただし、対応していたとしても規格が異なるもの同士なので、
EPWINGと一つのカタログファイルにはできないと思うけど。

2006/10/04(水) 12:57:25
本文ファイル (EBXA の start, EPWING の honmon) のデータ形式は、微妙に異なります。
なので、カタログファイルを一まとめにすることはできるかも知れませんが、閲覧ソフトから
はまともに読めなくなると思います。

>>560 の言いたいことも、たぶん同じかな
2006/10/04(水) 13:20:12
>>559
その失礼な態度はやめたほうがいいと思われ
2006/10/04(水) 13:33:37
失礼というより馬鹿そうな書き方はやめた方がいいだろな。
2006/10/04(水) 14:02:14
>>559
少し手間をかければやりたいことは出来るんだから
カタログだけに拘る必要ないでしょ
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況