X



全文検索エンジンNamazu ver2
0001名無しさん@お腹いっぱい。
垢版 |
2005/04/11(月) 01:31:01
全文検索エンジンNamazuについてアレコレ

http://www.namazu.org
0195(^-^) ◆MONSOON/qo
垢版 |
2006/10/08(日) 05:27:21
インディックス作成時に読み込む文字種を正規表現で指定できますか?
記号は除外するとかです
0196名無しさん@お腹いっぱい。
垢版 |
2006/10/08(日) 07:47:34
mknmz -K

文字列処理:
-E, --no-edge-symbol 単語の両端の記号は削除する
-G, --no-okurigana 送り仮名を削除する
-H, --no-hiragana 平仮名のみの単語は登録しない
-K, --no-symbol 記号をすべて削除する

あとはソース書き換えかな
0197(^-^) ◆MONSOON/qo
垢版 |
2006/10/08(日) 11:58:48
>>196
どうもありがとう
0198名無しさん@お腹いっぱい。
垢版 |
2006/10/15(日) 10:14:17
NamazuをCGI(localhost)で利用しているのですが、検索結果と
して表示されたファイルが開けません。よろしければ、お教え
願えないでしょうか?

検索結果のファイルを選択
Forbidden
You don't have permission to access
/C|/a/b/c/d/f/soturon.html on this server.
------------------------------------------------------
Apache/2.0.55 (Win32) PHP/5.0.5 Server at localhost Port 80
という表示になります。

各種設定はNamazu2.014のインストーラのデフォルトです。
.namazurc の Replace で正しい URI に書き換えれば良いという話なのです
がどうにもうまくいかなくて。。。

索対象のファイルのpath
C:/a/b/c/d/1/ファイル
C:/a/b/c/d/2/ファイル
C:/a/b/c/d/3/ファイル
という様にファイルを格納しています。

そして、CGIはローカルホストで動かしているのですが、http://
以下はどのように指定すれば良いのでしょうか?






0199名無しさん@お腹いっぱい。
垢版 |
2006/10/15(日) 11:42:00
httpd.conf に書いた
<Directory> ディレクティブ
Alias ディレクティブ
ぐらいは示さないとコメントのしようがないよ
0200名無しさん@お腹いっぱい。
垢版 |
2006/10/15(日) 23:08:08
>>198

>>NamazuをCGI(localhost)で利用(win32)
多分だけど C|このせいだと思う。昔はまった。
<a harf=c|となってると見れないはず

ブラウザによるけど

lynx
では個別にルール指定できてC|/ C:と置換指定。
なんでもlynxが内部で指定置換してくれる。
だからオリジナルは弄ず。w3m あたりも平気

firefox,oprea,IE系は無理だった気が...
なんか慣行らしいけど|。GUIのブラウザだと無理?かも??

namazuの方がC|じゃなくてC:/と吐いてくれないと。パスを。昔
考えたのは適当にsed噛ますとかして置換ちゃえばとか思った
が...namazu -hで吐かせてるからsedでフィルタすれば...と

テキストブラウザで使えるしそのまま...圧縮したまま使えるか
ら。普通のブラウザだと圧縮したまま動かないんで...

公開しないし個人で使う分には書換ちゃっていいと思うけど、セ
キュリティ上よくないのかね?

cgi?どこで吐いてるのかわかんないけど|を/に変えるべく追って
弄らないといけないと思う。winの代表的な各種ブラウザで見た
いなら
0203名無しさん@お腹いっぱい。
垢版 |
2006/10/18(水) 01:14:49
>198です。
インデックス作成のオプション指定に気をつけ、きちんとドキュメントルート
を確認の上、.namazurcのReplaceを設定したら無事にできました。
ありがとうございました。
0204名無しさん@お腹いっぱい。
垢版 |
2006/10/18(水) 19:08:09
UNIX板ですが、話題がNamazuなので。。。
以下について、どなたかご教示願えませんか?

Windows XPでNamazuを利用しているのですが、これからPHP(5.0)
でNamazuを使うために、Namazuモジュール(php-namazu-2.3.1)
をインストールしたいと考えています。

調べた限りでは、現在はPECLもCVSも利用できない(Namazuモジュール)
ということでした。Windowsでこのモジュールをインストールするにはど
のような手順を踏めばよいのでしょうか?

それと、塚田卓也さんという方がNamazu関数をWindows版PHPで
も使えるように開発された、モジュール「php4_namazu-3.0.0PHP4.3.x
」があるそうですが、これは5.0でも使えたりするのでしょうか?

0205名無しさん@お腹いっぱい。
垢版 |
2006/10/18(水) 20:55:13
なんでナマズってこんなに遅いの?
0208名無しさん@お腹いっぱい。
垢版 |
2006/10/18(水) 23:34:51
>204
マルチよくない
ttp://www.namazu.org/pipermail/namazu-win32-users-ja/2006-October/001443.html

使えたりするかどうかは自分で試してみたの?
0209名無しさん@お腹いっぱい。
垢版 |
2006/10/18(水) 23:49:19
いや、[PHP4---]というモジュール名から見るに、多分使えないだろう
なぁと思って、試してはいません。ただ、使えるか知っている方がいた
ら、その是非を教えて欲しいなぁと思いまして。
もう1つの、WindowsへのNamazuモジュールのインストールのほうは自分
でもそれなりに調べたりしましたが、どうも分からなかったもので。。。
0212名無しさん@お腹いっぱい。
垢版 |
2006/11/13(月) 20:52:00
namazurcってmknmzしたときには適用されないんですか?
replace使いたいんですが…
0214名無しさん@お腹いっぱい。
垢版 |
2006/12/22(金) 16:04:17
namazuの検索結果をEUC-JPで出力させているのですが、Shift_JISで書かれた
ファイルの内容がそのままShift_JISで出力されてしまうため、検索結果が文
字化けしてしまいます。何か設定が必要なんでしょうか。
0216名無しさん@お腹いっぱい。
垢版 |
2006/12/26(火) 14:20:11
tp://www.ki.nu/software/namazu/tutorial/make.html#PERL_MODULEで
namazu 1.9.12 以降では Chasen2 にだけ対応している。
とありますが、kakasiは使用できないということでしょうか?
0217名無しさん@お腹いっぱい。
垢版 |
2006/12/26(火) 15:07:33
検索結果にキーワードが最初にファイルの何行目に登場するか、の情報って取得できますか?
google検索エンジンみたいに、キーワードのヒットした前後の文章を結果一覧に出したいのですが・・・
0219名無しさん@お腹いっぱい。
垢版 |
2006/12/28(木) 22:22:23
Namazu の ML はなぜ iso-2022-jp でも Content-Transfer-Encoding: 8bit
で送ってくるんだろう。なんか気持ち悪いなあ。
0221名無しさん@お腹いっぱい。
垢版 |
2006/12/29(金) 22:42:03
Linuxにnamazu-2.0.16をインストールして、
インデックスの作成とNamazuコマンドでの検索が出来るようになったのですが
検索対象はファイルの中身だけで、ファイル名は検索外にする事は可能でしょうか?
index.htmlを検索しても表示されない、でもindex.htmlの中身に書いてある文章で
検索を掛けると表示されるようにしたいのですが・・・
0222名無しさん@お腹いっぱい。
垢版 |
2006/12/30(土) 12:24:41
>>221
mknmz の namazu_core というサブルーチンに
$content .= "\n\n$filename\n\n"; # add filename
という行がある
これを削ってインデックスを作り直す
0223名無しさん@お腹いっぱい。
垢版 |
2007/01/02(火) 19:57:55
>>222
真にありがとうございます。上手く行きました。
ただ"index.html"だと表示されないようになったのですが、"index"で検索すると表示されてしまいます。
これも表示されないようにする方法はありますでしょうか?何度も質問して申し訳ありません
0224223
垢版 |
2007/01/04(木) 21:18:12
自己解決しました
本当にありがとうございました
0225名無しさん@お腹いっぱい。
垢版 |
2007/01/10(水) 19:44:10
スレ違いかもしれませんが、

自分がよく利用するウェブサイトの一部のコンテンツをNamazuで検索可能にしたいの
ですが(Google等では何故かうまく出てこないので)、
その場合はウェブサイトの必要なコンテンツをローカルにダウンロードして、
それをNamazuにかけるわけですよね?
ウェブサイトのコンテンツをダウンロードするのにお勧めのソフトはありますか?
0231名無しさん@お腹いっぱい。
垢版 |
2007/07/05(木) 13:53:45
ag
0232名無しさん@お腹いっぱい。
垢版 |
2007/10/09(火) 03:41:55
EmphasisTags "<strong class=\"keyword\">" "</strong>"
みたいに設定してキーワードをハイライトさせているのですが、
キーワードの出現位置が検索結果の本文表示文字数のリミットと
被る場合にタグを閉じてくれず、次の行から真っ赤っかになってしまいます。
回避する方法ってあるのでしょうか?
0234名無しさん@お腹いっぱい。
垢版 |
2007/11/28(水) 05:27:51
ダブルクオーテーション内の連続した文字 "、狼8、" で検索かけたいのだがノイズ入りまくり
/、狼8、/ も試したが今度は見つからないとか言われた
勝手に要素に分割するなああああ
0235名無しさん@お腹いっぱい。
垢版 |
2007/12/14(金) 21:25:55
mknmz -CでCoding System: eucってでるんだけどsjisにするにはどこの設定を弄れば良いですか?
0236名無しさん@お腹いっぱい。
垢版 |
2007/12/14(金) 21:46:18
Cording Systemの意味わかってないんじゃない?
検索結果をSJISにしたいんだったら
.namazurcでShift_JISに設定すればいいだけだし。
ちなみにNamazuのインデックス内部はeuc。
0237235
垢版 |
2007/12/14(金) 22:33:23
>>236
なるほどありがとうございます

Namazuのインデックス内部はeuc。
ということはインデックスさせるページはEUCで記述しないと駄目なんですか?
0239235
垢版 |
2007/12/14(金) 22:41:36
>>238
むむむ・・
sjisで書いたページをmknmz -kでインデックス作ると
NMZ.wの中が所々文字化けるんですよ。。。
何かアドバイスお願いします。

# mknmz -C
わかち書き: /usr/local/bin/kakasi -isjis -osjis -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: euc

mknmzする前にsetenv LANG ja_JP.SJISしてます


0242235
垢版 |
2007/12/18(火) 10:46:31
>>240
>>241
なるほど!解決しました!
ありがとうございます!
0244名無しさん@お腹いっぱい。
垢版 |
2008/02/06(水) 03:00:26
共有鯖でインスコしたいのですがsshやtelnet以外でインスコする方法ありませんか?
鯖が対応してなくて困ってます。
0247名無しさん@お腹いっぱい。
垢版 |
2008/02/21(木) 21:40:38
新しいバージョンのnamazuだけど、namazu.cgiがnamazurc読み込んでないな。
なんかバージョンアップのたびに質が落ちてる。
0248名無しさん@お腹いっぱい。
垢版 |
2008/02/21(木) 21:49:47
うーん…ベストを尽くせ。
0249名無しさん@お腹いっぱい。
垢版 |
2008/02/22(金) 01:52:53
ナマズ作り直してくれねーかなあ。バカスカメモリ食いやがって。このへたくそが。
0251名無しさん@お腹いっぱい。
垢版 |
2008/02/22(金) 03:33:49
それを必要な人がそれをやるしかないんだよ。

いわゆる言い出しっぺの法則 ――言い出しっぺがやらなければ誰もやらない―― だね。
0252名無しさん@お腹いっぱい。
垢版 |
2008/02/28(木) 13:15:05
なんでこれ環境変数と設定ファイルで同一の設定値を設定しないといけないんだ?
混乱するだけだと思うんだが。
世の中からこういうバカがいなくなればいいなあ。
0254名無しさん@お腹いっぱい。
垢版 |
2008/03/03(月) 03:31:23
>>252
じゃあ直せよ
0257名無しさん@お腹いっぱい。
垢版 |
2008/04/21(月) 21:18:16
windows環境でのNamazuでofficeを入れない環境で
office文書を検索対象に含めるには何のソフトが有効ですか?
Microsoft Office Viewerを入れたら可能ですか?

また、zipなどの圧縮ファイル名を検索対象にするにはどうしたらいいでしょう?

よろしくおねがいします
0258名無しさん@お腹いっぱい。
垢版 |
2008/04/21(月) 23:47:00
>>257
officeを入れない環境ではxdoc2txt.exeが有効。
windows環境ではzipには標準で対応している。試してみましたか?
説明書を読んでますか?
ttp://www.namazu.org/doc/manual.html#doc-filter
よろしくおねがいします
0264名無しさん@お腹いっぱい。
垢版 |
2008/09/19(金) 01:28:40
質問です。

WindowsXP + NTEmacs22.2 + Gnus の環境で Namazu を使っていますが、
Fedora9 + Emacs23 + Gnus で同じようにインストールした Namazu だと
「山田」のような固有名詞でも検索出来ますが、Winの場合だと同じ名前
で検索に引っかかりません。
(その名前が含まれたメールは存在してます。)

一般的な名詞だとどちらも同じように検索できてます。

環境としては、Win は ja_JP.SJIS で、Fedora9 は ja_JP.utf8 です。
両方共 Kakasi を使ってます。

何か気づいた点などありましたら教えてください。
0265名無しさん@お腹いっぱい。
垢版 |
2008/10/17(金) 19:17:44
すみません。教えてください

test.tgzという1GBほどのファイルがあった場合に、
中身のについてのindex作成を行わずに
ファイルの名前とパスのみをindexに残したいのですが、
どのように設定すればよいでしょうか?

たとえばtest.tgzをtgzで検索にひっかけるなど、
ファイル名だけでも検索に引っかかるようにしたいのですが
可能でしょうか?
0266名無しさん@お腹いっぱい。
垢版 |
2009/08/29(土) 11:16:19
64bit Linuxマシン(Red Hat Linux ES5)でnamazuをインストールしようとしますと、


Text/ChaSen/ChaSen.so \
-L/usr/local/lib -lchasen \

/usr/bin/ld: /usr/local/lib/libchasen.a(chalib.o): relocation R_X86_64_32 against `a local symbol' can not be used when making a shared object; recompile with -fPIC
/usr/local/lib/libchasen.a: could not read symbols: Bad value
collect2: ld はステータス 1 で終了しました
make: *** [blib/arch/auto/Text/ChaSen/ChaSen.so] エラー 1

というエラーがでます。

どのように対処したらよろしいでしょうか?

GOOGLE検索してもなかなか解決策が出てきません。

よろしくお願いします。
0269名無しさん@お腹いっぱい。
垢版 |
2009/08/29(土) 15:02:28
>>267
recompile with -fPIC
というのはどういうふうに試せばいいのでしょうか?
これも検索したんですが、よくわかりません。。
>>268
rpmはでていないようです。さがしてみたんですが。。
0270269
垢版 |
2009/08/29(土) 15:06:27
少し説明不足だったように思いますので、付け加えますと、
http://www.asahi-net.or.jp/~wv7y-kmr/memo/namazu.html
を参考にし、
Text::chassen perl moduleをインストールしようとし、
$ perl Makefile.PL
$ make
をした後に、266のメッセージはでます。。

0271名無しさん@お腹いっぱい。
垢版 |
2009/08/29(土) 15:46:16
>>270
茶筅のライブラリ /usr/local/lib/libchasen.a(chalib.o) が読み込めないと言って居るんだから
ライブラリをシステムに合わせて構築し直せ。
0272269
垢版 |
2009/08/29(土) 16:11:36
>>271
すみません、もう少しヒントをもらえますか?
どのようにしてライブラリを構築しなおすといいのでしょうか?
自分がやったのは、
$perl -fPIC Makefile.PL
ですが、それもエラーがでました。このへん詳しくないので。。
0273267
垢版 |
2009/08/29(土) 17:03:34
>>269 はじめのカキコのメッセージは、namazu のコンパイルオプション云々
じゃなくて、namazu をビルドするときに使おうとしているchasen のライブラリが
変だよ、といってるの。リンクに失敗しているんで、libchasen を -fPICという
のオプション付けてコンパイル (gcc) してくれたら直るとおもうよ、と言っているの.。

察するに、-fPIC オプションは実際には不要で、単に、chasen のソースを
とってきて、./configure; make; sudo make install ; sudo ldconfig とやれば
済みそうな気もするが。
0274名無しさん@お腹いっぱい。
垢版 |
2009/08/29(土) 17:22:27
>>272
茶筅のインストールに失敗しているんだろ
ttp://chasen.naist.jp/hiki/ChaSen/?%A5%BD%A1%BC%A5%B9%A4%AB%A4%E9%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB
茶筅単体で動くことを確認してみろ。 あと、茶筅のバージョンは最新か?

いらん話: -fPIC だが、茶筅の Makefile の CFLAG に 追加。
(このモジュールはCだかC++だかで書かれていたはず)
0276269
垢版 |
2009/08/30(日) 09:45:59
>>273
>>274

ありがとうございます。

chasen自体は、
$ chasen
EOS
テスト
テスト テスト テスト 名詞-サ変接続

のように動いています。

ただ、 namazuで使う perl moduleの
Text::chasen がうまく入ってくれません。

chasen はchasen-2.4.4を使っています。これが最新のようです。

chasenのコンパイル時のMakefileにCFLAGに-fPIC をつけてもうまくいきません。。

もし何か分かりましたら、よろしくお願いいたします。
0277269
垢版 |
2009/08/30(日) 09:54:18
64bitマシンがだめなのでしょうか?
32bitのときは問題なく前は入ったのですが。。
64bitでnamazuはあきらめたほうがいいということなのでしょうか?
0279名無しさん@そうだ選挙に行こう
垢版 |
2009/08/30(日) 10:00:12
# 64bitでnamazu

64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
適切に対応していない可能性がある。
0280名無しさん@お腹いっぱい。
垢版 |
2009/08/31(月) 19:35:35
>>278
>>.so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう?
これはしております。

>>あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした?
http://www.daionet.gr.jp/~knok/chasen/
はい、patchはあてています。

http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html
これは、まだチェックしきれていませんが、むつかしそうですね。調べてみます。

>>279
>>64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
>>/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
>>適切に対応していない可能性がある。
/usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。
0281名無しさん@お腹いっぱい。
垢版 |
2009/08/31(月) 23:52:45
> >>適切に対応していない可能性がある。
> /usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。
「64bit版のライブラリは /usr/lib64 に置く必要があるかも?」って話なんだけど。
0282名無しさん@お腹いっぱい。
垢版 |
2009/09/03(木) 18:01:17
mknmzで大規模データを一日かけて実施していたところ、

NMZ.lock2 ファイルを発見しました
このインデックスは他のプロセスによって更新されている可能性があります

というエラーがでました。おそらく前回、途中でmknmzをやめ、indexファイル群
を削除せずに再度mknmzを実施したからだと思います。
仕方ないので、このlock2ファイルを削除し、
mknmz -Y
で差分更新をしようと思うのですが、前回エラーで中断したところから、うまく
再開できますか?

よろしくお願いいたします。
0283名無しさん@お腹いっぱい。
垢版 |
2009/09/05(土) 08:26:43
280です。別の64bitマシンを借りて、インストールをし直してみたところ、インストールはうまく
いったのですが、別の問題が起きています。。
Text::Chasenの64bitマシンへのインストールでつまずいています。
以下のように、Text::Chasenのインストール自体には成功しているように
見えるのですが、perlからよびだせていないようです。
検索して、LIBS lstdc++ chasenなどを、Makefile.PLに足したりはしているのですが、
それでもうまくいっていません。
$ sudo make install
Files found in blib/arch: installing files in blib/lib into architecture dependent library tree
Writing /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/.packlist
Appending installation info to /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/perllocal.pod

$ perl -MText::ChaSen -e ''
Can't load '/usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/ChaSen.so' for module Text::ChaSen:
libchasen.so.2: 共有オブジェクトファイルを開けません: そのようなファイルやディレクトリはありません
at /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/DynaLoader.pm line 230.
at -e line 0
Compilation failed in require.
BEGIN failed--compilation aborted.

lddをすると以下のようになります。libchasen.so.2のある場所がおかしいのでしょうか?
どうすればいいかわからないので、何かアドバイスをいただけないでしょうか?

$ ldd /usr/local/bin/chasen
libchasen.so.2 => /usr/local/lib/libchasen.so.2 (0x00002aaaaaaad000)
libstdc++.so.6 => /usr/lib64/libstdc++.so.6 (0x00000032afc00000)
libm.so.6 => /lib64/libm.so.6 (0x00000032a9c00000)
libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00000032af400000)
libc.so.6 => /lib64/libc.so.6 (0x00000032a9800000)
/lib64/ld-linux-x86-64.so.2 (0x00000032a8800000)

よろしくお願いします。
0285名無しさん@お腹いっぱい。
垢版 |
2009/09/08(火) 20:31:02
namazuでmknmzする際の最大メモリ使用量が32bitマシンでは、4GBでしょうか?
それだと足りなくて、
Out of memory!
NMZ.lock2 ファイルを発見しました
となる場合はどうすればよいでしょうか?
0289名無しさん@お腹いっぱい。
垢版 |
2010/04/22(木) 20:07:42
6万貰ってセックヌしてきたぞ!!

濡れた熟マンに入れたら、肉ヒダがしっとり絡みついてきて、
そんだけでイきそうになったわww
http://xabrina.net/om/c9y94mf
0291名無しさん@お腹いっぱい。
垢版 |
2011/02/04(金) 21:34:06
mknmz + pdftotext で PDF ファイルをインデックス化してるんだけど、
100MBを超える PDF だと、out of memory のエラーが出る。

mknmzrc の記述はチェック済み ($FILE_SIZE_MAX, $TEXT_SIZE_MAX, $ON_MEMORY_MAX)。
マシンのメモリは 4G 積んでるので、実際のメモリ不足ではないと思う。

ご存知の方、よろしく。m(_ _)m

環境:Namazu for Windows (ver. 20.0.20) on WinXP SP3
Active Perl 5.8.9
レスを投稿する


ニューススポーツなんでも実況