全文検索エンジンNamazu ver2
全文検索エンジンNamazuについてアレコレ http://www.namazu.org それを必要な人がそれをやるしかないんだよ。 いわゆる言い出しっぺの法則 ――言い出しっぺがやらなければ誰もやらない―― だね。 なんでこれ環境変数と設定ファイルで同一の設定値を設定しないといけないんだ? 混乱するだけだと思うんだが。 世の中からこういうバカがいなくなればいいなあ。 windows環境でのNamazuでofficeを入れない環境で office文書を検索対象に含めるには何のソフトが有効ですか? Microsoft Office Viewerを入れたら可能ですか? また、zipなどの圧縮ファイル名を検索対象にするにはどうしたらいいでしょう? よろしくおねがいします >>257 officeを入れない環境ではxdoc2txt.exeが有効。 windows環境ではzipには標準で対応している。試してみましたか? 説明書を読んでますか? ttp://www.namazu.org/doc/manual.html#doc-filter よろしくおねがいします 14ではzip対応していなかった。 18では全部できました。 lzhを対象にしたフィルタはない? ここは潰れてる http://log.counterghost.net/20040417.html >>259 lzhを対象にしたフィルタはcvsにはあるっぽいね http://cvs.namazu.org/namazu/filter/ でもwindowsでは使えないかもね sub status() { return 'no' if ($English::OSNAME =~ /^(?:MSWin32|os2)$/i); # Only LHa for UNIX. $lhapath = util::checkcmd('lha'); とかあるからwinは無理っぽいですね。。。 http://log.counterghost.net/20040417.html ↑持っている人どこかに上げてくれないだろうか・・・ 質問です。 WindowsXP + NTEmacs22.2 + Gnus の環境で Namazu を使っていますが、 Fedora9 + Emacs23 + Gnus で同じようにインストールした Namazu だと 「山田」のような固有名詞でも検索出来ますが、Winの場合だと同じ名前 で検索に引っかかりません。 (その名前が含まれたメールは存在してます。) 一般的な名詞だとどちらも同じように検索できてます。 環境としては、Win は ja_JP.SJIS で、Fedora9 は ja_JP.utf8 です。 両方共 Kakasi を使ってます。 何か気づいた点などありましたら教えてください。 すみません。教えてください test.tgzという1GBほどのファイルがあった場合に、 中身のについてのindex作成を行わずに ファイルの名前とパスのみをindexに残したいのですが、 どのように設定すればよいでしょうか? たとえばtest.tgzをtgzで検索にひっかけるなど、 ファイル名だけでも検索に引っかかるようにしたいのですが 可能でしょうか? 64bit Linuxマシン(Red Hat Linux ES5)でnamazuをインストールしようとしますと、 Text/ChaSen/ChaSen.so \ -L/usr/local/lib -lchasen \ /usr/bin/ld: /usr/local/lib/libchasen.a(chalib.o): relocation R_X86_64_32 against `a local symbol' can not be used when making a shared object; recompile with -fPIC /usr/local/lib/libchasen.a: could not read symbols: Bad value collect2: ld はステータス 1 で終了しました make: *** [blib/arch/auto/Text/ChaSen/ChaSen.so] エラー 1 というエラーがでます。 どのように対処したらよろしいでしょうか? GOOGLE検索してもなかなか解決策が出てきません。 よろしくお願いします。 メッセージに recompile with -fPIC と言っているから、それを試みる。 >>267 recompile with -fPIC というのはどういうふうに試せばいいのでしょうか? これも検索したんですが、よくわかりません。。 >>268 rpmはでていないようです。さがしてみたんですが。。 少し説明不足だったように思いますので、付け加えますと、 http://www.asahi-net.or.jp/ ~wv7y-kmr/memo/namazu.html を参考にし、 Text::chassen perl moduleをインストールしようとし、 $ perl Makefile.PL $ make をした後に、266のメッセージはでます。。 >>270 茶筅のライブラリ /usr/local/lib/libchasen.a(chalib.o) が読み込めないと言って居るんだから ライブラリをシステムに合わせて構築し直せ。 >>271 すみません、もう少しヒントをもらえますか? どのようにしてライブラリを構築しなおすといいのでしょうか? 自分がやったのは、 $perl -fPIC Makefile.PL ですが、それもエラーがでました。このへん詳しくないので。。 >>269 はじめのカキコのメッセージは、namazu のコンパイルオプション云々 じゃなくて、namazu をビルドするときに使おうとしているchasen のライブラリが 変だよ、といってるの。リンクに失敗しているんで、libchasen を -fPICという のオプション付けてコンパイル (gcc) してくれたら直るとおもうよ、と言っているの.。 察するに、-fPIC オプションは実際には不要で、単に、chasen のソースを とってきて、./configure; make; sudo make install ; sudo ldconfig とやれば 済みそうな気もするが。 >>272 茶筅のインストールに失敗しているんだろ ttp://chasen.naist.jp/hiki/ChaSen/?%A5%BD%A1%BC%A5%B9%A4%AB%A4%E9%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB 茶筅単体で動くことを確認してみろ。 あと、茶筅のバージョンは最新か? いらん話: -fPIC だが、茶筅の Makefile の CFLAG に 追加。 (このモジュールはCだかC++だかで書かれていたはず) 茶筅の最新版の取得先 ttp://sourceforge.jp/projects/chasen-legacy/ >>273 様 >>274 様 ありがとうございます。 chasen自体は、 $ chasen EOS テスト テスト テスト テスト 名詞-サ変接続 のように動いています。 ただ、 namazuで使う perl moduleの Text::chasen がうまく入ってくれません。 chasen はchasen-2.4.4を使っています。これが最新のようです。 chasenのコンパイル時のMakefileにCFLAGに-fPIC をつけてもうまくいきません。。 もし何か分かりましたら、よろしくお願いいたします。 64bitマシンがだめなのでしょうか? 32bitのときは問題なく前は入ったのですが。。 64bitでnamazuはあきらめたほうがいいということなのでしょうか? >>269 「うまくいきません」 .so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう? あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした? http://www.daionet.gr.jp/ ~knok/chasen/ http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html # 64bitでnamazu 64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて /usr/lib64 のほうに行っていて、namazu の Makefile がそれに 適切に対応していない可能性がある。 >>278 >>.so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう? これはしております。 >>あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした? http://www.daionet.gr.jp/ ~knok/chasen/ はい、patchはあてています。 http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html これは、まだチェックしきれていませんが、むつかしそうですね。調べてみます。 >>279 >>64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて >>/usr/lib64 のほうに行っていて、namazu の Makefile がそれに >>適切に対応していない可能性がある。 /usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。 > >>適切に対応していない可能性がある。 > /usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。 「64bit版のライブラリは /usr/lib64 に置く必要があるかも?」って話なんだけど。 mknmzで大規模データを一日かけて実施していたところ、 NMZ.lock2 ファイルを発見しました このインデックスは他のプロセスによって更新されている可能性があります というエラーがでました。おそらく前回、途中でmknmzをやめ、indexファイル群 を削除せずに再度mknmzを実施したからだと思います。 仕方ないので、このlock2ファイルを削除し、 mknmz -Y で差分更新をしようと思うのですが、前回エラーで中断したところから、うまく 再開できますか? よろしくお願いいたします。 280です。別の64bitマシンを借りて、インストールをし直してみたところ、インストールはうまく いったのですが、別の問題が起きています。。 Text::Chasenの64bitマシンへのインストールでつまずいています。 以下のように、Text::Chasenのインストール自体には成功しているように 見えるのですが、perlからよびだせていないようです。 検索して、LIBS lstdc++ chasenなどを、Makefile.PLに足したりはしているのですが、 それでもうまくいっていません。 $ sudo make install Files found in blib/arch: installing files in blib/lib into architecture dependent library tree Writing /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/.packlist Appending installation info to /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/perllocal.pod $ perl -MText::ChaSen -e '' Can't load '/usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/ChaSen.so' for module Text::ChaSen: libchasen.so.2: 共有オブジェクトファイルを開けません: そのようなファイルやディレクトリはありません at /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/DynaLoader.pm line 230. at -e line 0 Compilation failed in require. BEGIN failed--compilation aborted. lddをすると以下のようになります。libchasen.so.2のある場所がおかしいのでしょうか? どうすればいいかわからないので、何かアドバイスをいただけないでしょうか? $ ldd /usr/local/bin/chasen libchasen.so.2 => /usr/local/lib/libchasen.so.2 (0x00002aaaaaaad000) libstdc++.so.6 => /usr/lib64/libstdc++.so.6 (0x00000032afc00000) libm.so.6 => /lib64/libm.so.6 (0x00000032a9c00000) libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00000032af400000) libc.so.6 => /lib64/libc.so.6 (0x00000032a9800000) /lib64/ld-linux-x86-64.so.2 (0x00000032a8800000) よろしくお願いします。 Text::ChaSen をビルドする前に、Makefile.PL のなかのLIBS指定、 'LIBS' => ['-L/usr/local/lib -lchasen' みたくしてる? namazuでmknmzする際の最大メモリ使用量が32bitマシンでは、4GBでしょうか? それだと足りなくて、 Out of memory! NMZ.lock2 ファイルを発見しました となる場合はどうすればよいでしょうか? >>287 近代化されているかは不明だけど、バージョンアップされているね。 Namazu 2.0.20 http://www.namazu.org/index.html.ja#news 6万貰ってセックヌしてきたぞ!! 濡れた熟マンに入れたら、肉ヒダがしっとり絡みついてきて、 そんだけでイきそうになったわww http://xabrina.net/om/c9y94mf mknmz + pdftotext で PDF ファイルをインデックス化してるんだけど、 100MBを超える PDF だと、out of memory のエラーが出る。 mknmzrc の記述はチェック済み ($FILE_SIZE_MAX, $TEXT_SIZE_MAX, $ON_MEMORY_MAX)。 マシンのメモリは 4G 積んでるので、実際のメモリ不足ではないと思う。 ご存知の方、よろしく。m(_ _)m 環境:Namazu for Windows (ver. 20.0.20) on WinXP SP3 Active Perl 5.8.9 >>291 以前、某パッケージのマニュアルで発生した。 pdfsplit.pl でページ単位に分解したら上手くいった。 # つ〜か、そのサイズのpdfって数百ページないか? # ページに分解して処理しないと面倒だと思う。 >>292 サンクスです。 >> ttp://www.namazu.org/ml/namazu-devel-ja/msg01950.html を見て、pdfslit.pl を導入してみましたが、out of memory のエラー がでます。やはり、pdfファイルがでかすぎるのかな… >>293 File::MMagicでメモリを大量に消費しているのが原因っぽい。 -tを使うとうまくいくかも。 サーバ中の文書を検索したくて入れてみました。 入れてみて気付いたのですが、EUC-JPにしか対応していないようです。 検索対象の文書は、UTF-8とEUCJPとSJISのファイルが混在しています。 内部的に、エンコードを自動的に検出して変換してインデックス化、 という処理は行われているのでしょうか? それとも、すべてEUC-JPの文書という前提で動作しているのでしょうか? ハゲ侍 サブコミュ イケメン スカイプ マリリンマンソン Twitter マリオ64 ゲーム実況者 マリオカート ハゲ侍 ツイッター 星のカービィ64 マリオサンシャイン ニコニコ超会議 ポケモン フレコ MH4G アメブロ ハゲ侍 アメーバブログ 仕事 Skype ツイキャス モンハン 歌い手 スプラトゥーン マニアック ハゲ侍 動画 顔 ドリームクラブ 好き 刃牙 サイレントヒル ドラゴンボール イケボ ハゲ侍 漫画 フレンドコード NG縛り ニコニコ生放送 歌ってみた 太刀 ニコニコ超パーティー コミュニティ ハゲ侍 大学 アキネーター 配信 ニコ生 サブコミュ マリリンマンソン イケメン 学歴 ハゲ侍 マリオカート Twitter スカイプ マリオ64 ツイッター ゲーム実況者 星のカービィ64 ニコニコ超会議 ハゲ侍 ポケモン マリオサンシャイン フレコ MH4G アメーバブログ 仕事 Skype ツイキャス ハゲ侍 モンハン 歌い手 マニアック 動画 アメブロ スプラトゥーン 刃牙 ドリームクラブ ハゲ侍 好き サイレントヒル ドラゴンボール 漫画 顔 NG縛り フレンドコード ニコニコ生放送 http://kanae.2ch.net/test/read.cgi/pcqa/1421101110/51 http://kanae.2ch.net/test/read.cgi/pcqa/1415921104/55 http://kanae.2ch.net/test/read.cgi/pcqa/1436852775/17 誰でも簡単にパソコン1台で稼げる方法など 参考までに、 ⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。 グーグル検索⇒『宮本のゴウリエセレレ』 V65BEHAU71 知り合いから教えてもらったパソコン一台でお金持ちになれるやり方 時間がある方はみてもいいかもしれません グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』 7BK22 10年前くらいに社内システムの鯖見たらNamazu入ってたな でも検索すら出来なかった チエオクレのハゲの悲惨なツイッター https://twitter.com/aphonedollar ↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑ この自称「ハゲ」とかいうチエオクレのブログが酷すぎる >「DesktopHE」 はWindows10に対応してないらしい はぁ??? ★★★大嘘デタラメ★★★を垂れ流すな!!! ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ チエオクレのこのハゲが、Javaの設定を失敗してるだけじゃねえか!!! 嘘デタラメ垂れ流しやがって、このハゲがやっていることは立派な公害じゃねえか! hatenaとかでまで、必死こいて大嘘をばらまいているんだが https://twitter.com/5chan_nel (5ch newer account) あー飛行機代高騰してるとかノスタルジーなオッサンだな これは何なん? >>1 なんか関係あったっけ プロ意識なさすぎだろ 今量ったら 空飛ぶタイヤは整備不良って初めから決めつけて練習着のままって感じかな 半年に一ヶ月だけ入って長く伸びる 草 下で投げたチキン居らんよな 機関が売り抜けてる頃にもいたんだよね 舞は毒母の被害者続出していて 今日で車両保険自体いらない説も多いからメアドとパスワードの組み合わせは 素人考えでもないし >>301 サロンの情報空間の中のショーに出る 野菜だけ食って野菜も食って飲んだ read.cgi ver 07.5.4 2024/05/19 Walang Kapalit ★ | Donguri System Team 5ちゃんねる