X



全文検索エンジンNamazu ver2

2006/03/13(月) 15:38:49
はじめてNmazuに挑戦しまた
nknmzrc実行後
http://〜/namazu.cgiにアクセスするとブラウザが真っ白
・・・
どこで間違っているのでしょう。
ヒントください
OS FreeBSD portsから導入
ブラウザ winXP IE
2006/03/13(月) 16:40:55
> ヒントください
こっちのセリフだ
2006/03/14(火) 00:18:47
2006-03-12: Namazu 2.0.16 を公開

* セキュリティフィックスリリース
Directory traversal 問題を修正
* 空白を含むファイル名の文書に対応
* NTFS のアクセス権で読み込み許可がないものは処理をスキップするように変更
2006/03/15(水) 06:23:14
>>139
インデックスが読み込めていないときにそうなった
まずnamazuで結果が出てくるか確認しろ
次にnamazurcの中身を確認しろ
2006/03/15(水) 18:26:19
>>142
nknmzrc実行後、沢山ファイルが作成された
取り合えず、動作しなくてもいいから表示してほしい・・・

作成されたファイルの中身を見ようとしたら何も表示されない
もしかしてファイル名だけ作成された?
2006/03/15(水) 18:45:35
まず"namazu (適当なキーワード)" で検索結果がでる?
出なければ~/.namazurcか/etc/namazurcでのインデックスのパスが違う
2006/03/15(水) 20:23:56
ports@FreeBSDのnamazu2が更新そぞろなも。
2006/04/05(水) 12:56:41
Emacsでnamazu.elを使用しているのですが、
出力結果をutf-8にしたいのですが、どの辺をいじれば可能でしょうか
2006/04/05(水) 23:26:44
奈辺
148名無しさん@お腹いっぱい。
垢版 |
2006/04/25(火) 09:19:38
なまずでサイズの小さく、検索の早く、漏れのないインデックスの作り方。

なまずにすべての作業を任せずに文字コード変換、Kakasiをあらかじめ
自分でやっておく。 フィルタも使わない。
自分で確実にテキストに変換できたことを確認してからなまずに渡す。

インデックスに登録しないような一語の単語や記号などをあらかじめ削除する。

これでOk>
2006/04/27(木) 01:07:07
>>148
専用のスクリプトを用意して cron とかで作成させると
効果的なんだろうか?
150名無しさん@お腹いっぱい。
垢版 |
2006/04/27(木) 02:24:29
>>149
nkfの最新版(それ以前もたぶん)はUTF-8の文字コードを誤認する。
これをすべてNAMAZUに任せると当然、検索できないindexが作成される。
丹誠込めて念入りにindexを作ることが重要だ。ちゃんと変換できてるとか目で見て。
2006/04/27(木) 05:32:59
>>150
ああ、文字コードはそうかもね。
で、どうやって >>148 みたいなフィルタの結果をなまずに渡すの?

$ フィルタスクリプト | mknmz とか?
152名無しさん@お腹いっぱい。
垢版 |
2006/04/27(木) 05:50:57
ふつうにテキストで固定してindexを作成する。オプションの設定。
なまずは自動判別するからpdfでもhtmlでも中身がテキストなら
そうなるけどテキストに固定した方が早い。
153名無しさん@お腹いっぱい。
垢版 |
2006/04/27(木) 06:07:34
>>151
たとえば10000ファイルあったとしたら
構造、拡張子を保ったまますべてのファイルをEUCコードに変換する。
そしてまたすべてのファイルを分かち書きする(-wオプション)。
154名無しさん@お腹いっぱい。
垢版 |
2006/04/28(金) 16:43:24
UTF-8を誤認することは間違いないのだがどれがUTF-8かを見つけるのが苦労する。
155名無しさん@お腹いっぱい。
垢版 |
2006/05/03(水) 19:52:08
データだけ他サーバーに置くことは出来ますか?
あと複数のindexを検索するにはどうしたらいいですか。
2006/05/06(土) 17:54:36
データだけ他サーバー =>できる。
複数のindexを検索する =>マニュアル夜目。
2006/05/06(土) 19:04:08
マニュアル夜目 =>断る。
158名無しさん@お腹いっぱい。
垢版 |
2006/05/06(土) 23:36:46
>>156
でも動作鈍いんですよね?
無料のとくつーにデータ全部おくことにします。
fc2にデータおいて広告なし無料cgi可のページから検索したかったんですけど。
2006/05/07(日) 18:51:41
nfsdとか動いてないとダメなんじゃないのか?
2006/05/08(月) 08:11:15
いや、『データ』だけ他のサーバにおくのはかんたんでしょ。読み出せないけど。
161名無しさん@お腹いっぱい。
垢版 |
2006/06/01(木) 17:13:27
少し困っていることがあるので,教えてください.

Namazuのログで,検索ワードにヒットした文書ごとの
検索ワードの出現回数TFを出力できたりしますでしょうか?
ご教示お願いします.

また,タイトル<title>にその検索ワードが使われていたかどうか
などもログ出力できると助かるので,そういうことができるか
もお教えください.
162名無しさん@お腹いっぱい。
垢版 |
2006/06/01(木) 21:00:39
あげ
163名無しさん@お腹いっぱい。
垢版 |
2006/06/05(月) 11:05:16
age
2006/06/07(水) 23:08:46
ユカコ☆スレに遊びにこいよ!

http://travel2.2ch.net/test/read.cgi/kyoto/1148668530/l50
165名無しさん@お腹いっぱい。
垢版 |
2006/07/25(火) 23:24:19
検索キーワードのログを見たいのですが、設定ファイルを
Logging on にするとどこにログが保存されているのでしょうか?
また、ログの保存場所を指定するにはどのようにしたらよいでしょうか?
2006/07/26(水) 08:23:04
NMZ.slogに保存されます。場所はたぶん変えられないかな。
167名無しさん@お腹いっぱい。
垢版 |
2006/07/26(水) 15:46:23
Estraier、NAMAZU、msearch でデフォルトの設定で、
インデックスの作成時の負荷がかかる順に並べるとどうなりますか?
2006/07/26(水) 16:30:55
msearch は知らないけど、
HyperEstraier は Namazu より軽いと思う。
169名無しさん@お腹いっぱい。
垢版 |
2006/07/26(水) 20:30:41
namazuって重いんですね
2006/07/27(木) 09:35:53
重い要因は
* Perlで書かれている
* File::Findによるディレクトリ走査
* File::MMagicによるコンテンツの種別確認
* DB書き込み速度がPerlのhashに依存
このへんかなあ。
171名無しさん@お腹いっぱい。
垢版 |
2006/07/27(木) 11:08:12
msearchもperlだよ。
NAMAZUよりmsearchのが軽いのかな?

HyperEstraier はよく知らんけど何で書かれてるの?
2006/07/27(木) 12:20:30
msearchって、仕組みを知って爆笑してしまったぜ。
2006/07/27(木) 13:11:58
中でハムスターが走ってるんだよな
174名無しさん@お腹いっぱい。
垢版 |
2006/07/27(木) 15:41:28
>>172
何で爆笑?
175名無しさん@お腹いっぱい。
垢版 |
2006/07/28(金) 17:32:38
namazuって、検索結果を重要度が高い順に並べたりしてくれる
ような機能ってあるっけ?
176名無しさん@お腹いっぱい。
垢版 |
2006/07/29(土) 16:43:59
>>175
重要度は分からんが、ポイント機能ならあるぞ
177名無しさん@お腹いっぱい。
垢版 |
2006/07/31(月) 12:58:34
最近では、EstraierとNAMAZUどっちが人気?
178名無しさん@お腹いっぱい。
垢版 |
2006/08/22(火) 13:39:59
Namazuのようにインデクシングの際に形態素解析を用いている
検索エンジンと、その他、形態素解析を用いない検索エンジンとは
インデックス作成の時間以外でどのような違いがあるのでしょうか?
2006/08/23(水) 07:37:56
>>177 Google Trendsでも使ってしらべれ。
>>179 検索時の精度。すくなくとも再現率(recall)はn-gramのほうが高い。
180名無しさん@お腹いっぱい。:
垢版 |
2006/08/27(日) 13:38:59
namazuでPDFファイルを検索し、概要だけであればhtmlで、
全文を見るのであれば、PDFで見るというふうにしたいのですが、
どうすればよいでしょうか?概要のhtmlは作ってあるのですが、ど
うすれば検索時にhtmlとPDFを選択できるのかなぁと思いまして。
よろしければ、お知恵をお貸しください。

2006/08/27(日) 14:00:27
NMZ.result.* に概要のHTMLのURIを追加すればOK。
概要のHTMLのURIを${uri].htmlにして、その場所に概要のHTMLを格納するのが
楽そうだ。
182名無しさん@お腹いっぱい。:
垢版 |
2006/08/27(日) 14:13:20
>181
参考にさせていただきます。ご回答ありがとうございました。
183名無しさん@お腹いっぱい。
垢版 |
2006/09/21(木) 16:53:43
NMZ.* ファイルの仕様
http://www.namazu.org/doc/nmz.html.ja

上記を読んでもよく分からなかったのですが、
結局検索エンジン (namazu.exe)はどういう手順で
検索クエリから目的の文書を探し出すの?
NMZ.i には単語情報はないんだよね?

1.まずNMZ.iiで検索文字列から算出したハッシュ値をキーにして
  NMZ.iのレコード番号を引く
2.NMZ.i の該当レコード番号から文書IDを引っ張ってくる

文書IDと対象ファイルの対応表はどこにあるのかなぁ?(・〜・)ウーム
2006/09/21(木) 18:34:21
お〜、それ、わたしも首をひねったよ。
2006/09/21(木) 23:25:02
バージョン1.xのときはNMZ.f とNMZ.fi というファイルがあって
各ファイルの情報を記録していた。

2.xからは
NMZ.field.{subject,from,date,message-id,...}
NMZ.field.{subject,from,date,message-id,...}.i
の2つのファイルがその代わりをしている。
行番号=文書IDとなっている。
2006/09/22(金) 08:26:08
NMZ.wが単語表で、NMZ.wiがそのインデックス(各単語の先頭のオフセット値が
入っている)。
NMZ.wはコード順にソートされているので、NMZ.wiとNMZ.wをバイナリサーチ
すれば該当するNMZ.wiのファイルの位置から単語IDが求まる。

まあ最悪mknmzとlibnamazu.cあたりをみればわかるよ。
187名無しさん@お腹いっぱい
垢版 |
2006/09/26(火) 09:15:59
Namazu(最新版)をWindows XPで使いたいのですが、カスタマイズを行う
場合は、バイナリではなく、ソースコードからインストールしなければ
ならないでしょうか?
2006/09/27(水) 07:50:14
カスタマイズする内容によるが、普通いらない。
必要になるのはソースコードレベルで埋め込まれている出力を
いじるときぐらい。
それもほとんどはgettext化されてるので、ja.poだけいじって差し替えれば
済む話だし。
2006/10/03(火) 13:05:12
"ペイジ" は勘弁して欲しい。直したけど。
2006/10/04(水) 00:10:39
>>189
なんでページにしないんだろうな
2006/10/04(水) 02:28:57
ぱげ
2006/10/04(水) 05:05:52
三四郎ファンなんだろ
2006/10/04(水) 10:48:43
ペイイチ?
2006/10/04(水) 16:48:59
N-gram戦争中w
全文検索ユーティリティ統一スレッド part3
ttp://pc8.2ch.net/test/read.cgi/bsoft/1120649196/
195(^-^) ◆MONSOON/qo
垢版 |
2006/10/08(日) 05:27:21
インディックス作成時に読み込む文字種を正規表現で指定できますか?
記号は除外するとかです
2006/10/08(日) 07:47:34
mknmz -K

文字列処理:
-E, --no-edge-symbol 単語の両端の記号は削除する
-G, --no-okurigana 送り仮名を削除する
-H, --no-hiragana 平仮名のみの単語は登録しない
-K, --no-symbol 記号をすべて削除する

あとはソース書き換えかな
197(^-^) ◆MONSOON/qo
垢版 |
2006/10/08(日) 11:58:48
>>196
どうもありがとう
198名無しさん@お腹いっぱい。
垢版 |
2006/10/15(日) 10:14:17
NamazuをCGI(localhost)で利用しているのですが、検索結果と
して表示されたファイルが開けません。よろしければ、お教え
願えないでしょうか?

検索結果のファイルを選択
Forbidden
You don't have permission to access
/C|/a/b/c/d/f/soturon.html on this server.
------------------------------------------------------
Apache/2.0.55 (Win32) PHP/5.0.5 Server at localhost Port 80
という表示になります。

各種設定はNamazu2.014のインストーラのデフォルトです。
.namazurc の Replace で正しい URI に書き換えれば良いという話なのです
がどうにもうまくいかなくて。。。

索対象のファイルのpath
C:/a/b/c/d/1/ファイル
C:/a/b/c/d/2/ファイル
C:/a/b/c/d/3/ファイル
という様にファイルを格納しています。

そして、CGIはローカルホストで動かしているのですが、http://
以下はどのように指定すれば良いのでしょうか?






2006/10/15(日) 11:42:00
httpd.conf に書いた
<Directory> ディレクティブ
Alias ディレクティブ
ぐらいは示さないとコメントのしようがないよ
2006/10/15(日) 23:08:08
>>198

>>NamazuをCGI(localhost)で利用(win32)
多分だけど C|このせいだと思う。昔はまった。
<a harf=c|となってると見れないはず

ブラウザによるけど

lynx
では個別にルール指定できてC|/ C:と置換指定。
なんでもlynxが内部で指定置換してくれる。
だからオリジナルは弄ず。w3m あたりも平気

firefox,oprea,IE系は無理だった気が...
なんか慣行らしいけど|。GUIのブラウザだと無理?かも??

namazuの方がC|じゃなくてC:/と吐いてくれないと。パスを。昔
考えたのは適当にsed噛ますとかして置換ちゃえばとか思った
が...namazu -hで吐かせてるからsedでフィルタすれば...と

テキストブラウザで使えるしそのまま...圧縮したまま使えるか
ら。普通のブラウザだと圧縮したまま動かないんで...

公開しないし個人で使う分には書換ちゃっていいと思うけど、セ
キュリティ上よくないのかね?

cgi?どこで吐いてるのかわかんないけど|を/に変えるべく追って
弄らないといけないと思う。winの代表的な各種ブラウザで見た
いなら
2006/10/17(火) 15:40:16
>そして、CGIはローカルホストで動かしているのですが、http://
設定を晒してくれ
2006/10/17(火) 21:35:23
「Replace http://localhost/C|/ file:」

にしとけ
203名無しさん@お腹いっぱい。
垢版 |
2006/10/18(水) 01:14:49
>198です。
インデックス作成のオプション指定に気をつけ、きちんとドキュメントルート
を確認の上、.namazurcのReplaceを設定したら無事にできました。
ありがとうございました。
204名無しさん@お腹いっぱい。
垢版 |
2006/10/18(水) 19:08:09
UNIX板ですが、話題がNamazuなので。。。
以下について、どなたかご教示願えませんか?

Windows XPでNamazuを利用しているのですが、これからPHP(5.0)
でNamazuを使うために、Namazuモジュール(php-namazu-2.3.1)
をインストールしたいと考えています。

調べた限りでは、現在はPECLもCVSも利用できない(Namazuモジュール)
ということでした。Windowsでこのモジュールをインストールするにはど
のような手順を踏めばよいのでしょうか?

それと、塚田卓也さんという方がNamazu関数をWindows版PHPで
も使えるように開発された、モジュール「php4_namazu-3.0.0PHP4.3.x
」があるそうですが、これは5.0でも使えたりするのでしょうか?

205名無しさん@お腹いっぱい。
垢版 |
2006/10/18(水) 20:55:13
なんでナマズってこんなに遅いの?
2006/10/18(水) 21:13:56
>>205
何に比べて?
2006/10/18(水) 23:11:06
バンドウイルカ
2006/10/18(水) 23:34:51
>204
マルチよくない
ttp://www.namazu.org/pipermail/namazu-win32-users-ja/2006-October/001443.html

使えたりするかどうかは自分で試してみたの?
209名無しさん@お腹いっぱい。
垢版 |
2006/10/18(水) 23:49:19
いや、[PHP4---]というモジュール名から見るに、多分使えないだろう
なぁと思って、試してはいません。ただ、使えるか知っている方がいた
ら、その是非を教えて欲しいなぁと思いまして。
もう1つの、WindowsへのNamazuモジュールのインストールのほうは自分
でもそれなりに調べたりしましたが、どうも分からなかったもので。。。
2006/10/19(木) 22:20:26
使えないと思うならPHPやめてPerlにしておけ
2006/10/20(金) 03:49:00
使えない。
はい、この話題は終了。
212名無しさん@お腹いっぱい。
垢版 |
2006/11/13(月) 20:52:00
namazurcってmknmzしたときには適用されないんですか?
replace使いたいんですが…
2006/11/13(月) 21:31:48
--replace というオプションがある
ttp://www.namazu.org/doc/tutorial.html#run-mknmz
214名無しさん@お腹いっぱい。
垢版 |
2006/12/22(金) 16:04:17
namazuの検索結果をEUC-JPで出力させているのですが、Shift_JISで書かれた
ファイルの内容がそのままShift_JISで出力されてしまうため、検索結果が文
字化けしてしまいます。何か設定が必要なんでしょうか。
2006/12/24(日) 22:02:54
>>214
必要
2006/12/26(火) 14:20:11
tp://www.ki.nu/software/namazu/tutorial/make.html#PERL_MODULEで
namazu 1.9.12 以降では Chasen2 にだけ対応している。
とありますが、kakasiは使用できないということでしょうか?
2006/12/26(火) 15:07:33
検索結果にキーワードが最初にファイルの何行目に登場するか、の情報って取得できますか?
google検索エンジンみたいに、キーワードのヒットした前後の文章を結果一覧に出したいのですが・・・
2006/12/27(水) 09:38:55
>>216
そんな古い情報参照しないでよ...
http://www.namazu.org/doc/tutorial.html#prep-make

>>217
namazu.cgi単独では無理。コマンドラインならnmzgrepというのがあるけど、
あれは単に検索結果に基づいてあとでgrepしているだけ。
libnmz使って同等のことをやるか、Hyper Estraierでも使ってみるのが吉。
2006/12/28(木) 22:22:23
Namazu の ML はなぜ iso-2022-jp でも Content-Transfer-Encoding: 8bit
で送ってくるんだろう。なんか気持ち悪いなあ。
2006/12/29(金) 09:48:34
僕はテンプルウエストが気持ち悪いよ。
2006/12/29(金) 22:42:03
Linuxにnamazu-2.0.16をインストールして、
インデックスの作成とNamazuコマンドでの検索が出来るようになったのですが
検索対象はファイルの中身だけで、ファイル名は検索外にする事は可能でしょうか?
index.htmlを検索しても表示されない、でもindex.htmlの中身に書いてある文章で
検索を掛けると表示されるようにしたいのですが・・・
2006/12/30(土) 12:24:41
>>221
mknmz の namazu_core というサブルーチンに
$content .= "\n\n$filename\n\n"; # add filename
という行がある
これを削ってインデックスを作り直す
2007/01/02(火) 19:57:55
>>222
真にありがとうございます。上手く行きました。
ただ"index.html"だと表示されないようになったのですが、"index"で検索すると表示されてしまいます。
これも表示されないようにする方法はありますでしょうか?何度も質問して申し訳ありません
224223
垢版 |
2007/01/04(木) 21:18:12
自己解決しました
本当にありがとうございました
2007/01/10(水) 19:44:10
スレ違いかもしれませんが、

自分がよく利用するウェブサイトの一部のコンテンツをNamazuで検索可能にしたいの
ですが(Google等では何故かうまく出てこないので)、
その場合はウェブサイトの必要なコンテンツをローカルにダウンロードして、
それをNamazuにかけるわけですよね?
ウェブサイトのコンテンツをダウンロードするのにお勧めのソフトはありますか?
2007/01/10(水) 21:58:48
wget >> 225
2007/01/11(木) 08:26:55
wwwoffle+Namazuという組合せはどうか。
squid cacheも対応フィルタがどこかにあったような。
2007/01/11(木) 17:18:29
風博士 + Hyper Estraier とか。
229名無しさん@お腹いっぱい。
垢版 |
2007/02/02(金) 19:26:32
Vine3.2から4.0にしてから気づいたんですが、
kernel2.6系だとqueryの先頭からフィールド検索すると
日付ソートが逆になりませんか? バグですかね?

例:
http://www.namazu.org/cgi-bin/namazu.cgi?query=%2Bsubject%3ANamazu&submit=Search%21&whence=0&lang=ja_JP.eucjp&max=20&result=normal&sort=date%3Alate&idxname=www.namazu.org.ja
2007/03/15(木) 00:55:42
namazu 2.0.17 release!!
231名無しさん@お腹いっぱい。
垢版 |
2007/07/05(木) 13:53:45
ag
232名無しさん@お腹いっぱい。
垢版 |
2007/10/09(火) 03:41:55
EmphasisTags "<strong class=\"keyword\">" "</strong>"
みたいに設定してキーワードをハイライトさせているのですが、
キーワードの出現位置が検索結果の本文表示文字数のリミットと
被る場合にタグを閉じてくれず、次の行から真っ赤っかになってしまいます。
回避する方法ってあるのでしょうか?
233名無しさん@お腹いっぱい。
垢版 |
2007/10/10(水) 16:05:50
http://www.namazu.org/pipermail/namazu-devel-ja/2007-October/001647.html
これで直りませんかね。
2007/11/28(水) 05:27:51
ダブルクオーテーション内の連続した文字 "、狼8、" で検索かけたいのだがノイズ入りまくり
/、狼8、/ も試したが今度は見つからないとか言われた
勝手に要素に分割するなああああ
235名無しさん@お腹いっぱい。
垢版 |
2007/12/14(金) 21:25:55
mknmz -CでCoding System: eucってでるんだけどsjisにするにはどこの設定を弄れば良いですか?
2007/12/14(金) 21:46:18
Cording Systemの意味わかってないんじゃない?
検索結果をSJISにしたいんだったら
.namazurcでShift_JISに設定すればいいだけだし。
ちなみにNamazuのインデックス内部はeuc。
237235
垢版 |
2007/12/14(金) 22:33:23
>>236
なるほどありがとうございます

Namazuのインデックス内部はeuc。
ということはインデックスさせるページはEUCで記述しないと駄目なんですか?
2007/12/14(金) 22:34:52
>>237
んなこたーない
239235
垢版 |
2007/12/14(金) 22:41:36
>>238
むむむ・・
sjisで書いたページをmknmz -kでインデックス作ると
NMZ.wの中が所々文字化けるんですよ。。。
何かアドバイスお願いします。

# mknmz -C
わかち書き: /usr/local/bin/kakasi -isjis -osjis -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: euc

mknmzする前にsetenv LANG ja_JP.SJISしてます


2007/12/15(土) 20:44:17
-i -o については何も疑問に感じないのかね。
2007/12/15(土) 22:55:03
/usr/local/bin/kakasi -ieuc -oeuc -w
に戻せばいいよ
kakasiに渡される前にeucに変換されているのですよ。
242235
垢版 |
2007/12/18(火) 10:46:31
>>240
>>241
なるほど!解決しました!
ありがとうございます!
2008/02/04(月) 01:50:13
>>229
激しく亀レスだが、日付ソート(新しい順)の結果が
スコア順のソートと同じ結果になっている気がするんだが……。
244名無しさん@お腹いっぱい。
垢版 |
2008/02/06(水) 03:00:26
共有鯖でインスコしたいのですがsshやtelnet以外でインスコする方法ありませんか?
鯖が対応してなくて困ってます。
2008/02/06(水) 14:37:42
それ意味不明だし。
2008/02/06(水) 14:43:34
>>244
管理者の方に相談してください。
247名無しさん@お腹いっぱい。
垢版 |
2008/02/21(木) 21:40:38
新しいバージョンのnamazuだけど、namazu.cgiがnamazurc読み込んでないな。
なんかバージョンアップのたびに質が落ちてる。
248名無しさん@お腹いっぱい。
垢版 |
2008/02/21(木) 21:49:47
うーん…ベストを尽くせ。
249名無しさん@お腹いっぱい。
垢版 |
2008/02/22(金) 01:52:53
ナマズ作り直してくれねーかなあ。バカスカメモリ食いやがって。このへたくそが。
2008/02/22(金) 02:22:48
>>249
よし頑張れ。
2008/02/22(金) 03:33:49
それを必要な人がそれをやるしかないんだよ。

いわゆる言い出しっぺの法則 ――言い出しっぺがやらなければ誰もやらない―― だね。
252名無しさん@お腹いっぱい。
垢版 |
2008/02/28(木) 13:15:05
なんでこれ環境変数と設定ファイルで同一の設定値を設定しないといけないんだ?
混乱するだけだと思うんだが。
世の中からこういうバカがいなくなればいいなあ。
2008/02/29(金) 04:25:26
>>252
kwsk
254名無しさん@お腹いっぱい。
垢版 |
2008/03/03(月) 03:31:23
>>252
じゃあ直せよ
2008/03/03(月) 21:09:29
>>254
kursk
2008/03/12(水) 02:04:18
Namazu 2.0.18 リリース age
257名無しさん@お腹いっぱい。
垢版 |
2008/04/21(月) 21:18:16
windows環境でのNamazuでofficeを入れない環境で
office文書を検索対象に含めるには何のソフトが有効ですか?
Microsoft Office Viewerを入れたら可能ですか?

また、zipなどの圧縮ファイル名を検索対象にするにはどうしたらいいでしょう?

よろしくおねがいします
2008/04/21(月) 23:47:00
>>257
officeを入れない環境ではxdoc2txt.exeが有効。
windows環境ではzipには標準で対応している。試してみましたか?
説明書を読んでますか?
ttp://www.namazu.org/doc/manual.html#doc-filter
よろしくおねがいします
2008/04/23(水) 00:31:46
14ではzip対応していなかった。
18では全部できました。

lzhを対象にしたフィルタはない?
ここは潰れてる
http://log.counterghost.net/20040417.html
2008/04/23(水) 23:24:10
>>259
lzhを対象にしたフィルタはcvsにはあるっぽいね
http://cvs.namazu.org/namazu/filter/
でもwindowsでは使えないかもね
2008/04/23(水) 23:55:45
sub status() {
return 'no' if ($English::OSNAME =~ /^(?:MSWin32|os2)$/i);

# Only LHa for UNIX.
$lhapath = util::checkcmd('lha');

とかあるからwinは無理っぽいですね。。。

http://log.counterghost.net/20040417.html
↑持っている人どこかに上げてくれないだろうか・・・
2008/04/24(木) 00:22:14
WaybackMachine
2008/04/24(木) 00:33:50
IA探したけどなかったんだよ
264名無しさん@お腹いっぱい。
垢版 |
2008/09/19(金) 01:28:40
質問です。

WindowsXP + NTEmacs22.2 + Gnus の環境で Namazu を使っていますが、
Fedora9 + Emacs23 + Gnus で同じようにインストールした Namazu だと
「山田」のような固有名詞でも検索出来ますが、Winの場合だと同じ名前
で検索に引っかかりません。
(その名前が含まれたメールは存在してます。)

一般的な名詞だとどちらも同じように検索できてます。

環境としては、Win は ja_JP.SJIS で、Fedora9 は ja_JP.utf8 です。
両方共 Kakasi を使ってます。

何か気づいた点などありましたら教えてください。
265名無しさん@お腹いっぱい。
垢版 |
2008/10/17(金) 19:17:44
すみません。教えてください

test.tgzという1GBほどのファイルがあった場合に、
中身のについてのindex作成を行わずに
ファイルの名前とパスのみをindexに残したいのですが、
どのように設定すればよいでしょうか?

たとえばtest.tgzをtgzで検索にひっかけるなど、
ファイル名だけでも検索に引っかかるようにしたいのですが
可能でしょうか?
266名無しさん@お腹いっぱい。
垢版 |
2009/08/29(土) 11:16:19
64bit Linuxマシン(Red Hat Linux ES5)でnamazuをインストールしようとしますと、


Text/ChaSen/ChaSen.so \
-L/usr/local/lib -lchasen \

/usr/bin/ld: /usr/local/lib/libchasen.a(chalib.o): relocation R_X86_64_32 against `a local symbol' can not be used when making a shared object; recompile with -fPIC
/usr/local/lib/libchasen.a: could not read symbols: Bad value
collect2: ld はステータス 1 で終了しました
make: *** [blib/arch/auto/Text/ChaSen/ChaSen.so] エラー 1

というエラーがでます。

どのように対処したらよろしいでしょうか?

GOOGLE検索してもなかなか解決策が出てきません。

よろしくお願いします。
2009/08/29(土) 12:03:02
メッセージに recompile with -fPIC と言っているから、それを試みる。
2009/08/29(土) 12:04:23
rpmないの?
269名無しさん@お腹いっぱい。
垢版 |
2009/08/29(土) 15:02:28
>>267
recompile with -fPIC
というのはどういうふうに試せばいいのでしょうか?
これも検索したんですが、よくわかりません。。
>>268
rpmはでていないようです。さがしてみたんですが。。
270269
垢版 |
2009/08/29(土) 15:06:27
少し説明不足だったように思いますので、付け加えますと、
http://www.asahi-net.or.jp/~wv7y-kmr/memo/namazu.html
を参考にし、
Text::chassen perl moduleをインストールしようとし、
$ perl Makefile.PL
$ make
をした後に、266のメッセージはでます。。

2009/08/29(土) 15:46:16
>>270
茶筅のライブラリ /usr/local/lib/libchasen.a(chalib.o) が読み込めないと言って居るんだから
ライブラリをシステムに合わせて構築し直せ。
272269
垢版 |
2009/08/29(土) 16:11:36
>>271
すみません、もう少しヒントをもらえますか?
どのようにしてライブラリを構築しなおすといいのでしょうか?
自分がやったのは、
$perl -fPIC Makefile.PL
ですが、それもエラーがでました。このへん詳しくないので。。
273267
垢版 |
2009/08/29(土) 17:03:34
>>269 はじめのカキコのメッセージは、namazu のコンパイルオプション云々
じゃなくて、namazu をビルドするときに使おうとしているchasen のライブラリが
変だよ、といってるの。リンクに失敗しているんで、libchasen を -fPICという
のオプション付けてコンパイル (gcc) してくれたら直るとおもうよ、と言っているの.。

察するに、-fPIC オプションは実際には不要で、単に、chasen のソースを
とってきて、./configure; make; sudo make install ; sudo ldconfig とやれば
済みそうな気もするが。
2009/08/29(土) 17:22:27
>>272
茶筅のインストールに失敗しているんだろ
ttp://chasen.naist.jp/hiki/ChaSen/?%A5%BD%A1%BC%A5%B9%A4%AB%A4%E9%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB
茶筅単体で動くことを確認してみろ。 あと、茶筅のバージョンは最新か?

いらん話: -fPIC だが、茶筅の Makefile の CFLAG に 追加。
(このモジュールはCだかC++だかで書かれていたはず)
2009/08/29(土) 17:26:25
茶筅の最新版の取得先
ttp://sourceforge.jp/projects/chasen-legacy/
276269
垢版 |
2009/08/30(日) 09:45:59
>>273
>>274

ありがとうございます。

chasen自体は、
$ chasen
EOS
テスト
テスト テスト テスト 名詞-サ変接続

のように動いています。

ただ、 namazuで使う perl moduleの
Text::chasen がうまく入ってくれません。

chasen はchasen-2.4.4を使っています。これが最新のようです。

chasenのコンパイル時のMakefileにCFLAGに-fPIC をつけてもうまくいきません。。

もし何か分かりましたら、よろしくお願いいたします。
277269
垢版 |
2009/08/30(日) 09:54:18
64bitマシンがだめなのでしょうか?
32bitのときは問題なく前は入ったのですが。。
64bitでnamazuはあきらめたほうがいいということなのでしょうか?
2009/08/30(日) 09:58:36
>>269 「うまくいきません」
.so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう?
あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした?
http://www.daionet.gr.jp/~knok/chasen/
http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html
2009/08/30(日) 10:00:12
# 64bitでnamazu

64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
適切に対応していない可能性がある。
280名無しさん@お腹いっぱい。
垢版 |
2009/08/31(月) 19:35:35
>>278
>>.so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう?
これはしております。

>>あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした?
http://www.daionet.gr.jp/~knok/chasen/
はい、patchはあてています。

http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html
これは、まだチェックしきれていませんが、むつかしそうですね。調べてみます。

>>279
>>64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
>>/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
>>適切に対応していない可能性がある。
/usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。
2009/08/31(月) 23:52:45
> >>適切に対応していない可能性がある。
> /usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。
「64bit版のライブラリは /usr/lib64 に置く必要があるかも?」って話なんだけど。
282名無しさん@お腹いっぱい。
垢版 |
2009/09/03(木) 18:01:17
mknmzで大規模データを一日かけて実施していたところ、

NMZ.lock2 ファイルを発見しました
このインデックスは他のプロセスによって更新されている可能性があります

というエラーがでました。おそらく前回、途中でmknmzをやめ、indexファイル群
を削除せずに再度mknmzを実施したからだと思います。
仕方ないので、このlock2ファイルを削除し、
mknmz -Y
で差分更新をしようと思うのですが、前回エラーで中断したところから、うまく
再開できますか?

よろしくお願いいたします。
283名無しさん@お腹いっぱい。
垢版 |
2009/09/05(土) 08:26:43
280です。別の64bitマシンを借りて、インストールをし直してみたところ、インストールはうまく
いったのですが、別の問題が起きています。。
Text::Chasenの64bitマシンへのインストールでつまずいています。
以下のように、Text::Chasenのインストール自体には成功しているように
見えるのですが、perlからよびだせていないようです。
検索して、LIBS lstdc++ chasenなどを、Makefile.PLに足したりはしているのですが、
それでもうまくいっていません。
$ sudo make install
Files found in blib/arch: installing files in blib/lib into architecture dependent library tree
Writing /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/.packlist
Appending installation info to /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/perllocal.pod

$ perl -MText::ChaSen -e ''
Can't load '/usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/ChaSen.so' for module Text::ChaSen:
libchasen.so.2: 共有オブジェクトファイルを開けません: そのようなファイルやディレクトリはありません
at /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/DynaLoader.pm line 230.
at -e line 0
Compilation failed in require.
BEGIN failed--compilation aborted.

lddをすると以下のようになります。libchasen.so.2のある場所がおかしいのでしょうか?
どうすればいいかわからないので、何かアドバイスをいただけないでしょうか?

$ ldd /usr/local/bin/chasen
libchasen.so.2 => /usr/local/lib/libchasen.so.2 (0x00002aaaaaaad000)
libstdc++.so.6 => /usr/lib64/libstdc++.so.6 (0x00000032afc00000)
libm.so.6 => /lib64/libm.so.6 (0x00000032a9c00000)
libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00000032af400000)
libc.so.6 => /lib64/libc.so.6 (0x00000032a9800000)
/lib64/ld-linux-x86-64.so.2 (0x00000032a8800000)

よろしくお願いします。
2009/09/05(土) 21:53:03
Text::ChaSen をビルドする前に、Makefile.PL のなかのLIBS指定、
'LIBS' => ['-L/usr/local/lib -lchasen' みたくしてる?
285名無しさん@お腹いっぱい。
垢版 |
2009/09/08(火) 20:31:02
namazuでmknmzする際の最大メモリ使用量が32bitマシンでは、4GBでしょうか?
それだと足りなくて、
Out of memory!
NMZ.lock2 ファイルを発見しました
となる場合はどうすればよいでしょうか?
2009/09/09(水) 01:21:47
>>285
インデックス分ければいい。
2009/09/09(水) 21:25:51
だれかNamazuを近代化補修しろよ。
2009/09/29(火) 19:31:08
>>287
近代化されているかは不明だけど、バージョンアップされているね。

Namazu 2.0.20
http://www.namazu.org/index.html.ja#news
289名無しさん@お腹いっぱい。
垢版 |
2010/04/22(木) 20:07:42
6万貰ってセックヌしてきたぞ!!

濡れた熟マンに入れたら、肉ヒダがしっとり絡みついてきて、
そんだけでイきそうになったわww
http://xabrina.net/om/c9y94mf
2010/05/31(月) 16:47:39
スレがうまく読み込めない…
2011/02/04(金) 21:34:06
mknmz + pdftotext で PDF ファイルをインデックス化してるんだけど、
100MBを超える PDF だと、out of memory のエラーが出る。

mknmzrc の記述はチェック済み ($FILE_SIZE_MAX, $TEXT_SIZE_MAX, $ON_MEMORY_MAX)。
マシンのメモリは 4G 積んでるので、実際のメモリ不足ではないと思う。

ご存知の方、よろしく。m(_ _)m

環境:Namazu for Windows (ver. 20.0.20) on WinXP SP3
Active Perl 5.8.9
2011/02/04(金) 23:23:25
>>291
以前、某パッケージのマニュアルで発生した。
pdfsplit.pl でページ単位に分解したら上手くいった。

# つ〜か、そのサイズのpdfって数百ページないか?
# ページに分解して処理しないと面倒だと思う。
2011/02/05(土) 10:22:07
>>292
サンクスです。
>> ttp://www.namazu.org/ml/namazu-devel-ja/msg01950.html
を見て、pdfslit.pl を導入してみましたが、out of memory のエラー
がでます。やはり、pdfファイルがでかすぎるのかな…
294名無しさん@お腹いっぱい。
垢版 |
2011/07/09(土) 20:40:20.11
>>293
File::MMagicでメモリを大量に消費しているのが原因っぽい。
-tを使うとうまくいくかも。
295名無しさん@お腹いっぱい。
垢版 |
2011/09/18(日) 16:06:29.49
サーバ中の文書を検索したくて入れてみました。
入れてみて気付いたのですが、EUC-JPにしか対応していないようです。
検索対象の文書は、UTF-8とEUCJPとSJISのファイルが混在しています。
内部的に、エンコードを自動的に検出して変換してインデックス化、
という処理は行われているのでしょうか?
それとも、すべてEUC-JPの文書という前提で動作しているのでしょうか?
2011/09/18(日) 16:40:29.46
試しに検索してみたらできました
NGNG?PLT(12080)
ver3は?
298名無しさん@お腹いっぱい。
垢版 |
2014/01/30(木) 20:35:11.93
グーグル検索の進化
http://webblogsakusei.main.jp/seo-taisaku-matt-cutts-toha-2014-google-hummingbir.html
2014/11/11(火) 18:34:41.57
winのお話だけど、PCの引越ししたら下記URLをチェキだ!
http://www.namazu.org/pipermail/namazu-win32-users-ja/2009-September/001206.html
http://namazu.asablo.jp/blog/2009/08/09/4488130

なんでそんな古い話するかって?俺が今日ハマったからだ!
2015/12/10(木) 00:48:56.82
ハゲ侍 サブコミュ イケメン スカイプ マリリンマンソン Twitter マリオ64 ゲーム実況者 マリオカート
ハゲ侍 ツイッター 星のカービィ64 マリオサンシャイン ニコニコ超会議 ポケモン フレコ MH4G アメブロ
ハゲ侍 アメーバブログ 仕事 Skype ツイキャス モンハン 歌い手 スプラトゥーン マニアック
ハゲ侍 動画 顔 ドリームクラブ 好き 刃牙 サイレントヒル ドラゴンボール イケボ
ハゲ侍 漫画 フレンドコード NG縛り ニコニコ生放送 歌ってみた 太刀 ニコニコ超パーティー コミュニティ
ハゲ侍 大学 アキネーター 配信 ニコ生 サブコミュ マリリンマンソン イケメン 学歴
ハゲ侍 マリオカート Twitter スカイプ マリオ64 ツイッター ゲーム実況者 星のカービィ64 ニコニコ超会議
ハゲ侍 ポケモン マリオサンシャイン フレコ MH4G アメーバブログ 仕事 Skype ツイキャス
ハゲ侍 モンハン 歌い手 マニアック 動画 アメブロ スプラトゥーン 刃牙 ドリームクラブ
ハゲ侍 好き サイレントヒル ドラゴンボール 漫画 顔 NG縛り フレンドコード ニコニコ生放送
http://kanae.2ch.net/test/read.cgi/pcqa/1421101110/51
http://kanae.2ch.net/test/read.cgi/pcqa/1415921104/55
http://kanae.2ch.net/test/read.cgi/pcqa/1436852775/17
301名無しさん@お腹いっぱい。
垢版 |
2017/12/29(金) 10:39:51.92
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。

グーグル検索⇒『宮本のゴウリエセレレ』

V65BEHAU71
302名無しさん@お腹いっぱい。
垢版 |
2018/05/22(火) 03:31:49.14
知り合いから教えてもらったパソコン一台でお金持ちになれるやり方
時間がある方はみてもいいかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

7BK22
2019/02/17(日) 13:35:08.10
10年前くらいに社内システムの鯖見たらNamazu入ってたな
でも検索すら出来なかった
2020/02/11(火) 15:34:25.83
チエオクレのハゲの悲惨なツイッター
https://twitter.com/aphonedollar

  ↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑
この自称「ハゲ」とかいうチエオクレのブログが酷すぎる

>「DesktopHE」 はWindows10に対応してないらしい

はぁ??? ★★★大嘘デタラメ★★★を垂れ流すな!!!

■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■

チエオクレのこのハゲが、Javaの設定を失敗してるだけじゃねえか!!!
嘘デタラメ垂れ流しやがって、このハゲがやっていることは立派な公害じゃねえか!

hatenaとかでまで、必死こいて大嘘をばらまいているんだが  
https://twitter.com/5chan_nel (5ch newer account)
305名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 19:35:04.77
あー飛行機代高騰してるとかノスタルジーなオッサンだな
これは何なん?
306名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 19:37:48.37
>>1

なんか関係あったっけ

プロ意識なさすぎだろ
307名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 20:04:14.36
今量ったら
空飛ぶタイヤは整備不良って初めから決めつけて練習着のままって感じかな
半年に一ヶ月だけ入って長く伸びる

下で投げたチキン居らんよな
308名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 20:10:03.59
改憲看板は馬鹿さ
309名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 20:26:22.73
機関が売り抜けてる頃にもいたんだよね
舞は毒母の被害者続出していて
2024/03/27(水) 21:02:31.41
今日で車両保険自体いらない説も多いからメアドとパスワードの組み合わせは
素人考えでもないし
2024/03/27(水) 21:03:42.70
オートミールは
しゃべくりは確か
312名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 21:25:05.37
>>301
サロンの情報空間の中のショーに出る
野菜だけ食って野菜も食って飲んだ
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況