X



全文検索エンジンNamazu ver2
0001名無しさん@お腹いっぱい。垢版2005/04/11(月) 01:31:01
全文検索エンジンNamazuについてアレコレ

http://www.namazu.org
0003名無しさん@お腹いっぱい。垢版2005/04/11(月) 05:09:19
3ちしげ3ゆ3様が電光石火の3ゲットなの!
                         >>1番かわいいのはさゆなの!
                    ノノハヽヽ〃ノハヾ /) >>2じ本はハゲすぎなの!
  後>>10は落ち目すぎなの! ∩*・ 。.・)从*・ 。.・)/ミ
                 〃ノハヾノノハヽヽノノハヽヽつ  い>>4川は黒すぎなの!
>>9ちもフケすぎなの!⊂(。.・从(・ 。.・*∩ノノノハ 。.・)ノハヽ
              ((  (\ゝノノノハノハ〃ハ v)っ彡*・ 。.・)
>>8やはフケすぎなの! ⊂`ヽ从*・ 。.・)・ 。.・))ノノノハヽつ ))>>5んのは顔ふくれすぎなの!
大の大人が>>7っちとか(プ⊂\  ⊂ )  _つ从*・ 。.・)
                   (/( /∪∪ヽ)ヽ)/ U  つ モー>>6すは売れなさすぎなの!
                   ∪ ̄(/ ̄\) ゝし'⌒∪              

              >>11-1000さゆのかわいさの前にひれ伏すの!
0004名無しさん@お腹いっぱい。垢版2005/04/11(月) 09:47:20
    ,,r 、,r'"⌒`゙゙ヽ、     +
   /  "~ ヽ、    `ゝ    +
. ./ ,r彡"   、ノ彡' ヽミ`\   +
 r、r.r 、 ソ/ノ     ヽ `ゝ   + 
 _ ,|_,|  ノ   ⌒    ⌒ヾ|ミヾ   + 
 ノ ノノノノ--<-●>-,(-●>ミ ミ    + 素敵な微笑とともに4様上陸!
 ノ ノノノノ   ""    )  " ミ    +
ノ .彡| |     トーー/| | ミ   
   ∧ | \  ..ヾ____/  ..|
   |ノ \  \  "⌒  ノ\
   ヽ 《   ..~ ー--/   /
0005名無しさん@お腹いっぱい。垢版2005/04/14(木) 15:26:59
【日産】 NOTE ノート Part9 【普通で素直】
http://hobby7.2ch.net/test/read.cgi/auto/1113087118/

孤独な日産信者、通称「ネット版劇団独り」。
相次ぐノートの酷評記事、酷評レスの結果にもめげず、叩かれ役として大活躍w
気が向いたら燃料でも投下してあげてください。

◆◇◆◇◆◇◆◇◆◇◆◇ネット版劇団独りの特徴◇◆◇◆◇◆◇◆◇◆◇◆
>ノート信者はやたらと若者向けと思わせたがる。
>ノート信者はやたらと女に人気があると思わせたがる。
>ノート信者はやたらと個性という単語を強調したがる。

さらに

捏造した燃費データを報告。
ノートについて論点は存在せず、私怨で追いかけ回すざま。
>>229,232などでわかるように、悔し涙で文字が読めないほど常時興奮。
ID変えまくって仲間がいると思わせたいらしいw
執念だけはルパンを追う銭形以上。
やられっぷりはトムとジェリーのトム以上。

本人へのアドバイス
「IDを変えて必死か?」というレスに対する反応が、毎回ビックリするほどワンパターンw
ID変えの際に書き込み時間が集中しすぎ。文体が似すぎw厨房レベルw
◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆
0006名無しさん@お腹いっぱい。垢版2005/04/22(金) 14:58:10
namazuって、滅びた?
0007名無しさん@お腹いっぱい。垢版2005/04/22(金) 17:52:35
しばらくは現役でしょ。今でもいろんなとこで使われている。
日本語全文検索エンジンを普及せしめたという歴史的役割は終えつつある
と思うけど。
0008名無しさん@お腹いっぱい。垢版2005/04/22(金) 18:29:13
いやいや、開発コミュニティがさ。
サイトの復旧が途中で止まってる。
0010名無しさん@お腹いっぱい。垢版2005/04/22(金) 21:05:39
>>9
あそこまでひどくはないだろう。せめて引き合いに出すならCannaってところだ。
まあ作る方も使う方もフィルタ増やすことくらいしか頭にないからな。
それとUTF-8化。
0012名無しさん@お腹いっぱい。垢版2005/04/22(金) 23:43:22
企業関係のメイン検索システムに入ってるんで
そうそう簡単に捨てられることはないんじゃないの?
やっぱ、オフィス、PDFなんかがまとめて行けるのは大きい。
あと、インストールや設定の資料が豊富だし。

ただ、Namazu Proj.はセキュリティ関連アップデートとか
フィルタまわりのソフトウェアバージョンアップに伴う修正
ぐらいしかやってないから、進化は止まっちゃったよね。
良い意味でも悪い意味でも、枯れてしまった。

0013名無しさん@お腹いっぱい。垢版2005/05/23(月) 18:00:46
茶筌でUTF8を使おうと思って、茶筌のHPの説明にあるとおりにしたんですが、
エラーがでてます。

それに関係しているようなのですが、英語の単語の認識が、例えばHelloだったら
h e l l o のように解析されてしまうんですが、一単語として認識させるには、
何が問題かわかる方いらっしゃいますか。
0014名無しさん@お腹いっぱい。垢版2005/05/23(月) 18:02:18
あげときますです。。。
0017名無しさん@お腹いっぱい。垢版2005/06/24(金) 13:14:47
a name ごとにインデックス作成するのでやってるんですが、
特定の a name を対象外に指定することってできますでしょうか?
具体的には、ページトップ戻り用の<a name="top">てのをはずしたいんですが…
0018名無しさん@お腹いっぱい。垢版2005/06/24(金) 13:32:20
あげてみた
0019名無しさん@お腹いっぱい。垢版2005/06/24(金) 19:54:25
ヒットした検索結果毎に表示される日付のフォーマットって変更することできますか?
テンプレには無いのでcのソースかなと思ったんですが、該当箇所が見当たらないので。。

それと、
------------------------
参考ヒット数:[***:10]
検索式にマッチする10個の文書が見つかりました。
------------------------
の前後に挟まる謎の<p>,<dl>タグと
------------------------
現在のリスト: 1 - 3
ページ: [1]
------------------------
の前後に挟まる謎の<p>タグの消し方ご存知でしょうか?

#namazuの仕様にうんざり…
0023名無しさん@お腹いっぱい。垢版2005/06/24(金) 20:58:08
たたかれてないじゃん?
うんざりしてるんなら使わなければいいじゃん?
いまだったらEstraier みたいな高機能なのもあるしさ。
0024名無しさん@お腹いっぱい。垢版2005/06/24(金) 21:42:56
他のを使えと言うのならこのスレはなんなんだ?
0025名無しさん@お腹いっぱい。垢版2005/06/24(金) 22:08:12
>>24
意味不明
002619垢版2005/06/24(金) 23:52:27
すいません、色々物議をかもしてるようで…
namazuの仕様にうんざりしたのは、色々と
試行錯誤していてもなかなかうまくいかなかったのでつい…。

修正する方法が無いのであれば仕方ないのかもしれませんが、
もしご存知の方がおりましたらご教授いただければ幸いです。
0028名無しさん@お腹いっぱい。垢版2005/06/25(土) 00:51:35
あと、日付の書式は NMZ.field.date を読んでるだけだから,
そっちを直す。 NMZ.*を手で修正した場合は,rfnmz で
NMZ.field.*を再構築すること。
002919垢版2005/06/25(土) 12:49:47
>>27,28

ありがとうございます!
もう少し頑張ってみます。
0030名無しさん@お腹いっぱい。垢版2005/07/13(水) 14:24:03
namazuをWindows2000で動かしています。Apacheを使ってnamazu.cgiもできましたし、
すべてが順調にすすんでいるかのように思いました,,,が、pdfを検索対象にするにあたって
インデックスを作成すると、
検索対象のファイルを調べています...
1個のファイルがインデックス作成の対象として見つかりました
1/1 - /C|/aaa/tsunaba_abst.pdf Unable to convert pdf file (maybe copying protect
ion)
[基本]
日付: Wed Jul 13 14:21:42 2005
わかち書き: module_kakasi -ieuc -oeuc -w
経過時間 (秒): 1
ファイル/秒: 0.00
システム: MSWin32
Perl: 5.00503
Namazu: 2.0.14

となり、インデックス作成できませんでした。
だれか解決法教えてください
0032名無しさん@お腹いっぱい。垢版2005/07/13(水) 15:16:15
>>31
それも設定しました!説明などに書いてあるものはすべてしました!mknmz -Cを実行すると、
一応application/pdf: pdf.plが対応になっています。
0037名無しさん@お腹いっぱい。垢版2005/07/14(木) 20:31:49
>>36
どこが平和だ!!

イラクではアメリカ軍の攻撃で毎日毎日100万人ものイラク人が
虐殺されているのに、よくも平和だとかほざけるもんだな!!
0040名無しさん@お腹いっぱい。垢版2005/07/17(日) 02:27:52
rastはWindows版がないから駄目。
0047名無しさん@お腹いっぱい。垢版2005/08/05(金) 11:12:41
namazuのフレーズ検索を利用しているのですが,
"New Order"で検索をかけても100%New Orderというフレーズ
がでるわけでなく,ときどきnewとorderが分離してても
結果としてはじきだしちゃう場合があります.
そういうミスをできるだけ減らしたいのですが,なんかいい
テクニックありますでしょうか?
フレーズ検索とはそういうものでしょうか?

googleだとNew-Orderとして検索するとほぼ100%でフレーズとなって
結果がでてくるのですが..
0048名無しさん@お腹いっぱい。垢版2005/08/05(金) 11:31:00
というか,いまいろいろ調べてたら,
"New Order"で検索をかけてもand検索にしかなっていない事が
判明しました.
フレーズ検索ってどうやってやるの?

環境はFedora4でnamazu of Namazu 2.0.14
です.
よろしくお願いします.
0049名無しさん@お腹いっぱい。垢版2005/08/05(金) 12:04:14
できました
0051名無しさん@お腹いっぱい。垢版2005/08/05(金) 12:18:05
"{New Order}"
でよかったです.
0053名無しさん@お腹いっぱい。垢版2005/08/09(火) 21:24:22
JAVAでretrievalWordという変数にModern Artsというような文字列をいれて,
下記のような検索プログラムにより,検索エンジンnamazuの
入力として渡しています.
この場合,namazuには,
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
という入力が渡される事になります.
なおnamazuは,"{Modern Arts}"という検索がいった場合,
"{}"で囲まれた文字列がフレーズとして検索されるという機能をもっています.
つまりターミナルから
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
と入力するとModern Artsの検索としてうまく行くのですが,
java経由で下記のプログラムからnamazuへ検索要求をしても
namazuでは,
"{Modern Arts}"という文字列の検索を行ってしまい,
Modern Artsの検索がうまくいきません.

String proscmd = "namazu --max=2000000 ";
proscmd = proscmd + "\"{" + retrievalWord + "}\" " + indexdir;
System.out.println("proscmds : " + proscmd);
Process process = Runtime.getRuntime().exec(proscmd);

結果
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0

この原因がどういう点にあるのかを教えて頂けないでしょうか?
もう長いことこれに時間をかけています。でもわかりません。
宜しくお願い致します.
0055名無しさん@お腹いっぱい。垢版2005/09/02(金) 12:23:34
メール本文のインデックスを作ってくれるのはありがたいんですけど、
メールに添付されている PDF や、Excel, Word ファイルについても
インデックスを作ることはできませんか?
0058名無しさん@お腹いっぱい。垢版2005/09/04(日) 21:25:54
>>57
multi-part部も
2.0.15ではインデックスに含めるようにできると思われる
ttp://www.namazu.org/pipermail/namazu-devel-ja/2005-July/000487.html
2.0.15pre1が出ているから試してみては?
0062名無しさん@お腹いっぱい。垢版2005/09/23(金) 22:44:14
gj

でも何が増えたのかわからないし、独自加工もしにくいので
mkkanwaする前のソースデータもうpきぼんぬ。GPLだし。
0063名無しさん@お腹いっぱい。垢版2005/11/01(火) 17:00:27
かなり困った。。。

PHPモジュールでmaxhit超えたやつに Too match hitとか出したいんだが
resultが全部0で帰ってくる・・・

どうしたらいいものだろうか
006463垢版2005/11/01(火) 17:11:13
Too many documents hitだな・・・お恥ずかしい
0065名無しさん@お腹いっぱい。垢版2005/11/04(金) 00:17:55
会社でUNIX畑の人に「とりあえずなまずって検索してみて」といわれたので
OHPとかこのスレとか見てみました。
日本語全文検索ってほぼGoogleでカバーできてるのでは?
Winではあまり普及していないらしいし、導入に面倒がありそうだし
これからのNamazuの役割って一体なんです?
0068名無しさん@お腹いっぱい。垢版2005/11/04(金) 11:54:23
>>65

UNIX畑の人に聞いてみたら?
ってか色々なサイト見てきたんだったら役割は自ずと見えてくるだろうと思うけど

まぁちょっと設計が古かったりするところはあるとはおもうけど
自分に必要な機能が満たされていればNamazuでも十分だとか
そういうことを判別できれば役割はかなりあると思うよ

まぁ役割は自分が必要と思えばあるし、無ければ無いんだよ
0069名無しさん@お腹いっぱい。垢版2005/11/04(金) 11:58:41
>>66
> McDonald's があれば、モスバーガー、ロッテリアは必要ない、とかそーゆーこと?
McDonald'sがあれば、家庭に台所は必要ない、って言ってるんだろ。
0071名無しさん@お腹いっぱい。垢版2005/11/04(金) 23:35:30
>>65です。たくさんレスありがとうございます。
実際自分はWinしか触ったことのないリアル素人で、OHPや主だった関連サイトを
いくつか見てみましたがいまいちピンときませんでしたが
>>69氏の譬えが的を射ているのかな。

つまりGoogleとかはロボットに「検索してもらう」という受動的な検索だけど
なまずは自分で全文を検索に引っ掛けるように設定するという能動的検索
という理解でよろしかろうか。
なんか新しく入った会社で雑務のひとつとして、なまず検索の更新も担当する
ということらしいです。
まだ具体的には本物の鯰なのかcgiの鯰なのかよくわかりませんが、
これからも何かとお世話になるかも知れません。
どうぞよろしくおながいします。
0073名無しさん@お腹いっぱい。垢版2005/11/05(土) 00:09:33
> なまず検索の更新も担当

これも謎だよなー
ふつうは更新されたファイルを探し出て、インデックスも更新する
スクリプトを自動的に動かすもんだし。
0074名無しさん@お腹いっぱい。垢版2005/11/05(土) 00:21:14
>>71
> なんか新しく入った会社で雑務のひとつとして、なまず検索の更新も担当する
> ということらしいです。

UNIX畑の人がいるのに素人にこんな雑務をやらせるこの会社って一体…
0076名無しさん@お腹いっぱい。垢版2005/11/05(土) 01:56:18
Obsoleted Home Page だよもん

webブラウザを立ち上げたときやホームボタンで表示されるページだよもんが、
メンテされないのでリンク切れ多発でよく使うのにリンクしてないサイト
多数出現だよもん
0078名無しさん@お腹いっぱい。垢版2005/11/05(土) 10:50:34
>>74
UNIX畑の人が抜けるんで、自分が引継ぎということらしいです。
なにしろ社員3人で他SOHOスタッフしかいないんで勘弁してやってください。

>>77
エロゲ用語だったのですか。ふつーに公式サイトの意味で使われているものとばかり(w

>>73
なるほどー。それがふつうなのですね。
昨日全体の業務引き継ぎ内容を大雑把に説明されただけなので
まだ具体的なことはよくわからないのですが、鯰のこともうちょっと
調べてみるです。
008068垢版2005/11/07(月) 14:10:30
がーん

ttp://www.ki.nu/OHP/
このことかと思ってた俺って。。。。
0081名無しさん@お腹いっぱい。垢版2005/11/09(水) 00:36:29
Namazu 2.0.14 for Win32 (Beta) を導入したのですが、
C:\namazu\share\namazu\filter\win32 の中に oleword.pl が見当たりません。
Office 2000ではダメで, 2003が導入されている必要があるのでしょうか?

wvWareのWindows版を導入しようとしたのですが、コマンドがシェルスクリプトに
なっているようです。cygwinがいるのでしょうか?
0082名無しさん@お腹いっぱい。垢版2005/11/09(水) 02:01:38
>>81
俺は cygwin + Namazu-2.0.14.tar.gz を
ソースコンパイルなので環境がだいぶ違うが、
Namazu 本家の namazu-2.0.14.tar.gz を解凍したら
namazu-2.0.14/filter/win32/ 以下に
olemsword.pl があるよ。

後半の方は俺には質問の意味が分からんのでパス。
0086名無しさん@お腹いっぱい。垢版2005/11/24(木) 11:56:33
Namazuで検索キーワードの該当部分を
検索結果に反映する方法はありますか?

たとえば、デフォだと該当キーワードがHTMLの末のほうにあっても、
検索結果のプレビューではHTMLの上のほうから表示されてキーワードが
出てきませんよね?
それを、キーワードの該当部分の前後文を表示するようにある方法が
あるらしいといわれたので探しているのですが、わかりません。

もしかして指示者が別の検索エンジンと混同してるかも知れないので、
Namazuにそういう機能があるのかどうか だけでも教えていただければ
幸いです。
0090名無しさん@お腹いっぱい。垢版2005/11/25(金) 10:05:19
>>89
指示者もうろ覚えだったようなので、Esterierと混同していたのですね。
そのように報告しました。
どうもありがとうございます(´∀`)
0091名無しさん@お腹いっぱい。垢版2005/12/05(月) 20:35:20
Webサイト内の商品検索に使用したいと思うのですが
namazuの検索結果に画像を表示させることは可能ですか?
0092名無しさん@お腹いっぱい。垢版2005/12/06(火) 00:45:33
>>91
どこかのサイトで検索結果のサムネイル画像をやろうとしてた希ガス。
template の NMZ.result.normal.?? を変更すれば出来るっけか。
0093名無しさん@お腹いっぱい。垢版2005/12/06(火) 11:41:20
>>91
検索結果に見合った画像を出すのはテンプレ変更だけじゃ無理かも。
「可能か」の問いには、オープンソースだからね。出来るさ。
009491垢版2005/12/06(火) 13:55:33
ありがとうございます。私のスキルでは簡単には出来そうもないですね。

調べてみたところkabayakiなら出来そうな感じですね。
Vineなんですが導入できるんだろうか。
009691垢版2005/12/07(水) 12:32:17
>>95
ありがとうございます!
他のどの方法でやるのか悩んでいたので助かりました。
0097名無しさん@お腹いっぱい。垢版2005/12/07(水) 22:12:00
ビバ・オープンソース!
0099名無しさん@お腹いっぱい。垢版2005/12/09(金) 12:44:41
Namazuで動的ページに対してインデックスを作ることはできますか?

DBから取得した情報をHTMLで出力するPHPプログラムがあるとして、
そのHTMLを検索対象にしたい場合が結構でてくると思うんですが、
やっぱりHTMLファイルを生成するしかないんですかね?

wget 等で一度プログラムをたたいてその結果をインデックスすれば
いけないこともないと思うんですが…。
そのようなNamazuモジュールや設定があればご教示いただけると助かります。
010199垢版2005/12/09(金) 18:22:14
>>100

そんなモジュールがあったんですね。
参考になります。

ただやっぱりNamazu系のフリーの全文検索ツールじゃないときついですね…
0104101垢版2005/12/12(月) 15:46:05
>>102,103

言葉足らずですんません。

mod_estraier はキャッシュとして動く感じだと思うので
ちょっと想定の動作とは異なる感じがしました。

Namazuを使うのはほぼ決定なんですが、
動的ページの検索がHyper Estraierでしかできないのであれば
その方向でも考えた方がよさそうですね。
0106名人垢版2005/12/18(日) 16:22:25
インディックスの作成の名人ですがどなたか勝負しましょう。
どこかサイトをいってください。
そしてインディックスの小ささと、単語のヒット率で勝負です。
0107名人垢版2005/12/18(日) 16:23:32
工夫の余地の大きい日本語のサイトにしましょう。
0108名人垢版2005/12/19(月) 09:05:34
前処理をよく行っておくことが重要です
0110名無しさん@お腹いっぱい。垢版2005/12/19(月) 16:27:59
>>109
全角にしました。

誰も挑戦者はいないようなのでインディックスにしたいサイトが
あったら名人が作ってあげます。
小さすぎても大きすぎても駄目。ファイル数が五千から五万くらいのならいいよ。
0111 垢版2006/01/04(水) 18:31:15
2.0.15RC1 テストに参加しる!!
0112名無しさん@お腹いっぱい。垢版2006/01/11(水) 18:10:18
ウェブ上のバグ報告システムなら気軽に書けるし
仮にメール欄があっても捨てアドなりなんなりで良いけど
メールで ML にバグ報告は色々と敷居が高いよぅ

…と保守がてら言ってみるテスト。
0113名無しさん@お腹いっぱい。垢版2006/01/11(水) 19:56:47
ファイルの添付も簡単だし、ハードコピーも貼れるし。
(namazu.cgiとかWindows上のエラーダイアログくらいしか出番はないかもしれんが)

Wikiがあるならドキュメントの保守も簡単だし、TracのWiki自体も差分や変更履歴が残るしね。

と言ってみる。
0115名無しさん@お腹いっぱい。垢版2006/01/16(月) 10:23:25
現在phpから動的にページを生成して出力しているのですが、
このPHPから出来上がるページをnamazuで検索したいと思っています。
どのような手法がありますでしょうか?
0116名無しさん@お腹いっぱい。垢版2006/01/16(月) 20:04:50
>>115
一番いいのは、その PHP のページががキャッシュを書き出す方法だけど
Proxy 経由でキャッシュを取るか、無限ループに気をつけて wget するかじゃないかな。
0117名無しさん@お腹いっぱい。垢版2006/01/22(日) 14:28:27
ファイル数が多く時間がかかるので
インデックスの作成を何日かに分けてやりたいんですが
どうすればいいでしょうか?
途中から再開する方法を知りたいです
0118名無しさん@お腹いっぱい。垢版2006/01/23(月) 03:53:30
>>117
ファイル一覧を作ってから5000個ずつ処理するのがよいぞ
0119名無しさん@お腹いっぱい。垢版2006/01/23(月) 03:56:11
大量のファイルを処理するにはindexサイズが大きくなりすぎないように
することが大切だぞ。
処理中になんどか更新するがとても時間が掛かってしまう
あとでマージせよ
0120名無しさん@お腹いっぱい。垢版2006/01/23(月) 10:27:28
>>118,119
ありがとうございます。インデックスをいくつかに分けて
作成する事にしました。インデックスのサイズが小さいと
時間の掛かり方も全然違いますね。
全部まとめてやるよりも早く終わりそうです。
0121名無しさん@お腹いっぱい。垢版2006/01/24(火) 13:27:51
動的ページ(DBから情報を取得するもの)を検索対象にするために、
wget + Namazu で実際に運用されている方はおられますか?

DBから取得した情報も全て静的ページに吐き出してからそれをインデックスするのか、
wgetで全部ダウンロードしてそれをインデックスするのかで悩んでいます。

後者の方が圧倒的にメンテナンスも構築も容易なのですが
実運用で使うに耐えられるものなのかが不安でして…。

宜しくお願いします。
0122名無しさん@お腹いっぱい。垢版2006/01/24(火) 13:30:44
>>121
> 後者の方が圧倒的にメンテナンスも構築も容易なのですが
> 実運用で使うに耐えられるものなのかが不安でして…。

と悩みはじめてすでに5年〜♪
0123121垢版2006/01/24(火) 14:10:24
>>122

悩むんですよね…。
Namazuのためだけに静的ページ生成を行うというのはどうも。

Namazuだと、ドキュメントルート以下にあるファイルでも
Webに公開されていない(リンクされていない)ものも引っかかってしまうので、
そう考えると wget の方が理にかなってるんですよね。

#メルマガなんかで直接URLを通知されるページは元も子も無いですが。。
0124名無しさん@お腹いっぱい。垢版2006/01/26(木) 05:06:02
>>120
最初は一度にまとめてやった方が速いと思うのだろうけど。
例えば5メガずつindexを書き出す場合、今のindexサイズが200メガだったら
後50メガ追加するのに約1ギガの書き込み、消去を行うことになる。
これはとても大変だ。
0125名無しさん@お腹いっぱい。垢版2006/01/26(木) 05:08:29
ただディスクアクセスだけではない。
indexサイズがでかければメモリ、cpuの処理も時間が掛かる。
0127名無しさん@お腹いっぱい。垢版2006/01/30(月) 21:45:06
2006-01-29: Namazu 2.0.15 を公開

ISO-8859-* に関する文書の間違いを訂正
RedHat ソフトウェア namazu.spec の不必要なパッチは削除
File::MMagic 1.25 を同梱
MeCab の正式対応
mknmz に -b 及び --use-mecab オプションを追加
mknmz および namazu に --norc オプションを追加
mknmz に --decode-base64 オプションを追加
新しいフィルタ(Gnumeric, Koffice, Mainman/Pipermail, Zip, Visio)を追加
mknmzrc に MECAB, DENY_DDN を追加
ファイル名がDDN である時にスキップ。
日付フィールドによるソート機能の追加
nmzcat, nmzegrep コマンドの追加
フィルタの Windows 対応
(msword.pl, excel.pl, powerpoint.pl, postscript.pl, 等...)
OLE コントロールフィルタ更新
QUERY_STRING の区切りに';' 使用可能
Perl版テストプログラム(pltests) を追加
各種バグフィックス
0131名無しさん@お腹いっぱい。垢版2006/02/11(土) 21:10:15
Debian Sarge で namazu 2.0.14 を使っているのですが、教えてください。

mknmz を -U オプションを付けて、Samba 内のインデックスを作成しているの
ですが、職場のパソコンのIEのバージョンにより、動作が異なります。

IE 6.0 では、検索結果の表示、クリックした時にファイルが開けるのですが、
IE 5.5 では、検索結果の表示は正常なものの、クリックしたときにパス名が
文字化けして、うまくファイルを開くことができません。

そこで、両バージョンのIEでファイルが正常に開けるように、検索結果を
.namazurc の Replace コマンドで全体を " " で囲む等ということが可能
でしょうか?それとも、もっとよい方法が存在するのでしょうか?

よろしくお願いします。m(._.)m
0132131垢版2006/02/12(日) 19:57:31
>>131 です。 自己レス申し訳ないです。

再度、確認したら、自分の設定がおかしかったか、キャッシュが禍したのか原
因は不明でしたが、いずれのバージョンのIEでもまともに表示し、ファイルを
開くことができました。
確認したこと、.mknamazurc で lang=ja.SJIS、 mknmz -U オプション。

すれ汚し、申し訳ありませんでした。m(._.)m

0136名無しさん@お腹いっぱい。垢版2006/03/01(水) 16:41:00
>>133
研究者連中、面白いものを作っても、
作って論文にしただけで満足して死蔵するケース多すぎ。

公開しようとするといろいろ面倒なのはわかるが、
なんとかならんものかのう。
0138名無しさん@お腹いっぱい。垢版2006/03/01(水) 18:33:17
>133
http://www.spa.is.uec.ac.jp/~takita/CBNS/ を見てくれ。

…と言いたいところだが、電通大情報システム学専攻のネットワークが切れていて今は見れんようです。
復旧したら見てください。

一応、激しく汚いソース(NetBSD 1.6.2 からの差分)も置いてあります。
0139名無しさん@お腹いっぱい。垢版2006/03/13(月) 15:38:49
はじめてNmazuに挑戦しまた
nknmzrc実行後
http://〜/namazu.cgiにアクセスするとブラウザが真っ白
・・・
どこで間違っているのでしょう。
ヒントください
OS FreeBSD portsから導入
ブラウザ winXP IE
0141名無しさん@お腹いっぱい。垢版2006/03/14(火) 00:18:47
2006-03-12: Namazu 2.0.16 を公開

* セキュリティフィックスリリース
Directory traversal 問題を修正
* 空白を含むファイル名の文書に対応
* NTFS のアクセス権で読み込み許可がないものは処理をスキップするように変更
0143名無しさん@お腹いっぱい。垢版2006/03/15(水) 18:26:19
>>142
nknmzrc実行後、沢山ファイルが作成された
取り合えず、動作しなくてもいいから表示してほしい・・・

作成されたファイルの中身を見ようとしたら何も表示されない
もしかしてファイル名だけ作成された?
0144名無しさん@お腹いっぱい。垢版2006/03/15(水) 18:45:35
まず"namazu (適当なキーワード)" で検索結果がでる?
出なければ~/.namazurcか/etc/namazurcでのインデックスのパスが違う
0148名無しさん@お腹いっぱい。垢版2006/04/25(火) 09:19:38
なまずでサイズの小さく、検索の早く、漏れのないインデックスの作り方。

なまずにすべての作業を任せずに文字コード変換、Kakasiをあらかじめ
自分でやっておく。 フィルタも使わない。
自分で確実にテキストに変換できたことを確認してからなまずに渡す。

インデックスに登録しないような一語の単語や記号などをあらかじめ削除する。

これでOk>
0150名無しさん@お腹いっぱい。垢版2006/04/27(木) 02:24:29
>>149
nkfの最新版(それ以前もたぶん)はUTF-8の文字コードを誤認する。
これをすべてNAMAZUに任せると当然、検索できないindexが作成される。
丹誠込めて念入りにindexを作ることが重要だ。ちゃんと変換できてるとか目で見て。
0152名無しさん@お腹いっぱい。垢版2006/04/27(木) 05:50:57
ふつうにテキストで固定してindexを作成する。オプションの設定。
なまずは自動判別するからpdfでもhtmlでも中身がテキストなら
そうなるけどテキストに固定した方が早い。
0153名無しさん@お腹いっぱい。垢版2006/04/27(木) 06:07:34
>>151
たとえば10000ファイルあったとしたら
構造、拡張子を保ったまますべてのファイルをEUCコードに変換する。
そしてまたすべてのファイルを分かち書きする(-wオプション)。
0154名無しさん@お腹いっぱい。垢版2006/04/28(金) 16:43:24
UTF-8を誤認することは間違いないのだがどれがUTF-8かを見つけるのが苦労する。
0155名無しさん@お腹いっぱい。垢版2006/05/03(水) 19:52:08
データだけ他サーバーに置くことは出来ますか?
あと複数のindexを検索するにはどうしたらいいですか。
0158名無しさん@お腹いっぱい。垢版2006/05/06(土) 23:36:46
>>156
でも動作鈍いんですよね?
無料のとくつーにデータ全部おくことにします。
fc2にデータおいて広告なし無料cgi可のページから検索したかったんですけど。
0161名無しさん@お腹いっぱい。垢版2006/06/01(木) 17:13:27
少し困っていることがあるので,教えてください.

Namazuのログで,検索ワードにヒットした文書ごとの
検索ワードの出現回数TFを出力できたりしますでしょうか?
ご教示お願いします.

また,タイトル<title>にその検索ワードが使われていたかどうか
などもログ出力できると助かるので,そういうことができるか
もお教えください.
0162名無しさん@お腹いっぱい。垢版2006/06/01(木) 21:00:39
あげ
0163名無しさん@お腹いっぱい。垢版2006/06/05(月) 11:05:16
age
0165名無しさん@お腹いっぱい。垢版2006/07/25(火) 23:24:19
検索キーワードのログを見たいのですが、設定ファイルを
Logging on にするとどこにログが保存されているのでしょうか?
また、ログの保存場所を指定するにはどのようにしたらよいでしょうか?
0167名無しさん@お腹いっぱい。垢版2006/07/26(水) 15:46:23
Estraier、NAMAZU、msearch でデフォルトの設定で、
インデックスの作成時の負荷がかかる順に並べるとどうなりますか?
0169名無しさん@お腹いっぱい。垢版2006/07/26(水) 20:30:41
namazuって重いんですね
0170名無しさん@お腹いっぱい。垢版2006/07/27(木) 09:35:53
重い要因は
* Perlで書かれている
* File::Findによるディレクトリ走査
* File::MMagicによるコンテンツの種別確認
* DB書き込み速度がPerlのhashに依存
このへんかなあ。
0171名無しさん@お腹いっぱい。垢版2006/07/27(木) 11:08:12
msearchもperlだよ。
NAMAZUよりmsearchのが軽いのかな?

HyperEstraier はよく知らんけど何で書かれてるの?
0174名無しさん@お腹いっぱい。垢版2006/07/27(木) 15:41:28
>>172
何で爆笑?
0175名無しさん@お腹いっぱい。垢版2006/07/28(金) 17:32:38
namazuって、検索結果を重要度が高い順に並べたりしてくれる
ような機能ってあるっけ?
0176名無しさん@お腹いっぱい。垢版2006/07/29(土) 16:43:59
>>175
重要度は分からんが、ポイント機能ならあるぞ
0177名無しさん@お腹いっぱい。垢版2006/07/31(月) 12:58:34
最近では、EstraierとNAMAZUどっちが人気?
0178名無しさん@お腹いっぱい。垢版2006/08/22(火) 13:39:59
Namazuのようにインデクシングの際に形態素解析を用いている
検索エンジンと、その他、形態素解析を用いない検索エンジンとは
インデックス作成の時間以外でどのような違いがあるのでしょうか?
0180名無しさん@お腹いっぱい。:垢版2006/08/27(日) 13:38:59
namazuでPDFファイルを検索し、概要だけであればhtmlで、
全文を見るのであれば、PDFで見るというふうにしたいのですが、
どうすればよいでしょうか?概要のhtmlは作ってあるのですが、ど
うすれば検索時にhtmlとPDFを選択できるのかなぁと思いまして。
よろしければ、お知恵をお貸しください。

0181名無しさん@お腹いっぱい。垢版2006/08/27(日) 14:00:27
NMZ.result.* に概要のHTMLのURIを追加すればOK。
概要のHTMLのURIを${uri].htmlにして、その場所に概要のHTMLを格納するのが
楽そうだ。
0182名無しさん@お腹いっぱい。:垢版2006/08/27(日) 14:13:20
>181
参考にさせていただきます。ご回答ありがとうございました。
0183名無しさん@お腹いっぱい。垢版2006/09/21(木) 16:53:43
NMZ.* ファイルの仕様
http://www.namazu.org/doc/nmz.html.ja

上記を読んでもよく分からなかったのですが、
結局検索エンジン (namazu.exe)はどういう手順で
検索クエリから目的の文書を探し出すの?
NMZ.i には単語情報はないんだよね?

1.まずNMZ.iiで検索文字列から算出したハッシュ値をキーにして
  NMZ.iのレコード番号を引く
2.NMZ.i の該当レコード番号から文書IDを引っ張ってくる

文書IDと対象ファイルの対応表はどこにあるのかなぁ?(・〜・)ウーム
0185名無しさん@お腹いっぱい。垢版2006/09/21(木) 23:25:02
バージョン1.xのときはNMZ.f とNMZ.fi というファイルがあって
各ファイルの情報を記録していた。

2.xからは
NMZ.field.{subject,from,date,message-id,...}
NMZ.field.{subject,from,date,message-id,...}.i
の2つのファイルがその代わりをしている。
行番号=文書IDとなっている。
0186名無しさん@お腹いっぱい。垢版2006/09/22(金) 08:26:08
NMZ.wが単語表で、NMZ.wiがそのインデックス(各単語の先頭のオフセット値が
入っている)。
NMZ.wはコード順にソートされているので、NMZ.wiとNMZ.wをバイナリサーチ
すれば該当するNMZ.wiのファイルの位置から単語IDが求まる。

まあ最悪mknmzとlibnamazu.cあたりをみればわかるよ。
0187名無しさん@お腹いっぱい垢版2006/09/26(火) 09:15:59
Namazu(最新版)をWindows XPで使いたいのですが、カスタマイズを行う
場合は、バイナリではなく、ソースコードからインストールしなければ
ならないでしょうか?
0188名無しさん@お腹いっぱい。垢版2006/09/27(水) 07:50:14
カスタマイズする内容によるが、普通いらない。
必要になるのはソースコードレベルで埋め込まれている出力を
いじるときぐらい。
それもほとんどはgettext化されてるので、ja.poだけいじって差し替えれば
済む話だし。
0195(^-^) ◆MONSOON/qo 垢版2006/10/08(日) 05:27:21
インディックス作成時に読み込む文字種を正規表現で指定できますか?
記号は除外するとかです
0196名無しさん@お腹いっぱい。垢版2006/10/08(日) 07:47:34
mknmz -K

文字列処理:
-E, --no-edge-symbol 単語の両端の記号は削除する
-G, --no-okurigana 送り仮名を削除する
-H, --no-hiragana 平仮名のみの単語は登録しない
-K, --no-symbol 記号をすべて削除する

あとはソース書き換えかな
0197(^-^) ◆MONSOON/qo 垢版2006/10/08(日) 11:58:48
>>196
どうもありがとう
0198名無しさん@お腹いっぱい。垢版2006/10/15(日) 10:14:17
NamazuをCGI(localhost)で利用しているのですが、検索結果と
して表示されたファイルが開けません。よろしければ、お教え
願えないでしょうか?

検索結果のファイルを選択
Forbidden
You don't have permission to access
/C|/a/b/c/d/f/soturon.html on this server.
------------------------------------------------------
Apache/2.0.55 (Win32) PHP/5.0.5 Server at localhost Port 80
という表示になります。

各種設定はNamazu2.014のインストーラのデフォルトです。
.namazurc の Replace で正しい URI に書き換えれば良いという話なのです
がどうにもうまくいかなくて。。。

索対象のファイルのpath
C:/a/b/c/d/1/ファイル
C:/a/b/c/d/2/ファイル
C:/a/b/c/d/3/ファイル
という様にファイルを格納しています。

そして、CGIはローカルホストで動かしているのですが、http://
以下はどのように指定すれば良いのでしょうか?






0200名無しさん@お腹いっぱい。垢版2006/10/15(日) 23:08:08
>>198

>>NamazuをCGI(localhost)で利用(win32)
多分だけど C|このせいだと思う。昔はまった。
<a harf=c|となってると見れないはず

ブラウザによるけど

lynx
では個別にルール指定できてC|/ C:と置換指定。
なんでもlynxが内部で指定置換してくれる。
だからオリジナルは弄ず。w3m あたりも平気

firefox,oprea,IE系は無理だった気が...
なんか慣行らしいけど|。GUIのブラウザだと無理?かも??

namazuの方がC|じゃなくてC:/と吐いてくれないと。パスを。昔
考えたのは適当にsed噛ますとかして置換ちゃえばとか思った
が...namazu -hで吐かせてるからsedでフィルタすれば...と

テキストブラウザで使えるしそのまま...圧縮したまま使えるか
ら。普通のブラウザだと圧縮したまま動かないんで...

公開しないし個人で使う分には書換ちゃっていいと思うけど、セ
キュリティ上よくないのかね?

cgi?どこで吐いてるのかわかんないけど|を/に変えるべく追って
弄らないといけないと思う。winの代表的な各種ブラウザで見た
いなら
0203名無しさん@お腹いっぱい。垢版2006/10/18(水) 01:14:49
>198です。
インデックス作成のオプション指定に気をつけ、きちんとドキュメントルート
を確認の上、.namazurcのReplaceを設定したら無事にできました。
ありがとうございました。
0204名無しさん@お腹いっぱい。垢版2006/10/18(水) 19:08:09
UNIX板ですが、話題がNamazuなので。。。
以下について、どなたかご教示願えませんか?

Windows XPでNamazuを利用しているのですが、これからPHP(5.0)
でNamazuを使うために、Namazuモジュール(php-namazu-2.3.1)
をインストールしたいと考えています。

調べた限りでは、現在はPECLもCVSも利用できない(Namazuモジュール)
ということでした。Windowsでこのモジュールをインストールするにはど
のような手順を踏めばよいのでしょうか?

それと、塚田卓也さんという方がNamazu関数をWindows版PHPで
も使えるように開発された、モジュール「php4_namazu-3.0.0PHP4.3.x
」があるそうですが、これは5.0でも使えたりするのでしょうか?

0205名無しさん@お腹いっぱい。垢版2006/10/18(水) 20:55:13
なんでナマズってこんなに遅いの?
0208名無しさん@お腹いっぱい。垢版2006/10/18(水) 23:34:51
>204
マルチよくない
ttp://www.namazu.org/pipermail/namazu-win32-users-ja/2006-October/001443.html

使えたりするかどうかは自分で試してみたの?
0209名無しさん@お腹いっぱい。垢版2006/10/18(水) 23:49:19
いや、[PHP4---]というモジュール名から見るに、多分使えないだろう
なぁと思って、試してはいません。ただ、使えるか知っている方がいた
ら、その是非を教えて欲しいなぁと思いまして。
もう1つの、WindowsへのNamazuモジュールのインストールのほうは自分
でもそれなりに調べたりしましたが、どうも分からなかったもので。。。
0212名無しさん@お腹いっぱい。垢版2006/11/13(月) 20:52:00
namazurcってmknmzしたときには適用されないんですか?
replace使いたいんですが…
0214名無しさん@お腹いっぱい。垢版2006/12/22(金) 16:04:17
namazuの検索結果をEUC-JPで出力させているのですが、Shift_JISで書かれた
ファイルの内容がそのままShift_JISで出力されてしまうため、検索結果が文
字化けしてしまいます。何か設定が必要なんでしょうか。
0216名無しさん@お腹いっぱい。垢版2006/12/26(火) 14:20:11
tp://www.ki.nu/software/namazu/tutorial/make.html#PERL_MODULEで
namazu 1.9.12 以降では Chasen2 にだけ対応している。
とありますが、kakasiは使用できないということでしょうか?
0217名無しさん@お腹いっぱい。垢版2006/12/26(火) 15:07:33
検索結果にキーワードが最初にファイルの何行目に登場するか、の情報って取得できますか?
google検索エンジンみたいに、キーワードのヒットした前後の文章を結果一覧に出したいのですが・・・
0221名無しさん@お腹いっぱい。垢版2006/12/29(金) 22:42:03
Linuxにnamazu-2.0.16をインストールして、
インデックスの作成とNamazuコマンドでの検索が出来るようになったのですが
検索対象はファイルの中身だけで、ファイル名は検索外にする事は可能でしょうか?
index.htmlを検索しても表示されない、でもindex.htmlの中身に書いてある文章で
検索を掛けると表示されるようにしたいのですが・・・
0222名無しさん@お腹いっぱい。垢版2006/12/30(土) 12:24:41
>>221
mknmz の namazu_core というサブルーチンに
$content .= "\n\n$filename\n\n"; # add filename
という行がある
これを削ってインデックスを作り直す
0223名無しさん@お腹いっぱい。垢版2007/01/02(火) 19:57:55
>>222
真にありがとうございます。上手く行きました。
ただ"index.html"だと表示されないようになったのですが、"index"で検索すると表示されてしまいます。
これも表示されないようにする方法はありますでしょうか?何度も質問して申し訳ありません
0224223垢版2007/01/04(木) 21:18:12
自己解決しました
本当にありがとうございました
0225名無しさん@お腹いっぱい。垢版2007/01/10(水) 19:44:10
スレ違いかもしれませんが、

自分がよく利用するウェブサイトの一部のコンテンツをNamazuで検索可能にしたいの
ですが(Google等では何故かうまく出てこないので)、
その場合はウェブサイトの必要なコンテンツをローカルにダウンロードして、
それをNamazuにかけるわけですよね?
ウェブサイトのコンテンツをダウンロードするのにお勧めのソフトはありますか?
0231名無しさん@お腹いっぱい。垢版2007/07/05(木) 13:53:45
ag
0232名無しさん@お腹いっぱい。垢版2007/10/09(火) 03:41:55
EmphasisTags "<strong class=\"keyword\">" "</strong>"
みたいに設定してキーワードをハイライトさせているのですが、
キーワードの出現位置が検索結果の本文表示文字数のリミットと
被る場合にタグを閉じてくれず、次の行から真っ赤っかになってしまいます。
回避する方法ってあるのでしょうか?
0234名無しさん@お腹いっぱい。垢版2007/11/28(水) 05:27:51
ダブルクオーテーション内の連続した文字 "、狼8、" で検索かけたいのだがノイズ入りまくり
/、狼8、/ も試したが今度は見つからないとか言われた
勝手に要素に分割するなああああ
0235名無しさん@お腹いっぱい。垢版2007/12/14(金) 21:25:55
mknmz -CでCoding System: eucってでるんだけどsjisにするにはどこの設定を弄れば良いですか?
0236名無しさん@お腹いっぱい。垢版2007/12/14(金) 21:46:18
Cording Systemの意味わかってないんじゃない?
検索結果をSJISにしたいんだったら
.namazurcでShift_JISに設定すればいいだけだし。
ちなみにNamazuのインデックス内部はeuc。
0237235垢版2007/12/14(金) 22:33:23
>>236
なるほどありがとうございます

Namazuのインデックス内部はeuc。
ということはインデックスさせるページはEUCで記述しないと駄目なんですか?
0239235垢版2007/12/14(金) 22:41:36
>>238
むむむ・・
sjisで書いたページをmknmz -kでインデックス作ると
NMZ.wの中が所々文字化けるんですよ。。。
何かアドバイスお願いします。

# mknmz -C
わかち書き: /usr/local/bin/kakasi -isjis -osjis -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: euc

mknmzする前にsetenv LANG ja_JP.SJISしてます


0242235垢版2007/12/18(火) 10:46:31
>>240
>>241
なるほど!解決しました!
ありがとうございます!
0244名無しさん@お腹いっぱい。垢版2008/02/06(水) 03:00:26
共有鯖でインスコしたいのですがsshやtelnet以外でインスコする方法ありませんか?
鯖が対応してなくて困ってます。
0247名無しさん@お腹いっぱい。垢版2008/02/21(木) 21:40:38
新しいバージョンのnamazuだけど、namazu.cgiがnamazurc読み込んでないな。
なんかバージョンアップのたびに質が落ちてる。
0248名無しさん@お腹いっぱい。垢版2008/02/21(木) 21:49:47
うーん…ベストを尽くせ。
0249名無しさん@お腹いっぱい。垢版2008/02/22(金) 01:52:53
ナマズ作り直してくれねーかなあ。バカスカメモリ食いやがって。このへたくそが。
0251名無しさん@お腹いっぱい。垢版2008/02/22(金) 03:33:49
それを必要な人がそれをやるしかないんだよ。

いわゆる言い出しっぺの法則 ――言い出しっぺがやらなければ誰もやらない―― だね。
0252名無しさん@お腹いっぱい。垢版2008/02/28(木) 13:15:05
なんでこれ環境変数と設定ファイルで同一の設定値を設定しないといけないんだ?
混乱するだけだと思うんだが。
世の中からこういうバカがいなくなればいいなあ。
0254名無しさん@お腹いっぱい。垢版2008/03/03(月) 03:31:23
>>252
じゃあ直せよ
0257名無しさん@お腹いっぱい。垢版2008/04/21(月) 21:18:16
windows環境でのNamazuでofficeを入れない環境で
office文書を検索対象に含めるには何のソフトが有効ですか?
Microsoft Office Viewerを入れたら可能ですか?

また、zipなどの圧縮ファイル名を検索対象にするにはどうしたらいいでしょう?

よろしくおねがいします
0258名無しさん@お腹いっぱい。垢版2008/04/21(月) 23:47:00
>>257
officeを入れない環境ではxdoc2txt.exeが有効。
windows環境ではzipには標準で対応している。試してみましたか?
説明書を読んでますか?
ttp://www.namazu.org/doc/manual.html#doc-filter
よろしくおねがいします
0264名無しさん@お腹いっぱい。垢版2008/09/19(金) 01:28:40
質問です。

WindowsXP + NTEmacs22.2 + Gnus の環境で Namazu を使っていますが、
Fedora9 + Emacs23 + Gnus で同じようにインストールした Namazu だと
「山田」のような固有名詞でも検索出来ますが、Winの場合だと同じ名前
で検索に引っかかりません。
(その名前が含まれたメールは存在してます。)

一般的な名詞だとどちらも同じように検索できてます。

環境としては、Win は ja_JP.SJIS で、Fedora9 は ja_JP.utf8 です。
両方共 Kakasi を使ってます。

何か気づいた点などありましたら教えてください。
0265名無しさん@お腹いっぱい。垢版2008/10/17(金) 19:17:44
すみません。教えてください

test.tgzという1GBほどのファイルがあった場合に、
中身のについてのindex作成を行わずに
ファイルの名前とパスのみをindexに残したいのですが、
どのように設定すればよいでしょうか?

たとえばtest.tgzをtgzで検索にひっかけるなど、
ファイル名だけでも検索に引っかかるようにしたいのですが
可能でしょうか?
0266名無しさん@お腹いっぱい。垢版2009/08/29(土) 11:16:19
64bit Linuxマシン(Red Hat Linux ES5)でnamazuをインストールしようとしますと、


Text/ChaSen/ChaSen.so \
-L/usr/local/lib -lchasen \

/usr/bin/ld: /usr/local/lib/libchasen.a(chalib.o): relocation R_X86_64_32 against `a local symbol' can not be used when making a shared object; recompile with -fPIC
/usr/local/lib/libchasen.a: could not read symbols: Bad value
collect2: ld はステータス 1 で終了しました
make: *** [blib/arch/auto/Text/ChaSen/ChaSen.so] エラー 1

というエラーがでます。

どのように対処したらよろしいでしょうか?

GOOGLE検索してもなかなか解決策が出てきません。

よろしくお願いします。
0269名無しさん@お腹いっぱい。垢版2009/08/29(土) 15:02:28
>>267
recompile with -fPIC
というのはどういうふうに試せばいいのでしょうか?
これも検索したんですが、よくわかりません。。
>>268
rpmはでていないようです。さがしてみたんですが。。
0270269垢版2009/08/29(土) 15:06:27
少し説明不足だったように思いますので、付け加えますと、
http://www.asahi-net.or.jp/~wv7y-kmr/memo/namazu.html
を参考にし、
Text::chassen perl moduleをインストールしようとし、
$ perl Makefile.PL
$ make
をした後に、266のメッセージはでます。。

0271名無しさん@お腹いっぱい。垢版2009/08/29(土) 15:46:16
>>270
茶筅のライブラリ /usr/local/lib/libchasen.a(chalib.o) が読み込めないと言って居るんだから
ライブラリをシステムに合わせて構築し直せ。
0272269垢版2009/08/29(土) 16:11:36
>>271
すみません、もう少しヒントをもらえますか?
どのようにしてライブラリを構築しなおすといいのでしょうか?
自分がやったのは、
$perl -fPIC Makefile.PL
ですが、それもエラーがでました。このへん詳しくないので。。
0273267垢版2009/08/29(土) 17:03:34
>>269 はじめのカキコのメッセージは、namazu のコンパイルオプション云々
じゃなくて、namazu をビルドするときに使おうとしているchasen のライブラリが
変だよ、といってるの。リンクに失敗しているんで、libchasen を -fPICという
のオプション付けてコンパイル (gcc) してくれたら直るとおもうよ、と言っているの.。

察するに、-fPIC オプションは実際には不要で、単に、chasen のソースを
とってきて、./configure; make; sudo make install ; sudo ldconfig とやれば
済みそうな気もするが。
0274名無しさん@お腹いっぱい。垢版2009/08/29(土) 17:22:27
>>272
茶筅のインストールに失敗しているんだろ
ttp://chasen.naist.jp/hiki/ChaSen/?%A5%BD%A1%BC%A5%B9%A4%AB%A4%E9%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB
茶筅単体で動くことを確認してみろ。 あと、茶筅のバージョンは最新か?

いらん話: -fPIC だが、茶筅の Makefile の CFLAG に 追加。
(このモジュールはCだかC++だかで書かれていたはず)
0276269垢版2009/08/30(日) 09:45:59
>>273
>>274

ありがとうございます。

chasen自体は、
$ chasen
EOS
テスト
テスト テスト テスト 名詞-サ変接続

のように動いています。

ただ、 namazuで使う perl moduleの
Text::chasen がうまく入ってくれません。

chasen はchasen-2.4.4を使っています。これが最新のようです。

chasenのコンパイル時のMakefileにCFLAGに-fPIC をつけてもうまくいきません。。

もし何か分かりましたら、よろしくお願いいたします。
0277269垢版2009/08/30(日) 09:54:18
64bitマシンがだめなのでしょうか?
32bitのときは問題なく前は入ったのですが。。
64bitでnamazuはあきらめたほうがいいということなのでしょうか?
0279名無しさん@そうだ選挙に行こう垢版2009/08/30(日) 10:00:12
# 64bitでnamazu

64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
適切に対応していない可能性がある。
0280名無しさん@お腹いっぱい。垢版2009/08/31(月) 19:35:35
>>278
>>.so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう?
これはしております。

>>あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした?
http://www.daionet.gr.jp/~knok/chasen/
はい、patchはあてています。

http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html
これは、まだチェックしきれていませんが、むつかしそうですね。調べてみます。

>>279
>>64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
>>/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
>>適切に対応していない可能性がある。
/usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。
0281名無しさん@お腹いっぱい。垢版2009/08/31(月) 23:52:45
> >>適切に対応していない可能性がある。
> /usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。
「64bit版のライブラリは /usr/lib64 に置く必要があるかも?」って話なんだけど。
0282名無しさん@お腹いっぱい。垢版2009/09/03(木) 18:01:17
mknmzで大規模データを一日かけて実施していたところ、

NMZ.lock2 ファイルを発見しました
このインデックスは他のプロセスによって更新されている可能性があります

というエラーがでました。おそらく前回、途中でmknmzをやめ、indexファイル群
を削除せずに再度mknmzを実施したからだと思います。
仕方ないので、このlock2ファイルを削除し、
mknmz -Y
で差分更新をしようと思うのですが、前回エラーで中断したところから、うまく
再開できますか?

よろしくお願いいたします。
0283名無しさん@お腹いっぱい。垢版2009/09/05(土) 08:26:43
280です。別の64bitマシンを借りて、インストールをし直してみたところ、インストールはうまく
いったのですが、別の問題が起きています。。
Text::Chasenの64bitマシンへのインストールでつまずいています。
以下のように、Text::Chasenのインストール自体には成功しているように
見えるのですが、perlからよびだせていないようです。
検索して、LIBS lstdc++ chasenなどを、Makefile.PLに足したりはしているのですが、
それでもうまくいっていません。
$ sudo make install
Files found in blib/arch: installing files in blib/lib into architecture dependent library tree
Writing /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/.packlist
Appending installation info to /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/perllocal.pod

$ perl -MText::ChaSen -e ''
Can't load '/usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/ChaSen.so' for module Text::ChaSen:
libchasen.so.2: 共有オブジェクトファイルを開けません: そのようなファイルやディレクトリはありません
at /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/DynaLoader.pm line 230.
at -e line 0
Compilation failed in require.
BEGIN failed--compilation aborted.

lddをすると以下のようになります。libchasen.so.2のある場所がおかしいのでしょうか?
どうすればいいかわからないので、何かアドバイスをいただけないでしょうか?

$ ldd /usr/local/bin/chasen
libchasen.so.2 => /usr/local/lib/libchasen.so.2 (0x00002aaaaaaad000)
libstdc++.so.6 => /usr/lib64/libstdc++.so.6 (0x00000032afc00000)
libm.so.6 => /lib64/libm.so.6 (0x00000032a9c00000)
libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00000032af400000)
libc.so.6 => /lib64/libc.so.6 (0x00000032a9800000)
/lib64/ld-linux-x86-64.so.2 (0x00000032a8800000)

よろしくお願いします。
0285名無しさん@お腹いっぱい。垢版2009/09/08(火) 20:31:02
namazuでmknmzする際の最大メモリ使用量が32bitマシンでは、4GBでしょうか?
それだと足りなくて、
Out of memory!
NMZ.lock2 ファイルを発見しました
となる場合はどうすればよいでしょうか?
0289名無しさん@お腹いっぱい。垢版2010/04/22(木) 20:07:42
6万貰ってセックヌしてきたぞ!!

濡れた熟マンに入れたら、肉ヒダがしっとり絡みついてきて、
そんだけでイきそうになったわww
http://xabrina.net/om/c9y94mf
0291名無しさん@お腹いっぱい。垢版2011/02/04(金) 21:34:06
mknmz + pdftotext で PDF ファイルをインデックス化してるんだけど、
100MBを超える PDF だと、out of memory のエラーが出る。

mknmzrc の記述はチェック済み ($FILE_SIZE_MAX, $TEXT_SIZE_MAX, $ON_MEMORY_MAX)。
マシンのメモリは 4G 積んでるので、実際のメモリ不足ではないと思う。

ご存知の方、よろしく。m(_ _)m

環境:Namazu for Windows (ver. 20.0.20) on WinXP SP3
Active Perl 5.8.9
0292名無しさん@お腹いっぱい。垢版2011/02/04(金) 23:23:25
>>291
以前、某パッケージのマニュアルで発生した。
pdfsplit.pl でページ単位に分解したら上手くいった。

# つ〜か、そのサイズのpdfって数百ページないか?
# ページに分解して処理しないと面倒だと思う。
0293名無しさん@お腹いっぱい。垢版2011/02/05(土) 10:22:07
>>292
サンクスです。
>> ttp://www.namazu.org/ml/namazu-devel-ja/msg01950.html
を見て、pdfslit.pl を導入してみましたが、out of memory のエラー
がでます。やはり、pdfファイルがでかすぎるのかな…
0294名無しさん@お腹いっぱい。垢版2011/07/09(土) 20:40:20.11
>>293
File::MMagicでメモリを大量に消費しているのが原因っぽい。
-tを使うとうまくいくかも。
0295名無しさん@お腹いっぱい。垢版2011/09/18(日) 16:06:29.49
サーバ中の文書を検索したくて入れてみました。
入れてみて気付いたのですが、EUC-JPにしか対応していないようです。
検索対象の文書は、UTF-8とEUCJPとSJISのファイルが混在しています。
内部的に、エンコードを自動的に検出して変換してインデックス化、
という処理は行われているのでしょうか?
それとも、すべてEUC-JPの文書という前提で動作しているのでしょうか?
0300名無しさん@お腹いっぱい。垢版2015/12/10(木) 00:48:56.82
ハゲ侍 サブコミュ イケメン スカイプ マリリンマンソン Twitter マリオ64 ゲーム実況者 マリオカート
ハゲ侍 ツイッター 星のカービィ64 マリオサンシャイン ニコニコ超会議 ポケモン フレコ MH4G アメブロ
ハゲ侍 アメーバブログ 仕事 Skype ツイキャス モンハン 歌い手 スプラトゥーン マニアック
ハゲ侍 動画 顔 ドリームクラブ 好き 刃牙 サイレントヒル ドラゴンボール イケボ
ハゲ侍 漫画 フレンドコード NG縛り ニコニコ生放送 歌ってみた 太刀 ニコニコ超パーティー コミュニティ
ハゲ侍 大学 アキネーター 配信 ニコ生 サブコミュ マリリンマンソン イケメン 学歴
ハゲ侍 マリオカート Twitter スカイプ マリオ64 ツイッター ゲーム実況者 星のカービィ64 ニコニコ超会議
ハゲ侍 ポケモン マリオサンシャイン フレコ MH4G アメーバブログ 仕事 Skype ツイキャス
ハゲ侍 モンハン 歌い手 マニアック 動画 アメブロ スプラトゥーン 刃牙 ドリームクラブ
ハゲ侍 好き サイレントヒル ドラゴンボール 漫画 顔 NG縛り フレンドコード ニコニコ生放送
http://kanae.2ch.net/test/read.cgi/pcqa/1421101110/51
http://kanae.2ch.net/test/read.cgi/pcqa/1415921104/55
http://kanae.2ch.net/test/read.cgi/pcqa/1436852775/17
0301名無しさん@お腹いっぱい。垢版2017/12/29(金) 10:39:51.92
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。

グーグル検索⇒『宮本のゴウリエセレレ』

V65BEHAU71
0302名無しさん@お腹いっぱい。垢版2018/05/22(火) 03:31:49.14
知り合いから教えてもらったパソコン一台でお金持ちになれるやり方
時間がある方はみてもいいかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

7BK22
0304名無しさん@お腹いっぱい。垢版2020/02/11(火) 15:34:25.83
チエオクレのハゲの悲惨なツイッター
https://twitter.com/aphonedollar

  ↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑
この自称「ハゲ」とかいうチエオクレのブログが酷すぎる

>「DesktopHE」 はWindows10に対応してないらしい

はぁ??? ★★★大嘘デタラメ★★★を垂れ流すな!!!

■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■

チエオクレのこのハゲが、Javaの設定を失敗してるだけじゃねえか!!!
嘘デタラメ垂れ流しやがって、このハゲがやっていることは立派な公害じゃねえか!

hatenaとかでまで、必死こいて大嘘をばらまいているんだが  
https://twitter.com/5chan_nel (5ch newer account)
0305名無しさん@お腹いっぱい。垢版2024/03/27(水) 19:35:04.77
あー飛行機代高騰してるとかノスタルジーなオッサンだな
これは何なん?
0306名無しさん@お腹いっぱい。垢版2024/03/27(水) 19:37:48.37
>>1

なんか関係あったっけ

プロ意識なさすぎだろ
0307名無しさん@お腹いっぱい。垢版2024/03/27(水) 20:04:14.36
今量ったら
空飛ぶタイヤは整備不良って初めから決めつけて練習着のままって感じかな
半年に一ヶ月だけ入って長く伸びる

下で投げたチキン居らんよな
0308名無しさん@お腹いっぱい。垢版2024/03/27(水) 20:10:03.59
改憲看板は馬鹿さ
0309名無しさん@お腹いっぱい。垢版2024/03/27(水) 20:26:22.73
機関が売り抜けてる頃にもいたんだよね
舞は毒母の被害者続出していて
0312名無しさん@お腹いっぱい。垢版2024/03/27(水) 21:25:05.37
>>301
サロンの情報空間の中のショーに出る
野菜だけ食って野菜も食って飲んだ
レスを投稿する


ニューススポーツなんでも実況