全文検索エンジンNamazuについてアレコレ
http://www.namazu.org
探検
全文検索エンジンNamazu ver2
1名無しさん@お腹いっぱい。
2005/04/11(月) 01:31:012005/04/11(月) 01:49:46
削除依頼よろ
3名無しさん@お腹いっぱい。
2005/04/11(月) 05:09:19 3ちしげ3ゆ3様が電光石火の3ゲットなの!
>>1番かわいいのはさゆなの!
ノノハヽヽ〃ノハヾ /) >>2じ本はハゲすぎなの!
後>>10は落ち目すぎなの! ∩*・ 。.・)从*・ 。.・)/ミ
〃ノハヾノノハヽヽノノハヽヽつ い>>4川は黒すぎなの!
矢>>9ちもフケすぎなの!⊂(。.・从(・ 。.・*∩ノノノハ 。.・)ノハヽ
(( (\ゝノノノハノハ〃ハ v)っ彡*・ 。.・)
あ>>8やはフケすぎなの! ⊂`ヽ从*・ 。.・)・ 。.・))ノノノハヽつ ))>>5んのは顔ふくれすぎなの!
大の大人が>>7っちとか(プ⊂\ ⊂ ) _つ从*・ 。.・)
(/( /∪∪ヽ)ヽ)/ U つ モー>>6すは売れなさすぎなの!
∪ ̄(/ ̄\) ゝし'⌒∪
>>11-1000さゆのかわいさの前にひれ伏すの!
>>1番かわいいのはさゆなの!
ノノハヽヽ〃ノハヾ /) >>2じ本はハゲすぎなの!
後>>10は落ち目すぎなの! ∩*・ 。.・)从*・ 。.・)/ミ
〃ノハヾノノハヽヽノノハヽヽつ い>>4川は黒すぎなの!
矢>>9ちもフケすぎなの!⊂(。.・从(・ 。.・*∩ノノノハ 。.・)ノハヽ
(( (\ゝノノノハノハ〃ハ v)っ彡*・ 。.・)
あ>>8やはフケすぎなの! ⊂`ヽ从*・ 。.・)・ 。.・))ノノノハヽつ ))>>5んのは顔ふくれすぎなの!
大の大人が>>7っちとか(プ⊂\ ⊂ ) _つ从*・ 。.・)
(/( /∪∪ヽ)ヽ)/ U つ モー>>6すは売れなさすぎなの!
∪ ̄(/ ̄\) ゝし'⌒∪
>>11-1000さゆのかわいさの前にひれ伏すの!
4名無しさん@お腹いっぱい。
2005/04/11(月) 09:47:20 ,,r 、,r'"⌒`゙゙ヽ、 +
/ "~ ヽ、 `ゝ +
. ./ ,r彡" 、ノ彡' ヽミ`\ +
r、r.r 、 ソ/ノ ヽ `ゝ +
_ ,|_,| ノ ⌒ ⌒ヾ|ミヾ +
ノ ノノノノ--<-●>-,(-●>ミ ミ + 素敵な微笑とともに4様上陸!
ノ ノノノノ "" ) " ミ +
ノ .彡| | トーー/| | ミ
∧ | \ ..ヾ____/ ..|
|ノ \ \ "⌒ ノ\
ヽ 《 ..~ ー--/ /
/ "~ ヽ、 `ゝ +
. ./ ,r彡" 、ノ彡' ヽミ`\ +
r、r.r 、 ソ/ノ ヽ `ゝ +
_ ,|_,| ノ ⌒ ⌒ヾ|ミヾ +
ノ ノノノノ--<-●>-,(-●>ミ ミ + 素敵な微笑とともに4様上陸!
ノ ノノノノ "" ) " ミ +
ノ .彡| | トーー/| | ミ
∧ | \ ..ヾ____/ ..|
|ノ \ \ "⌒ ノ\
ヽ 《 ..~ ー--/ /
5名無しさん@お腹いっぱい。
2005/04/14(木) 15:26:59 【日産】 NOTE ノート Part9 【普通で素直】
http://hobby7.2ch.net/test/read.cgi/auto/1113087118/
孤独な日産信者、通称「ネット版劇団独り」。
相次ぐノートの酷評記事、酷評レスの結果にもめげず、叩かれ役として大活躍w
気が向いたら燃料でも投下してあげてください。
◆◇◆◇◆◇◆◇◆◇◆◇ネット版劇団独りの特徴◇◆◇◆◇◆◇◆◇◆◇◆
>ノート信者はやたらと若者向けと思わせたがる。
>ノート信者はやたらと女に人気があると思わせたがる。
>ノート信者はやたらと個性という単語を強調したがる。
さらに
捏造した燃費データを報告。
ノートについて論点は存在せず、私怨で追いかけ回すざま。
>>229,232などでわかるように、悔し涙で文字が読めないほど常時興奮。
ID変えまくって仲間がいると思わせたいらしいw
執念だけはルパンを追う銭形以上。
やられっぷりはトムとジェリーのトム以上。
本人へのアドバイス
「IDを変えて必死か?」というレスに対する反応が、毎回ビックリするほどワンパターンw
ID変えの際に書き込み時間が集中しすぎ。文体が似すぎw厨房レベルw
◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆
http://hobby7.2ch.net/test/read.cgi/auto/1113087118/
孤独な日産信者、通称「ネット版劇団独り」。
相次ぐノートの酷評記事、酷評レスの結果にもめげず、叩かれ役として大活躍w
気が向いたら燃料でも投下してあげてください。
◆◇◆◇◆◇◆◇◆◇◆◇ネット版劇団独りの特徴◇◆◇◆◇◆◇◆◇◆◇◆
>ノート信者はやたらと若者向けと思わせたがる。
>ノート信者はやたらと女に人気があると思わせたがる。
>ノート信者はやたらと個性という単語を強調したがる。
さらに
捏造した燃費データを報告。
ノートについて論点は存在せず、私怨で追いかけ回すざま。
>>229,232などでわかるように、悔し涙で文字が読めないほど常時興奮。
ID変えまくって仲間がいると思わせたいらしいw
執念だけはルパンを追う銭形以上。
やられっぷりはトムとジェリーのトム以上。
本人へのアドバイス
「IDを変えて必死か?」というレスに対する反応が、毎回ビックリするほどワンパターンw
ID変えの際に書き込み時間が集中しすぎ。文体が似すぎw厨房レベルw
◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆
6名無しさん@お腹いっぱい。
2005/04/22(金) 14:58:10 namazuって、滅びた?
2005/04/22(金) 17:52:35
しばらくは現役でしょ。今でもいろんなとこで使われている。
日本語全文検索エンジンを普及せしめたという歴史的役割は終えつつある
と思うけど。
日本語全文検索エンジンを普及せしめたという歴史的役割は終えつつある
と思うけど。
8名無しさん@お腹いっぱい。
2005/04/22(金) 18:29:13 いやいや、開発コミュニティがさ。
サイトの復旧が途中で止まってる。
サイトの復旧が途中で止まってる。
2005/04/22(金) 19:10:49
FreeWnn化進行中?
2005/04/22(金) 21:05:39
2005/04/22(金) 21:36:46
でもなんだか今年中に hyperestraier だの rast だのがリリースされそうだし、
寂れる一方なのかもしれない。
寂れる一方なのかもしれない。
2005/04/22(金) 23:43:22
企業関係のメイン検索システムに入ってるんで
そうそう簡単に捨てられることはないんじゃないの?
やっぱ、オフィス、PDFなんかがまとめて行けるのは大きい。
あと、インストールや設定の資料が豊富だし。
ただ、Namazu Proj.はセキュリティ関連アップデートとか
フィルタまわりのソフトウェアバージョンアップに伴う修正
ぐらいしかやってないから、進化は止まっちゃったよね。
良い意味でも悪い意味でも、枯れてしまった。
そうそう簡単に捨てられることはないんじゃないの?
やっぱ、オフィス、PDFなんかがまとめて行けるのは大きい。
あと、インストールや設定の資料が豊富だし。
ただ、Namazu Proj.はセキュリティ関連アップデートとか
フィルタまわりのソフトウェアバージョンアップに伴う修正
ぐらいしかやってないから、進化は止まっちゃったよね。
良い意味でも悪い意味でも、枯れてしまった。
2005/05/23(月) 18:00:46
茶筌でUTF8を使おうと思って、茶筌のHPの説明にあるとおりにしたんですが、
エラーがでてます。
それに関係しているようなのですが、英語の単語の認識が、例えばHelloだったら
h e l l o のように解析されてしまうんですが、一単語として認識させるには、
何が問題かわかる方いらっしゃいますか。
エラーがでてます。
それに関係しているようなのですが、英語の単語の認識が、例えばHelloだったら
h e l l o のように解析されてしまうんですが、一単語として認識させるには、
何が問題かわかる方いらっしゃいますか。
14名無しさん@お腹いっぱい。
2005/05/23(月) 18:02:18 あげときますです。。。
2005/05/24(火) 08:40:00
ChaSenのバージョンはいくつよ。
2005/06/09(木) 04:19:06
前スレくらい貼っとけばいいのに
http://pc5.2ch.net/test/read.cgi/unix/1009715036
http://pc5.2ch.net/test/read.cgi/unix/1009715036
2005/06/24(金) 13:14:47
a name ごとにインデックス作成するのでやってるんですが、
特定の a name を対象外に指定することってできますでしょうか?
具体的には、ページトップ戻り用の<a name="top">てのをはずしたいんですが…
特定の a name を対象外に指定することってできますでしょうか?
具体的には、ページトップ戻り用の<a name="top">てのをはずしたいんですが…
18名無しさん@お腹いっぱい。
2005/06/24(金) 13:32:20 あげてみた
19名無しさん@お腹いっぱい。
2005/06/24(金) 19:54:25 ヒットした検索結果毎に表示される日付のフォーマットって変更することできますか?
テンプレには無いのでcのソースかなと思ったんですが、該当箇所が見当たらないので。。
それと、
------------------------
参考ヒット数:[***:10]
検索式にマッチする10個の文書が見つかりました。
------------------------
の前後に挟まる謎の<p>,<dl>タグと
------------------------
現在のリスト: 1 - 3
ページ: [1]
------------------------
の前後に挟まる謎の<p>タグの消し方ご存知でしょうか?
#namazuの仕様にうんざり…
テンプレには無いのでcのソースかなと思ったんですが、該当箇所が見当たらないので。。
それと、
------------------------
参考ヒット数:[***:10]
検索式にマッチする10個の文書が見つかりました。
------------------------
の前後に挟まる謎の<p>,<dl>タグと
------------------------
現在のリスト: 1 - 3
ページ: [1]
------------------------
の前後に挟まる謎の<p>タグの消し方ご存知でしょうか?
#namazuの仕様にうんざり…
2005/06/24(金) 20:41:58
うんざりしてるなら,つかわなきゃいいじゃん。
2005/06/24(金) 20:43:33
> namazuの仕様にうんざり…
って高飛車なこと書けるならsrcみて直せるんじゃないの?
って高飛車なこと書けるならsrcみて直せるんじゃないの?
2005/06/24(金) 20:48:07
namazuにケチつけるとひたすら叩かれる件。
2005/06/24(金) 20:58:08
たたかれてないじゃん?
うんざりしてるんなら使わなければいいじゃん?
いまだったらEstraier みたいな高機能なのもあるしさ。
うんざりしてるんなら使わなければいいじゃん?
いまだったらEstraier みたいな高機能なのもあるしさ。
24名無しさん@お腹いっぱい。
2005/06/24(金) 21:42:56 他のを使えと言うのならこのスレはなんなんだ?
25名無しさん@お腹いっぱい。
2005/06/24(金) 22:08:122619
2005/06/24(金) 23:52:27 すいません、色々物議をかもしてるようで…
namazuの仕様にうんざりしたのは、色々と
試行錯誤していてもなかなかうまくいかなかったのでつい…。
修正する方法が無いのであれば仕方ないのかもしれませんが、
もしご存知の方がおりましたらご教授いただければ幸いです。
namazuの仕様にうんざりしたのは、色々と
試行錯誤していてもなかなかうまくいかなかったのでつい…。
修正する方法が無いのであれば仕方ないのかもしれませんが、
もしご存知の方がおりましたらご教授いただければ幸いです。
2005/06/25(土) 00:44:51
2005/06/25(土) 00:51:35
あと、日付の書式は NMZ.field.date を読んでるだけだから,
そっちを直す。 NMZ.*を手で修正した場合は,rfnmz で
NMZ.field.*を再構築すること。
そっちを直す。 NMZ.*を手で修正した場合は,rfnmz で
NMZ.field.*を再構築すること。
30名無しさん@お腹いっぱい。
2005/07/13(水) 14:24:03 namazuをWindows2000で動かしています。Apacheを使ってnamazu.cgiもできましたし、
すべてが順調にすすんでいるかのように思いました,,,が、pdfを検索対象にするにあたって
インデックスを作成すると、
検索対象のファイルを調べています...
1個のファイルがインデックス作成の対象として見つかりました
1/1 - /C|/aaa/tsunaba_abst.pdf Unable to convert pdf file (maybe copying protect
ion)
[基本]
日付: Wed Jul 13 14:21:42 2005
わかち書き: module_kakasi -ieuc -oeuc -w
経過時間 (秒): 1
ファイル/秒: 0.00
システム: MSWin32
Perl: 5.00503
Namazu: 2.0.14
となり、インデックス作成できませんでした。
だれか解決法教えてください
すべてが順調にすすんでいるかのように思いました,,,が、pdfを検索対象にするにあたって
インデックスを作成すると、
検索対象のファイルを調べています...
1個のファイルがインデックス作成の対象として見つかりました
1/1 - /C|/aaa/tsunaba_abst.pdf Unable to convert pdf file (maybe copying protect
ion)
[基本]
日付: Wed Jul 13 14:21:42 2005
わかち書き: module_kakasi -ieuc -oeuc -w
経過時間 (秒): 1
ファイル/秒: 0.00
システム: MSWin32
Perl: 5.00503
Namazu: 2.0.14
となり、インデックス作成できませんでした。
だれか解決法教えてください
2005/07/13(水) 14:42:28
ttp://www.namazu.org/FAQ.html.ja#xpdf
32名無しさん@お腹いっぱい。
2005/07/13(水) 15:16:152005/07/13(水) 16:05:36
2005/07/13(水) 21:29:02
>>30
PDFのセキュリティで文字のコピーが許可しないになってる
PDFのセキュリティで文字のコピーが許可しないになってる
2005/07/14(木) 08:53:43
そのまんまやんけ
2005/07/14(木) 16:30:39
平和な世の中やなあ。
2005/07/14(木) 20:31:49
2005/07/14(木) 21:02:58
一日100万ならたいしたことないな。
2005/07/15(金) 17:02:22
もし日本なら130日で日本人全滅か
40名無しさん@お腹いっぱい。
2005/07/17(日) 02:27:52 rastはWindows版がないから駄目。
2005/07/17(日) 03:24:06
ないなら作r(y
2005/07/17(日) 17:48:14
2005/07/17(日) 18:21:02
2005/07/17(日) 18:31:53
Namazu邪悪だなwww
2005/07/17(日) 18:37:09
>>43は、どう見ても、名乗りだけあげてあとは放置犯。
2005/07/24(日) 08:53:54
IPAで同じことやるよりはいいだろ。
47名無しさん@お腹いっぱい。
2005/08/05(金) 11:12:41 namazuのフレーズ検索を利用しているのですが,
"New Order"で検索をかけても100%New Orderというフレーズ
がでるわけでなく,ときどきnewとorderが分離してても
結果としてはじきだしちゃう場合があります.
そういうミスをできるだけ減らしたいのですが,なんかいい
テクニックありますでしょうか?
フレーズ検索とはそういうものでしょうか?
googleだとNew-Orderとして検索するとほぼ100%でフレーズとなって
結果がでてくるのですが..
"New Order"で検索をかけても100%New Orderというフレーズ
がでるわけでなく,ときどきnewとorderが分離してても
結果としてはじきだしちゃう場合があります.
そういうミスをできるだけ減らしたいのですが,なんかいい
テクニックありますでしょうか?
フレーズ検索とはそういうものでしょうか?
googleだとNew-Orderとして検索するとほぼ100%でフレーズとなって
結果がでてくるのですが..
48名無しさん@お腹いっぱい。
2005/08/05(金) 11:31:00 というか,いまいろいろ調べてたら,
"New Order"で検索をかけてもand検索にしかなっていない事が
判明しました.
フレーズ検索ってどうやってやるの?
環境はFedora4でnamazu of Namazu 2.0.14
です.
よろしくお願いします.
"New Order"で検索をかけてもand検索にしかなっていない事が
判明しました.
フレーズ検索ってどうやってやるの?
環境はFedora4でnamazu of Namazu 2.0.14
です.
よろしくお願いします.
49名無しさん@お腹いっぱい。
2005/08/05(金) 12:04:14 できました
2005/08/05(金) 12:07:32
>>49
どうやって?
どうやって?
51名無しさん@お腹いっぱい。
2005/08/05(金) 12:18:05 "{New Order}"
でよかったです.
でよかったです.
2005/08/05(金) 22:41:49
>>51
っていうか 「検索式について」 嫁や。
っていうか 「検索式について」 嫁や。
53名無しさん@お腹いっぱい。
2005/08/09(火) 21:24:22 JAVAでretrievalWordという変数にModern Artsというような文字列をいれて,
下記のような検索プログラムにより,検索エンジンnamazuの
入力として渡しています.
この場合,namazuには,
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
という入力が渡される事になります.
なおnamazuは,"{Modern Arts}"という検索がいった場合,
"{}"で囲まれた文字列がフレーズとして検索されるという機能をもっています.
つまりターミナルから
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
と入力するとModern Artsの検索としてうまく行くのですが,
java経由で下記のプログラムからnamazuへ検索要求をしても
namazuでは,
"{Modern Arts}"という文字列の検索を行ってしまい,
Modern Artsの検索がうまくいきません.
String proscmd = "namazu --max=2000000 ";
proscmd = proscmd + "\"{" + retrievalWord + "}\" " + indexdir;
System.out.println("proscmds : " + proscmd);
Process process = Runtime.getRuntime().exec(proscmd);
結果
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
この原因がどういう点にあるのかを教えて頂けないでしょうか?
もう長いことこれに時間をかけています。でもわかりません。
宜しくお願い致します.
下記のような検索プログラムにより,検索エンジンnamazuの
入力として渡しています.
この場合,namazuには,
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
という入力が渡される事になります.
なおnamazuは,"{Modern Arts}"という検索がいった場合,
"{}"で囲まれた文字列がフレーズとして検索されるという機能をもっています.
つまりターミナルから
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
と入力するとModern Artsの検索としてうまく行くのですが,
java経由で下記のプログラムからnamazuへ検索要求をしても
namazuでは,
"{Modern Arts}"という文字列の検索を行ってしまい,
Modern Artsの検索がうまくいきません.
String proscmd = "namazu --max=2000000 ";
proscmd = proscmd + "\"{" + retrievalWord + "}\" " + indexdir;
System.out.println("proscmds : " + proscmd);
Process process = Runtime.getRuntime().exec(proscmd);
結果
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
この原因がどういう点にあるのかを教えて頂けないでしょうか?
もう長いことこれに時間をかけています。でもわかりません。
宜しくお願い致します.
2005/08/10(水) 08:26:03
2005/09/02(金) 12:23:34
メール本文のインデックスを作ってくれるのはありがたいんですけど、
メールに添付されている PDF や、Excel, Word ファイルについても
インデックスを作ることはできませんか?
メールに添付されている PDF や、Excel, Word ファイルについても
インデックスを作ることはできませんか?
2005/09/02(金) 22:16:22
>>55
使ってるメーラーによる。
使ってるメーラーによる。
2005/09/04(日) 13:40:04
e-mail の milti-part がそのまま保存される、mh形式です。
2005/09/04(日) 21:25:54
>>57
multi-part部も
2.0.15ではインデックスに含めるようにできると思われる
ttp://www.namazu.org/pipermail/namazu-devel-ja/2005-July/000487.html
2.0.15pre1が出ているから試してみては?
multi-part部も
2.0.15ではインデックスに含めるようにできると思われる
ttp://www.namazu.org/pipermail/namazu-devel-ja/2005-July/000487.html
2.0.15pre1が出ているから試してみては?
レスを投稿する
ニュース
- 【工作員】「X」のアカウント所在地公開機能が暴いた世論操作の実態 MAGA支持著名アカウントの多くが米国外から運営 日本にも波及 ★2 [ごまカンパチ★]
- 【大阪】日本一高い観覧車が落雷で緊急停止 約20人乗客が閉じ込められ9時間にわたり救助活動 [七波羅探題★]
- 【大阪】「もっとこっち来てよ」女子高校生を電車内に連れ込み 小学校教諭再逮捕「話をしたかっただけ [七波羅探題★]
- 【・(ェ)・】「くまちゃんがいた」散歩中の2歳園児が発見 クリ林に1頭のクマ…保育士「ワンちゃんだね…」と声かけて移動 [Ailuropoda melanoleuca★]
- 【芸能】安達祐実 44歳の最新姿「ぇーーーーー!!!」「声出た」「なんなの」「まって」「ワオ」 [湛然★]
- ラピダス、第2工場建設でも見えぬ顧客 技術開発も難題山積 [蚤の市★]
- フィフィさんが姉と妹の写真を公開 「みんなべっぴんさん」「クレオパトラ三姉妹」など絶賛の声 [309323212]
- 🖐( -᷄ὢ)これから>>2の>>3なんで……
- 【悲報】『たぬかな』ファンのホビット、絶望「こうして36歳年収650万円身長155cmの底辺独身男性が残りましたとさ…どうすればいいんだよ [257926174]
- 小田原城行ってみようかな
- 【悲報】日本の田舎、もう住める場所じゃないと話題に
- UFOの爆盛バーレル食べたい
