X



全文検索エンジン Hyper Estraier 2

0004名無しさん@お腹いっぱい。
垢版 |
2007/04/17(火) 22:08:40
いいえ、タイにご執心の気違い次男がいる限り、なまずは不滅です。
もっとも最近は、もっとダイレクトにcockらしいですが。
0011名無しさん@お腹いっぱい。
垢版 |
2007/04/22(日) 20:12:08
フロントエンド、統一してくれんかのぅ
0012774
垢版 |
2007/04/23(月) 01:14:13
前スレとの二重カキコご免なさい。
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?clip=8
こちらのサイトでtestを検索
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?phrase=text&perpage=10&clip=8&navi=0&attr=&order=
すると関連キーワードとして
Related terms: text, rowspan, style, align, center, color, background, key
というふうに出てきますが、これって配布されているCGI、estseek.cgiでも出すようにできますか??
いろいろ調べているんですが、方法が一向に分からず。
ご存知の方いらしたら改造のしかた教えて下さい。
0013名無しさん@お腹いっぱい。
垢版 |
2007/04/24(火) 22:20:44
複数のインデックスを作っておいて、同時に検索できるのでしょうか?
estseek.confのindexname: 部分では複数の記述ができませんでした。
001413
垢版 |
2007/04/24(火) 22:22:08
すみません。前スレに移動しました。
001816
垢版 |
2007/05/02(水) 22:17:48
俺なら作者に「お願い」するけどな。

ところでGNU FDLに基づいて公開義務が生じる根拠って何かあるの?
0022名無しさん@お腹いっぱい。
垢版 |
2007/06/12(火) 00:07:48
KaMailV3もここで良い?
0024名無しさん@お腹いっぱい。
垢版 |
2007/06/20(水) 03:25:39
estcmd search -ord のあとに何をかけばいいのかわかんねー。
rubyの二つの bindingもどういう得失があるんだろう..
やっぱり purerubyだとちょっと遅いとか??
ちょっとソースに diveしてくる。
0027名無しさん@お腹いっぱい。
垢版 |
2007/07/04(水) 20:56:32
namazu.el と同じようなフロントエンドおねがいしますー。

上にあったlookupじゃ使いにくいです。
リターン一発で編集したいです。

0028名無しさん@お腹いっぱい。
垢版 |
2007/08/26(日) 14:16:34
Windowsバイナリ版で作成したインデクスと付属CGI(estseek.cgi及び関連ファイル)は
そのままレン鯖にうpしても動かないですかね?
試用段階なのだけど、なにか違うんだろうか。
002928
垢版 |
2007/08/26(日) 15:33:46
ご、ごめん、いずれにしてもRubyからアクセス(検索)することになるので
そっちをテストしたらうまくいきました。
付属CGIが動かない理由はまだわからないけど、
自分でもいまいち整理できてないですし、
estseek.cgiは使わないので質問は取り下げます。
ごめりんこですm(_ _)m
0033名無しさん@お腹いっぱい。
垢版 |
2007/10/28(日) 19:54:12
>>32
開発スピードが遅くなるのはいいんだけど、放置プレイだけが心配だなぁ。
Tokyo Cabinet で QDBM の不満点を解消したとかいってるし、QDBM 放置 → H.E. も放置な流れの気配が…
0034名無しさん@お腹いっぱい。
垢版 |
2007/11/05(月) 14:51:27
100万レコードくらいのインデックスを作成したいのですが、
mysqlのエラーで止まります。何かいい方法ありますか?
0035名無しさん@お腹いっぱい。
垢版 |
2007/11/06(火) 00:03:34
そもそもmysqlのエラーというのが発生する経緯がわからん
どういう使い方をしているのか、それを説明したまえ
003634
垢版 |
2007/11/06(火) 19:34:03
>35

レスありがとうございます。
hyperestraierとacts_as_searchableというrailsのプラグインを使って、全文検索を行いたいと考えています。

acts_as_searchableに備わっているreindex!というメソッドを実行すると、インデックスが構築される仕様になっているのですが、
これを実行すると、だんだん処理が重くなり、最終的にはMysql::Error: Lost connection to MySQL server during queryというエラーが出てしまいます。

reindex!というメソッドはデフォルトでは対象になるレコードを一気にメモリにのせてしまうので、
そのあたりは負荷を減らすようなコードに修正して実行しています。
(このような感じです。ttp://d.hatena.ne.jp/yune_kotomi/20070912/1189617411)

hyperestraierのメーリングリストで、mysqlのLost Connectionを改善する
mysql_retry_lost_connectionというrailsのプラグインを教えて頂いたのですが、
インストールしても効果がなく、どうも、接続が切れる前の段階でつまずいているような気がします。

対象レコード数は100万弱で、途中で止まってしまいましたが、
#docs => 22897、#words => 196666まではいけました。

なにかアドバイスいただければ幸いです。
よろしくお願いします。







0037名無しさん@お腹いっぱい。
垢版 |
2007/11/07(水) 11:56:45
そのMySQLのqueryとやらは、その先の処理が何時間かかろうともいつまでも待ってくれるの?
単にタイムアウトしているだけのような気が...
0040名無しさん@お腹いっぱい。
垢版 |
2007/11/08(木) 22:48:10
マルチっていうより、ML で有効なレスポンスがないからこっちにも、ってことだろう。
残念ながら俺は MySQL と組み合わせたことも Rails も使ったことがないからよくわからん。
つか普通 MySQL で全文検索するんだったら Senna じゃね?
0042名無しさん@お腹いっぱい。
垢版 |
2007/11/12(月) 00:50:42
メンテナンスに関しては、開発者コミュニティが形成されていない
のがダメな点だな。

作者の手を煩わせてはいかんよ。
0043名無しさん@お腹いっぱい。
垢版 |
2007/11/12(月) 08:59:50
いやでもパッチ投げても直接マージされるわけじゃなく、本人がリライトして
著作権保持者を維持してるので、開発コミュニティの形成はforkでもしないと
無理だよ。
0045名無しさん@お腹いっぱい。
垢版 |
2007/11/12(月) 10:59:56
googleに行ったフーリソフトウェア者も沈黙しちゃってる件(泣)

0048名無しさん@お腹いっぱい。
垢版 |
2007/11/21(水) 14:44:41
あとgather -aa @uri STRで属性インデックスつけてるけど やっぱ遅いですね
属性検索で速く検索する方法ありますか
0049名無しさん@お腹いっぱい。
垢版 |
2007/11/21(水) 18:22:16
>>48
それ属性インデクス追加のオプションだっけ?
おれは
estcmd create -attr @uri str idx
とかやって属性インデクス付けたよ.

1000万件位のレコード数だったけど,URI検索は体感できるほど
速くなった.
0050名無しさん@お腹いっぱい。
垢版 |
2007/11/29(木) 10:43:00
>>39-45
で、いざ新バージョンが出たら沈黙ってなんだよ。
0051名無しさん@お腹いっぱい。
垢版 |
2007/11/29(木) 13:26:34
http://hyperestraier.sourceforge.net/index.ja.html
> 最新のソースパッケージ(バージョン1.4.12)

あれ、いつの間に。
ML 入ってるけどリリース情報なかったぞ。
何にせよ復活age.

ただ、ChangeLog 見る限り、

2007-11-18 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c: code clean-up.
- Bugs related to type casting of perl binding were fixed.
- Release: 1.4.12

2006-11-11 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c (est_resmap_add): "method" argument was added.
* estraier.c (est_inode): a bug related to overflow was fixed.
* estraier.c (est_narrow_score): a bug related to attribute distinction was fixed.
* estraier.c (est_search_union): search accuracy with trailing uni-gram was improved.
* estmaster.c (searchlocal): a bug related to scanning with regular expressions was fixed.
* estscout.c (realmain): "union", "score", and "idsuffix" attributes were added.
* estsupt.c (realmain): "score" attribute was added.
* estsupt.c (procsearch): accuracy of hint was improved.
* estsupt.c (realmain): "logmsg" parameter was added.
* estscout.c (realmain): "distinct" parameter was added.
* estscout.c (showresult): cache clear at random was added.
- Release: 1.4.11

ここのところ精力的に ML に投げられてたパッチはマージされてなさげ?
0053名無しさん@お腹いっぱい。
垢版 |
2007/12/06(木) 19:59:56
Chimera Search(キメラ・サーチ)
http://www.osstech.co.jp/product/chimera

> 構築コンポーネントに以下のOSS(オープンソースソフトウェア)を利用
> しているため、安価に導入できるのに高性能・高機能を発揮します。
> * プログラム言語: Rubyおよび Ruby On Rails
> * 全文検索システム : Hyper Estraier
0054名無しさん@お腹いっぱい。
垢版 |
2007/12/22(土) 14:50:01
百度でやってるように
會→会
懷→懐
みたいに異体・旧字体・繁体・簡体をまとめてくれるといいのに。

estraier.c のなかの canonize なんとか関数に誰かちょっちょっと書き加えてくれ。
0055名無しさん@お腹いっぱい。
垢版 |
2007/12/22(土) 15:24:27
>>53
こういう製品って虚しいよね。
だって、導入60万、年12万だったらGoogle MINIの方が
安いし、ハードウェア込みの提供だからメンテフリーだし。
実際,うちの会社はWWW用はGoogleMINI にした。
部内サーバは自分でHyper Estraierをいれた。
0056名無しさん@お腹いっぱい。
垢版 |
2007/12/22(土) 17:12:45
>>55
それはそうなんだが、Google MINIってちっとも社内のニーズに合わせてくれなくて不満がでるんだよな。
ページの計算もなんか適当に丸められちゃうし。
0057名無しさん@お腹いっぱい。
垢版 |
2007/12/24(月) 16:00:59
コレ使って、某サイトの1万件の記事の全文検索作ったが早いし良いね!!
acts_as_searchableの未完成具合に泣いたけどww

Rails系のエンジニアに聞くと皆使ってるし、
結構いろんなサービスでも使ってるみたい。
0061名無しさん@お腹いっぱい。
垢版 |
2008/01/29(火) 14:23:57
クローラー+ノードサーバーを使用した検索をシステムを動かし
http://*****:1978/node/***/search_ui の形式で検索には成功しました。

次ステップで
estraierpure.rb を PHP に移植したという 「EstraierPure for PHP 4.3」を使用し、ClassNodeを利用しましたが、検索結果に同じサイトばかり表示されてしまいます。

1:Pure版には 類似隠匿機能はないのでしょうか。
  Ruby、Javaにもないようですし..

2:Binding版(Perl等)には、類似隠匿機能(set_eclipse)があるのですが、classNode がありません。
  Binding版で、P2P(ノード)利用した検索をシステムって可能なのでしょうか。
  CPAN(Search-Estraier)を観ましたが、classNodeがあったのですが、set_eclipseがありませんでした
3:そもそもBinding版とPure版の違いってなんでしょうか。(汗


全く、的外れな質問でしたらお許しください
やりたいのは、「P2P+クローラーでの検索サーバーの構築」です。
0062名無しさん@お腹いっぱい。
垢版 |
2008/01/29(火) 18:32:53
ノードAPIの場合、est_noderes_eclipse関数。 
Pureには、実装されてないようです。


>そりゃ俺がやるから使う側は楽なんだけどさ、面倒くせーことこの上ない。
 ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11306060711414945086
0065名無しさん@お腹いっぱい。
垢版 |
2008/01/30(水) 02:18:18
鰤と鯰
006661
垢版 |
2008/01/30(水) 14:55:51
面倒くせーですか.... Cでやってみましょうか..15年ブリ(鬱
レスを投稿する


ニューススポーツなんでも実況