探検
全文検索エンジン Hyper Estraier 2
1名無しさん@お腹いっぱい。
2007/04/17(火) 19:56:122名無しさん@お腹いっぱい。
2007/04/17(火) 19:57:062007/04/17(火) 21:59:35
「はっ!はぁぁぁあんっ!ナ、ナマズは?ナマズは、こ、超えたの??」
2007/04/17(火) 22:08:40
いいえ、タイにご執心の気違い次男がいる限り、なまずは不滅です。
もっとも最近は、もっとダイレクトにcockらしいですが。
もっとも最近は、もっとダイレクトにcockらしいですが。
2007/04/18(水) 00:12:47
>>1
乙
乙
2007/04/18(水) 22:59:59
こんなところにエロゲーのスレが!??
2007/04/19(木) 08:50:05
>>6
「イサキ 大漁」で検索
「イサキ 大漁」で検索
2007/04/19(木) 17:49:02
インストール方法から検索方法までの詳細
↓
↓
↓
↓
2007/04/19(木) 18:58:11
つGoogle
2007/04/22(日) 17:16:55
11名無しさん@お腹いっぱい。
2007/04/22(日) 20:12:08 フロントエンド、統一してくれんかのぅ
12774
2007/04/23(月) 01:14:13 前スレとの二重カキコご免なさい。
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?clip=8
こちらのサイトでtestを検索
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?phrase=text&perpage=10&clip=8&navi=0&attr=&order=
すると関連キーワードとして
Related terms: text, rowspan, style, align, center, color, background, key
というふうに出てきますが、これって配布されているCGI、estseek.cgiでも出すようにできますか??
いろいろ調べているんですが、方法が一向に分からず。
ご存知の方いらしたら改造のしかた教えて下さい。
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?clip=8
こちらのサイトでtestを検索
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?phrase=text&perpage=10&clip=8&navi=0&attr=&order=
すると関連キーワードとして
Related terms: text, rowspan, style, align, center, color, background, key
というふうに出てきますが、これって配布されているCGI、estseek.cgiでも出すようにできますか??
いろいろ調べているんですが、方法が一向に分からず。
ご存知の方いらしたら改造のしかた教えて下さい。
2007/04/24(火) 22:20:44
複数のインデックスを作っておいて、同時に検索できるのでしょうか?
estseek.confのindexname: 部分では複数の記述ができませんでした。
estseek.confのindexname: 部分では複数の記述ができませんでした。
1413
2007/04/24(火) 22:22:08 すみません。前スレに移動しました。
2007/05/02(水) 19:49:28
relwords.qdb って何処で入手できるんでしょうか。
2007/05/02(水) 20:50:02
ttp://qdbm.sourceforge.net/mikio/rbbs.cgi?id=RA11373623770980940568&focus=1
2007/05/02(水) 21:16:15
>>16
http://athlon64.fsij.org:8080/wikipedia/relwords.tsv.bz2
は
http://athlon64.fsij.org/wikipedia/relwords.tsv.bz2
のようですが、not found なのです。
wikipediaのデータを使っているようなので、GNU FDL に基づいて
作者に直接請求しなければならないのでしょうかね。
http://athlon64.fsij.org:8080/wikipedia/relwords.tsv.bz2
は
http://athlon64.fsij.org/wikipedia/relwords.tsv.bz2
のようですが、not found なのです。
wikipediaのデータを使っているようなので、GNU FDL に基づいて
作者に直接請求しなければならないのでしょうかね。
1816
2007/05/02(水) 22:17:48 俺なら作者に「お願い」するけどな。
ところでGNU FDLに基づいて公開義務が生じる根拠って何かあるの?
ところでGNU FDLに基づいて公開義務が生じる根拠って何かあるの?
2007/05/03(木) 13:45:41
20名無しさん@お腹いっぱい。
2007/05/06(日) 11:58:48 これだろ
http://athlon64.fsij.org/~mikio/wikipedia/relwords.qdb
http://athlon64.fsij.org/~mikio/wikipedia/relwords.qdb
2007/05/07(月) 11:24:34
22名無しさん@お腹いっぱい。
2007/06/12(火) 00:07:48 KaMailV3もここで良い?
2007/06/12(火) 15:08:13
xyzzyのスレがあるべ。
作者さんはずっとあっちの人だ
作者さんはずっとあっちの人だ
2007/06/20(水) 03:25:39
estcmd search -ord のあとに何をかけばいいのかわかんねー。
rubyの二つの bindingもどういう得失があるんだろう..
やっぱり purerubyだとちょっと遅いとか??
ちょっとソースに diveしてくる。
rubyの二つの bindingもどういう得失があるんだろう..
やっぱり purerubyだとちょっと遅いとか??
ちょっとソースに diveしてくる。
25名無しさん@お腹いっぱい。
2007/07/02(月) 22:06:30 mixiが自社開発の検索エンジンに移行、ウェブ検索はYSTに:ニュース - CNET Japan
http://japan.cnet.com/news/media/story/0,2000056023,20352009,00.htm
Hyper Estraier あげ
http://japan.cnet.com/news/media/story/0,2000056023,20352009,00.htm
Hyper Estraier あげ
2007/07/03(火) 09:54:12
mixy日記はコーパスとしておもしろそうだよねえ。
2007/07/04(水) 20:56:32
namazu.el と同じようなフロントエンドおねがいしますー。
上にあったlookupじゃ使いにくいです。
リターン一発で編集したいです。
上にあったlookupじゃ使いにくいです。
リターン一発で編集したいです。
28名無しさん@お腹いっぱい。
2007/08/26(日) 14:16:34 Windowsバイナリ版で作成したインデクスと付属CGI(estseek.cgi及び関連ファイル)は
そのままレン鯖にうpしても動かないですかね?
試用段階なのだけど、なにか違うんだろうか。
そのままレン鯖にうpしても動かないですかね?
試用段階なのだけど、なにか違うんだろうか。
2928
2007/08/26(日) 15:33:46 ご、ごめん、いずれにしてもRubyからアクセス(検索)することになるので
そっちをテストしたらうまくいきました。
付属CGIが動かない理由はまだわからないけど、
自分でもいまいち整理できてないですし、
estseek.cgiは使わないので質問は取り下げます。
ごめりんこですm(_ _)m
そっちをテストしたらうまくいきました。
付属CGIが動かない理由はまだわからないけど、
自分でもいまいち整理できてないですし、
estseek.cgiは使わないので質問は取り下げます。
ごめりんこですm(_ _)m
2007/09/04(火) 21:14:26
ちかごろ良さげなパッチがMLに
流れてるが、作者はマージせんのか。
中華、作者はメンテしてんのか?
流れてるが、作者はマージせんのか。
中華、作者はメンテしてんのか?
2007/09/05(水) 02:18:45
確か1.4.9と1.4.10の間も長かったな。
mixi移籍後社内業務で手一杯なのか開発速度が大幅に落ちた希ガス
mixi移籍後社内業務で手一杯なのか開発速度が大幅に落ちた希ガス
2007/09/05(水) 11:32:08
Tokyo Cabinet なんてのも作ってるしなあ。 QDBM ともども H.E. もこのまま放置されたりして。
http://tokyocabinet.sourceforge.net/
つーか代わりにメンテナに立候補する香具師はおらんかなあと思う今日このごろ。
http://tokyocabinet.sourceforge.net/
つーか代わりにメンテナに立候補する香具師はおらんかなあと思う今日このごろ。
2007/10/28(日) 19:54:12
>>32
開発スピードが遅くなるのはいいんだけど、放置プレイだけが心配だなぁ。
Tokyo Cabinet で QDBM の不満点を解消したとかいってるし、QDBM 放置 → H.E. も放置な流れの気配が…
開発スピードが遅くなるのはいいんだけど、放置プレイだけが心配だなぁ。
Tokyo Cabinet で QDBM の不満点を解消したとかいってるし、QDBM 放置 → H.E. も放置な流れの気配が…
34名無しさん@お腹いっぱい。
2007/11/05(月) 14:51:27 100万レコードくらいのインデックスを作成したいのですが、
mysqlのエラーで止まります。何かいい方法ありますか?
mysqlのエラーで止まります。何かいい方法ありますか?
2007/11/06(火) 00:03:34
そもそもmysqlのエラーというのが発生する経緯がわからん
どういう使い方をしているのか、それを説明したまえ
どういう使い方をしているのか、それを説明したまえ
3634
2007/11/06(火) 19:34:03 >35
レスありがとうございます。
hyperestraierとacts_as_searchableというrailsのプラグインを使って、全文検索を行いたいと考えています。
acts_as_searchableに備わっているreindex!というメソッドを実行すると、インデックスが構築される仕様になっているのですが、
これを実行すると、だんだん処理が重くなり、最終的にはMysql::Error: Lost connection to MySQL server during queryというエラーが出てしまいます。
reindex!というメソッドはデフォルトでは対象になるレコードを一気にメモリにのせてしまうので、
そのあたりは負荷を減らすようなコードに修正して実行しています。
(このような感じです。ttp://d.hatena.ne.jp/yune_kotomi/20070912/1189617411)
hyperestraierのメーリングリストで、mysqlのLost Connectionを改善する
mysql_retry_lost_connectionというrailsのプラグインを教えて頂いたのですが、
インストールしても効果がなく、どうも、接続が切れる前の段階でつまずいているような気がします。
対象レコード数は100万弱で、途中で止まってしまいましたが、
#docs => 22897、#words => 196666まではいけました。
なにかアドバイスいただければ幸いです。
よろしくお願いします。
レスありがとうございます。
hyperestraierとacts_as_searchableというrailsのプラグインを使って、全文検索を行いたいと考えています。
acts_as_searchableに備わっているreindex!というメソッドを実行すると、インデックスが構築される仕様になっているのですが、
これを実行すると、だんだん処理が重くなり、最終的にはMysql::Error: Lost connection to MySQL server during queryというエラーが出てしまいます。
reindex!というメソッドはデフォルトでは対象になるレコードを一気にメモリにのせてしまうので、
そのあたりは負荷を減らすようなコードに修正して実行しています。
(このような感じです。ttp://d.hatena.ne.jp/yune_kotomi/20070912/1189617411)
hyperestraierのメーリングリストで、mysqlのLost Connectionを改善する
mysql_retry_lost_connectionというrailsのプラグインを教えて頂いたのですが、
インストールしても効果がなく、どうも、接続が切れる前の段階でつまずいているような気がします。
対象レコード数は100万弱で、途中で止まってしまいましたが、
#docs => 22897、#words => 196666まではいけました。
なにかアドバイスいただければ幸いです。
よろしくお願いします。
2007/11/07(水) 11:56:45
そのMySQLのqueryとやらは、その先の処理が何時間かかろうともいつまでも待ってくれるの?
単にタイムアウトしているだけのような気が...
単にタイムアウトしているだけのような気が...
2007/11/08(木) 01:02:45
つーかMLとマルチ?やるなあおい
2007/11/08(木) 08:42:09
作者こないね
2007/11/08(木) 22:48:10
マルチっていうより、ML で有効なレスポンスがないからこっちにも、ってことだろう。
残念ながら俺は MySQL と組み合わせたことも Rails も使ったことがないからよくわからん。
つか普通 MySQL で全文検索するんだったら Senna じゃね?
残念ながら俺は MySQL と組み合わせたことも Rails も使ったことがないからよくわからん。
つか普通 MySQL で全文検索するんだったら Senna じゃね?
2007/11/11(日) 18:28:54
いや、だからさ、作者はメンテする意思あんのか、と。
42名無しさん@お腹いっぱい。
2007/11/12(月) 00:50:42 メンテナンスに関しては、開発者コミュニティが形成されていない
のがダメな点だな。
作者の手を煩わせてはいかんよ。
のがダメな点だな。
作者の手を煩わせてはいかんよ。
2007/11/12(月) 08:59:50
いやでもパッチ投げても直接マージされるわけじゃなく、本人がリライトして
著作権保持者を維持してるので、開発コミュニティの形成はforkでもしないと
無理だよ。
著作権保持者を維持してるので、開発コミュニティの形成はforkでもしないと
無理だよ。
2007/11/12(月) 10:29:24
作者がmixiじゃなくgoogleに就職していれば…
45名無しさん@お腹いっぱい。
2007/11/12(月) 10:59:56 googleに行ったフーリソフトウェア者も沈黙しちゃってる件(泣)
2007/11/12(月) 19:53:49
マイクロソフトはソース見たらフリーウェアに参加で着なくなるけどほかのも?
2007/11/21(水) 14:39:17
estseek.cgiで属性検索しても結果に出てこないのはなんで?
[UVSET]してるけどなー
[UVSET]してるけどなー
2007/11/21(水) 14:44:41
あとgather -aa @uri STRで属性インデックスつけてるけど やっぱ遅いですね
属性検索で速く検索する方法ありますか
属性検索で速く検索する方法ありますか
2007/11/21(水) 18:22:16
>>48
それ属性インデクス追加のオプションだっけ?
おれは
estcmd create -attr @uri str idx
とかやって属性インデクス付けたよ.
1000万件位のレコード数だったけど,URI検索は体感できるほど
速くなった.
それ属性インデクス追加のオプションだっけ?
おれは
estcmd create -attr @uri str idx
とかやって属性インデクス付けたよ.
1000万件位のレコード数だったけど,URI検索は体感できるほど
速くなった.
50名無しさん@お腹いっぱい。
2007/11/29(木) 10:43:00 >>39-45
で、いざ新バージョンが出たら沈黙ってなんだよ。
で、いざ新バージョンが出たら沈黙ってなんだよ。
2007/11/29(木) 13:26:34
http://hyperestraier.sourceforge.net/index.ja.html
> 最新のソースパッケージ(バージョン1.4.12)
あれ、いつの間に。
ML 入ってるけどリリース情報なかったぞ。
何にせよ復活age.
ただ、ChangeLog 見る限り、
2007-11-18 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c: code clean-up.
- Bugs related to type casting of perl binding were fixed.
- Release: 1.4.12
2006-11-11 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c (est_resmap_add): "method" argument was added.
* estraier.c (est_inode): a bug related to overflow was fixed.
* estraier.c (est_narrow_score): a bug related to attribute distinction was fixed.
* estraier.c (est_search_union): search accuracy with trailing uni-gram was improved.
* estmaster.c (searchlocal): a bug related to scanning with regular expressions was fixed.
* estscout.c (realmain): "union", "score", and "idsuffix" attributes were added.
* estsupt.c (realmain): "score" attribute was added.
* estsupt.c (procsearch): accuracy of hint was improved.
* estsupt.c (realmain): "logmsg" parameter was added.
* estscout.c (realmain): "distinct" parameter was added.
* estscout.c (showresult): cache clear at random was added.
- Release: 1.4.11
ここのところ精力的に ML に投げられてたパッチはマージされてなさげ?
> 最新のソースパッケージ(バージョン1.4.12)
あれ、いつの間に。
ML 入ってるけどリリース情報なかったぞ。
何にせよ復活age.
ただ、ChangeLog 見る限り、
2007-11-18 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c: code clean-up.
- Bugs related to type casting of perl binding were fixed.
- Release: 1.4.12
2006-11-11 Mikio Hirabayashi <mikio@users.sourceforge.net>
* estraier.c (est_resmap_add): "method" argument was added.
* estraier.c (est_inode): a bug related to overflow was fixed.
* estraier.c (est_narrow_score): a bug related to attribute distinction was fixed.
* estraier.c (est_search_union): search accuracy with trailing uni-gram was improved.
* estmaster.c (searchlocal): a bug related to scanning with regular expressions was fixed.
* estscout.c (realmain): "union", "score", and "idsuffix" attributes were added.
* estsupt.c (realmain): "score" attribute was added.
* estsupt.c (procsearch): accuracy of hint was improved.
* estsupt.c (realmain): "logmsg" parameter was added.
* estscout.c (realmain): "distinct" parameter was added.
* estscout.c (showresult): cache clear at random was added.
- Release: 1.4.11
ここのところ精力的に ML に投げられてたパッチはマージされてなさげ?
2007/12/05(水) 19:46:42
pthreadsライブラリのないシステムで動かしたいんですが
なんとかならんですかね。
なんとかならんですかね。
53名無しさん@お腹いっぱい。
2007/12/06(木) 19:59:56 Chimera Search(キメラ・サーチ)
http://www.osstech.co.jp/product/chimera
> 構築コンポーネントに以下のOSS(オープンソースソフトウェア)を利用
> しているため、安価に導入できるのに高性能・高機能を発揮します。
> * プログラム言語: Rubyおよび Ruby On Rails
> * 全文検索システム : Hyper Estraier
http://www.osstech.co.jp/product/chimera
> 構築コンポーネントに以下のOSS(オープンソースソフトウェア)を利用
> しているため、安価に導入できるのに高性能・高機能を発揮します。
> * プログラム言語: Rubyおよび Ruby On Rails
> * 全文検索システム : Hyper Estraier
2007/12/22(土) 14:50:01
百度でやってるように
會→会
懷→懐
みたいに異体・旧字体・繁体・簡体をまとめてくれるといいのに。
estraier.c のなかの canonize なんとか関数に誰かちょっちょっと書き加えてくれ。
會→会
懷→懐
みたいに異体・旧字体・繁体・簡体をまとめてくれるといいのに。
estraier.c のなかの canonize なんとか関数に誰かちょっちょっと書き加えてくれ。
2007/12/22(土) 15:24:27
>>53
こういう製品って虚しいよね。
だって、導入60万、年12万だったらGoogle MINIの方が
安いし、ハードウェア込みの提供だからメンテフリーだし。
実際,うちの会社はWWW用はGoogleMINI にした。
部内サーバは自分でHyper Estraierをいれた。
こういう製品って虚しいよね。
だって、導入60万、年12万だったらGoogle MINIの方が
安いし、ハードウェア込みの提供だからメンテフリーだし。
実際,うちの会社はWWW用はGoogleMINI にした。
部内サーバは自分でHyper Estraierをいれた。
レスを投稿する
ニュース
- 日本と中国を結ぶ12航空路線で全便欠航 中国人に最も人気の海外旅行先は日本から韓国に [ぐれ★]
- 【速報】トランプ大統領、中国の習近平国家主席を「国賓」として招待することに ★2 [ニョキニョキ★]
- 米中電話会談、トランプ氏は「米国側は中国にとっての台湾問題の重要性を理解する」 [1ゲットロボ★]
- 【国際】トランプ氏、来年4月に中国を訪問する招待を受け入れる 習氏も国賓で訪米へ 電話会談 [ぐれ★]
- 【音楽】「なんでこんなバカが国のトップなの?」 若者に人気のバンド「GEZAN」のマヒトゥ・ザ・ピーポーが高市総理に苦言 [シャチ★]
- 【東京・足立の車暴走】赤信号無視か 危険運転致死傷疑いも視野に捜査 逮捕された職業不詳の男性(37)は精神疾患で通院歴も ★3 [ぐれ★]
- スマホのやつこの動画見てくれ [577451214]
- 【高市悲報】来年、習近平主席がアメリカに「国賓」として訪米。どうするんだよ高市・・・アメリカも敵に回すのか? [483862913]
- フィフィ「外国人だろうが日本人だろうが反日は要らんのよ、この国に…自分にとって住みやすい国に行け。」 [856698234]
- うええええええん仕事いぎだくないよぉ
- 【高市悲報】トランプおやびん「偉大な指導者である習近平首席、米国は中国にとっての台湾問題の重要性を理解しています」 [115996789]
- 【速報】足立ひき逃げ犯、精神病持ちだった [329271814]
