2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

オープンソースの全文検索ソフト

1 :はるお:02/11/01 03:28 ID:5yfQC/Z+.net
オープンソースの全文検索エンジン全般を扱うスレッドです。

ソフトウェアによっては固有のスレッドが立てられている場合もあります。
それらについては適宜リンクを張ります。

Namazu http://www.namazu.org/
Glimpse http://webglimpse.org/
SWISH++ http://homepage.mac.com/pauljlucas/software/swish/
ht:/Dig http://www.htdig.org/

Comparing Open Source Indexers
http://www.infomotions.com/musings/opensource-indexers/

関連スレッド
全文検索ユーティリティ統一スレッド
http://pc.2ch.net/test/read.cgi/bsoft/1006680403/
 ビジネスソフト板のスレッドです。
 主に Windows のパッケージソフトについてのようです。

Microsoftの全文検索ソフト(Indexing Service等)
http://pc3.2ch.net/test/read.cgi/win/1035387243/


183 :login:Penguin:2007/02/08(木) 09:58:55 ID:lffkdWu+.net
html内で、コメントを使わずにスタイルシートのhiddenを使ってコメントアウトしているページがあり
NAMAZUはもちろん対応していないのですが、対応できる検索エンジンってあります?

184 :login:Penguin:2007/02/08(木) 15:30:47 ID:aalcJ7Z4.net
多分ない。


185 :login:Penguin:2007/02/08(木) 15:43:02 ID:lffkdWu+.net
>>184
そうですよね。googleでも引っかかってしまうし。

186 :login:Penguin:2007/02/08(木) 22:54:22 ID:WBqU/6bx.net
対応ってどういう意味だろう。
そこが検索でヒットされて欲しくないってこと?
そんなエンジンはないだろうな。

187 :login:Penguin:2007/02/08(木) 23:29:33 ID:xQE/x50H.net
対応できるってどういう意味だろう。
「作ればあるもん」だと思うのだが。

188 :login:Penguin:2007/02/13(火) 16:54:43 ID:g+G6znAU.net
rastって死亡? なんか実質1年くらい動きがなさそうなんだけど。
matzがいるような会社でも、IPAから金めぐんでもらってやってただけで
それがなくなったら後は野となれ山となれなのかね? もしそうだったら寂しいね。

189 :login:Penguin:2007/02/13(火) 18:46:26 ID:JrXWD7sx.net
>>188
長い目で見れば、死亡させた方が金になるんだよ。

190 :login:Penguin:2007/02/14(水) 07:47:29 ID:/l3toK3t.net
Hyper Estarierは未踏で開発が加速して、今はまったりとしつつも
きちんと続いている。
SennaもMySQL連携が効いたのか、じわじわと利用が進んでいる。

Rastはなあ... 構造を複雑にしすぎて、金が切れてからのメンテナンスが
難しくなったんじゃないかという気がする。あとは外部からの開発者を
集められなかったことが敗因か。


191 :login:Penguin:2007/02/14(水) 09:45:36 ID:URN3dXTi.net
H.E. も個人開発だけどね

192 :login:Penguin:2007/02/14(水) 13:13:18 ID:fQFyeH6h.net
>>190
> 難しくなったんじゃないかという気がする。あとは外部からの開発者を
> 集められなかったことが敗因か。

いや〜
金をもらって作られたブツの世話を引き継いで、タダで作業するのって、惨めだぞ〜
特に多大な金が投入されたことをみんなが知っていると、いろいろあって鬱病になりそうになる。

もう2度とやりたくない。

193 :login:Penguin:2007/02/15(木) 11:59:16 ID:vlsOl9z9.net
>>191
作者はじつにいい会社に転職したよね。今後も安泰かというと不安だけど...
>>192
気持ちはよくわかる。最低限、「自分が使うから」ぐらいのモチベーションが
ないとやっていけないよなあ。



194 :login:Penguin:2007/07/12(木) 15:36:46 ID:FQfZ6HrX.net
>>181
これの固有名詞版ってないのかしらん?

USA、米国、アメリカ、U.S.→アメリカみたいな

195 :login:Penguin:2007/08/28(火) 03:01:56 ID:AfUQD9wn.net
人少ないみたいだからアゲますね。

ちょっとダサい質問なんですが、インデックスを作成するタイプの全文検索で
そのものがインストールされていないレンタル鯖で使えるものってありますか?
PerlもしくはRubyから検索したいと思って
Namazu、HyperEstraierを試したんですが、
前者はPerlモジュールのインストールを断られ、
後者はインデックスがQDBMの形式だからどの道無理かと思いました。
(方法があればHEの方は使ってみたいけど)

頻繁に更新されるような対象じゃないので、MySQLのFULLTEXTでも・・・
と思ってはいるんだけど、
なにか方法(ソフト)があればおしえてください。

196 :login:Penguin:2007/08/28(火) 08:03:34 ID:NA5riCTs.net
http://rubyforge.org/projects/ferret/

pure rubyでこんなのがあるよ。日本語が使えるかどうかはわからないけど。
Luceneにinspreされたとかいてあるから、UTF-8なら使えそうな気もする。


197 :195:2007/08/28(火) 20:02:17 ID:uwrt1akO.net
>>196
少し触ってみたところ使いやすい感じで好感触でした!
完全かどうかはわかりませんが、日本語も大丈夫でした。
とりあえずレン鯖での動作も確認できました。
まだ不明な点もありますが、しばらく使ってみようと思います。
ありがとうございました!

198 :login:Penguin:2008/01/08(火) 00:46:08 ID:XSbSibRZ.net
gonzuiみたいなのでVB6検索できるエンジンありませんかね?

VB6病発病したソースコードを手術しないといけないので
頼みます。

199 :login:Penguin:2008/04/09(水) 00:25:01 ID:X4T3aWgW.net
こんなん出てた。
全文検索エンジンLux
http://luxse.sourceforge.net/

ToDo のところに
# 削除・更新
# 全角半角かなの同一視
とか書いてあるあたり見ると、まだ全然未完成みたいだけど。

200 :login:Penguin:2008/04/09(水) 13:25:32 ID:P7VWxNnr.net
apacheのluceneがeclipseのヘルプ?で使われていたことを知った。


201 :login:Penguin:2008/09/08(月) 17:32:23 ID:NVWE6wto.net
InfoCrawlerとOmniFindってどう?


今研究室の文書管理システムを作らなきゃいけないんだが,ユーザビリティを損なわず文書管理したい.
ファイルドラッグできるフリーなシステムは見つからない.
⇒Sambaフォルダに適当にぶち込んで後から見るときは検索でおk

と言う風に今は考えてるんだが、間違ってないよな?
doc,pdf,ppt辺りを読み込んでくれる素敵なエンジンはない物か…

202 :login:Penguin:2008/11/20(木) 11:23:32 ID:rg5Oz6Z5.net
保守

203 :login:Penguin:2008/11/29(土) 10:11:46 ID:lHYI9aEV.net
http://www.jieks.com/2ch/

204 :login:Penguin:2009/12/23(水) 12:09:55 ID:2EkpDgwW.net
ど素人の質問で申し訳ないんですが、
ひらがな/カタカナのどちらでも検索可能にしたい場合、
「検索時に、両方のキーワードで検索する」案と、
「インデックス自体を、両方作っておく」案の、どちらが検索時間が短くすむのでしょうか?
(検証しろと言われれば、それまでなんですが)

私の事情的には、「大差はない」というのが理想ですが、
どうなんでしょうか?

ちなみに、使ってるのはLucene(2.3.2かな)で、すでに運用開始している状態です。


205 :login:Penguin:2009/12/23(水) 12:50:29 ID:hw50+bfV.net
常にひらがな/カタカナのどちらでも検索していいなら、
インデックス作るときに、どっちかにまとめてしまうな。
あとは、検索時に指定されたのを同じルールで処理してから検索。

データが小さくなるし、analyzerでこの処理をさせれば、
本文はそのままだから、取り出し可能にもできるし。

206 :login:Penguin:2009/12/23(水) 13:01:14 ID:hw50+bfV.net
あと、データ量と同時検索数次第な気がするけど、
両方のキーワードで検索した方が速いと思うよ。
インデックスを小さくしておいた方が速いと思う。

ひらがな/カタカナ混じりだったらどうするとか考えると、
統一しちゃう方が簡単だと思うんだよなー。

検索用フィールドをいくつか作るのはありかもね。
平仮名片仮名を無視する検索用はどちらかに統一して、
そうじゃない方はそのまま入れておく。

207 :login:Penguin:2009/12/24(木) 14:55:08 ID:pQ+PzKun.net
>>206
レスありがとうございます。

やはり「INDEXも検索も統一」というのが良さそうですね。

ただ、すでに運用してるシステムでして、
根本から作り直すことになると、コストやリソースの関係で、
お客様の希望する時期に出せそうになかったもので、
質問のような小手先の対応を考えていました。



208 :login:Penguin:2011/10/26(水) 09:08:10.23 ID:u1Edo4nm.net
dpkgとzeitgeistがXapianっていう全文検索ソフトを使っているけれどあれは何?
対応言語に日本語は入っていないみたい

209 :login:Penguin:2011/12/11(日) 16:26:21.87 ID:jX1ksO4u.net
「俺の全文検索」のソースをアップロードした。

http://www.ne.jp/asahi/sun/patagonia/fulltext/fulltext.html

うまく全文検索できないときには掲示板に書きこんでくれ。

210 :login:Penguin:2011/12/11(日) 16:52:48.77 ID:SGJMDI+x.net
postgresql 使ってるのか。
Hyper Estraier でいいと思うけどなあ。ずっと楽だし

211 :login:Penguin:2012/08/12(日) 05:00:25.96 ID:9d6phxtS.net
>>209
NOT FOUNDだよ

半年も前かぁ・・・(´・ω・`)

212 :login:Penguin:2012/12/14(金) 05:08:44.92 ID:/WE9Cz8v.net
Fessというソフトなんですけど、
検索されたファイルの名前に、スペースが含まれている場合に、
一覧から開くことができません。
対策ってありますでしょうか。

213 :login:Penguin:2012/12/14(金) 11:36:00.22 ID:ZBNKtAHu.net
>>212
FessのMLがあるからそっちで聞けば?

214 :login:Penguin:2013/01/12(土) 01:36:56.87 ID:17wiELXf.net
聞こう聞こうと思っているうちに、
どなたかがメーリングリストで質問してくださっていました。
今、その回答町です。

215 :login:Penguin:2013/01/27(日) 16:23:24.30 ID:Y1uylGbU.net
全裸変換ソフトって読んでしまった。
寝てくるノシ

216 :login:Penguin:2013/02/09(土) 12:29:36.38 ID:0CxhohCh.net
専用サーバソフトいらずで
単純なインタプリタcgiのみで動くやつないかね?
まあ要するにフリーのレンサバで動かしたい

217 :login:Penguin:2013/02/09(土) 12:38:10.29 ID:ihRM0VR4.net
>>216
namazu

218 :login:Penguin:2014/02/18(火) 01:12:04.63 ID:TuEYQrKl.net
全文検索サーバ: Fess 9.0.0 リリース

http://sourceforge.jp/projects/fess/news/24562

本当に、新機能の搭載待っていました。
ありがとう。ありがとう。

勝手に記念して、専用スレッドを作りました。

http://engawa.2ch.net/test/read.cgi/linux/1392653371/

219 :login:Penguin:2016/02/22(月) 11:39:34.04 ID:qmaloGTy.net
自分はセナがいいよとか言われてた時代までしか知らん
ナマズは定番とかね

220 :login:Penguin:2017/06/15(木) 00:18:19.61 ID:PnzM59LG.net
保守

221 :login:Penguin:2017/07/10(月) 04:10:38.96 ID:YwZ+60fd.net
Hyper Estraier

222 :login:Penguin:2017/07/10(月) 09:29:17.37 ID:1K3bAr2+.net
>>221
もうメンテされてない

223 :login:Penguin:2017/12/29(金) 14:39:05.17 ID:S/CsVkMC.net
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。

グーグル検索⇒『宮本のゴウリエセレレ』

78TOY3CJA0

224 :login:Penguin:2018/04/11(水) 15:23:21.47 ID:tpwD4HOs.net
78TOY3CJA0

225 :login:Penguin:2018/05/22(火) 10:39:06.88 ID:Czl6p0FW.net
僕の知り合いの知り合いができた副業情報ドットコム
関心がある人だけ見てください。
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

MT3J0

226 :login:Penguin:2018/09/10(月) 08:58:04.43 ID:TiViGl7e.net
ぶっちゃけどれも反応が早くない

227 :login:Penguin:2019/02/20(水) 08:46:09.74 ID:3PODLb22.net
今の定番ってあるの?

228 :login:Penguin:2019/02/21(木) 01:27:54.47 ID:DcWB1LI3.net
Elasticsearchとかsolr/luceneとかじゃないの

229 :login:Penguin:2019/02/21(木) 14:56:57.32 ID:K4vLfaHD.net
NASとかでも検索機能あったりするけど
目に見えてどれを使ってるって分かるのかな?
その中でのシェアとかあるの?

230 :login:Penguin:2020/02/11(火) 15:34:57 ID:vu/qvDyp.net
チエオクレのハゲの悲惨なツイッター
https://twitter.com/aphonedollar

  ↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑
この自称「ハゲ」とかいうチエオクレのブログが酷すぎる

>「DesktopHE」 はWindows10に対応してないらしい

はぁ??? ★★★大嘘デタラメ★★★を垂れ流すな!!!

■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■

チエオクレのこのハゲが、Javaの設定を失敗してるだけじゃねえか!!!
嘘デタラメ垂れ流しやがって、このハゲがやっていることは立派な公害じゃねえか!

hatenaとかでまで、必死こいて大嘘をばらまいているんだが  
(deleted an unsolicited ad)

231 :login:Penguin:2021/07/31(土) 00:46:25.71 ID:3Ihfr/Ax.net
今時はLuceneですかね
Twitterでも使われてるらしいし

232 :login:Penguin:2022/09/19(月) 23:42:14.58 ID:/7TP2U0im
(入れてはならない政党5大税金泥棒政策)
観光促進‥…温室効果カ゛スに騒音にコ囗ナにとまき散らすデシ゛タ儿音痴のハ゛カに支配された世界最悪の腐敗利権國家継続政策な
防衛費倍増…ウクライナ防衛費GDP比4%超に他國支援て゛2O%超、人類に湧いた害蟲公務員利権を拡大させるほど灰燼に帰す現実
金融緩和……資本家階級資産倍増、ひとりて゛資産1兆円超.末代まで揺らく゛ことのない圧倒的格差社会優越的地位濫用促進政策な
少子化対策…貧乏人に不幸な子を産み落とさせ,全国航空騷音まみれて゛勉強まで妨害して.地球破壞する害蟲増殖国力低下政策な
原發稼働…‥マッチポンプへリ飛ばしまくって,都心まて゛数珠つなぎで莫大な石油ひたすら無駄に燃やす技術後進国か゛笑わせよる
      全空港を火力発電所に転換して航空騒音によるシステム障害まみれのポンコツ腐敗後進国を脱却してからほさ゛きやか゛れ

創価学会員は、何百萬人も殺傷して損害を与えて私腹を肥やし続けて逮捕者まて゛出てる世界最悪の殺人腐敗組織公明党を
池田センセ一が□をきけて容認するとか本氣て゛思ってるとしたら侮辱にもほと゛か゛あるぞ!
https://i.imgur.com/hnli1ga.jpeg

総レス数 232
57 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★