2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

【Fess】5分で構築!全文検索サーバ【専用スレ】

1 :Fess:2014/02/18(火) 01:09:31.31 ID:TuEYQrKl.net
Fessは全文検索のJavaアプリケーションサーバです。
インストールから起動までが5分もかからずに検索サーバを構築することができます。
OS非依存でJavaの実行環境があれば利用可能です。

Seasar2 ベースで構築され、検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。
ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。

(旧ページ)http://fess.sourceforge.jp/ja/index.html
(新ページ)http://fess.codelibs.org/ja/


<最新バージョンダウンロード>
http://fess.codelibs.org/ja/downloads.html

なかったので作りました。
ユーザーさん!語らいの場所としませう。

2 :login:Penguin:2014/02/18(火) 07:10:42.92 ID:k9q+Q5uA.net
落ちないか心配なので2

3 :login:Penguin:2014/02/18(火) 14:58:03.56 ID:L4L0RMMT.net
elasticsearch と比較してどうなの?

4 :login:Penguin:2014/02/18(火) 17:20:15.70 ID:w9L1ruYh.net
w

5 :login:Penguin:2014/02/18(火) 19:34:02.48 ID:TuEYQrKl.net
>>3
日本語に対応。5分でできることか。

6 :login:Penguin:2014/02/18(火) 19:37:38.58 ID:tvLRNv1w.net
検索エンジンはJAVAなの?

7 :login:Penguin:2014/02/19(水) 20:02:09.81 ID:PXrp0UA1.net
>>6
つ >検索エンジン部分には 2 億ドキュメントもインデックス可能と言われる Solr を利用しています。

8 :login:Penguin:2014/02/19(水) 20:11:04.96 ID:wCfvPVsx.net
>>7
つまりJAVAなのか。
JAVAいれないとイカンのかー嫌だなあ

9 :login:Penguin:2014/02/19(水) 21:57:15.37 ID:E0ScXIs3.net
今から帰るのでその後軽く触ってみようと思ってるけど、Fessって solr のフロントエンドみたいなの?
それとも、それらも含めたパッケージってこと?

10 :login:Penguin:2014/02/19(水) 22:07:26.10 ID:E0ScXIs3.net
あ、勘違いしてた。
solr をdb として動くwebアプリケーションって感じか

elasticsearch と比較とかトンチンカンだったな。すまん

11 :login:Penguin:2014/02/20(木) 00:03:30.94 ID:ZidauIr6.net
>>8
サーバ用JREなら邪魔なプラグインとか入らないぞ
32bit用はないけどな

12 :login:Penguin:2014/02/20(木) 01:49:13.23 ID:qJ5W4xZq.net
>>8
JAVAなんて、centosのデスクトップ版だったら、最初から入っていたよ

13 :login:Penguin:2014/02/20(木) 01:51:16.57 ID:qJ5W4xZq.net
>>10
>ドキュメントクロールには S2Robot を利用することで、ウェブやファイルシステムに対するクロールが可能になり、
>MS Office 系のドキュメントや zip などの圧縮ファイルも検索対象とすることができます。

S2Robotがなんかよく知らないけど、このへんがすごそうでしょ
googleロボットのようなものだと理解している。

14 :login:Penguin:2014/02/21(金) 10:49:04.93 ID:4JjEExTM.net
JAVAって時点でイラネ

15 :login:Penguin:2014/02/21(金) 13:09:11.16 ID:kYL4Kz4u.net
シッタカほどそう言うね

16 :login:Penguin:2014/02/24(月) 06:04:17.02 ID:pF0tvCHx.net
age

17 :login:Penguin:2014/02/25(火) 02:22:54.32 ID:qqzTNRIm.net
>>14
javaが検索処理するわけではないようだよ
あくまでフロントエンドのWEBアプリがJAVAで書かれているってことじゃないの?
WEBアプリだったら、JAVA以外になにを使いたいっての?

18 :login:Penguin:2014/02/25(火) 08:53:43.40 ID:pylh68Lc.net
無知は黙ればいいと思うよ

19 :login:Penguin:2014/02/26(水) 07:57:45.29 ID:xfsdUR/1.net
Solrがエンジンて書いてあるからJavaベースだろ。

20 :login:Penguin:2014/02/26(水) 09:09:57.04 ID:4VNT7tqy.net
Solrは、JAVAで書かれているのか?

21 :login:Penguin:2014/02/26(水) 10:57:13.26 ID:/+fsmmiT.net
訊く前に自分で調べてみないヤツはいつまで経ってもアホのまま

22 :login:Penguin:2014/02/27(木) 08:16:51.28 ID:BtwaOiyQ.net
試しに使おうと思うんですが、空きメモリって512MBほどあれば十分でしょうか。

23 :login:Penguin:2014/03/08(土) 15:46:27.85 ID:zLZACqEZ.net
試してみればいいだろ

24 :login:Penguin:2014/05/24(土) 01:05:51.32 ID:OMaMNgDg.net
いいよこれ

25 :login:Penguin:2014/05/28(水) 03:51:04.45 ID:FnLmjL/R.net
質問いいでしょうか。

Fess 9.1.0を、CentOS 6.5 64bitにインストールして、
./startup.shを起動したのですが、ブラウザからlocalhost:8080/fessへアクセスできません。

jdkは、yum install java-1.7.0-openjdk* で入っています。

環境変数は、
# echo ${JAVA_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64
# echo ${JRE_HOME}
/usr/lib/jvm/java-1.7.0-openjdk-1.7.0.55.x86_64

となっています。

ip6tables iptablesは無効になっています。

結構いろいろ試行錯誤して、粘りましたが、お手上げです。
5分どころか、4時間もかかってもできません・・・疲れた。

26 :login:Penguin:2014/05/28(水) 03:51:49.11 ID:FnLmjL/R.net
質問↑
age させてください。

27 :login:Penguin:2014/07/14(月) 01:35:23.16 ID:ZbPu+eyy.net
>>25
こっちはFess9.2.0 serverをCentOS6.5 32bitに入れてみたが、ダメだな。Tomcatが動かん。
試しに、Fessに入ってるのと同じverのTomcat7.0.54を別に入れてみたらデフォルトでTomcatの起動だけはうまくいった。
だから26もTomcatに対するjdkのパスの通し方は問題ないと思うよ。

http://fess.sourceforge.jp/ja/4.0/config/install-on-tomcat.html
こんなページも見つけて試してみたけど、やっぱりTomcatがそもそも起動しなくなる。
fessとopenjdkの組み合わせがダメなのか、別な何かがダメなのかわからん。オレは趣味でやってみただけだから諦めたよ。

28 :27:2014/07/15(火) 15:27:12.46 ID:i/ir43DZz
動いた動いた。
./bin/setenv.shあたりの設定直したらいけた。
そのシェルの中に注意書きあった。

>>22
メモリ結構食って重い。512Mだと、たぶんモッサモサでスケジュール通りにクロールしないぞ。

29 :login:Penguin:2014/07/23(水) 02:34:41.76 ID:uh+cSX8+.net
Fess9.2.0をScientific Linux 6のマシンにインストールして使ってます
ジョブとクローラの関係について理解したいので、教えてください

現在は試験運用として、過去の古いファイルを置いてるファイルサーバをクロールさせて
インデックスを作っています
クロールには、差分クロールを有効にしても数時間かかること、また格納されてるファイルは
更新されないことから、「Crawler」ジョブを無効にしています
(ファイルシステムクロールとCrawlerジョブがどこで関連づけられてるのか分かってないのですが)

このマシンで、新たに最新のファイルを置いてるファイルサーバを、こちらは定期的に
クロールさせたいと思ってます

とりあえず、ファイルシステムクロールで2つめの設定を加えたのですが、ジョブで
・古いファイルはクロールさせない
・最新のファイルは週に一度クロールさせる
という設定をするためには、どういう設定を施せばよいのでしょうか

公式サイト等みてるのですが、どうにも糸口がつかめず

30 :login:Penguin:2014/11/10(月) 16:13:53.79 ID:ssEKguwc.net
Fess 9.3.0だけど、ファイルシステムクロールでzip(書庫)の展開を無効化するにはどうしたらええのん?

31 :login:Penguin:2014/11/10(月) 17:14:03.01 ID:MJiRF7py.net
通常ファイルにして書庫に入れない

32 :login:Penguin:2014/11/15(土) 11:48:48.11 ID:oZ6QSUo5.net
ファイルの中身を見ないでファイル名だけでインデックス作成したいんだけど、どうもできなさそうね。

33 :login:Penguin:2014/11/25(火) 02:04:47.97 ID:94ngxVaV.net
fess、人気が出てきたな。
メーリングリストからメールが結構回ってくる。

34 :login:Penguin:2015/01/05(月) 10:59:52.53 ID:y2Z3MYI8.net
age

35 :login:Penguin:2015/02/21(土) 12:17:11.83 ID:S9F0w3qg.net
CvsDataStoreの解説まだかなー

36 :ブロンチョ:2015/05/04(月) 00:38:44.00 ID:WBQqPO1n.net
メールディレクトリのメッセージをすべてsolrに登録して
imap searchコマンドでメール本文を全文検索させたいんご
検証環境つくるかな
dnsとsquidとwikiとbackupサーバとldapとftpとフロントエンドWebサーバのリプレイスの後に
ニヤリ

37 :login:Penguin:2015/06/23(火) 12:05:56.92 ID:ks5pbfUO.net
UniJISだかAdobe Japanだか言う文字コードのPDFが化け化けでクロールできない
仕様?

ttp://sourceforge.net/p/pdfbox/bugs/_discuss/thread/66f3c682/1353/attachment/UniJIS-UCS2-HW-H_sample.pdf

38 :login:Penguin:2017/06/16(金) 14:11:25.56 ID:SDXyAFC+.net
鉄板の検索エンジンってあるの?

39 :login:Penguin:2017/12/29(金) 16:19:52.29 ID:S/CsVkMC.net
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。

グーグル検索⇒『宮本のゴウリエセレレ』

9BJF3O5E8R

40 :login:Penguin:2018/05/22(火) 09:17:06.85 ID:Czl6p0FW.net
僕の知り合いの知り合いができた副業情報ドットコム
関心がある人だけ見てください。
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

G7BK2

41 :login:Penguin:2018/10/29(月) 00:04:51.21 ID:7tTWBMqX.net
ここは誰もいないのか

42 :login:Penguin:2018/10/29(月) 07:54:58.73 ID:v/2jA1j3.net
|・ω・*)チラ

43 :login:Penguin:2019/03/31(日) 14:25:15.46 ID:uyzTGgTF.net
ちんぽいらね

44 :login:Penguin:2019/04/06(土) 21:50:42.27 ID:D34QLrab.net
FESS使ってるよ

45 :login:Penguin:2019/04/29(月) 22:43:59.19 ID:epKJVUe2.net
Elasticsearchにものすごく時間かかる

46 :login:Penguin:2020/07/16(木) 15:53:20.12 ID:ZSfeRuR9.net
リバースプロキシ経由で、http://サーバIP/fess/に接続したらfessのトップの検索ページにアクセスできるようにしたいです

fessですが、HTML内にURIとして/js/とか/image/とかって書かれていて、
どうもそのままだとリバースプロキシに対応してないようなのですが、
リバースプロキシに対応させられるようにURLを変更するためには
どうすればよいよいのでしょう

47 :login:Penguin:2020/07/17(金) 11:11:22.85 ID:o2cjs4Y4.net
「リバースプロキシ 相対URL」でぐぐれ
多分/fess/imageとかにしたらけるかと

48 :login:Penguin:2020/07/17(金) 11:12:41.14 ID:o2cjs4Y4.net
いや違ったか
まあぐぐって見て

49 :login:Penguin:2021/12/11(土) 22:39:46.78 ID:KdSXAxOL.net
log4j地味に直撃

50 :login:Penguin:2023/06/27(火) 02:32:39.52 ID:FFNmut2F.net
Excelファイルとか検索してダウンロードするとファイル名が全て
「ダウンロード.xlsx」になってしまうんだけど
どこら辺を調べれば良いのでしょう?

11 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★