fess で自分だけの検索エンジン
FESSを使って、自分・自社内部のコンテツをクローリングして、検索インデックスを作って検索できる。
ちょっとやってみることにする。
fess docker を動かす設定
公式サイトにDocker Compose用のファイルが配布されているので、それを使うことにする。
https://fess.codelibs.org/ja/setup.html
docker compose -f compose.yaml -f compose-elasticsearch8.yaml up -d
docker で起動する設定。をあれこれやって、Elasticsearchを動かす。
Elasticsearchに入る。
docker exec -it $(docker ps -q --filter name=es01 ) bash
設定を触る。
vi ./config/elasticsearch.yml
cluster.name: "docker-cluster" network.host: 0.0.0.0 configsync.config_path: ${FESS_DICTIONARY_PATH} ## 以下を追加 transport.host: localhost transport.port: 9300 http.port: 9200
理由はよくわからない。が、上記を書くと動く。
参考したのは、次の記事→ https://qiita.com/teru855/items/1be13721ddf38231c37d
サクッとやるか、強引にインスタンスを起動しておかないと、 vi して編集するまでに、docker compose がインスタンス起動に失敗して再起動なり、編集中をダウンさせちゃうので注意。
言語設定
タイムゾーンと言語があれなので直したい。
docker exec -it fess01 bash
apt update apt install language-pack-ja update-locale LANG=ja_JP.UTF-8
locale-gen --purge "ja_JP.UTF-8" dpkg-reconfigure --frontend noninteractive locales
タイムゾーンは compose.yml に環境変数を追加したほうが早い
手作業で指定する場合
dpkg-reconfigure tzdata
これ、docker compose の記述の問題で永続化しない。
管理画面の言語設定はできない
管理画面の言語設定ができないので、ブラウザの言語設定を変える。
めんどくさいなぁ
FESS微妙だった
Fess以外に良いソフトがないので、これを使うしか無いのだろうが。
正直言って、使いやすいとは言えないソフトウェアだった。
クローリング設定が面倒
https://note.com/hitoshiarakawa/n/n1c8c32005010
(1)「Fess の管理画面>ウェブクロール設定>クロール対象とする URL 」 検索対象に入れたいページは、そのリンク元ページを「クロール対象とする URL」に書かなければいけないということだ。
(3)ディレクトリ名に半角スペースが含まれる場合、インデックスが作成されなかった。
robots.txt を無視できない
WEB-UIからの設定で、robots.txtを無視できるようだけど、うまく動作しない?
設定パラメータを入れても動かない。信用できない。
docker コンテナ内部に入って直接書き換える。
docker exec -it $(docker ps -a -q --filter name=fess01 ) bash vim /etc/fess/fess_config.properties ## 200行目から 217 crawler.ignore.robots.txt=true 218 crawler.ignore.robots.tags=true
このあたりをサクッと変えられない.こんなDockerfile を書かないでほしい。
https://linuxer2006.blog.jp/archives/65949570.html
elastic 重いし、Javaもヘビィ
CPU使い倒すのでヘビィすぎる。電気代怖い。
WEB認証めんどくさい
動いたやつ
いろいろ試したけど、WEBフォームによるCookie認証ですら手間だった。
動くようになったけど、どこが良くて動いてるのか、正直言ってよくからない。
fess 重いなぁ
Javaの宿命だろうか、めちゃくちゃ遅い。
CPUパワーとメモリが必要なのはとても困る。Raspi4のArmで試した結果が遅い。とにかく遅い。
x86でやれば、「電気代がかかる」と思います。とても。富豪向きですね。