PostgreSQL で全文検索 ( Rast ) [RDBMS]
長崎県のやつは、MySQL に入っているデータを HTML に変換して namazu で検索させるというものみたいだけど、PostgreSQL を使って全文検索エンジンで検索するようなのがあったような・・・発見しました。
http://blog.postgresql.jp/28
http://ml.postgresql.jp/pipermail/pgsql-jp/2005-August/019364.html
検索エンジンは Rast http://www.netlab.jp/rast/ ってやつらしいです。
Python バインディングが欲しいです。
いざ使うとなると、N-gram というのを使えば、辞書のメンテナンスは必要なさそうだけど、
>推奨ソフトウェア(文書ファイルからのテキスト抽出機能を利用する場合)
を設定するのが大変そうなのは namazu と同じ。テキストしか扱わないなら問題ないけど。
コメント 0