2005-11-09 昨日のお祭りを振り返って 技術メモ 全文検索 というわけで、 昨日は一人全文検索祭り(Perlで簡単に使えてN-gramイケるやつ)をしていたわけですが、 大規模な文書をインデックスするにはSennaかHyper Estraierしか実用的じゃない印象。 Lucene系は、 Javaで本家Luceneを使う場合を除くと余計な心配事が多すぎる。転置インデックス用のデータストレージエンジンを自分で書かないと スケーラビリティーは確保できない、ということかしらね。属性でのソート、属性での絞込みを高速にしたい用途は多いと思うので、 Senna on MySQLのFULLTEXT+別のindexパッチの登場を改めて大期待。