昨日のお祭りを振り返って

というわけで、
昨日は一人全文検索祭り(Perlで簡単に使えてN-gramイケるやつ)をしていたわけですが、
大規模な文書をインデックスするにはSennaHyper Estraierしか実用的じゃない印象。
Lucene系は、
Javaで本家Luceneを使う場合を除くと余計な心配事が多すぎる。

転置インデックス用のデータストレージエンジンを自分で書かないと
スケーラビリティーは確保できない、ということかしらね。

属性でのソート、属性での絞込みを高速にしたい用途は多いと思うので、
Senna on MySQLのFULLTEXT+別のindexパッチの登場を改めて大期待。