Senna

ThinkIT 「徹底比較!検索エンジン」についてツッコミ

Sennaの場合には、文書数を166,512より多くしようとすると、メモリ確保の失敗が原因のsen_memory_exhaustedというエラーが発生し、インデックスに文書を追加できなくなりました。 http://thinkit.jp/article/744/1/ しっかりと反応しておきます。 対象文書サ…

SennaでWAVE DASH(〜)とFULLWIDTH TILDE(〜)を同一視する

Sennaでは、UTF-8の文字列を正規化しています。 たとえば、「?」は「ミリバール」に、「AbRACADAbra」は「abracadabra」に、「ハラヘッタZO」は「ハラヘッタZO」に変換されます。 これで、文字のゆれに対応した検索ができるわけです。 さて、某サービスでWAVE D…

グッドデザイン賞を受賞しました。

未来検索ブラジルが検索エンジン開発において(!)グッドデザイン賞を受賞したようです。 http://www.g-mark.org/search/Detail?id=34960&sheet=outline&lang=ja みんなも、オープンソース開発をしてグッドデザイン賞をもらおう! あ、あとブラジルはIT技術者…

Senna 2.0の展望と、Tritonnで問題が発生している人向け情報

Senna 2.0βのリリースが見えてきました。 去年の夏に出すと言っていましたが、紆余曲折あっての現状です。 ライバルのTokyo Cabinet/Tokyo Dystopiaについては、 ストレージと全文検索インデックスを分割する方向性です。 mixi engineer blog 今までのSenna…

SennaのTracが公開されております。

そういえば(安定剤)、lighttpのTracサイトで思い出しましたが、 SennaのTracが稼動し始めました。 まだ情報が少ないですが、Ticketを切って開発を進めていこうと思っています。 宜しくお願いいたします。 SennaのTrac ちなみに、 以前から公開しているニコ…

検索エンジンの歴史的意義と未来

弊社森(オラの上司)が大阪市立大学で発表をしてきました。 発表資料は以下からどぞー。 検索エンジンの歴史的意義と未来 発表の前半は、コミュニケーション技術の歴史を踏まえ、 多対1のコミュニケーション技術として検索エンジンを捉える試みです。 発表…

ツッコめ!全文検索エンジンSennaの新しいAPIについての素案。

みんな、[Senna-dev 884]のメールは読んだかな!? 全文検索エンジンSennaの新しいAPIについての素案がついに公開されました。 今までのAPIのほとんどを刷新するという 大改造!劇的ビフォーアフター的API群です(APIの匠)。 んで、この新しいAPI群で何が…

Ludiaパフォーマンス・チューニング・セミナをやるらしい

Ludiaパフォーマンス・チューニング・セミナというセミナをやるそうです。 http://lists.sourceforge.jp/mailman/archives/ludia-users/2008-March/000205.html http://d.hatena.ne.jp/ludia/20080326 さて、演習問題サンプルを解けるでしょうか!?

Ludia 1.5.0ワクテカ

PostgreSQL 8.3対応のLudia 1.5.0が今月中に出る(ことを目標にしている)ようです。 Ludia 1.5.0 ドキドキ。

MySQL + Sennaで実現する全文検索とMySQL Enterprise Monitor 日本語版プレビュー

住商情報システム主催で、MySQL+Sennaの紹介を含んだセミナーが開催されるそうです。 MySQL + Sennaで実現する全文検索とMySQL Enterprise Monitor 日本語版プレビュー 興味のある方は是非是非ご参加くださーい。

最もタメになる「初心者用言語」はSennaQL!

地味に反響のないSenna 1.1.0ですが、 SennaQLという新しい問い合わせ言語が搭載されています。 我々の調査の結果、 なんとSennaQLは以下のページで挙げられている Schemeの特徴を全て満たしていることが判明しましたっ!!! 最もタメになる「初心者用言語…

Senna 1.1.0リリース

Senna 1.1.0をリリースしました!(GREEで) 落ちるバグとか治っているので是非入れ替えを…

Google Suggestのようなものを高速に実現するサーバsuggested

Google Suggestのようなものを高速に実現するサーバsuggestedというものを書いてみた。 が、しばらく放置していた。とりあえず公開してみる。 特徴 epollやkqueueを使っていてネットワーク部分が速い Sennaを使っていてSuggest部分が速い Sennaを使って正規…

Sennaではてなキーワード自動リンクを実装する

[注意]このエントリはPHPとMecabでキーワード自動リンクを実装するのパクリです。 こんにちは、末永です。 今年もどうぞよろしくお願い致します。Webサービスを開発していると、特定のキーワードを自動でURLリンクにする処理が必要になることがあると思いま…

TritonnとLudiaの記事を書きました。

Tritonn/Ludiaの導入と、実用上気をつけることを記事にまとめてみました。 MySQL/PostgreSQL+Sennaで行うラクラク全文検索……Tritonn&Ludia導入のポイント|gihyo.jp … 技術評論社 なんか間違ったこと言ってたらごめんなさい…>Tritonn/Ludiaの方々 そうい…

WEB+DB PRESS Vol.42にSennaの記事が掲載されます。

WEB+DB PRESS Vol.42にSennaの記事を書きました。 WEB+DB PRESS Vol.42|技術評論社 今回の記事は、TritonnやLudiaのような他のDBMSを利用するのではなく、 SennaQLという独自のクエリ言語をPHP経由で利用する場合の サンプルコードが載っています。 という…

第5回?密教文献情報処理研究会というのがあるそうです

密教文献(TEI文書として)と全文検索。 http://www.koyasan-u.net/131/etp 最近,SennaやHyperEstraierなど多くの新しい全文検索エンジンが登場しています。それらはMecabによる分かち書きやN-Gramなどをサポートする最新のシステムですが,はたして,送りが…

システム制御情報学会セミナー2007の発表資料

システム制御情報学会セミナー2007にて、 「鮮度と精度を重視した全文検索エンジンSenna」という題で発表させていただきました。 発表の際にプロジェクターに映した資料について、 システム制御情報学会のご厚意により公開の許可を得られましたので、 公開さ…

大阪の講演に呼ばれた。

「システム制御情報学会セミナー2007」というセミナーで、 「鮮度と精度を重視した全文検索エンジンSenna」 という題で講演することになりました。 http://www.iscie.or.jp/seminar.html この文章を書いているだけで手に汗をぶわっってかくほどの緊張ですよ…

Django勉強会 Disc 4での資料を公開します

Django勉強会 Disc 4で発表させていただいた資料を公開します。 今回は構成とかグダグダ&Djangoの話が少なくてすみませんすみません… DjangoでSenna 2.0!(PDF注意) Senna 2.0を用いたWikipedia検索はリポジトリに公開しています。 Senna2.0でのWikipedia検…

Senna 2.0がやってくる!

Sennaの公式ページに、Senna 2.0についての解説文書が登場しました。 http://qwik.jp/senna/senna2.html 実は数日前から登場していたのですが、 随時加筆中でした。 そろそろ内容が固まってきたので、ここでも告知します。 とはいえ、まだまだ文法が変わった…

Ludia 1.2.0リリースとPostgresForest Suite ハンズオンセミナの宣伝

Ludiaの1.2.0がリリースされたようです。ぱちぱち。んで、Ludiaを含んでいるPostgresForest Suiteのセミナーをやるそうです。 第4回 PostgresForest Suite ハンズオンセミナ - Ludia開発日記 ぜひぜひ参加お願いいたします。

Ohlohにプロジェクト登録をしてみた。

ドジっ娘のハッカーから、 Ohlohなるサイトを教えていただいた。 Open Hub, the open source network 早速Sennaも登録してみたが、 リポジトリのクロールの途中のようだ。 The Senna Open Source Project on Open Hub Sennaは、1.1リリースに向けて大きな変…

Software DesignでMySQL + Sennaが取り上げられているようです。

Software Design のエントリによると、Software Designの2007/07号でMySQL + Sennaが紹介されているようだ。チェックしよっと。Software Design (ソフトウエア デザイン) 2007年 07月号 [雑誌]出版社/メーカー: 技術評論社発売日: 2007/06/18メディア: 雑誌…

Ludia 1.1.0リリース

Ludiaの1.1.0がリリースされていました。 変更点を勝手にコピペするとこんな感じ。 (1) VACUUM対応 concurrent VACUUM, FULL VACUUM両方に対応しました。 Auto VACUUMも使用可です。 (2) senna.confの使用廃止 senna.confで設定していたINITIAL_N_SEGMENTSは…

住商情報システム、日本語全文検索に対応した「MySQL」の技術サポートを開始

日本語全文検索を高速に処理できるMySQLの技術サポートが始まったようです。 MySQL

代取と創業者のインタビューが掲載されたようです。

未来検索ブラジルの代取と創業者へのインタビュー記事が CNET Venture Viewに掲載されたようです。 CNET Japan みなさんも半ズボンには気をつけてください。

第3回 PostgresForest Suite ハンズオンセミナ 初級

第3回 PostgresForest Suite ハンズオンセミナ 初級 の参加者が少ないようです。 参加された方(yamazさん)のレビューもあります。 Postgres Forestのセミナに出席してきた - yamazのRails日記 - Rubyist かなり質の高いセミナを実施されているようです。しか…

Wikipedia検索で、発行したSQLと実行時間をユーザに見せる

Wikipedia検索であるが、 利用したSQLをHTMLでダンプする 多言語化(とりあえず英語/日本語のみ) の2つをやる必要が出てきた。 とりあえず、SQLをHTMLにダンプするのをやってみたよ。 利用したSQLをHTMLにダンプする perezvonの日記によると、 http://d.hate…

Sennaで巡回@2007/04/16

巡回巡回。Macのports!! http://d.hatena.ne.jp/Voluntas/20070415/1176588156PHP bindings!! http://d.hatena.ne.jp/rsky/20070414/1176545853Ludiaではてブ先を検索!! http://d.hatena.ne.jp/uchiuchiyama/20070403/ludia_rails_demo