2006-01-01から1年間の記事一覧

Senna 0.9.0リリース

わーいわーいリリースリリース!

SPARC用コードを書く…

Ludiaのメーリングリストで、以下のような要望が出ていた。 http://lists.sourceforge.jp/mailman/archives/ludia-users/2006-December/000011.html SPARCかあ。 昔調べた結果が使えるぞウヒヒ… 一応、Monoでの実装を見てみる。 static inline gint32 Interlock…

Binary 2.0 カンファレンスにいってきた

Binary 2.0 カンファレンスにいってきた。 どの話も面白かったよ。 Sennaはlock-freeなRCU(Read-Copy-Update)を使っていますよ! Sennaはlock-freeなRCU(Read-Copy-Update)を使っていますよ! Sennaはlock-freeなRCU(Read-Copy-Update)を使っていますよ! と…

JiroSearchという検索エンジンがあるようだ。

JiroSearch http://www.crm.co.jp/jirosearch/ Luceneベース。基本N-Gram。 タグ検索機能がついているらしい。 タグ検索かあ。 検索エンジンは世の中にかなりの数が出ていると思う。 そのうち多くは、転置インデックスをインデックスのデータ構造として採用…

MySQL or PostgreSQL + Sennaのオススメ構成

Sennaの主な利用用途であると考えられる、 データベース組み込み用途。 ブラジル内部でもSennaを用いたサービスを運用していますが、 その運用ノウハウの一部をメモ。

プラズマディスプレイ、安くなったなあ。

ううう…コレ欲しい… asin:B000F3AKHA:title しかし、citi cardで日曜日決済だと5%オフなんだよなあ… 悩むぜ。

ARMのインストラクションセットいいねえ。

ARMのatomic_addについて調べた。 ARMはswp命令を備えているので、 load->add->swp->cmp でいけるね。 昔、ポケットステーション用のプログラムを触っていたときにちょっと調べたけれども、 もともと6502や65816を触っていたこともあり? かなり好きなインス…

パイプが詰まった場合に、ぜひ呼んでもらいたい会社があります

こだわりのある人や会社が好きだ。 今住んでいるマンションの浴室は、 以前からちょくちょく詰まっていた。 詰まるたびに、 ラバーキャップ(キュポキュポ)やワイヤーで なんとか流れるようにして、ごまかしてきたのだ。 しかしついに、 詰まりがひどいあま…

Sennaによる部分一致検索の挙動について

Sennaの部分一致検索時の挙動について、 ACM SIGMOD日本支部大会で質問が出ました。 傀儡師の館 - 組み込み型全文検索エンジン Senna を使ってみる http://plaza.rakuten.co.jp/kugutsushi/diary/200611120002/ のエントリでも、部分一致検索の挙動について…

どーせどーせ、興味持たれないですよ!ブツブツブツブツ

ブックマーク件数が無限大倍。すすり泣く。 http://b.hatena.ne.jp/entry/http://qdbm.sourceforge.net/mikio/he-sigmodj.pdf http://b.hatena.ne.jp/entry/http://qwik.jp/senna/publication.download/senna-sigmod.pdf [追記] Yappoさんのおかげで無限大じ…

IPA(いぱ)サーチ

IPA(いぱ)サーチというものの公募。 知らんかった。 http://www.ipa.go.jp/software/ipasearch/kobo2006/ イパネマの娘。

MeCab 0.93で数を表す名詞が長く判断されてしまう

MeCabの0.81だと解析OKだが、0.93だと解析に失敗するケース 四条口大道檮原本村川科学技術振興事業団潮美横間黒竜江蚕食 一芸太秦門田小中川少年画報社東大輪内保湾 一番柳岳駒崎茂松禅寺宥恕笊田愛宕山金膺顯 九条大国髱大水無瀬島柴又三根川芥見堀田槻木南…

講演のあと…

某社の社長、カワイイ系だった。 でもちゃんと帰れたのかしら?

講演してきたりした。

資料はこちら。 http://qwik.jp/senna/publication.download/senna-sigmod.pdf アガって失敗した。トホホ… 補足すると、 現在のMeCab 0.93+IPADIC 2.7.0では、 「東京都」は「東京/都」に分かち書きされるので、 Sennaの部分一致検索でも検索漏れを救えない…

いまさらsvk

いまさらsvkを使ってみようと思って、 適当にaptitudeでインストール。 svk mirror & syncして、 さっそく試しに作業中のものをコミットじゃー!!! とコミットしてみたら、 本番に反映されるのね。。。 青ざめた。あせった。 というわけで、今から必死に戻…

failmallocのようなもの

Sennaでmallocに失敗した場合に、 落ちてしまうパスがいくつかあるようだ。 Failmallocで検査しようと思ったら、 そもそもMeCabの段階で落ちてしまう。 failmalloc (相当) のおもいで - Backnumbers: Steps to Phantasienでは、 "特定の関数の中でだけ"エラ…

広がる広がるSennaの世界

わーいわーい! Sennaの利用が広がってうれしい今日この頃ですよ。 全文検索ライブラリSennaのPythonバインディング with SWIG http://www.void.in/wiki/SWIG-senna SennaのRubyバインディング 非公式ドキュメント http://mono.kmc.gr.jp/~yhara/w/?RubySenn…

IBMのFLASH広告が面白い

ずっと前から遊んでいたのだが、 IBMのFLASH広告いいよねえ。 コレがお気に入り。 http://m1.jp.2mdn.net/1168541/IBM_SWG_tbc2_rational_300x300_50k_mugen_0925_opentech_rectangle.swf Rationalといえば、Purifyが欲しい。

DBMSデフォルト組み込みの全文検索

PostgreSQL 8.2からGINというインデックス形式が追加され、 それを用いれば全文検索インデックスが実現できます。 分かち書きを別途行う必要はありますが。 http://itpro.nikkeibp.co.jp/article/COLUMN/20060912/247864/?ST=lin-server&P=3 MySQLのデフォル…

Ludiaの開発ブログができてるみたい

Ludia(TM) のいろいろ http://www.doblog.com/weblog/myblog/74336/ さて、Ludia は商用DBMS並みに早い、といってます。これは、マシンでの検証によるものです。平均4〜5kのテキストカラムを持つテーブルにLudiaを適用する評価を行いました。テーブルは、お…

AzaraCいいね

Sedueのプリファードインフラストラクチャーから出たAzaraC。 http://labs.preferred.jp/azarac/ 昔C++だけで2ch風掲示板のスクリプトを書いたことがあったけど、 こういうライブラリで、しかもBSDライセンスのものがなくて 結局1から書いたのを思い出した…

Ludiaはアナxネタ

職場で見る人は注意ね。 http://analtimes.blog18.fc2.com/blog-entry-1165.html アナxが好きな方を対象にアナxネタを発信します。 とあるが、アナxは形容詞なので、 アヌxが好きな方を対象にアナxネタを発信します。 ではないか、と思ったりする昼下がり…

MySQL/PgだけでなくRailsでもSQLiteでもSenna

LudiaでPostgres上での利用の幅が広がったSennaですが、 Senna関係で他にも面白いことをやっている人がいるんです!!! SQLiteでSenna! http://www.dodgson.org/omo/t/?date=20061001 RailsでSenna! http://blog.masuidrive.jp/articles/2006/10/03/mysql-full…

Ludiaリリースおめでとう。

Sennaを使ったPostgreSQL用全文検索エンジンLudiaがリリースされたよ! http://www.nttdata.co.jp/release/2006/101100.html http://www.nttdata.co.jp/services/ludia/index.html

LANケーブルはカテゴリ6eで

LANケーブルを買うときはカテゴリ6eのものを買うようにしている。 サンワサプライのKB-T6Eシリーズをよく買っている。 ラインナップは0.5m,1m,2m,3m,5m,7m,10mの白・黒・水色。 サンワサプライ エンハンスドカテゴリ6LANケーブル0.5m KB-T6E-005BK サンワサ…

LINXのLinux版のオープンソース公開マダー!?

LINXは、イントラノードIPCで、遅延を25%低減、スループットを20%向上、インターノードIPCで、遅延を10%低減、スループットを25%向上させています。(数値はいずれも平均値) というIPC(プロセス間通信)サービスであるLINX君。 ヘテロジーニアスな環境・…

メールの開封確認をつけてしまっていた。。

Becky!からThunderbirdに乗り換えよう計画中だったのですが、 (IMAPでの速度が速いから!) Thunderbirdで全てのメールに開封確認をつけるチェックがついていてしまった。。。 澤君はShuriken Proがいいと言っていたなあ。メーラー。

Sedueのサイトに、各種全文検索システムの速度比較が載ってるよ!

Sedueっていう検索システム。 圧縮Suffix Arrayらしい。 http://preferred.jp/sedue/benchmark.htm 圧縮Suffix Arrayについては、 開発メンバーにも入っている岡野原さんがいろんなところで書いているので 参考になります。 上記サイトでの性能比較について…

MySQLのSpatial Data TypesとSenna全文検索の併用

MySQLのSpatial Extensions http://dev.mysql.com/doc/refman/5.0/en/spatial-extensions.html を使って、 以下のブログで実現していることをMySQL + Sennaで実現できるのかな? http://lucene.jugem.jp/?eid=92

Development Environment Conference

お尻が蒸れてかゆい。 vim使い少ないのね。。