2007-01-01から1年間の記事一覧

Wikipedia日本語版 - 独自の研究 = ?

ウィキペディア日本語版では、 「独自研究は載せない」ことが、ついこの間までは「公式の方針」じゃなかったのね… Wikipedia:独自研究は載せない - Wikipedia どうやら「公式の方針」になったようです。 「卵かけご飯」の項目の記述内容が減ってしまうのか、…

Windowsのcmdでコードページを変更

以下のエントリを読んで、直接関係ないのですが備忘録を。 Perlでマルチバイトなファイル名を扱えないというFUD - Charsbar::Note Windowsのcmdでコードページを変えるコマンドは「CHCP」。 これ、ついこの間まで僕知りませんでした。 cmdで「HELP」とすると…

第3回 PostgresForest Suite ハンズオンセミナ 初級

第3回 PostgresForest Suite ハンズオンセミナ 初級 の参加者が少ないようです。 参加された方(yamazさん)のレビューもあります。 Postgres Forestのセミナに出席してきた - yamazのRails日記 - Rubyist かなり質の高いセミナを実施されているようです。しか…

Protothreadsで学ぶC言語

いまだにC言語をよく理解していない。 1文しかない関数を定義する場合でもブロックは必須なのね。 例えばこういうのはダメ、と。 void test_func(void) return; 上記の問題は、 epollのチェック関数を作っているときに気づきました。 しかし、Linux 2.4君よ…

Webサーバ書くのって流行りなの?

Memcachedの添え物として扱われている(ような気がする) libeventちゃんカワイソウ。 libevent というわけで、libeventとsennaを使って COOKIEによるセッション維持機能がついたWebサーバを書いてみた例。 (Sennaは単なるハッシュライブラリとして使ってい…

Python関連の日記はは別日記に移動します。

グニャラくんのグニャグニャPython備忘録 に移転します。Djangoの話はともかく、wxPythonの話なんかはドメインが違う気がするので分割。 本当にメモが多くなる予定。

MySQL用N-Gram全文検索プラグイン

「MySQL用N-Gram全文検索プラグイン」っていうのがあるのを知った。 http://mysqlbigram.googlepages.com/mysql%E7%94%A8n-gram%E5%85%A8%E6%96%87%E6%A4%9C%E7%B4%A2%E3%83%97%E3%83%A9%E3%82%B0%E3%82%A4%E3%83%B3Senna側から見たmysql-bigramとの違いはこ…

モリタポ通帳リニューアル&コッソリアンケート

モリタポ通帳とコッソリアンケートがリニューアルされました! モリタポ通帳 http://find.2ch.net/moritapo/ コッソリアンケート http://find.2ch.net/enq/ コッソリアンケートがじわじわと盛り上がりつつある予感…

ちょ、高すぎ。

lex & yaccプログラミングの邦訳版はオライリーのページを見る限り絶版のようだ。 Amazonだと\12,000-!!! ヤフオクでも\9,800-!!! たけーっすよたけーっすよ… 英語版でもいいけど、読み進めるのがすっごく遅くなるからなぁ… 誰か邦訳版が余っていたら適価で…

IDE(統合開発環境)についての昔話

とあるMLを読んでいて、昔話を思い出した。 あればたぶん2000年ごろ。僕がまだJavaを触っていた時代。 バイト先での作業のために、 JBuilderを買ってもらって使っていた。 まあそれなりの環境で、それなりに気に入っていた。 あるとき、協力会社の人たちが J…

Wikipedia検索で、発行したSQLと実行時間をユーザに見せる

Wikipedia検索であるが、 利用したSQLをHTMLでダンプする 多言語化(とりあえず英語/日本語のみ) の2つをやる必要が出てきた。 とりあえず、SQLをHTMLにダンプするのをやってみたよ。 利用したSQLをHTMLにダンプする perezvonの日記によると、 http://d.hate…

特筆すべき実績の無い会社。

特筆すべき実績の無い会社…悲しいですね…http://ja.wikipedia.org/wiki/Wikipedia:%E5%89%8A%E9%99%A4%E4%BE%9D%E9%A0%BC/%E6%9C%AA%E6%9D%A5%E6%A4%9C%E7%B4%A2%E3%83%96%E3%83%A9%E3%82%B8%E3%83%AB Google検索でも1件ヒット!http://www.google.com/searc…

Sennaで巡回@2007/04/16

巡回巡回。Macのports!! http://d.hatena.ne.jp/Voluntas/20070415/1176588156PHP bindings!! http://d.hatena.ne.jp/rsky/20070414/1176545853Ludiaではてブ先を検索!! http://d.hatena.ne.jp/uchiuchiyama/20070403/ludia_rails_demo

SennaとDjangoを使ったWikipedia検索のデモを公開してみた。

Djangoで書いた、Sennaを用いたWikipedia検索のデモを公開してみた。公開終了しました。 インデックスはN-gramで作ってみたよ。 http://wikipedia.suenaga.name/ にとりあえず置いてみた。動いているコード自体は、 http://svn.razil.jp/django-wikipedia/tr…

SennaによるN-gramインデックスで注意すべき挙動

追記:以下の文書について 現在リリースされているSenna 1.0.7では、 N-gramで1文字の日本語を検索する場合は 直接部分一致検索を動作させるようにしました。というわけで、以下で説明している挙動は今現在当てはまりません。 1文字の単語について uchiuchi…

MySQLのUDF(ユーザ定義関数)をDjangoから使う

動機 SennaのMySQLバインディングには、 UDFというMySQLのユーザ定義関数を使ってスニペットを返す関数があります。 スニペットとは、検索対象文書の一部を抜粋したものです。 通常はKWICと呼ばれる、検索キーワードとその周辺の文書を抽出したものを出力し…

Python Tシャツもらったよ!!!

PyCon 2007のおみやげのTシャツ http://omake.accense.com/wiki/PyCon2007/GiveAway ダーツで抽選された結果、 僕が当選しました!!! 高品質RADIUSサーバシリーズfullflexでおなじみの アクセンス・テクノロジー様からいただきました!!! Tシャツを着てみて、…

出た!出た出た!Tritonn(トリトン)

SennaのMySQLバインディングを高品質にする、Tritonnプロジェクトの成果物がリリースされました! http://qwik.jp/tritonn/ 僕が覚えている範囲だと、今までのMySQLバインディングとの差異は以下のとおりです。 alter table/create index/drop indexなどでイ…

acts_as_ludiaを使ってRails + Pg + Ludia + Sennaで全文検索

acts_as_ludiaという、RailsでLudiaが簡単に使えるプラグインが公開されています!! http://d.hatena.ne.jp/uchiuchiyama/20070318/ludia_rails_plugin スニペットが簡単に取得できるのが嬉しい。 Ludia + Railsユーザはぜひぜひご利用を。 [追記] act_as_l…

文字コードあれこれ

http://slashdot.jp/askslashdot/article.pl?sid=07/03/10/0845225 文字コード問題は下手に首を突っ込むとコワイ人(?)が続々と議論に参加してきて触れづらい話題です。 SennaでUTF-8を使う場合、以下のような問題があります。 nfkc正規化で時間がかかる(e…

Django勉強会 Disc 3

Django勉強会 Disc 3 http://www.djangoproject.jp/etude/3/ でお話させてもらってきた。 資料を以下のURLに置いておきます。嘘が混じってるかもしれないけど… http://qwik.jp/senna/publication.download/django-ja-disc3-senna.pdf 僕の発表内容を簡単にま…

Wikipediaの記事をPlainTextにしたい

Wikipediaの記事検索はデモに使えるので、 MediaWikiの記事をプレインテキストにしたい場合がよくある。 以下のページにパーサ一覧みたいなものがあるんだけど、 どれもHTML出力が多くて… http://meta.wikimedia.org/wiki/Alternative_parsers さらに、日本…

2chのSennaスレッドが伸びていると思ったら

2chのSennaスレッドがやけに伸びていると思ったら、 http://pc11.2ch.net/test/read.cgi/php/1118762053/ 荒れていた… dump→リビルド→データ流し込むの作業はいらない気がしますが、 まあ、ビルドはめんどくさいですよね…

SQLiteスレでのSennaの話題

http://pc11.2ch.net/test/read.cgi/db/1162621344/446 Sennaスレ http://pc8.2ch.net/test/read.cgi/php/1118762053/ に書き込むか迷ったけど、あっちはPHP板なのでここに書いてみる。 mecab の src/Makefile.msvc.in をそのまま使うと iconv-win32 が微妙…

PEAR::CodeGen_PECLでPHP拡張を書いてみよう(その1)

(この記事は随時更新していきます) SennaのPHPバインディングのページに、PHPバインディングを希望する声が続々! http://qwik.jp/senna/PHP_binding.html 実は、以前PHPバインディングを書いていたののの、 rm -rfですべてを消し去るというステキな行為をや…

PEAR::CodeGen_MySQL_UDF

ところで、PEARを漁っていると、PEAR::CodeGen_MySQL_UDFなるものも発見。 http://pear.php.net/package/CodeGen_MySQL_UDF MySQLのUDF(ユーザ定義関数)をXMLの定義ファイルから自動生成してくれるらしい。 外部ライブラリを利用したUDFが書きやすくなるんじ…

Senna 1.0.0リリース!!!

Sennaの1.0.0がリリースされました!!! 本当は金曜日にリリースしたんだけど、 MLのあて先を間違えていて…リリースメールが届いていなかったという… 恥ずかしい。 結局、スラドにだけリリースが伝わった形になってしまいました。 インデックス形式が変わっ…

やるぞ!Sennaカンファレンス

前々からやりたいと思っていたSennaカンファレンスですが、 id:yappoさんがこんなページを作ってくれたよ! http://soozy.org/index.cgi?SennaConference1 というわけで、参加希望者はじゃんじゃん登録してください! 会場もプログラムも何も決まってないけ…

全文検索勉強会開きたい!

http://d.hatena.ne.jp/Voluntas/20070219/1171885382 全文検索勉強会! 全文検索勉強会! Hyper Estraierの平林さんとも 「勉強会やりましょう!!」と言ったっきりなんですが、 全文検索勉強会をやったらどのくらい人が集まるんでしょうか。 そして!!! Sen…

ぐんまの子どものための50のルール

ぐんまの子どものための50のルール http://www.pref.gunma.jp/kyoi/01/rule/rule1.html個人的には24,42,47がツボ。