2007-01-01から1年間の記事一覧
ウィキペディア日本語版では、 「独自研究は載せない」ことが、ついこの間までは「公式の方針」じゃなかったのね… Wikipedia:独自研究は載せない - Wikipedia どうやら「公式の方針」になったようです。 「卵かけご飯」の項目の記述内容が減ってしまうのか、…
以下のエントリを読んで、直接関係ないのですが備忘録を。 Perlでマルチバイトなファイル名を扱えないというFUD - Charsbar::Note Windowsのcmdでコードページを変えるコマンドは「CHCP」。 これ、ついこの間まで僕知りませんでした。 cmdで「HELP」とすると…
第3回 PostgresForest Suite ハンズオンセミナ 初級 の参加者が少ないようです。 参加された方(yamazさん)のレビューもあります。 Postgres Forestのセミナに出席してきた - yamazのRails日記 - Rubyist かなり質の高いセミナを実施されているようです。しか…
いまだにC言語をよく理解していない。 1文しかない関数を定義する場合でもブロックは必須なのね。 例えばこういうのはダメ、と。 void test_func(void) return; 上記の問題は、 epollのチェック関数を作っているときに気づきました。 しかし、Linux 2.4君よ…
Memcachedの添え物として扱われている(ような気がする) libeventちゃんカワイソウ。 libevent というわけで、libeventとsennaを使って COOKIEによるセッション維持機能がついたWebサーバを書いてみた例。 (Sennaは単なるハッシュライブラリとして使ってい…
グニャラくんのグニャグニャPython備忘録 に移転します。Djangoの話はともかく、wxPythonの話なんかはドメインが違う気がするので分割。 本当にメモが多くなる予定。
「MySQL用N-Gram全文検索プラグイン」っていうのがあるのを知った。 http://mysqlbigram.googlepages.com/mysql%E7%94%A8n-gram%E5%85%A8%E6%96%87%E6%A4%9C%E7%B4%A2%E3%83%97%E3%83%A9%E3%82%B0%E3%82%A4%E3%83%B3Senna側から見たmysql-bigramとの違いはこ…
モリタポ通帳とコッソリアンケートがリニューアルされました! モリタポ通帳 http://find.2ch.net/moritapo/ コッソリアンケート http://find.2ch.net/enq/ コッソリアンケートがじわじわと盛り上がりつつある予感…
lex & yaccプログラミングの邦訳版はオライリーのページを見る限り絶版のようだ。 Amazonだと\12,000-!!! ヤフオクでも\9,800-!!! たけーっすよたけーっすよ… 英語版でもいいけど、読み進めるのがすっごく遅くなるからなぁ… 誰か邦訳版が余っていたら適価で…
とあるMLを読んでいて、昔話を思い出した。 あればたぶん2000年ごろ。僕がまだJavaを触っていた時代。 バイト先での作業のために、 JBuilderを買ってもらって使っていた。 まあそれなりの環境で、それなりに気に入っていた。 あるとき、協力会社の人たちが J…
Wikipedia検索であるが、 利用したSQLをHTMLでダンプする 多言語化(とりあえず英語/日本語のみ) の2つをやる必要が出てきた。 とりあえず、SQLをHTMLにダンプするのをやってみたよ。 利用したSQLをHTMLにダンプする perezvonの日記によると、 http://d.hate…
特筆すべき実績の無い会社…悲しいですね…http://ja.wikipedia.org/wiki/Wikipedia:%E5%89%8A%E9%99%A4%E4%BE%9D%E9%A0%BC/%E6%9C%AA%E6%9D%A5%E6%A4%9C%E7%B4%A2%E3%83%96%E3%83%A9%E3%82%B8%E3%83%AB Google検索でも1件ヒット!http://www.google.com/searc…
巡回巡回。Macのports!! http://d.hatena.ne.jp/Voluntas/20070415/1176588156PHP bindings!! http://d.hatena.ne.jp/rsky/20070414/1176545853Ludiaではてブ先を検索!! http://d.hatena.ne.jp/uchiuchiyama/20070403/ludia_rails_demo
Djangoで書いた、Sennaを用いたWikipedia検索のデモを公開してみた。公開終了しました。 インデックスはN-gramで作ってみたよ。 http://wikipedia.suenaga.name/ にとりあえず置いてみた。動いているコード自体は、 http://svn.razil.jp/django-wikipedia/tr…
追記:以下の文書について 現在リリースされているSenna 1.0.7では、 N-gramで1文字の日本語を検索する場合は 直接部分一致検索を動作させるようにしました。というわけで、以下で説明している挙動は今現在当てはまりません。 1文字の単語について uchiuchi…
動機 SennaのMySQLバインディングには、 UDFというMySQLのユーザ定義関数を使ってスニペットを返す関数があります。 スニペットとは、検索対象文書の一部を抜粋したものです。 通常はKWICと呼ばれる、検索キーワードとその周辺の文書を抽出したものを出力し…
PyCon 2007のおみやげのTシャツ http://omake.accense.com/wiki/PyCon2007/GiveAway ダーツで抽選された結果、 僕が当選しました!!! 高品質RADIUSサーバシリーズfullflexでおなじみの アクセンス・テクノロジー様からいただきました!!! Tシャツを着てみて、…
SennaのMySQLバインディングを高品質にする、Tritonnプロジェクトの成果物がリリースされました! http://qwik.jp/tritonn/ 僕が覚えている範囲だと、今までのMySQLバインディングとの差異は以下のとおりです。 alter table/create index/drop indexなどでイ…
acts_as_ludiaという、RailsでLudiaが簡単に使えるプラグインが公開されています!! http://d.hatena.ne.jp/uchiuchiyama/20070318/ludia_rails_plugin スニペットが簡単に取得できるのが嬉しい。 Ludia + Railsユーザはぜひぜひご利用を。 [追記] act_as_l…
http://slashdot.jp/askslashdot/article.pl?sid=07/03/10/0845225 文字コード問題は下手に首を突っ込むとコワイ人(?)が続々と議論に参加してきて触れづらい話題です。 SennaでUTF-8を使う場合、以下のような問題があります。 nfkc正規化で時間がかかる(e…
Django勉強会 Disc 3 http://www.djangoproject.jp/etude/3/ でお話させてもらってきた。 資料を以下のURLに置いておきます。嘘が混じってるかもしれないけど… http://qwik.jp/senna/publication.download/django-ja-disc3-senna.pdf 僕の発表内容を簡単にま…
Wikipediaの記事検索はデモに使えるので、 MediaWikiの記事をプレインテキストにしたい場合がよくある。 以下のページにパーサ一覧みたいなものがあるんだけど、 どれもHTML出力が多くて… http://meta.wikimedia.org/wiki/Alternative_parsers さらに、日本…
2chのSennaスレッドがやけに伸びていると思ったら、 http://pc11.2ch.net/test/read.cgi/php/1118762053/ 荒れていた… dump→リビルド→データ流し込むの作業はいらない気がしますが、 まあ、ビルドはめんどくさいですよね…
http://pc11.2ch.net/test/read.cgi/db/1162621344/446 Sennaスレ http://pc8.2ch.net/test/read.cgi/php/1118762053/ に書き込むか迷ったけど、あっちはPHP板なのでここに書いてみる。 mecab の src/Makefile.msvc.in をそのまま使うと iconv-win32 が微妙…
(この記事は随時更新していきます) SennaのPHPバインディングのページに、PHPバインディングを希望する声が続々! http://qwik.jp/senna/PHP_binding.html 実は、以前PHPバインディングを書いていたののの、 rm -rfですべてを消し去るというステキな行為をや…
ところで、PEARを漁っていると、PEAR::CodeGen_MySQL_UDFなるものも発見。 http://pear.php.net/package/CodeGen_MySQL_UDF MySQLのUDF(ユーザ定義関数)をXMLの定義ファイルから自動生成してくれるらしい。 外部ライブラリを利用したUDFが書きやすくなるんじ…
Sennaの1.0.0がリリースされました!!! 本当は金曜日にリリースしたんだけど、 MLのあて先を間違えていて…リリースメールが届いていなかったという… 恥ずかしい。 結局、スラドにだけリリースが伝わった形になってしまいました。 インデックス形式が変わっ…
前々からやりたいと思っていたSennaカンファレンスですが、 id:yappoさんがこんなページを作ってくれたよ! http://soozy.org/index.cgi?SennaConference1 というわけで、参加希望者はじゃんじゃん登録してください! 会場もプログラムも何も決まってないけ…
http://d.hatena.ne.jp/Voluntas/20070219/1171885382 全文検索勉強会! 全文検索勉強会! Hyper Estraierの平林さんとも 「勉強会やりましょう!!」と言ったっきりなんですが、 全文検索勉強会をやったらどのくらい人が集まるんでしょうか。 そして!!! Sen…
ぐんまの子どものための50のルール http://www.pref.gunma.jp/kyoi/01/rule/rule1.html個人的には24,42,47がツボ。