2005-10-01から1ヶ月間の記事一覧

クローラー落ちていた

またTidy先生のおかげで落ちていた。 とりあえず、forkやめてフォアグランド動作に戻して、 daemontools配下に全てのクローラ関係のデーモンを移動。あとデータ移行しておかなきゃ。

いやなバグ

http://bugs.mysql.com/bug.php?id=14037 (IN BOOLEAN MODEじゃなくても再現します)IN BOOLEAN MODEを使わずに、 MATCH() AGAINST()を組み合わせて使うような 設計にしていたらハマった。すなおにIN BOOLEAN MODEを使うべきかしらね。

クローラー落ちない

クローラーと各種デーモンがかなり安定してきた。 3日回しても大丈夫。 POEのDBIがちょっと不安定だったので普通に同期にしたら安定している。 ポエの内部動作を見極めんといけんな。

Perlでの数値の最大値

Perlの数値の最大値がよくわからん。 整数はintegerもしくは文字列形式でいくらでも、 浮動小数点数はどうなんだろう。use bignumをしたらスカラー値じゃない!っていっぱい怒られるしなあ。 かといって、bignumで使っているモジュール群をいちいち指定する…

CDB_Fileなんですが

CDB_Fileを使ってPgでカーソルでfreezeでbzip2のcompressで… というのをやっていたら、3.5GくらいでOut Of Memoryした。 オンメモリでやってるのかいな!!!で、CPAN先生に泣きついたところ、 CDB_File::Generatorっつーものがあるらしくてですね、ダンナ。 Th…

Xangoの新バージョン

早速新バージョン(rev.94)に入れ替えてみた。旧バージョンとの入れ替えのポイントは… Xango::BrokerをXango::Broker::Pullに retrieve_jobsで返すやつを、uriが入ったhashrefのarrayじゃなくて、 Xango::Job->new( uri => xxx, ...)で返ってきたののarrayに…

PerlでRACEエンコーディング

いるもの Unicode::String Convert::RACE Convert::Base32 エンコード $encoded_output = to_race(utf8($output)->utf16); デコード $decoded_input = utf16(from_race($input))->utf8; UTF-8フラグは適宜処理すること。

FusionChartsを日本語と共に使うときに気をつけるべきこと

FusionCharts http://www.infosoftglobal.com/FusionCharts/ は日本語通ります。ただし!!! 食わせるXMLはUTF-8で、BOM付き(UTF8BOMでも使う) パラメータとしてdataURLを与えるとき、 マニュアルどおりの&と?の変換だけでは、 一部のマルチバイト文字で化…

Hyper Estraier

Hyper Estraier、評価しなくちゃ・・・

DBIx::Cursor

DBIx::Cursorっていう汎用カーソル君が存在するみたい。 やほーい!!! さっそく試してみっか。 … 全部レコードとってきとるやないかい! カーソル風アクセスを実現するだけ、ってことやな。 結局Pgを入れた。

DBD::Pgめ!!!

カーソル使えないってどういうことやねん!!!!

MecabはChasenにとって変われるか

まあ、-jオプションが一番の問題なわけで。 http://www.namazu.org/pipermail/namazu-devel-ja/2005-September/000608.htmlchasenのマニュアルによると、 -j オプションについて 茶筌では通常,改行をもって一つの入力文字列の終了とする.そのため,文の途…

CabochaのPerl bindingでSEGV

でます。 Starting program: /usr/bin/perl test.pl [Thread debugging using libthread_db enabled] [New Thread 1076875392 (LWP 31414)]Program received signal SIGSEGV, Segmentation fault. [Switching to Thread 1076875392 (LWP 31414)] 0x4033ce16 …

Dartsクン

Dartsのコンパイルが止まっちゃう件について。 http://pcweb.mycom.co.jp/column/yetanother/045/ ふみゅ。

ビュービュー風が吹き荒れる。

例えば、 uid,date,textという3フィールドあるテーブルと、 uid,titleという2フィールドあるテーブルを、 uidで結合したビューを作るとしよう。 textにはfulltext indexがついている。ビューを使ってfulltext searchをするクエリに、 order by date descを…

でも…

blog判定ではじかれてしまった。Date Filterだな。 あとで見ておこう。

結局gdbセンセイにご足労願ったよ

実行ファイル版でも同じ設定ファイルを食わせると落ちる。 で、gdbセンセイの登場ってわけでさ。 #0 0x40056c7e in tmbstrncmp () from /usr/lib/libtidy-0.99.so.0 #1 0x4004c623 in DropSections () from /usr/lib/libtidy-0.99.so.0 #2 0x4004ca61 in Cle…

あぶないあぶない

油断していたら、 MySQLのあるMyISAMテーブルの容量が4G超えてた!…でもあっさり超えて正常稼動中。 SHOW TABLE STATUS LIKE 'html_data'; ってやってみると、 Max_data_length : 281474976710655 だそうで…(0xffffffffffff) これが64bitパワーでしょうか。 …

spaces.msn.com...

http://spaces.msn.comのblog解析に難儀中。 tidyがSEGVしてまーす。 設定ファイルを指定しなければtidyクンは死なないようです。 (warningもerrorも出るけど)xmlns:spaces、xmlns:msnなんてインポートしてる、 DTDもないのに。tidyのデバッグなんてしたく…

robots.txt

Xangoでいろいろやろうとするときには robots.txtを自前で処理しなきゃいけません。 POE::Component::Client::HTTPを派生していろいろやるのが一番かと思うけど、 Xangoから呼ばれるイベントの中で、 WWW::RobotUAを参考に(ほぼコピぺ)、 RobotRules::Any_…

sen_index_selとsen_index_select

MySQL bindingの中でも、sen_index_selectを使って 細かく制御したい欲が出てきた。ウズウズ。 いや、ここはガマンのしどころだガマンのしどころだ リリースまで時間がないことを忘れるな でもでも ああ あ

まとめ読みモードは危険!

SennaのMLで質問に返答した。 しかし、すでに解答が出ていたのだ。 まとめ読みモードなのを忘れていた… 恥ずかしい。しかも、まとめ読みモードだとスレッドもつながらず…ぐすん。 まとめ読みモードを解除したのは言うまでもなく。

PostgreSQL JP MLで

森田将棋の人が連続投稿されていた。 最近将棋の開発はあんまやってないっぽい。 最終作がPS2の2000年発売のやつみたいで。 あ、調べたら携帯版を最近出してるのね。にゃるほど。

DProf

新しい環境では、POEとDProfの相性が悪いらしく、 Segmentation Faultを起こしてしまう。 Devel::SmallProfも動かない。 さてどうしたものか。