mots quotidiens.
Daichi Mochihashi (持橋大地) daichi <at> ism.ac.jp by hns, version 2.10-pl1.

先月 2006年08月 来月
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

2006年08月02日(水) [n年日記]

#1 NC研究会

10/10-10/11にNAISTで行われる NC(ニューロコンピューティング)研究会 の招待講演に呼ばれてしまったので, 1時間くらい何かベイズ関係で話すことに なりました。びっくり。
正直全然自信がないので迷ったのですが, せっかくお声を掛けていただいたのと, 日本の自然言語処理のメッカである奈良先端大でやるので, 断わらずに 分野交流に貢献しようと思って, お引き受けすることにしました。
鹿島さん が書かれているのと似たような状況かも..(いや, 僕の方が多分全然わかってないです が。) ということで, 高次元の離散記号の(ベイズ的な)処理について, 僕も できるだけ知らない部分を勉強して, お話しさせていただこうかなと思っています。
つうか, 個人的にBPの使い方で先が見えない状況だったりするわけで, こういう時に聞くと ちょっと不安な気が..。

#2 webcat @ berkeley

Wainwright の berkeley のグラフィカルモデルの2005年の講義のビデオが http://inst.eecs.berkeley.edu/~cs281a//fa05/lectures/lectures.html から全部見られるのを発見。
そのまま見ると遠くてかなり画像が途切れるので, Net Transport のようなダウンロードツールを使ってセーブしてから見た方がいいと思います。 (注: 普通に右クリックではこの手のストリームはセーブできない。)
Wainwright の講義は(読んだ論文も, 僕には)結構難解でわかりやすいとは言えない と思ったので, これだけを見て勉強するというわけにはいかないと思いますが, 自分で勉強しただけで誰かが話すのを聞いたことがなかった "Ising models" とか "gradient descent" とかが実際に発音されているのを見て感慨したりして。
少なくとも, モチベーションを高めるには役に立ちそうです。


2006年08月05日() [n年日記]

#1 SVM2006終了

SVM2006 お疲れ様でした。
内輪の会ですが, 他に見たい方がいるかもしれないので, 僕の分の発表資料を 1週間くらい置いておきます。

"Introduction to Hierarchical Pitman-Yor Processes". svm2006-hpylm.pdf


2006年08月30日(水) [n年日記]

#1 COLING-ACL 2006 けいはんな

清水さんと会場で話していたら最後になってしまい, 飲みに行きませんかという話で 行った上の階で, CS研の愉快な話を2時間くらい聞いてしまった。:-)

#2 gamrand()

2005/12の日記で, ガンマ分布からの乱数を生成 する gamrand() のプログラムを載せたが, その後で調べてみると, 真の値と微妙に ずれていることが判明。 Devroye(1986)の該当ページを何度見返しても, 合っているようにしか見えない んだけど..。
同じアルゴリズムを使っているMATLAB(行列に拡張されているので, そのままでは 使えない)ではズレがないので, きっとどこか, 微妙な所が間違っているのだと 思うのだが。
とりあえず, ここ から手に入れられるrandlib (perlのMath::Randomでもこれを使っているらしい)に含まれるsgamma()を使えば 回避できますが, これは float だったりするので少し微妙。 悔しいので, 公開デバッグ。うーむ。

#3 ar and bundle

研究と関係ない細かい技術的な話, というかメモ。
『プログラミング言語AWK』 の練習問題に, 複数のテキストファイルを連結して出力し (bundle), それを元にほどく(unbundle) スクリプトを書け, という問題がある。 書いてある通りにやると, http://www.netlib.org/research/awkbookcode/ch3 に書いてあるようなコードになるが (っていうか, ここにあるファイル自体が bundle プログラムで作られてるのね..), 実際はどこかにセパレータがあれば充分なので, そういうスクリプトを大学1,2年の頃に面白いと思って書いていた。
で, 最近 ar コマンドを使っていて, 実はこれは標準コマンドの /usr/bin/ar で 簡単にできてしまうことを知った。
% ar rcv ab.a a.txt b.txt
を実行すると,
!<arch>
a.txt/          1154521091  2150  200   100644  13        `
これはa.txt。
b.txt/          1154521095  2150  200   100644  14        `
これはb.txt。
のようなファイルが作成される。ほどく時は普通に,
% ar xvo ab.a
x - a.txt
x - b.txt
とすればよい。(oは時間を復元するオプション。)
ar は普通はlibfoo.aのようなライブラリを作る時に使うが(僕もそうだった), 中身は実は, たとえバイナリでも上のような行をファイルの間に挿入して連結する だけのようなので *1 , テキストファイルでも普通に使える。GNU binutils が入っていれば どこでも使えるので, この方が普遍的かも。
最近 shar アーカイブを見ないなあ, と思っていたら, shar は % sh < hoge.shar として解凍するので, ウィルスの多い現在では中で何を実行されるかわからないので, 恐くて使えない, ということらしい。なるほど。
*1: 数字は順に, タイムスタンプ(Unix時間, mtime), uid, gid, パーミッション, ファイルサイズを表している。 a.txt はわざと最後の改行を落としているが, 上の結果を見ると改行が入って 出力されるようだ。

3 days displayed.
タイトル一覧
カテゴリ分類
 なかのひと
Powered by hns-2.10-pl1, HyperNikkiSystem Project