mots quotidiens.
Daichi Mochihashi (持橋大地) daichi <at> ism.ac.jp by hns, version 2.10-pl1.

先月 2007年09月 来月
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30

2007年09月04日(火) [n年日記]

#1 NIPS 2007

NIPSに通りました。&, Accepted papers 217本のうち, 26本の oral presentation の中に入りました。
Daichi Mochihashi and Eiichiro Sumita: "The Infinite Markov Model". *1

submissionの総数は975本で, 倍率はだいたい4.5倍くらいだったようです。
スコアは9-8-7でした。(大体6以上がaccept. 数値の意味は こちら にあります。)
内容的には Singer の "The Power of Amnesia" 以来の問題をノンパラメトリック ベイズで解いたことになっているのですが, アイデアは自分でもシンプルだと思うので, 階層クラスタリング等に使える (階層CRPの階層の深さ自体をベイズ推定する)という部分が評価されたのだと思います。
今年のレビューの途中で査読基準(上のページの最後)が変わって, ACLと同時に出すことはできなくなったため, もしACLに通っていたらNIPSには出せなかったわけなので, まぁ終わりよければ 全てよし, というところなのかも。

それより今回痛感したのは, ACLは結局応用の会議なんだなあ, ということ。 後でLiangの論文もちゃんと読んだわけですが, ただHDPを応用しただけの The Infinite Tree が通って, Matrixの新しいpriorやHDPの変分近似が含まれている Liangの論文が通らないのはどう考えてもおかしくて, レビュアーが理解できなかっただけだと思う。 レビュアーが理解できる範囲の簡単な数学だったら通る, みたいなのはどうよ.. という感じ。
一応計算言語学で一番の会議ということになっているのだから, ちょっと難しいのが来ると理解できません *2 , みたいなのはやめて,

Econometrica has no tightly controlled policy towards subject matter. No paper is rejected because it is "too mathematical" or "too quantitative," nor is a paper rejected because it is "not mathematical enough" or "too applied." ..

という Econometricaのポリシー を見習ってほしいよなあ..と思う。

Talkの準備をしないといけないのですが, NIPSはシングルセッションで, 超凄い Audience が話を聞くことになるので, 20分とはいえ, ガクガクブルブルです。

・ 追記

いつの間にか, Accepted Papers のリスト が出ているようです。


*1: 言うまでもなく, 共著という形になっていますが, 隅田さんはノータッチです。
*2: Hal Daume IIIも同じようにACLにrejectされて, それはJAIRに普通に通ったらしい。

2007年09月14日(金) [n年日記]

#1 数学セミナー

今月号の日本評論社 『数学セミナー』 の次号予告に載っていると思いますが, 来月(11月号)の特集「統計科学のすすめ その2」に, 伊庭さんからの依頼で, 「生きたことばをモデル化する ―自然言語処理と数学の接点」 というタイトルで記事が載ることになりました。
他にも伊庭さんの巻頭言や, 久保さん(北大)の計算生態学の話, 統数研の樋口先生 のデータ同化とSMCの話, etc..と豪華です。

ようやくこちらでの最終版をアップ。
6ページ(僕の記事は7ページになるらしい)ですが, 結局普通の論文と同じく, 2週間ほどフルに使って書きましたので, ご興味のある方はお読みください (来月12日発売です。)
自然言語処理の人で特にベイズの人には常識的な部分もありますが, 確かに結構勉強になったような気がします。
この後まだまだ修正や校正があるので, 全然終わらないのですが..。


2007年09月20日(木) [n年日記]

#1 Time-record

論文を読んでいる時, 出会った難しい英単語を調べるために昔書いた ejd は, ~/.ejd-record というファイルに調べた語を
2002年10月 6日(日) 01:29:49 infuriate
2002年10月 6日(日) 01:30:19 jeopardize
2002年10月 6日(日) 01:30:47 vizier
:
2006年 5月25日(木) 12:03:34 epithelium
2007年 7月 8日(日) 22:08:11 eradicate
2007年 7月10日(火) 15:14:02 courier
のように残してくれます。 これ自体ログを見ると, もう覚えた語とそうでない語 が混じっていて結構面白いので(ちなみに, 上の3つは全然調べた覚えさえない..), こうして記録が残っていると, 自分の記憶をチェックするにも役立ちそうです。
実はさらに, 上では時刻も記録されているので, ちょっと興味を持って プロットしてみました。以下のようにすると, xgraph でグラフが描けます。
% awk '{print substr($0,16,2)}' ~/.ejd-record | sort -n | uniq -c | awk '{print $2,$1}' | xgraph

これを見る限り, 大体お昼直前or午後に論文を(自席では)読んでいて, 15時~17時くらいがピークのようです。
昔, lastコマンドの出力で計算機の使用時間を調べたことがありますが, こうやって自分の時間をプロットすると, 色々面白い情報が得られそうです。

・ 補足

ちなみに, Windows PCの起動時間/シャットダウン時間を記録するために, 僕は Radium Software Development の方の書かれたwinlogというフリーソフト http://www.radiumsoftware.com/products.html を使っていますが, これはかなりお薦めです。
startupに入れておくと, 平均起動時間がわかる他, 時間毎の起動状況もわかります。


2007年09月29日() [n年日記]

#1 jroff

CS研に移って普段の環境が Fedora Core 6 に変わったら, いつの間にか groff が日本語に対応しているのに気付いた。
roff は LaTeX が普及する以前にUnixで広く使われていた組版システムで, 今でも man ページはこれ(のマクロ)で書かれています。 The Unix Super Textに書いてある通り, roff は普通は日本語には対応して いないので日本では流行っていませんが, 結構roffで書かれた論文や書籍は 昔は多かったようで, たとえば僕の見る所, SICP はroffで組版されているのではないかと思う。
以下, 自分用のメモ代わりも含めて。

roffはNAISTの学生だった頃から気になっていたのですが, jgroffを自分でコンパイル して入れても, うまく動かなかったりしてこれまで諦めていた。
僕は手元の環境には特に入れた覚えがないのですが, たとえば次のようなファイル test.rf

.TL
roff 文書のテスト
.AU
持橋大地
NTTコミュニケーション科学基礎研究所
.AB
This is an abstract.
We typeset this text using a traditional UNIX program
.I roff.
.AE
.NH
Introduction
.PP
ここから本文。
.SH
他の例
.DS
(define (fact n)
  (if (= n 0) 1
      (* n (fact (- n 1)))))
.DE
を用意して,
% groff -Tnippon -ms test.rf
のように実行すると, デフォルトでは端末に下のように整形されます。 素晴らしい。

roff が LaTeX と違うところは, こうして端末にテキストとして整形することが できること。かつ, -Tps オプションを使うと, 綺麗に PostScript に出力する こともできます。

% groff -Tnippon -Tps -ms test.rf > test.ps
roff.pdf [4KB] (上のtest.pdfをPDFにしたもの)。
これでわかるように, 脚注やverbatim等も含めて, 簡単に非常に綺麗なタイプセットが 得られます。

・ マクロパッケージ

上では標準的なmsマクロパッケージ *1 を使って書いていますが, roffで問題になるのは, ほとんど身の周りに解説書が ない(&知っている人もほとんどいない) ことです。
"% man 7 roff" や "% man 7 groff_man" でman形式のマニュアルが見られますが, msマクロパッケージの標準的な文書は M.E.Lesk, "Typing Documents on the UNIX System: Using the -ms Macros with Troff and Nroff" のようで, これはベル研の "Unix Tenth Edition Manual"のページ から読むことができます [ps] [pdf]
他にも探していると, 何と troff.org というサイトを発見。 http://www.troff.org/papers.html から, マニュアル類をすべて読むことができます。素晴らしすぎ。

ちょっと面白かったのは, 上のページで最後の参考文献のフォーマットが, "%A Dale Dougherty" のようにBibtexとは違う簡単な形式になっていて, 高林君の scbib とそっくりだなあ, ということ。 S式で書くのも "%A"と書くのも本質的に同じで, 結局simple is bestなのね, という気がします。

・ その他リンク:


*1: -m** の部分がマクロパッケージの名前(例えば, -manは"an"マクロパッケージ) なので, "s"というのが正確かもしれない。

4 days displayed.
タイトル一覧
カテゴリ分類
 なかのひと
Powered by hns-2.10-pl1, HyperNikkiSystem Project