mots quotidiens. | |
Daichi Mochihashi (持橋大地) daichi <at> ism.ac.jp | by hns, version 2.10-pl1. |
|
|||||||||||||||||||||||||||||||||||||||||||||||
査読してかなり色々コメントを書いたので, 2か所くらいに僕の名前が載っていますが,
所属は書かないというのが伊庭さんの方針らしいので, 知っている人が見ないと
名前だけでは誰が誰だかわからないかも。
非常に大部な本で, 様々な話題がカバーされているという印象です。
入門には, 英語の普通の論文を読んだ方がいいのかも知れないという気はしました。
p(x|p) = Πipi^(ni)になっている所を, Polya の場合は ni → n~(i) (~ 1)になって回数が減るので,
p(x|α) ~ Πipi^(n~(i))確率はむしろ上がることになる。 つまり, 確率 p の低い単語がn回出現すると, 最尤推定では確率は p^n になって 指数的に小さくなるが, Polya では"キャッシュ"が効くので p^(log n), 実際はほぼ p^1 くらいになる, ということ。
個人的に一番面白かったのはIBM 井手さんの, 相関行列を群論を使って拡張する話。
論文は
ここ
にあるようです。
量子力学は残念ながらやっていないので, 論文を読んでもかなりわからない部分が
多いですが(Diracのブラ〈|・ケット|>記法が!), 説明はかなりわかりやすくて
面白かったです。僕が理解した限りでは, 以下のような話。
変数xとyの普通の共分散行列は正規分布の指数の肩に現れて, それは
正規分布のキュムラント母関数をTaylor展開した時の2次の係数に対応しているが
(1次の係数は平均), 正規分布の場合は3次以上のキュムラントはすべて0なので,
(普通の)共分散行列を考えることは暗黙に,
たとえどんなデータでも裏に正規分布を仮定していることに対応している。
これに対して, 非線型な相関を考えるためには, 3次以上のキュムラントを相関として
考えるべきなのではないか, という話で, 群論から導かれる対称性から,
可能性を尽くして, 適切な相関係数の拡張を提案されている。(のだと思う。)
上の話から, これはキュムラント母関数に3次以上の項がある場合に対応している
ので, (キュムラント母関数と確率分布には1対1対応があったと思うので)
対応する確率分布があるんじゃないですか, と聞いてみたところ, かなり頑張った
のだけれども, 母関数から元にひっくり返せなかった, とのことでした。
もし1対1対応があるならば, それでも存在することは事実なので, 陰関数のように
implicit な形でしか表せないのかも知れない, と思ってみたりして。
載せるのにOKを出した人しか入っていないので, ここにない人もありますが, 例えば Blei の Correlated topic model (トピック分布の事前分布に ロジスティック正規分布を考える) は Laffertyのページ にあるようです。
Pachinko allocation: A Directed Acyclic Graph for Topic Correlations。。。。
Wei Li, Andrew McCallum (UMass)
In this paper we introduce the Pachinko Allocation Model (PAM), which uses a directed acyclic graph (DAG) to capture arbitrary and possibly sparse correlations.
We thank Sam Roweis for discussions.. and Michael Jordan for help naming the model.
やっとバグが取れた。はあはあ。; カクカクになっている方はノイズに強くて推定が安定している のに注意。
タイトル一覧 |