mots quotidiens.
Daichi Mochihashi (持橋大地) daichi <at> ism.ac.jp by hns, version 2.10-pl1.

先月 2024年04月 来月
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

2006年01月25日(水) [n年日記]

#1 Dirichlet Processes

大羽さんのベイズ掲示板で, Dirichlet Process のいい資料がないですか, と 聞かれている ので, コメント。 僕もそんなに偉そうなことを言えるわけではないのですが, Dirichlet Process については色々スライドの類がありますが, それを見ても 結局数学的な部分はよくわからないと思うので, 地道に論文を読むのが正道だと 思います。DPについては, まず最初の論文である
Ferguson (1973) A Bayesian Analysis of Some Nonparametric Problems, The Annals of Statistics,Vol.1, No.2, 1973.
Antoniak (1974) Mixtures of Dirichlet Processes with Applications to Bayesian Nonparametric Problems, The Annals of Statistics,Vol.2, No.6, 1974.
を読むのがいいと思います。
ただし, これはルベーグ測度論がわからないと全然お話にならないので(僕はそうでした), まずその勉強が必要かもしれません。 SVM2004 の後, 松本研的には平均場近似が流行っていたみたいですが, 僕は頭が固まりそうに なりながらひたすらルベーグ測度の勉強をしていました。 本としては "Probability with Martingales" が有名で, Guy Lebanon が 絶賛しています が, あまりに詰め込まれすぎていて, ざっと見た感じ僕はあまりいい本とは思わな かったです。ものすごく数学的基礎のある人が読むと, もしかすると素晴らしい本 なのかもしれません。

DPは, それ自体というよりディリクレ過程混合モデルとして使う人が多いか と思うので, その場合は

Escobar and West (1995) "Bayesian Density Estimation and Inference using Mixtures", Journal of the American Statistical Association,Vol. 90, No. 430, 1995.
がいい論文で, これを読むのが当面の目標ではないかと思います。 ちなみに, これを読むためには, ディリクレ過程の生成パラメータであるαの 推定が必要で, それを Beta variable を入れた augmented Gibbs でやる話で
West (1992) "Hyperparameter estimation in Dirichlet process mixture models", ISDS discussion paper 1992-03, 1992.
を読む必要があります。 (Googleで探すとリンクが切れているみたいですが, 今探したら ここ にありました。)
これを手に入れたのはもうずいぶん前で, 確か2年くらい前だったのだ けれども, この論文を理解できるようになるまでこんなに長い道のりが必要だった とは, 当時は全く思っていなかった。。。

他にも色々ありますが, とりあえず上に挙げた論文が一番基礎的だと思います。
ちなみに, Antoniak (1974)などはWeb上にはないので, NAISTの電子図書館で複写依頼して 大川さんに自宅まで転送してもらったのだけれど, 何と 京大数理解析研究所附属図書館から, 和紙風の白い封筒で来て(2003年の7月ごろ), 文IIIだった僕がついに京大数理解析研究所ですか!と個人的に感慨にふけって しまったのでした。
この論文では第1種 Stirling 数になる, という話が後ろの方でわりと 突然出てきますが, これがどうしてかというのは, 僕の 2005/9/6の日記 に書いておきました。結局この論文や上のものは後で東大にログインして JSTORからPDFをゲットしたので, PDFがほしい, という方は個人的にご連絡下さい。

上の論文とは別に, スライドとしては大羽さんも紹介されていた Ghahramani の UAI'05のスライド と, Jordanの NIPS'05のスライド が 直観的な感覚をつかむにはとてもいいと思います。 Ghahramani のスライドを見て, Base measure との関係はこんな感じか! というのが 僕はよくわかりました。
というあたりで, 参考になればと思います。


2003年01月25日() [n年日記]

#1 形態論

Xerox の Lauri Karttunen 氏の "Applications of Finite-State Transducers in Natural-Language Processing".
まだちゃんと中身を読んでいないが, abstract によると
Stump's recent book, INFLECTIONAL MORPHOLOGY (2001), lays out a rich set of principles and notational conventions designed to capture important linguistic generalizations. In spite of the apparent complexity of Stump's formalism, the system as a whole is no more powerful than a collection of regular relations. Consequently, a Stump-style description of the morphology of a particular language such as Lingala or Bulgarian can be compiled into a finite-state transducer that maps the underlying lexical representations directly into the corresponding surface forms or forms, and vice versa, yielding a single lexical transducer.
らしい。いかす.
Karttunen 氏はもともと言語学の出身で, 今は Xerox europe にいるが 結構お年を召したおじさんのようだ。ということに結構元気づけられたりして。
Stanford の NLP Reading group のMLのアナウンスより。


2 days displayed.
タイトル一覧
カテゴリ分類
 なかのひと
Powered by hns-2.10-pl1, HyperNikkiSystem Project