mots quotidiens.

LUMIXの手ブレ補正付きカメラとかが流行っていますが, すでに撮影された1枚の手ブレ画像から, 手ブレを除去して鮮明な画像にするアルゴリズムが SIGGRAPH 2006 で発表されたという話をたまたま読んで, 誰だろう, と思って調べてみたら, HertzmannとRoweisだった;。しかも中身は、variational Bayes。
論文とスライドの置いてある Hertzmann のページはここです。

画像の研究者ではないので専門的な所はわかりませんが, 要するに手ブレ画像を, 原画像とブレを表現する Blur kernel と呼ばれるものの畳み込み(+ノイズ) *1 と捉えて, 原画像と Blur kernel の両方を1枚の手ブレ画像から推定するという問題になるらしい。
感じとしては, 自然言語処理の分野では5月に紹介したGaP(NMF)での文書の分解の話と似ています。画像なので細かい所は違いますが, ざっと見た感じでは関連があって, 当たらずとも遠からずだと思う。
何となく, ブレた画像との重ね合わせがあると情報が失われてしまっているのではないかという気がしてしまいますが(特に、視覚的なものなので), 実際にはpixelの中に情報が残っていて, 相関を利用して分解できるという所が面白い。

内部的には Blur kernel を推定しながら, variational approximation を作って尤度を上げるということを繰り返すようです。
少し思ったのは, 内部でこうやって色々やっていても, ニュース等で紹介される時には「1枚の画像から手ブレが補正できる」という結果だけが広まるわけで, これは自然言語処理でも同じなんだろうなあ, ということ。研究者としては中で使われている細かい技術が重要なわけですが, 外から見ると, 「..ができる」というような形でしか見えないんだろうなあ, ということ。当たり前のことだけれども。

: この畳み込みが実際にどういう演算をするのかは, 専門家ではないのでわからないのですが..。(Forsythの本は持っているから, 見ればいいんだけど。)

NC研の招待講演「自然言語処理におけるベイズ統計」の原稿をやっとsubmit。基本的にサーベイで, 特に特許に抵触しないので, 下にPDFを置いておきます。
自然言語処理について知らない人を対象に, ナイーブベイズの教師なし階層ベイズ学習という形でDMを導入して, LDAと "Name that song!"とか"Matching words and pictures"などの応用について解説しています。識別モデルのベイズ学習(BPMなど)についても簡単に触れています。
サーベイを書くというのは, 全体的な立ち位置とか問題点を整理する意味でも勉強になったと思う。
10月11日の午後 [NC研予定ページ] (プログラム) なので, 時間のある方はおいで下さい。

「自然言語処理におけるベイズ統計」 nc2006bayes.pdf

2006年09月04日(月) [n年日記]

#1 ベイズ手ブレ補正

2006年09月19日(火) [n年日記]

#1 NC研

mots quotidiens.
Daichi Mochihashi (持橋大地) daichi <at> ism.ac.jp	by hns, version 2.10-pl1.