mots quotidiens.
Daichi Mochihashi (持橋大地) daichi <at> ism.ac.jp by hns, version 2.10-pl1.

先月 2006年09月 来月
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

2006年09月04日(月) [n年日記]

#1 ベイズ手ブレ補正

LUMIXの手ブレ補正付きカメラとかが流行っていますが, すでに撮影された1枚の 手ブレ画像から, 手ブレを除去して鮮明な画像にするアルゴリズムが SIGGRAPH 2006 で発表されたという話を たまたま読んで, 誰だろう, と思って調べてみたら, HertzmannとRoweisだった;。 しかも中身は、variational Bayes。
論文とスライドの置いてある Hertzmann のページは ここ です。

画像の研究者ではないので専門的な所はわかりませんが, 要するに手ブレ画像を, 原画像とブレを表現する Blur kernel と呼ばれるものの畳み込み(+ノイズ) *1 と捉えて, 原画像と Blur kernel の両方を1枚の手ブレ画像から推定するという問題 になるらしい。
感じとしては, 自然言語処理の分野では5月に紹介したGaP(NMF)での文書の分解の話と 似ています。画像なので細かい所は違いますが, ざっと見た感じでは関連があって, 当たらずとも遠からずだと思う。
何となく, ブレた画像との重ね合わせがあると情報が失われてしまっているのでは ないかという気がしてしまいますが(特に、視覚的なものなので), 実際にはpixelの中 に情報が残っていて, 相関を利用して分解できるという所が面白い。

内部的には Blur kernel を推定しながら, variational approximation を作って尤度を上げるということを繰り返すようです。
少し思ったのは, 内部でこうやって色々やっていても, ニュース等で紹介される 時には 「1枚の画像から手ブレが補正できる」という結果だけが広まるわけで, これは 自然言語処理でも同じなんだろうなあ, ということ。研究者としては中で使われている 細かい技術が重要なわけですが, 外から見ると, 「..ができる」というような形でしか 見えないんだろうなあ, ということ。当たり前のことだけれども。


*1: この畳み込みが実際にどういう演算をするのかは, 専門家ではないのでわからない のですが..。(Forsythの本は持っているから, 見ればいいんだけど。)

2006年09月19日(火) [n年日記]

#1 NC研

NC研の招待講演「自然言語処理におけるベイズ統計」の原稿をやっとsubmit。 基本的にサーベイで, 特に特許に抵触しないので, 下にPDFを置いておきます。
自然言語処理について知らない人を対象に, ナイーブベイズの教師なし階層ベイズ学習という形でDMを導入して, LDAと "Name that song!"とか"Matching words and pictures"などの応用について解説 しています。 識別モデルのベイズ学習(BPMなど)についても簡単に触れています。
サーベイを書くというのは, 全体的な立ち位置とか問題点を整理する意味でも 勉強になったと思う。
10月11日の午後 [NC研予定ページ] (プログラム) なので, 時間のある方はおいで下さい。

「自然言語処理におけるベイズ統計」 nc2006bayes.pdf


2 days displayed.
タイトル一覧
カテゴリ分類
 なかのひと
Powered by hns-2.10-pl1, HyperNikkiSystem Project