« サイエンス zero | メイン | 本格翻訳 »

2005年02月09日

平林さんの blog

estraier の作者の blog を発見。

索引語を作るとき、 n-gram か 分かち書きの選択
悩んでるみたい。

次回の言語処理学会では、この2つの方法論を unify する話をします。
実数のパラメータがあって、形態素解析の分かち書きと n-gram
(実際には文字unigram という実装になってますが、理論的には任意の
n-gram に拡張可能) の結果を自在にコントロールできます。
さらに、MeCab にその機能がつく予定。

大人の事情があって、論文とMeCabの公開は
言語処理学会の後になります。

投稿者 taku : 2005年02月09日 20:50

トラックバック

このエントリーのトラックバックURL:
http://chasen.org/~taku/blog/mt-tb.cgi/91

コメント

when grass anticipate mistery increase: http://www.moviefinder.com/ , round will corner unconditionally

投稿者 David Freeman : 2006年03月28日 19:10