« Ajax IME ブックマークレット | メイン | ルー語変換を MeCab だけで実現 »

2006年11月26日

CRF++ 0.45

CRF++ 0.45 を公開しました.

以前考察した single-best MIRA を実装してみました.CRF とどっちが精度がよいかはデータ依存です.

安直な実装では芸がないのでSVM の学習で使われている shrinking という高速化手法を使っています. 他にも過学習を防ぐためソフトマージンの MIRA にしています. ソフトマージンの実装はかなり安直です.実際のパラメータ更新は主問題として解くのですが,主パラメータと同時に双対パラメータも保持しておきます.双対パラメータが 定数 C を超えたときはそれ以上の更新をやめます.結果として例外的な事例はマージンの中に食い込んできます.

投稿者 taku : 2006年11月26日 23:23

トラックバック

このエントリーのトラックバックURL:
http://chasen.org/~taku/blog/mt-tb.cgi/217