« 2005年04月 | メイン | 2005年06月 »
2005年05月31日
sourceforge
mecab の配布元を徐々に移管しています。
http://sourceforge.jp/projects/mecab/
いままでは、リリース作業はかなりの部分自動化できていたのですが、
sourceforge だと、Web インターフェイス経由でやらないといけないので、
めんどうです。
command line でリリース作業が行えるようなツールあればいいのですが。
2005年05月28日
CRF++
CRF のツールキットを公開しました。
http://chasen.org/~taku/software/CRF++/
Text Chunking, Base-NP chunking, 固有表現抽出など、幅広い応用に
使えるような設計にしております。
特徴としては
- 汎用的なツール (サンプルとして、Text Chunking, Base-NP chunking, 日本語固有表現抽出を同封)
- 素性を比較的自由に定義できる
- LBFGS に基づく高速な学習
- 解析も比較的高速
- N-best 解を条件付確率付きで出力可能
- タグ別の周辺確率が出力可能
- YamCha と入力フォーマットの互換性
などです。YamCha にくらべると、素性の定義がめんどくさいです。
素性が適切に与えられれば、性能的には CRF のほうがよいと思います。
動作も高速です。
投稿者 taku : 17:27 | コメント (14) | トラックバック
2005年05月21日
Episode III
Star Wars Epsiod III を見てきますた。
http://www.starwars.com/episode-iii/
たしかに感動ものです
投稿者 taku : 12:23 | コメント (12) | トラックバック
2005年05月09日
mecab 0.90にむけて
分かりにくい文書ですいません。