« 2005年04月 | メイン | 2005年06月 »

2005年05月31日

sourceforge

mecab の配布元を徐々に移管しています。

http://sourceforge.jp/projects/mecab/

いままでは、リリース作業はかなりの部分自動化できていたのですが、
sourceforge だと、Web インターフェイス経由でやらないといけないので、
めんどうです。

command line でリリース作業が行えるようなツールあればいいのですが。

投稿者 taku : 06:06 | トラックバック

2005年05月28日

CRF++

CRF のツールキットを公開しました。
http://chasen.org/~taku/software/CRF++/

Text Chunking, Base-NP chunking, 固有表現抽出など、幅広い応用に
使えるような設計にしております。

特徴としては
- 汎用的なツール (サンプルとして、Text Chunking, Base-NP chunking, 日本語固有表現抽出を同封)
- 素性を比較的自由に定義できる
- LBFGS に基づく高速な学習
- 解析も比較的高速
- N-best 解を条件付確率付きで出力可能
- タグ別の周辺確率が出力可能
- YamCha と入力フォーマットの互換性

などです。YamCha にくらべると、素性の定義がめんどくさいです。
素性が適切に与えられれば、性能的には CRF のほうがよいと思います。
動作も高速です。

投稿者 taku : 17:27 | コメント (14) | トラックバック

2005年05月21日

Episode III

Star Wars Epsiod III を見てきますた。
http://www.starwars.com/episode-iii/

たしかに感動ものです

投稿者 taku : 12:23 | コメント (12) | トラックバック

2005年05月09日

mecab 0.90にむけて

http://mecab.sourceforge.jp/

分かりにくい文書ですいません。

投稿者 taku : 10:37 | コメント (28) | トラックバック