きまぐれ日記: 日本語形態素解析入門

« 構造化データの機械学習 MOST | メイン | colinux 上に Windows 開発環境構築 »

2005年03月31日

日本語形態素解析入門

たつをさんのD2のときの文書
http://nais.to/~yto/clog/2005-03-30-2.html
キター。すばらしい。

今の MeCab の理論、実装をほぼ網羅しています。
形態素解析の辞書のアルゴリズムは、Common Prefix Search と呼ばれ、通常の hash では実現でいない特徴を備える必要があります。 MeCab はダブル配列を使っています。
最近の話としては、2.3.3 の確率モデルの１つに CRF が増えました。

投稿者 taku : 2005年03月31日 21:02

トラックバック

このエントリーのトラックバックURL:
http://chasen.org/~taku/blog/mt-tb.cgi/134

このリストは、次のエントリーを参照しています: 日本語形態素解析入門:

» 日本語形態素解析入門 from Drk7jp
山下達雄 / 日本語形態素解析入門 Version 0.9.1 / 1999 (1.4M) 奈良先端科学技術大学院大学（NAIST）自然言語処理学講座（松本研）... [続きを読む]

トラックバック時刻: 2005年04月01日 23:21

» 日本語形態素解析入門 from Drk7jp
山下達雄 / 日本語形態素解析入門 Version 0.9.1 / 1999<http://nais.to/~yto/doc/tech/jma/jma19... [続きを読む]

トラックバック時刻: 2005年04月01日 23:22

» songs Madison from songs Madison
songs Madison [続きを読む]

トラックバック時刻: 2007年03月15日 12:57