« migemo風インクリメンタル検索に関する考察 | メイン | Visual C++ Toolkit + Platform SDK »

2005年03月24日

Rast

Rast が試用できるようなので試してみました。

高速でいいですね。N-gram なので再現率は問題ないし。素晴らしい。

しかし、「ruby 本」といれると、山本さんばかりが上位にきて、14000件もヒットしました。
文書のランキングは N-gram だけだと辛そうですね。

先日ソフト分かち書きの話で shugo さんからコメントを
いただいたのですが、形態素解析との併用も検討中のようです。

こちらに MeCab を使ったものを実験的に公開なさっておられます。
「ruby 本」で検索すると、数はかなり減るものの意図したとおりです。

投稿者 taku : 2005年03月24日 16:14

トラックバック

このエントリーのトラックバックURL:
http://chasen.org/~taku/blog/mt-tb.cgi/127