Next: 15.3.1 The Poisson distribution
Up: Topics in Information Retrival
Previous: 15.2.2 Term weighting
- Pi(k)
wi が 1つの document に k 回出現する確率を推定した
い
- Zipf の法則
- 1つの corpus に対して ある単語が何回出現するかの確率
-
- no-content word(非内容語,非重要語,keywordになりにくい語) と
content word (内容語,重要語,keyword になりやすい語) の区別をした
い(各単語に重要度を割り当てたい) それぞれの単語の分布と,重要度の
関係は?
1999-08-03