今度出る「言語処理学辞典」の最後の原稿が届いて,
とりまとめを依頼された「言語モデル」の項目が完成したので, ようやく提出。
第2部 "基礎技術"の最初の中項目, 2-1「言語モデル」は,
*1
- 2.1.0 「概要」(持橋)
- 2.1.1 「nグラム言語モデル」(森先生)
- 2.1.2 「nグラムモデルのスムージング法」(IBM 倉田さん)
- 2.1.3 「言語モデルの評価」(森先生)
- 2.1.4 「長距離モデル」(山本先生)
- 2.1.5 「文書モデル」(山本先生)
- 2.1.6 「言語モデルへのその他のアプローチ」(持橋)
という内容からなっています。
それぞれ力の入った内容を書いていただいたので, 一応辞典とはいえ,
かなり読みごたえのある項目になっていると思います。(Webでは内容は公開できない
のですが..)
個人的にも, 最初の「概要」では言語モデルとは何かという見識を示せ, と言われた
わけなので, (森先生におほめの言葉をいただきましたが)書きがいのある内容でした。
2.1.6「言語モデルへのその他のアプローチ」では, PCFGに基づく言語モデル,
全文最大エントロピー法などについて書いています。まさか自分がCharniakの論文
を読むことになるとは思わなかった..。
どれも手加減なしで書いているので, 出版された際には興味があれば読んでいただけ
れば, と思います。
全体に, 言語モデルの項目は研究者が読んでも, 得るところは
ある内容になったような気がします。
*1: 本の宣伝になるので, 書いても大丈夫だと思うのですが..。