必要があって, ACL 2005のチュートリアル
"Introduction to Arabic Natural Language Processing"
を読んだ。(ちなみに, この年のACLには出していません
(2005/06の日記)
)。面白い。
130ページくらいのスライドですが, 言語に興味のある人なら, 非常に面白いと
思います。英語や日本語のように活用がほとんどない言語と違って, 思い切り活用が
あり, アラビア語が難しいという話は前から聞いていましたが, 納得。ただ同時に,
わかるとかなり直観的に, 自然に思える, 良い言語なのだろうなとも思いました。
"ktb" が概念としては「書く」を表していて, パターンに従って "maktaba" と変化する
と「library」の意味となり, さらに接頭辞, 接尾辞がついて
"walilmaktabat" となると "and for the libraries" の意味になるとか。
NLP的には英語や中国語, 日本語あたりの言語が注目されがちですが, 活用が多いこう
いう言語の解析(むしろこの方が本当は多いのかも)も重要だと思った次第です。
話によると, ポーランド語が相当難しいらしいですが..。
しばらく前に撮った写真ですが, 難波千日前(=いわゆる大阪ミナミの超中心地)に
今年にできたカフェ。SVM2010でスライドに書くのを忘れたので,
chasen.org としては載せておかねば, ということで..。:-)