« mecab 0.90 rc6 | メイン | MeCab 0.90 だけをつかって Auto Link »

2006年01月09日

CoNLL-X Shared Task: Multi-lingual Dependency Parsing

Conll-X と聞いてはじめ プロジェクトXを連想してしまったのですが、10回目という意味なのですね。

さて、今回の Shared Task 多言語係り受け解析だそうです。かなり面白そうです。配布されているデータを見ると Dunish, Dutch, Swedish と、私にはさっぱり分からない言語ですが、それでも解析できてしまうところが統計的言語処理の恐ろしさです。

内容は、表層, 原型, 品詞, 言語別の特徴(人称など)から、かかり受けとかかり受けのタイプを求めるタスクとなっています。英語のよく知られているタスクだと、表層と品詞しかなく、かかり受けのタイプは無いので少々複雑です。

さらにやっかいなのは、今回のタスクは Non-projective なかかり受けが含まれている点です。Non-Projective とは交差があるようなかかり受け関係で、解析をとたんに難しくしています。これらの言語には交差はけっこう頻繁に現れるのでしょうか。日本語でも 「太郎に京都に会いに行く」なんていえなくは無いですね。変ですけど。

Non-Projective な話としては、前回の ACL の Nirve さんの話があります。基本的な流れは

1. Non-Projective なかかり受けを Graph の transformation を使って Projective な形に変換する
2. 逆変換ができるように、冗長な情報を付与しておく
3. Projective な parser で学習
4. 解析時には、出力を逆変換して Non-Projective に戻す

Projective への encoding の方法 が何個か紹介されていますが、完全に逆変換に戻るわけではないようです。逆変換の完全性と余分な情報を付与することによる学習の複雑さはトレードオフになります。

かかり受け解析もボーっとしている間にどんどん進化しているようです。

投稿者 taku : 2006年01月09日 02:20

トラックバック

このエントリーのトラックバックURL:
http://chasen.org/~taku/blog/mt-tb.cgi/186

このリストは、次のエントリーを参照しています: CoNLL-X Shared Task: Multi-lingual Dependency Parsing:

» Sesso gratis gay. from Sesso gratis gay.
Sesso gratis gay. Video sesso gratis. Sesso hardcore hardcore gratis. Sesso g... [続きを読む]

トラックバック時刻: 2006年11月24日 13:38

» Does generic viagra work?. from Canadian generic viagra.
Generic viagra. Generic viagra india. Viagra generic. Buy generic viagra onli... [続きを読む]

トラックバック時刻: 2007年01月12日 23:30

» viagra from viagra
great site, nice design. [続きを読む]

トラックバック時刻: 2007年03月14日 13:39

» viagra from viagra
cool design. i like it! [続きを読む]

トラックバック時刻: 2007年03月14日 15:15

» viagra from viagra
nice choice of colors. [続きを読む]

トラックバック時刻: 2007年03月14日 18:56

コメント

right cards will give girl without any questions: http://entertainment.msn.com/help/requirements.aspx , to do mistery you should be very industrious

投稿者 Zachary Adams : 2006年03月27日 23:44