Profile
Research Topics
- 統計的自然言語処理
- 形態素解析
- テキストチャンキング
- 統計的統語解析
- 統計的係り受け解析
- 機械学習
- Support Vector Machines
- Boosting
- Maximal Margine Classifiers
- データマイニング
- 半構造化データの高速マイニング
- テキストマイニング
- 評判分析
Software
- MeCab (次世代 形態素解析 エンジン)
- CaboCha (係り受け解析器)
- CRF++ (汎用 Tagger,Chunker based on CRF)
- YamCha (汎用 Tagger,Chunker based on SVM)
- TinySVM (SVM 学習パッケージ)
- TinySegmenter
- Darts (Double Array 構築 + 検索プログラム)
- FREQT (頻出部分木マイニングプログラム)
- BACT (木の分類/学習アルゴリズム) EMNLP2004-1 SIGAI135 NL158に使われたものと同一のプログラムです.
- PrefixSpan (シーケンシャルパターン マイニングプログラム) (PrefixSpan の詳細は こちら)
- Ajax を用いた KWIC, IME, Full IME, migemo
- mecab-skkserv(MeCab を用いた SKK サーバ (仮名漢字変換エンジン)
- HexeVote Yet Another ヘーボタン
Publications
- 工藤 拓, 松本 裕治 (2004)
相対的な係りやすさを考慮した日本語係り受け解析モデル, 情報処理学会論文誌 - 工藤 拓, 松本 裕治 (2004)
半構造化テキストの分類のためのブースティングアルゴリズム, 情報処理学会論文誌 - 工藤 拓, 松本 裕治 (2004)
カーネル法を用いた言語解析における高速化手法, 情報処理学会論文誌 - 工藤 拓, 松本 裕治 (2002)
チャンキングの段階適用による係り受け解析, 情報処理学会論文誌, Vol 43, No. 6 pp. 1834-1842 [PDF (draft)] - 工藤 拓, 松本 裕治 (2002)
Support Vector Machine を用いた Chunk 同定, 自然言語処理, Vol.9, No, 5 pp 3-22 [PDF (draft)] - 山田 寛康,工藤 拓,松本裕治 (2002)
Support Vector Machineを用いた日本語固有表現抽出 情報処理学会論文誌 , Vol 43, No. 1, pp.43-53 - 中川 哲治, 工藤 拓, 松本 裕治 (2003)
Support Vector Machineを用いた形態素解析と修正学習法の提案 情報処理学会論文誌, Vol.44, No.5, pp.1354-1367, May 2003 - Taku Kudo, Toshiyuki Hanaoka, Jun Mukai, Yusuke Tabata, and Hiroyuki Komatsu (2011)
Efficient dictionary and language model compression for input method editors, WTIM 2011 [PDF] - Taku Kudo, Jun Suzuki, Hideki Isozaki (2005)
Boosting-based parse reranking with subtree features, ACL 2005 [PDF] - Taku Kudo, Eisaku Maeda, Yuji Matsumoto (2004)
An Application of Boosting to Graph Classification, NIPS 2004 [PDF] - Taku Kudo, Yuji Matsumoto (2004)
A Boosting Algorithm for Classification of Semi-Structured Text, EMNLP 2004 [PDF] [PPT (slide)] - Taku Kudo, Kaoru Yamamoto, Yuji Matsumoto (2004)
Appliying Conditional Random Fields to Japanese Morphological Analysis, EMNLP 2004 [PDF] [PPT (slide)] - Taku Kudo, Yuji Matsumoto (2003)
Fast Methods for Kernel-based Text Analysis, ACL 2003 [PDF] [PPT (slide)] - Taku Kudo, Yuji Matsumoto (2002)
Japanese Dependency Analyisis using Cascaded Chunking, CONLL 2002 in TAIPEI [PDF] [PPT (slide)] - Taku Kudo, Yuji Matsumoto (2001)
Chunking with Support Vector Machines, NAACL 2001 [PDF] [PDF (slide)] [関連Link1 2] - Taku Kudo, Yuji Matsumoto (2000)
Japanese Dependency Analysis Based on Support Vector Machines, EMNLP/VLC 2000 [PDF] [PDF (slide)] - Taku Kudo, Yuji Matsumoto (2000)
Use of Support Vector Learning for Chunk Identification, CoNLL-2000 [Postscript] [関連 Link] - Tetsuji Nakagawa, Taku Kudo, Yuji Matsumoto (2002)
Revision Learning and its Application to Part-of-Speech Tagging, ACL2002 [PDF] - Tetsuji Nakagawa, Taku Kudo and Yuji Matsumoto (2001)
Unknown Word Guessing and Part-of-Speech Tagging Using Support Vector Machines, NLPRS2001 [PDF] - Kaoru Yamamoto (Riken GSC), Taku Kudo, Yuta Tsuboi (IBM Japan) and Yuji Matsumoto (2003)
Learning sequence-to-sequence correspondences from parallel corpora via sequential pattern mining,
Building and Using Parallel Texts: Data Driven Machine Translation and Beyond HLT-NAACL 2003 Workshop [PDF] - Kaoru Yamamoto (Riken GSC), Taku Kudo, Akihiko Konagaya (Riken GSC) and Yuji Matsumoto (2003)
Protein name tagging for biomedical annotation in text, ACL 2003 Workshop: Natural Language Processing in Biomedicine [PDF] - 工藤 拓, 市川 宙, David Talbot, 賀沢秀人
Web上のひらがな交じり文に頑健な形態素解析, 言語処理学会全国大会 NLP-2012, 2012 [PDF] - 工藤 拓
形態素周辺確率を用いた分かち書きの一般化とその応用, 言語処理学会全国大会 NLP-2005, 2005 [PDF] [PPT (slide)] - 工藤 拓, 松本 裕治
相対的な係りやすさを考慮した日本語係り受け解析 SIGNL-162, 2004 [PDF] [PPT (slide)] - 工藤 拓, 山本 薫, 松本 裕治
Conditional Random Fields を用いた日本語形態素解析, 情報処理学会自然言語処理研究会 SIGNL-161, 2004 [PDF] [PPT (slide)] - 工藤 拓, 松本 裕治
半構造化テキストの分類のためのブースティングアルゴリズム, 情報処理学会知能と複雑系研究会 SIGICS-135, 2004 [PDF] [PPT] - 工藤 拓, 松本 裕治 (2003)
部分木を素性とする Decision Stumps と Boosting Algorithm の適用, 情報処理学会自然言語処理研究会 SIGNL-158, 2003 [PDF] [PPT (slide)] - 工藤 拓, 松本 裕治
部分木に基づくマルコフ確率場と言語解析への適用, 情報処理学会自然言語処理研究会 SIGNL-157, 2003 [PDF] [PPT (slide)] - 工藤 拓, 松本 裕治 素性の組み合わせを実現する Power Set Kernel とその高速化, 電子情報通信学会「人工知能と知識処理」, 情報処理学会「知能と複雑系」, 人工知能学会「人工知能基礎論」, 「知識ベースシステム」合同研究会, 2003 [PDF] [PPT (slide)]
- 工藤 拓, 松本 裕治
系列パターンマイニングを用いた有効な素性の組み合わせの発見, 情報処理学会自然言語処理研究会 SIGNL-153, 2002 [PDF] [PPT (slide)] - 工藤 拓, 山本 薫, 坪井 祐太, 松本 裕治
テキストデータベースからの構文構造のマイニング, 情報処理学会 第128回 知能と複雑系研究会, 2002 [PDF] [PPT (slide)] - 山本 薫, 工藤 拓, 坪井祐太, 松本裕治
系列パターンマイニングによる対訳表現抽出, 情報処理学会自然言語処理研究会 SIGNL-148, 2002 - 工藤 拓, 山本 薫, 坪井 祐太, 松本 裕治
言語情報を利用したテキストマイニング, 情報処理学会自然言語処理研究会 SIGNL-148, 2002 [PDF] [PPT (slide)] - 工藤 拓, 山本 薫, 坪井 祐太, 松本 裕治
言語情報を利用したテキストマイニング, 言語処理学会全国大会 NLP-2002, 2002 [PDF] [PPT (slide)] - 工藤 拓, 松本 裕治
Cascaded Chunking Model における部分解析済み情報の利用, 情報処理学会全国大会 2001 [PDF] [PDF (slide)] - 中川哲治 工藤拓 松本裕治
修正学習法による形態素解析 情報処理学会自然言語処理研究会 SIGNL-146, 2001 - 工藤 拓, 松本 裕治
RDB を利用したタグ付きコーパス検索支援環境の構築, 情報処理学会自然言語処理研究会 SIGNL-144, 2001 [PDF] [PDF] - 工藤 拓, 山田 寛康, 中川 哲治, 松本 裕治
SVM を用いたチャンキングタスクにおける素性の自動選択, NLP-2001, 2001 [PDF] [PDF (slide)] - 工藤 拓, 松本 裕治
チャンキングの段階適用による係り受け解析, 情報処理学会自然言語処理研究会 SIGNL-142, 2001 [PDF] [PDF (slide)] - 山田 寛康,工藤 拓,松本裕治
Support Vector Machines による日本語固有表現抽出 情報処理学会自然言語処理研究会 SIGNL-142, 2001 - 中川 哲治, 工藤拓, 松本裕治
Support Vector Machine を用いた未知語の品詞推定, 情報処理学会自然言語処理研究会 SIGNL-141, 2001 - 山田 寛康, 工藤拓, 松本裕治
単語の部分文字列を考慮した専門用語抽出と分類 情報処理学会自然言語処理研究会 SIGNL-140, 2000 - 工藤 拓, 松本 裕治
Support Vector Machine を用いた Chunk 同定, 情報処理学会自然言語処理研究会 SIGNL-140, 2000 [PDF] [PDF (slide)] [関連Link1 2] - 工藤 拓, 松本 裕治
Support Vector Machine による日本語係り受け解析 情報処理学会自然言語処理研究会 SIGNL-138, 2000 [PDF] [PPT (slide)] - 日本語係り受け解析システム「南瓜」 マルチメディア言語学情報[18], 月刊 言語, Vol.32, No.6, pp.74-75, June 2003.
- 2000/11/22 NL 研究会 松本研研究室紹介: Support Vector Machine による自然言語処理 [PDF]
- 1999/7/26 Allen本輪講, Chapter7 Ambiguity Resolution: StatisticalMethods [html]
- 1999/7/29 Allen本輪講, Chapter7 Ambiguity Resolution: Statistical Methods (part2) [html]
- 1999/8/2 夏の勉強会, Foundations of Statistical Natuaral Language Processing - Chapter 15, IR [html]
- 2000/1/17 ゼミナール1 論文紹介, Probabilistic Latent Semantic Indexing (SIGIR '99) [html]
ジャーナル論文
国際会議 (査読あり)
研究会, 全国大会等
商用誌記事/事典項目等
松本研究会等 Handouts
Awards
- 平成16年 3月, 奈良先端科学技術大学院大学情報科学研究科 NAIST最優秀学生賞 受賞
- 平成14年 自然言語処理学会 年次大会優秀発表賞 受賞
言語情報を利用したテキストマイニング [PDF] [PPT (slide)] - 平成13年 情報処理学会 山下記念研究賞 受賞
チャンキングの段階適用による係り受け解析, 情報処理学会自然言語処理研究会 SIGNL-142 [PDF] [PDF (slide)] [学内誌への原稿]
蔵書リスト (書評付き)
Programming
- 普段: C++, Perl, Python, PHP
- 修業中: Java, Ruby, Scheme(Lisp)
- 分からない: prolog
Miscellaneous
taku@chasen.org
taku-spam@tahoo.org(for spam archive)