Publications
Papers
- "Unsupervised decomposition of natural monkey behavior into a sequence of
motion motifs",
Koki Mimura, Jumpei Matsumoto, Daichi Mochihashi, Tomoaki Nakamura,
Toshiyuki Hirabayashi, Makoto Higuchi, and Takafumi Minamimoto.
Communications Biology 7:1080, 2024. [Nature PDF]
-
"Learning Adverbs with Spectral Mixture Kernels",
Tomoe Taniguchi, Ichiro Kobayashi and Daichi Mochihashi.
Findings of ACL 2024, pp.7742-7752, 2024. (also presented at SpLU-RoboNLP 2024)
[Poster]
- 「潜在的正規分布によるイベントの時間関係の推定」.
船曳日佳里 (お茶大), 持橋大地, 浅原正幸, 小林一郎.
言語処理学会第30回年次大会A5-5, 2024. (NLP2024 委員特別賞)
- 「語形の分布状況のベクトル化による言語地図の分類方法」.
近藤泰弘(青山学院大), 持橋大地,
言語処理学会第30回年次大会D5-1, 2024.
- 「木構造自己注意機構による教師なし統語構造解析」.
成田百花(お茶大), 持橋大地, 小林一郎(お茶大),
言語処理学会第30回年次大会D3-3, 2024.
- 「意味変化分析に向けた単語埋め込みの時系列パターン分析」.
木山朔, 相田太一(都立大), 小町守, 小木曽智信, 高村大也, 松井英俊, 持橋大地,
言語処理学会第30回年次大会E9-2, 2024.
- 「Hol-CCG構文解析と拡散モデルの統合による構文構造を陽に考慮した画像生成」.
山木良輔(立命館大), 品川政太朗, 持橋大地, 谷口忠大,
言語処理学会第30回年次大会B6-3, 2024.
- 「短歌固有の属性に対応する脳内情報表現」.
佐藤杏奈(お茶大), 近添淳一, 船井正太郎, 持橋大地, 小林一郎,
言語処理学会第30回年次大会P4-9, 2024.
- "Estimating Differential Equations from Temporal Point Processes".
Shuichi Miyazawa and Daichi Mochihashi. Transactions on Machine Learning Research,
2023. [paper]
- 「クッカリー・データサイエンスの研究動向とその可能性」.
上原宏, 持橋大地. 日本調理科学会誌, Vol.56, No.4, pp.163-171, 2023.
[PDF]
- "Investigation of Information Processing Mechanisms in the Human Brain during
Reading Tanka Poetry". Anna Sato, Junichi Chikazoe, Shotaro Funai, Daichi
Mochihashi, Yutaka Shikano, Masayuki Asahara, Satoshi Iso, Ichiro Kobayashi.
ICANN 2023, pp.407-418, 2023. [PDF]
- "Holographic CCG Parsing".
Ryosuke Yamaki, Tadahiro Taniguchi, Daichi Mochihashi. ACL 2023,
pp.262-276, 2023. (oral presentation)
[code]
[Poster]
[Video]
- "Scale-invariant Infinite Hierarchical Topic Model".
Shusei Eshima, Daichi Mochihashi. Findings of ACL 2023, pp.11731-11746, 2023.
[poster]
[code]
- 「多次元項目反応理論による短歌の評価傾向の分析」.
川島寛乃 (慶応大), 持橋大地. 情報処理学会研究報告 2023-NL-256, 2023.
[slides] (第256回自然言語処理研究会 若手奨励賞)
- "Dynamical Non-compensatory Multidimensional IRT Model Using
Variational Approximation".
Hiroshi Tamano and Daichi Mochihashi.
Psychometrika, vol.88, pp.487-526 (2023).
[PDF]
[article]
- "Researcher2Vec: Neural Linear Model of Scholar Recommendation for Funding
Agency".
Daichi Mochihashi. International Society for Scientometrics and Informatics
(ISSI 2023), Vol. 2, pp.329-335, 2023.
- 「スケール不変な木構造棒折り過程に基づく無限階層トピックモデル」.
江島舟星 (ハーバード大学), 持橋大地. 言語処理学会第29回年次大会 Q3-12, 2023.
[Poster]
(言語処理学会2023 年次大会優秀賞)
- 「手がかり表現に基づく非論理的な言語推論の学習」.
張辰聖子 (お茶の水女子大学), 持橋大地, 小林一郎. 言語処理学会第29回年次大会 Q2-1,
2023.
- 「木構造自己注意機構による教師あり統語構造解析」.
成田百花 (お茶の水女子大学), 持橋大地, 小林一郎. 言語処理学会第29回年次大会 C1-1,
2023.
- 「短歌を読む際の情動に関する脳活動の解析」.
佐藤杏奈 (お茶の水女子大学), 近添淳一, 船井正太郎, 持橋大地, 鹿野豊, 浅原正幸,
磯暁, 小林一郎.
言語処理学会第29回年次大会 H10-4, 2023.
- 「構文解析と画像生成の統合による機能語の言語理解」.
山木良輔 (立命館大学), 谷口忠大, 持橋大地.
言語処理学会第29回年次大会 H12-4, 2023. (言語処理学会2023 年次大会優秀賞)
- 「食感の物性と言語表現の対応の推定」.
上原宏, 持橋大地. 言語処理学会第29回年次大会 H11-3, 2023.
- 「人間の脳と人工知能における短歌の鑑賞に関する神経活動の比較」.
船井正太郎, 近添淳一, 持橋大地, 浅原正幸, 松井鉄平, 鹿野豊, 川島寛乃, 磯暁.
言語処理学会第29回年次大会 B5-2, 2023.
- "Infinite SCAN: An Infinite Model of
Diachronic Semantic Change".
Seiichi Inoue, Mamoru Komachi, Toshinobu Ogiso, Hiroya Takamura,
Daichi Mochihashi. EMNLP 2022 (Long, oral), pp.1605-1616.
[slides]
[code]
- "Spatio-temporal categorization for first-person-view videos using a convolutional variational autoencoder and Gaussian processes".
Masatoshi Nagano, Tomoaki Nakamura, Takayuki Nagai, Daichi Mochihashi,
Ichiro Kobayashi.
Frontiers in Robotics and AI, Vol.9, 2022. doi=10.3389/frobt.2022.903450
[article][PDF]
- 「メール型広告におけるタイトルが開封に与える影響」
.
吉井健敏, 城田晃希, 市川匠, 佐野雄一 (株式会社D2C), 持橋大地.
情報処理学会第148回情報基礎とアクセス技術研究会 (SIG-IFAT), 2022.
[slides]
- 「推薦の解釈性を高める識別的なベイズ離散ガウス過程潜在空間モデル」.
竹原一彰, 持橋大地. 情報処理学会MPS研究会, 2022.
[第138回MPS研究会 ベストプレゼンテーション賞;情報処理学会2022年度山下研究賞]
- 「動画からの表情変化特徴の抽出と雰囲気・個性のモデリングのための表情の解析」.
小竹山祐輝, 中村理恵 (コーセー), 持橋大地. 情報処理学会MPS研究会, 2022.
[第138回MPS研究会 ベストプレゼンテーション賞, 情報処理学会2023年度CS領域奨励賞]
- "Nonparametric Bayesian Deep Visualization".
Haruya Ishizuka and Daichi Mochihashi. ECML-PKDD 2022.
[統計数理セミナー資料]
- 「離散イベント時系列からの潜在的な競争の推定」.
宮澤脩一, 持橋大地. 2022年度人工知能学会全国大会 (JSAI 2022),
3E3-GS-2-03, 2022.
- 「レシピ共有サイトからの食感トピックと食感物性のモデル化」.
上原宏(立正大学), 持橋大地. 2022年度人工知能学会全国大会 (JSAI 2022),
4J1-OS-25a-03, 2022. (OS口頭発表部門 優秀賞)
- "Detecting Sensory Textures with Rheological Characteritics from Recipe Sharing
Sites", Hiroshi Uehara and Daichi Mochihashi.
DECOR2022 (5th Internatinal Workshop on Data Engineering Intelligent Foods &
Cooking Recipes) at ICDE 2022, 2022.
[PDF] (Decor2022 Best Paper Award)
- 「文書ベクトルを用いた中国共産党のイデオロギーの分析」.
御器谷裕樹, 持橋大地. 電子情報通信学会NLC(言語理解とコミュニケーション)研究会,
信学技報 vol.121, no.415, NLC2021-32, pp.24-29, 2022.
- 「Infinite SCAN: 単語の意味変化と語義数の同時推定」.
井上誠一, 小町守, 小木曽智信, 高村大也, 持橋大地. 電子情報通信学会IBISML研究会 第45回研究会, 2022.
- 「ガウス過程を用いた周波数スペクトル分析による副詞の理解」.
谷口巴, 持橋大地, 長野匡隼, 中村友昭, 長井隆行, 稲邑哲也, 小林一郎.
電子情報通信学会PRMU研究会 PRMU2021-74, pp.91-96, 2022.
- 「Holographic EmbeddingsによるCCG構文解析」.
山木良輔, 谷口忠大, 持橋大地. 言語処理学会第28回年次大会 G5-2, 2022. (若手奨励賞)
- 「ガウス確率場による単語の意味変化と語義数の同時推定」.
井上誠一, 小町守, 小木曽智信, 高村大也, 持橋大地.
言語処理学会第28回年次大会 A7-1, 2022.
-
"A Comprehensive Analysis of PMI-based Models for Measuring Semantic
Differences".
Taichi Aida, Mamoru Komachi, Toshinobu Ogiso, Hiroya Takamura,
Daichi Mochihashi. PACLIC 2021, pp.21-31, 2021.
- 「統計学習を介する文化進化のモデルと音楽・文芸・絵画データにおける共役分布則」. (Best New Direction部門ベストプレゼンテーション賞受賞)
中村栄太, 持橋大地, 斎藤康之. 情報処理学会 第132回音楽情報科学研究会(SIGMUS),
132-16, 2021.
[PDF]
- 「確率的潜在意味スケーリング」.
持橋大地. 情報処理学会研究報告 2021-NL-249 (9), 2021.
[発表資料]
(自然言語処理研究会 優秀研究賞)
-
「Nonparametric Bayesian Deep Visualization」.
石塚治也(ブリヂストン), 持橋大地.
電子情報通信学会技術研究報告 Vol.121, No.80, IBISML2021-1, pp.1-8, 2021.
(2021年度IBISML研究会賞ファイナリスト)
- "Articulation of geminate obstruents in the Ikema dialect of Miyako
Ryukyuan: A real-time MRI analysis".
Masako Fujimoto, Shigeko Shinohara, Daichi Mochihashi.
Journal of the International Phonetic Association,
1-25, 2021.
doi:10.1017/S0025100321000013
[Link]
-
「Researcher2Vec: ニューラル線形モデルによる自然言語処理研究者の可視化と推薦」.
持橋大地, 言語処理学会第27回年次大会 B2-2, 2021.
[スライド]
[検索サービス(NLP2Vec)]
-
「スペクトル混合カーネルとガウス過程に基づく動画からの副詞の意味理解」.
谷口巴, 持橋大地, 長野匡隼, 中村友昭, 長井隆行, 高野渉, 小林一郎,
言語処理学会第27回年次大会 P6-17, 2021.
-
「通時的な単語の意味変化を捉える単語分散表現の同時学習」.
相田太一, 小町守, 小木曽智信, 高村大也, 持橋大地.
言語処理学会第27回年次大会 E4-3, 2021.
- 「非補償型時系列IRTにおけるKL最小化による学習者スキル推定」.
玉野浩嗣, 持橋大地. 人工知能学会 第91回先進的学習科学と工学研究会
(SIG-ALST), 2021.
- "How LSTM Encodes Syntax: Exploring
Context Vectors and Semi-Quantization on Natural Text".
Chihiro Shibata, Kei Uchiumi, Daichi Mochihashi.
COLING 2020, pp.4033-4043, 2020.
[slides]
- 「Slice Samplingに基づく高速な大規模時系列データの分節化」.
長野匡隼, 中村友昭, 長井隆行, 持橋大地, 小林一郎, 高野渉.
人工知能学会第34回全国大会 1Q5-GS-11-03, 2020.
[PDF]
- 「Relative Sentence Embeddingsに基づく文集合の可視化」.
石塚治也, 持橋大地. 電子情報通信学会IBISML研究会 第39回研究会, 2020.
- "Unbounded Slice Sampling".
Daichi Mochihashi. Research Memorandum No.1209,
The Institute of Statistical Mathematics, 2020.
(arXiv:2010.01760)
-
「局所的変分法による非補償型時系列IRT」.
玉野浩嗣, 持橋大地. 電子情報通信学会IBISML研究会 第38回研究会.
信学技報 Vol.119, No.360, IBISML2019-31, pp.91-98, 2020.
- 「ヒューマノイドロボットを用いた言語理解による動作生成」.
濱園侑美, 小林一郎, 麻生英樹, 中村友昭, 長井隆行, 持橋大地.
知能と情報 (日本知能情報ファジィ学会誌), 32巻1号, p.632-642, 2020.
[PDF]
-
"HVGH: Unsupervised Segmentation for High-dimensional Time Series
Using Deep Neural Compression and Statistical Generative Model".
Masatoshi Nagano, Tomoaki Nakamura, Takayuki Nagai, Daichi Mochihashi,
Ichiro Kobayashi, Wataru Takano.
Frontiers in Robotics and AI, Vol.6, p.115, 2019.
[Publisher site]
- "Survey on frontiers on language and robotics".
T. Taniguchi, D. Mochihashi, T. Nagai, S. Uchida, N. Inoue,
I. Kobayashi, T. Nakamura, Y. Hagiwara, N. Iwahashi, T. Inamura.
Advanced Robotics, Vol.33, No.15-16, pages 700-730, 2019.
(第9回 Advanced Robotics Best Survey Paper Award受賞)
-
"High-dimensional Motion Segmentation by Variational Autoencoder and
Gaussian Processes".
Masatoshi Nagano, Tomoaki Nakamura, Takayuki Nagai, Daichi Mochihashi,
Ichiro Kobayashi, Wataru Takano. IROS 2019, pp.105-111, 2019.
-
「HVGH: 高次元時系列データの深層圧縮と教師なし分節化」.
長野匡隼, 中村友昭, 長井隆行, 持橋大地, 小林一郎, 高野渉.
2019年度人工知能学会全国大会 1L3-J-11-01, 2019.
- Anh Duc Le, Daichi Mochihashi, Katsuya Masuda, Hideki Mima, and
Nam Tuan Ly. 2019. "Recognition of Japanese historical text lines by an
attention-based encoder-decoder and text line generation".
In Proceedings of the 5th International Workshop on Historical Document
Imaging and Processing (HIP'19). ACM, 37-41, 2019.
- 「霊長類における身体動作時系列の分節推移構造推定」.
三村喬生, 中村友昭 松本惇平, 西条寿夫, 須原哲也, 持橋大地, 南本敬史.
2019年度人工知能学会全国大会 1C4-J-3-01, 2019.
- 「可変次数無限隠れマルコフモデル」.
内海慶, 持橋大地. 電気情報通信学会IBISML研究会第33回研究会, 2018.
(2018年度IBISML研究会 研究会賞受賞)
- Amir Aly and Tadahiro Taniguchi Daichi Mochihashi.
"A Bayesian Approach to Phrase Understanding through Cross-Situational Learning", the International Workshop on Visually Grounded Interaction and Language (ViGIL), in Conjunction with the 32nd Conference on Neural Information Processing Systems (NIPS), 2018.
- "A Probabilistic Approach to Unsupervised Induction of Combinatory
Categorial Grammar in Situated Human-Robot Interaction",
Amir Aly, Tadahiro Taniguchi, Daichi Mochihashi.
2018 IEEE-RAS 18th International Conference on Humanoid Robots (Humanoids), pp.1113-1120, 2018.
-
「構文情報を陽に与えたときのLSTMによる内部表現について」.
岡本千尋, 内海慶, 持橋大地.
情報処理学会研究報告 自然言語処理研究会 2018-NL-237, 2018.
[統計数理セミナー発表資料]
- 「CNNを用いた近代文献画像からのテキスト領域抽出」.
永野雄大, 幡谷龍一郎, 持橋大地, 増田勝也. 電子情報通信学会 PRMU研究会,
PRMU2018-47, pp.73-78, 2018.
- "Sequence Pattern Extraction by Segmenting Time Series Data Using
GP-HSMM with Hierarchical Dirichlet Process".
Masatoshi Nagano, Tomoaki Nakamura, Takayuki Nagai, Daichi Mochihashi,
Ichiro Kobayashi, Masahide Kaneko. IROS 2018, pp.4067-4074, 2018.
[PDF]
- "Semi-Supervised Learning of a Pronunciation Dictionary from Disjoint
Phonemic Transcripts and Text". Takahiro Shinozaki, Shinji Watanabe,
Daichi Mochihashi and Graham Neubig, Interspeech 2017, pp.2546-2550,
2017.
- "Natural Language Generation Using Monte Carlo Tree Search",
Kaori Kumagai, Ichiro Kobayashi, Daichi Mochihashi, Hideki Asoh,
Tomoaki Nakamura, Takayuki Nagai.
Journal of Advanced Computational Intelligence and Intelligent
Informatics, Vol.22, No.5, pp.777-785, 2018.
[PDF]
- "Segmenting Continuous Motions with Hidden Semi-Markov Models and
Gaussian Processes".
Nakamura Tomoaki, Nagai Takayuki, Mochihashi Daichi, Kobayashi Ichiro,
Asoh Hideki, Kaneko Masahide. Frontiers in Neurorobotics,
Vol.11, pp.67, 2017.
[PDF]
- 「連続な無限因子モデル」. 中野允裕, 持橋大地, 松井知子, 柏野邦夫.
電子情報通信学会 IBISML研究会 (IBIS 2017), IBISML2017-59, pp.185-192,
2017.
- "MIPA: Mutual Information Based Paraphrase Acquisition via Bilingual
Pivoting".
Tomoyuki Kajiwara, Mamoru Komachi, Daichi Mochihashi.
IJCNLP 2017, pp.80-89, 2017.
[PDF]
- 「可変次数無限隠れマルコフモデル」. 内海慶, 持橋大地.
情報処理学会研究報告 2017-NL-233 (13), pp.1-8, 2017.
(自然言語処理研究会 優秀研究賞受賞)
- "Semi-Supervised Learning of a Pronunciation Dictionary from Disjoint Phonemic Transcripts and Text".
Takahiro Shinozaki, Shinji Watanabe, Daichi Mochihashi and Graham Neubig,
Interspeech 2017, pp.2546-2550, 2017.
-
"Learning Co-Substructures by Kernel Dependence Maximization".
Sho Yokoi, Daichi Mochihashi, Ryo Takahashi, Naoaki Okazaki,
Kentaro Inui. IJCAI 2017, pp.3329-3335, 2017.
-
"Nonparametric Bayesian Semi-supervised Word Segmentation".
Ryo Fujii, Ryo Domoto, Daichi Mochihashi. TACL, vol. 5, pp.179-189,
2017. (presented at EMNLP 2017)
-
「無限木構造隠れMarkovモデルによる階層的品詞の教師なし学習」.
[2017年度 情報処理学会山下記念研究賞]
持橋大地, 能地宏. 情報処理学会研究報告 2016-NL-226 (12), pp.1-11, 2016.
[slides]
-
"Musical Typicality: How Many Similar Songs Exist?".
Tomoyasu Nakano, Daichi Mochihashi, Kazuyoshi Yoshii and Masataka Goto.
ISMIR 2016, pp.695-701, 2016.
- "Learning word meanings and grammar for verbalization of daily life activities using multilayered multimodal latent Dirichlet allocation and Bayesian hidden Markov models",
Muhammad Attamimi, Yuji Ando, Tomoaki Nakamura, Takayuki Nagai,
Daichi Mochihashi, Ichiro Kobayashi, Hideki Asoh.
Advanced Robotics, Vol.30, Issue 11-12, pp.806-824, 2016.
[PDF]
- "Learning Word Meanings and Grammar for Describing Everyday Activities
in Smart Environments".
Muhammad Attamimi, Yuji Ando, Tomoaki Nakamura,
Takayuki Nagai, Daichi Mochihashi, Ichiro Kobayashi, Hideki Asoh.
EMNLP 2015, pp.2249-2254, 2015.
[PDF]
- "Inducing Word and Part-of-speech with
Pitman-Yor Hidden Semi-Markov Models".
Kei Uchiumi, Hiroshi Tsukahara, Daichi Mochihashi. ACL-IJCNLP 2015,
pp. 1774-1782, 2015.
- 「隠れセミマルコフモデルに基づく品詞と単語の同時ベイズ学習」.
内海慶, 塚原裕史, 持橋大地. 情報処理学会研究報告 2015-NL-220(3),
pp.1-8, 2015.
- "Mixture of Gaussian process experts for predicting sung melodic contour
with expressive dynamic fluctuations",
Yasunori Ohishi, Daichi Mochihashi, Hirokazu Kameoka, Kunio Kashino.
ICASSP 2014, pp.3714-3718, 2014.
[PDF]
- 「ガウス過程に基づく連続空間トピックモデル」.
持橋大地, 吉井和佳, 後藤真孝.
情報処理学会研究報告 2013-NL-213(11),1-8, 2013.
[slides]
- "Improvements to the Bayesian Topic N-gram Models".
Hiroshi Noji, Daichi Mochihashi, Yusuke Miyao.
EMNLP 2013, pp.1180-1190, 2013.
[PDF]
- "Beyond NMF: Time-Domain Audio Source Separation without Phase
Reconstruction".
Kazuyoshi Yoshii, Ryota Tomioka, Daichi Mochihashi, Masataka Goto.
ISMIR 2013, pp.369-374, 2013. Best Oral Presentation Award.
- "Infinite Positive Semidefinite Tensor Factorization for Source Separation of Mixture Signals".
Kazuyoshi Yoshii, Ryota Tomioka, Daichi Mochihashi, Masataka Goto.
ICML 2013, pp. 576-584, 2013.
- "Bayesian Semi-supervised Audio Event Transcription based on Markov Indian buffet Process",
Yasunori Ohishi, Daichi Mochihashi, Tomoko Matsui, Masahiro Nakano, Hirokazu Kameoka,
Tomonori Izumitani, Kunio Kashino. ICASSP 2013, pp.3163-3167, 2013.
- 「無限混合モデルを入れ子にしたmIBPに基づく音響イベント検出".
大石康智, 持橋大地, 松井知子, 中野允裕, 亀岡弘和, 泉谷知範, 柏野邦夫.
日本音響学会2012年秋季研究発表会, 1-P-22, pp. 775-778, 2012.
- 「潜在トピックを考慮した Bayes n-gram 言語モデル」. 能地宏, 持橋大地, 石塚満.
情報処理学会研究報告 2012-NL-208, 2012.
- "Predicting Word Fixations in Text with a CRF Model for Capturing General Reading
Strategies among Readers",
Tadayoshi Hara, Daichi Mochihashi, Yoshinobu Kano,
Akiko Aizawa. Proceedings of the First Workshop on Eye-tracking and Natural
Language Processing at COLING 2012, pages 55-70, 2012.
-
「条件付確率場とベイズ階層言語モデルの統合による半教師あり形態素解析」.
持橋大地, 鈴木潤, 藤野昭典.
言語処理学会第17回年次大会(NLP2011), B5-2, 2011.
[slides]
- "Gibbs Sampling Based Multi-scale Mixture Model for Speaker Clustering".
Shinji Watanabe, Daichi Mochihashi, Takaaki Hori, Atsushi Nakamura.
ICASSP 2011, pp.4524-4527, 2011.
- "Statistical Modeling of F0 Dynamics in Singing Voices Based on
Gaussian Processes with Multiple Oscillation Bases".
Yasunori Ohishi, Hirokazu Kameoka, Daichi Mochihashi, Hidehisa Nagano,
and Kunio Kashino. INTERSPEECH 2010, pp. 2598-2601, 2010.
[PDF]
- 「複数振動基底に基づく歌声のF0動特性の統計的モデリング」.
大石康智, 亀岡弘和, 持橋大地, 永野秀尚, 柏野邦夫.
日本音響学会2010年秋季研究発表会, 3-P-31.
- "Learning Common Grammar from Multilingual Corpus".
Tomoharu Iwata, Daichi Mochihashi and Hiroshi Sawada.
ACL 2010, pp.184-188, 2010. (short paper)
[PDF]
- 「マルチカーネル線形予測モデルによる音声分析」.
亀岡弘和, 大石康智, 持橋大地, ルルー・ジョナトン.
音響学会2010年春季研究発表会講演論文集 2-Q-24, 2010.
[PDF]
[Poster]
- "Conditional Simultaneous Draws from Hierarchical Chinese Restaurant
Processes",
Takaki Makino, Shunsuke Takei, Daichi Mochihashi, Issei Sato,
Toshihisa Takagi. NPBayes 2009 Workshop at NIPS 2009.
-
"Bayesian Unsupervised Word Segmentation with Nested Pitman-Yor
Language Modeling".
Daichi Mochihashi, Takeshi Yamada, Naonori Ueda.
ACL-IJCNLP 2009, pp.100-108, 2009.
[slides]
-
「ベイズ階層言語モデルによる教師なし形態素解析」.
持橋大地, 山田武士, 上田修功.
情報処理学会研究報告 2009-NL-190, 2009.
[slides]
-
"On the Properties of von Neumann Kernels for Link Analysis".
Masashi Shimbo, Takahiko Ito, Daichi Mochihashi, Yuji Matsumoto.
Machine Learning, 75:37-67, 2009.
- "The Infinite Markov Model".
Daichi Mochihashi and Eiichiro Sumita.
NIPS 2007 (oral&poster), pp.1017-1024, 2007.
[slides]
[Spotlight]
[Poster]
-
「階層Pitman-Yor過程に基づく可変長n-gram言語モデル」
持橋大地, 隅田英一郎. 情報処理学会論文誌 Vol.48, No.12, pp.4023-4032,
2007.
-
「Pitman-Yor過程に基づく可変長n-gram言語モデル」
持橋大地, 隅田英一郎. 情報処理学会研究報告 2007-NL-178, pp.63-70, 2007.
[slides]
- 「コミュニティを考慮したカーネル引用解析」
伊藤敬彦, 新保仁, 持橋大地, 松本裕治.
電子情報通信学会論文誌 D Vol.J90-D, No.2, pp.233-244, 2007.
- "Exploring Multiple Communities with Kernel-Based Link Analysis",
Takahiko Ito, Masashi Shimbo, Daichi Mochihashi and Yuji Matsumoto.
in Proc. of ECML/PKDD 2006, pp.246-253, 2006.
-
「自然言語処理におけるベイズ統計」
持橋大地. 電気情報通信学会 ニューロコンピューティング研究会 (招待講演).
NC2006-49, pp.25-30, 2006.
[slides]
- 「無限混合ディリクレ文書モデル」
持橋大地, 菊井玄一郎. 情報処理学会研究報告 2006-NL-172, pp.47-53, 2006.
-
「Gibbs Sampling による確率的テキスト分割と複数観測への拡張」
持橋大地, 菊井玄一郎.
NLP-2006
(言語処理学会第12回年次大会)
発表論文集, pp.212-215, 2006.
[slides]
- "Context as Filtering".
Daichi Mochihashi and Yuji Matsumoto.
NIPS 2005 (Neural Information Processing Systems 18)
pp. 907-914, 2006.
[Poster]
-
「Particle Filter による文脈の動的ベイズ推定」
持橋大地, 松本裕治. 情報処理学会研究報告 2005-NL-165, pp.59-66, 2005.
[slides]
-
「言語表現のベクトル空間モデルにおける最適な計量距離」
[PDF]
持橋大地, 菊井玄一郎, 北研二.
電子情報通信学会論文誌 Vol. J88-D-II No.4, pp.747-756, 2005.
-
"Learning Nonstructural Distance Metric by Minimum Cluster Distortions"
Daichi Mochihashi, Genichiro Kikui, and Kenji Kita.
EMNLP 2004 (Proceedings of Empirical Methods in Natural Language
Processing 2004), pp.341-348, 2004.
[slides]
大会論文等
- Muhammad Attamimi, 中村友昭, 長井隆行, 持橋大地, 小林一郎,麻生英樹.
「獲得した概念階層と語彙に基づく文生成」.
第32回日本ロボット学会学術講演会、九州産業大学、9月4-5日, 2014.
- 安東裕司, アッタミミ・ムハンマド, 中村友昭, 長井隆行, 持橋大地,
小林一郎, 麻生英樹. 「日常生活言語化のためのデータ取得システム」.
計測自動制御学会, 12月, 2014.
- 樺山絵里, 麻生英樹, 小林一郎, 持橋大地, Muhammad Attamimi, 中村友昭,
長井隆行. 「Zero-shot 学習した言語モテルによるテキスト生成結果の評価」.
第21回言語処理学会年次大会, 京都大学, 3月, 2015.
- 熊谷香織, 持橋大地, 小林一郎, 麻生英樹, Muhammad Attamimi, 中村友昭,
長井隆行.
「モンテカルロ木探索を用いた確率文脈自由文法に基づくテキスト生成」.
第21回言語処理学会年次大会, 京都大学, 3月, 2015.
- 恒川英里, 小林一郎, 麻生英樹, 長井隆行, 中村友昭, 持橋大地.
「画像認識に基づくロボットの行動を制御する強化学習の取組み」.
第77回情報処理学会全国大会, 京都大学, 3月, 2015.
- 濱園侑美, 小林一郎, 麻生英樹, 長井隆行, 中村友昭, 持橋大地.
「ロボットの調理動作学習へ向けた取組み」.
第77回情報処理学会全国大会, 京都大学, 3月, 2015.
Invited Talks and Tutorials
- 2024/7/21:
International Symposium of Emotional Informatics,
"Japanese Short Songs with Brain".
[PDF]
- 2024/3/17: 第1回Science of Science研究会,
「研究者と大学のベクトル化とその応用」.
[PDF]
- 2023/11/4: 日本英語学会 "深層学習時代の言語研究"シンポジウム,
「Infinite SCAN: 意味の数とその時間変化を同時に推定する統計モデル」.
[PDF]
- 2023/10/19: 土木学会 第6回AI・データサイエンスセミナー, 「テキストとその背後のダイナミクスをとらえる」.[PDF]
- 2023/10/13: NAISTデータサイエンス特別講義, 「ホログラフ埋め込みに基づくCCG構文解析」.[PDF]
- 2023/8/4: Complexity in Language Variation and Change
(COMPILA 2023, StatPhys28 satellite),
"Infinite SCAN: An Infinite Model of Diachronic Semantic Change",
University of Tokyo, Komaba.
- 2023/5/25: 統計数理研究所「統計的機械学習」の中核としての統計数理シンポジウム,
「自然言語処理・機械学習における企業との共同研究」.
[PDF]
- 2023/4/25: 島根大学 知能情報デザイン学科,
「スペクトル混合カーネルによる副詞の理解と生成」.
- 2022/11/6: 大阪公立大学 数学・数理科学5研究拠点合同市民講演会,
「単語ベクトルの数理」.
- 2021/12/21: 農研機構 農業情報研究センター 農業AI推進室, 「ガウス過程の基礎と疎データへの応用」.
- 2021/10/25: NAISTデータサイエンス特別講義, 「ガウス過程の基礎と自然言語処理・ロボティクス」. [PDF]
- 2021/8/27-29: Summer School数理物理 2021,
「ノンパラメトリックベイズ統計と自然言語処理」.
講演資料:1日目 |
2日目 |
3日目
- 2021/5/11: Seminar at the Research Group in Computational Linguistics
(RGCL) in the University of Wolverhampton, UK (Virtual),
"How LSTM Encodes Syntax: Exploring Context Vectors and
Semi-Quantization on Natural Text".
- 2021/3/23: 東北大学 みちのく情報伝達学セミナー(MiCS),
「Probabilistic Latent Semantic Scaling」. (Virtual)
- 2021/3/15: 言語処理学会第27回年次大会チュートリアルT1,
「ガウス過程と自然言語処理」. 小倉 北九州国際会議場, 2021.
[PDF]
- 2019/12/1: 総研大文化フォーラム2019講演, 「言葉の統計学と学際研究」.
国文学研究資料館, 2019.
- 2019/10/30: CoRL 2019
Tutorial,
"Gaussian Process Generative Models for Language and Robotics",
Osaka Senri Life Science Center, Japan.
- 2019/9/10: 計測自動制御学会 SICE 2019, Workshop "Recent advances and future trends
in basic and applications of Gaussian processes", 講演 "Gaussian processes for
recognizing Motions in robots", 広島大学東千田未来創成センター.
- 2019/8/30: 大阪大学 数理・データ科学研究センター
データ科学特論I
(集中講義),「機械学習のためのガウス過程とその応用」.
- 2019/7/24: ISBA East Asian Chapter, "High-dimensional motion segmentation
with semi-Markov Latent Gaussian Processes", Kobe University.
- 2019/7/22 : NAIST データサイエンス特別講義, 「ガウス過程によるロボットの「動作」の学習」, 奈良先端科学技術大学院大学.
- 2019/6/21: 電気通信大学 情報数理工学セミナー,
「ガウス過程による「動作」の学習」.
- 2019/5/30: University of Bristol, Jean Golding Institute,
"High Dimensional and Bayesian Inference toward Quantifying Real-World
Uncertainties" Workshop,
"High-dimensional motion segmentation with semi-Markov Latent Gaussian
processes".
- 2019/2/12: 東北大学大学院情報科学研究科数学教室 講演会,
「階層Pitman-Yor過程による半教師あり形態素解析」.
- 2018/10/19: 東京大学経済学部 応用統計学ワークショップ,
「無限木構造隠れMarkovモデルとその周辺」.
- 2018/10/1:
The Workshop on Language and Robotics at IROS 2018,
"Inducing Motions from Movements".
- 2018/8/31: 日本学術会議公開シンポジウム
"新たな発見をもたらす科学における計測と予知・予測" 招待講演,
「無限木構造隠れMarkovモデルと言語およびエピゲノム解析への応用」.
- 2018/8/27: 電子情報通信学会 音声研究会(SP)招待講演,
「積モデルと半教師あり形態素解析」.
- 2018/8/10: 統計・機械学習若手シンポジウム 2018 チュートリアル,
「自然言語処理と統計・機械学習」.
- 2017/7/25: 大阪大学 大学院基礎工学研究科 数理・データ科学セミナー,
「無限次元離散分布と無限木構造隠れMarkovモデル」.
- 2017/5/17: ATR「脳型情報処理とその応用」mini workshop,
「無限木構造隠れMarkovモデルとその周辺」.
- 2017/4/17: NYU Shanghai, Center for Data Science talk,
"Bayesian Unsupervised Word Segmentation and Beyond".
- 2016/12/13: 情報理論研究会 若手研究者のための講演会 (SITA 2016併設),
「統計的自然言語処理と情報理論」.
- 2016/9/26: 早稲田大学理工学術院 浜田研究室(バイオインフォマティクス)
講演, 「無限次元離散分布と無限木構造隠れMarkovモデル」.
- 2016/9/8: 第34回日本ロボット学会学術講演会 (RSJ2016),
「ロボティクスと言語における統計的分節化」.
- 2016/8/10: 統計サマーセミナー2016,
「無限次元離散分布と無限木構造隠れMarkovモデル」.
- 2015/2/26: ウイリアム王子来日記念 日英Big Data Workshop
"Innovation is GREAT" 講演, "Nonparametric Bayesian methods in Audio and Language processing".
- 2014/7/28: International Workshop on Spatial and Temporal Modeling from Statistical, Machine Learning and Engineering Perspectives (STM2014),
"Multiresolution Log Gaussian Cox Point Processes".
- 2014/6/13: 統計数理研究所オープンハウス2014 特別講演, 「音楽と言語へのベイズ統計的アプローチ」.
- 2013/12/6: IFAT研究会情報アクセスシンポジウム2013,
「グラフィカルモデルと情報検索」.
[PDF]
- 2013/11/22: 豊田中央研究所, 「統計的トピックモデルとその周辺」.
- 2013/11/10: IBIS2013 第2回IBISMLチュートリアル,
「機械学習に基づく自然言語処理―教師なし学習と最近の話題―」.
- 2013/5/12: 音学シンポジウム2013 (情報処理学会SIGMUS99)
「音楽・音声処理と統計的自然言語処理」.
- 2013/3/27: 日本ロボット学会 データ工学ロボティックス研究専門委員会 一般公開講演会,
「教師なし形態素解析とその周辺」.
[PDF]
- 2013/3/1: 統数研 統計的機械学習研究センター"統計的機械学習の数理とその応用"ワークショップ,
「単語の意味空間のベイズ学習」.
- 2012/6/29: 電気情報通信学会 パターン認識・メディア理解研究会(PRMU)招待講演,
「連続値と統計的自然言語処理」.
- 2011/10/3: IBM東京基礎研究所, "Nonparametric Bayesian Methods in
Language Modeling".
- 2011/01/19: 統計数理研究所
第2回Statistical Machine Learning Seminar.
"Unsupervised and Semi-supervised learning of Nonparametric Bayesian
word segmentation".
- 2010/06/26: 計測制御学会 第46回自律分散システム部会研究会講演,
「ベイズ教師なし形態素解析とその周辺」.
- 2009/11/27: 産業技術総合研究所
メディアインタラクション研究グループ,
「ノンパラメトリックベイズ法による言語モデル」.
- 2009/09/08: 2009年度統計関連学会連合大会 企画セッション "Bayes統計モデル
のための計算技法とその応用"講演,
「ノンパラメトリックベイズ法による教師なし形態素解析」.
- 2008/10/29: IBIS 2008, 企画セッション「ノンパラメトリックベイズ」.
"Nonparametric Bayes for Non-Bayesians".
(オープニング)
- 2008/5/23: The Hong Kong University of Science and Technology,
"Nonparametric Bayesian Methods in Language Modeling".
- 2008/2/13: University of Tokyo, Tokyo Forum on Advanced NLP and TM
(T-FaNT2),
"Present and Future of Text Modeling".
- 2008/1/28: University of British Columbia,
LCI Forum,
"Infinite Markov Models and Related Topics / Unknown Targets and Patterns of Dynamics".
- 2007/08/21: 統計数理研究所, Workshop on Bayesian Inference,
"The Infinite Markov Model: A Nonparametric Bayesian approach".
- 2006/10/11: 電気情報通信学会 ニューロコンピューティング研究会 招待講演,
「自然言語処理におけるベイズ統計」
- 2006/03/13: 言語処理学会第12回年次大会チュートリアル,
「Topicに基づく統計的言語モデルの最前線 ―PLSIからHDPまで―」
山本幹雄, 持橋大地.
- 2005/09/20: Google 東京研究開発センター, "Context Modeling and Adaptive
Statistical Language Modeling".
Books and Magazines
- 「特集: データサイエンスと数理モデル」
(特集全体企画).
「数理科学」2024年4月号, サイエンス社.
担当記事: 「教科書にない自然言語処理」
- 「大規模言語モデル(LLM)とロボティクス」.
日本ロボット学会誌 Vol.40, No.10, 2022, to appear.
- 「「言語統計力学」=言語学・自然言語処理・物理学」.
言語処理学会誌 Vol.29, No.3, pp.1030-1036, 2022.
- 「ロボティクスと自然言語処理」(特集 ロボットと言語).
日本ロボット学会誌 Vol.39, No.5, pp.399-404, 2021.
-
「ロボティクス・グラウンディングと自然言語処理」.
「自然言語処理」学会記事, 言語処理学会. Vol.27, No.4, pp.963-968, 2020.
-
講談社機械学習プロフェッショナルシリーズ「ガウス過程と機械学習」.
持橋大地・大羽成征 (共著), 2019-3-9発売, 2019.
[サポートページ]
- 「言語とテキストの機械学習」.
「数理科学」2018年8月号 pp.32-37, 特集: 機械学習の数理, 2018.
- 「言葉は数字」,
立川情報紙「えくてびあん」2018年6月号インタビュー.
-
「ベイズモデリングの世界」. 伊庭幸人編, 岩波書店, 2018.
[サポートページ]
数学セミナー2007年11月号『生きたことばをモデル化する』を加筆・再録.
-
「人工知能学大事典」, 人工知能学会編, 共立出版, pp.604-607, 2017.
8-4節「言語モデル」を担当.
- 「岩波データサイエンス Vol.2 [特集] 統計的自然言語処理―ことばを扱う機械」.
特集企画および執筆分担. 岩波書店, 2016.
[サポートサイト]
岩波データサイエンスVol.2「統計的自然言語処理」刊行記念イベント動画
(2016/3/3, グラントウキョウサウスタワー41F,
後援: リクルートコミュニケーションズ(株))
- 「自然言語処理と統計的グラウンディング・推論」.
日本ロボット学会誌 Vol.33, No.2, 特集"データサイエンス研究の
ロボティクス応用にむけて", pp.77-81, 2015.
-
「統計的自然言語処理と機械学習」.
映像情報メディア学会誌 Vol.69, No.2, 特集"メディア処理のための機械学習",
pp.131-135, 2015.
- 「確率と統計の科学でヒトのことばの謎を解く」.
「大学への数学」2014年9月号 pp.68-71, "ふしぎの国のスウガク使い".
-
「統計的学習の基礎―データマイニング・推論・予測―」
(Elements of Statistical Learning).
Trevor Hastie, Robert Tibshirani, Jerome Friedman著,
杉山将, 井手剛, 神嶌敏弘, 栗田多喜夫, 前田英作監訳.
共立出版, 2014.
9章「加法的モデル, 木, および関連手法」の翻訳を担当.
-
「応用数理ハンドブック」, 日本応用数理学会監修, 薩摩順吉, 大石進一,
杉原正顕編, 朝倉書店, pp.584-585, 2013.
"ベイズ推定"の項目を担当.
- 「統計的自然言語処理と機械学習・統計学の未来」.
人工知能学会誌 27巻3号, 特集「ポスト経験主義の言語処理」, pp.284-287,
2012.
-
「最近のベイズ理論の進展と応用(III) ―ノンパラメトリックベイズ―」.
電子情報通信学会誌 2010年1月号 (Vol.93 No.1) pp.73-79, 2010.
-
「言語処理学事典」, 言語処理学会編, pp.118-137, 2009.
2.1中項目「言語モデル」編集, 2.1.6節執筆.
-
「パターン認識と機械学習:ベイズ理論による統計的予測」(上)(下)
(Pattern Recognition and Machine Learning).
Christopher M. Bishop著,
元田浩, 栗田多喜夫, 樋口知之, 松本裕治, 村田昇 (編),
赤穂昭太郎, 神嶌敏弘, 杉山将, 小野田崇, 池田和司, 鹿島久嗣, 賀沢秀人,
中島伸一, 竹内純一, 持橋大地, 小山聡, 井手剛, 篠田浩一, 山川宏 (訳).
Springer 2007, 2008.
10章「近似推論法」の翻訳を担当.
-
「生きた言葉をモデル化する ― 自然言語処理と数学の接点」.
月刊『数学セミナー』2007年11月号pp.37-43,
特集 "統計科学のすすめ [その2]".
Notes
Selected Slides
- "「高度な電卓」としての人工知能:生成AIと教育"」
東京都立小石川中等教育学校 PTA講演会. 2023-11-11, 2023.
- 論文紹介: "Locally Typical Sampling"
(Meister+, TACL 2023)
第15回最先端NLP勉強会, 2023.
- "「見えないデータ」を推定する".
東京都立小石川中等教育学校SSH 「小石川フィロソフィーIV」講演, 2022-9-7, 2022.
-
"Introduction to Pólya-Gamma distribution".
SVM 2017 (NAIST cl-lab Summer Camp), 2017.
- 論文紹介: "Kernelized Bayesian
Softmax for Text Generation" (Miao+, NeurIPS 2019)
第12回最先端NLP勉強会, 2020-9-25, 2020.
- 「カーネル法とガウス過程の関係について」.
NAIST松本研究室 SVM勉強会2018, 2018.
- 論文紹介: "A simple but tough-to-beat baseline for sentence embeddings" (Arora+, ICLR 2017)
第10回最先端NLP勉強会, 2018-8-4, 2018.
- 「変分ベイズ法からVAEへ」
首都大小町研究室講義, 2018-2-6, 2018.
-
論文紹介: "A Latent Variable Model Approach to PMI-based Word Embeddings"
(TACL 2016)
第8回最先端NLP勉強会, 2016-9-11, 2016.
- 論文紹介: "A Log-Linear Model
for Unsupervised Text Normalization" (EMNLP 2013)
TokyoCL 第2回勉強会, 2015-11-20, 2015.
-
論文紹介: "Neural CRF Parsing" (ACL 2015)
第7回最先端NLP勉強会, 2015-8-29, 2015.
-
「離散データの確率的トピックモデル」. [講義録]
"生物に見られる時空間パターンと統計数理:同調・認知・行動"研究集会
招待講演, 統計数理研究所, 2015-1-6, 2015.
- 論文紹介:"Grounded Language Learning
from Video Described with Sentences" (ACL2013)
第5回最先端NLP勉強会, 2013-8-31, 2013.
- 「統計的自然言語処理におけるMCMC法」
統計数理研究所 MCMC2009研究会, 2010-2-21, 2010.
- "Introduction and Advances in Gaussian
Processes".
SVM 2009 (NAIST cl-lab Summer Camp), 2009.
- "Contrastive Divergence Learning,
Product Models, and Deep Belief Nets"
SVM 2008 (NAIST cl-lab Summer Camp), 2008.
- 「GaP, NMF, and more」
NAIST DMLA 勉強会資料, 2006-5-19, 2006.
-
"Introduction to Hierarchical Pitman-Yor Processes"
"Ultraconservative" SVM 2006 (NAIST cl-lab Summer Camp), 2006.
-
「Topicに基づく統計的言語モデルの最前線 ―PLSIからHDPまで―」
山本幹雄, 持橋大地.
言語処理学会第12回年次大会チュートリアル資料 pp.11-28, 2006.
- 「自然言語処理のための変分ベイズ法」
ATR SLC internal seminar, 2005.
- 「言語モデル」
NAIST cl-lab Doctor Lecture series, 2004.
-
"Latent Dirichlet kernel & Bayesian kernels"
ÜberSVM2004 (Machine Learning summer camp of cl-lab OB/OG's), 2004.
-
"Bayesian Replacement for Good-Turing" (Introduction to MacKay (1994)
"Hierarchical Dirichlet Language Model")
ÜberSVM2004 (Machine Learning summer camp of cl-lab OB/OG's), 2004.
最先端NLP勉強会での論文紹介スライドをまとめたものは
こちら.
Softwares
- bpcfg-0.5
Bayesian PCFG for unsupervised grammar induction
(Johnson, Griffiths, Goldwater 2007).
- ldab-0.1
LDA with a background distribution. Works directly on plain text.
- bhmm.py-0.2
Bayesian HMM in Python. (for educational and research purposes)
- lightlda.sh-0.1
Simple wrapper scripts for easy usage of
LightLDA
(WWW 2015) as lda-0.2 below.
- lda.py-0.2
A simple Cython implementation of LDA, basically for learning and
extension.
- gamglm-0.1
Gamma generalized linear model of huge number of features.
- rsm-0.1
A modified Python implementation of Replicated Softmax Model
(Salakhutdinov and Hinton, NIPS 2009).
- lwlm-0.1
The Latent Words Language Model (Deschacht and Moens, EMNLP 2009),
full Bayesian package.
- lda-0.2
A Latent Dirichlet Allocation package in MATLAB and C.
- dm-0.2
A Dirichlet Mixtures toolkit in C.
- bsets-0.1
"Bayesian Sets" (Ghahramani and Heller, 2005) algorithm in MATLAB.
- matlab-hash-0.2.tar.gz
A hashtable implementation in MATLAB.
- matlab-text-0.1.tar.gz
Text handling utilities in MATLAB, to use with matlab-hash.
- math++.el
Provides an "inferior Mathematica" mode, similarly as cmuscheme.el.
daichi<at>ism.ac.jp
Last modified: Tue Oct 8 09:19:28 2024