東京大学大学院情報理工学系研究科

交通アクセス・学内地図

受験・進学希望の方

留学生の方

（For International Students）

		コンピュータ科学
		数理情報学
		システム情報学
		電子情報学
		知能機械情報学
		創造情報学

連携講座等　（工事中）

国際交流

（International Relations）

（内部のみ）

ポータルサイト　（内部のみ）

学生情報システム　（内部のみ）

情報理工内部ページ　（内部のみ）

工学部

理学部

Home > 教育と研究 > 研究科案内 > 専攻と講義科目 >数理情報学




	｜専攻の目的｜ Department Objective ｜教員と研究室｜ Faculty and Labs ｜講義｜｜学位論文（修士）｜学位論文（博士）｜入試案内｜お知らせ｜｜ Technical Reports ｜計数工学科数理情報工学コース｜

>> 学位論文（修士）へ戻る

Machine Learning of Probabilistic Generative Model Based on Bayesian Nonparametrics（ベイジアンノンパラメトリクスに基づく確率的生成モデルの機械学習）

名前

（指導教員：中川裕志教授／数理言語情報学研究室）

資料PDF（sato.pdf）

研究概要

同じ文脈を持つ単語は，似た意味を持つ傾向にあるという仮説 "Distributional Hypothesis" をノンパラメトリックベイズモデルによりモデル化し，新聞記事から類義語の自動抽出を行った．"似た意味"の解釈を，単語の潜在的なトピックが同じであると仮定し，その潜在的トピックを推定する手法を提案した．単語の文脈として、直前のn単語を考慮するためにSuffix tree上にトピックの確率分布を仮定するモデルと構文情報を考慮するためにグラフのノード上にトピックの確率分布を仮定するモデルを提案し，WordNetと呼ばれる辞書を用いて評価した．

修論の感想

類義語の抽出は，重要な研究であるが，評価方法も確立されておらず，非常に難しいタスクであることがわかった．