東京大学
| ENGLISH | サイトマップ |
東京大学 大学院 情報理工学系研究科
交通アクセス・学内地図
訪問者別ご案内
受験・進学希望の方
留学生の方
(For International Students)
企業・一般の方
修了者の方
高校生の方
大学生の方
教育と研究
研究科案内
各専攻・教員の紹介
 
コンピュータ科学
  数理情報学
  システム情報学
  電子情報学
  知能機械情報学
  創造情報学
連携講座等 (工事中)
国際交流
(International Relations)
人材養成プログラム
魅力ある大学院教育
イニシアティブ
21世紀COEプログラム
入学・進学案内
科目履修生案内
産学連携
公募情報
情報理工システム管理室
(内部のみ)
ポータルサイト (内部のみ)
学生情報システム (内部のみ)
情報理工内部ページ (内部のみ)
関連学部
工学部
理学部
Home > 教育と研究 > 研究科案内 > 専攻と講義科目 >数理情報学
教育と研究

数理情報学
専攻の目的Department Objective教員と研究室Faculty and Labs講義
学位論文(修士)学位論文(博士)入試案内お知らせ
Technical Reports計数工学科数理情報工学コース

>> 学位論文(修士)へ戻る

Machine Learning of Probabilistic Generative Model Based on Bayesian Nonparametrics(ベイジアンノンパラメトリクスに基づく確率的生成モデルの機械学習)

名前

(指導教員:中川 裕志 教授/数理言語情報学研究室
資料PDF(sato.pdf
研究概要

同じ文脈を持つ単語は,似た意味を持つ傾向にあるという仮説 "Distributional Hypothesis" をノンパラメトリックベイズモデルによりモデル化し,新聞記事から類義語の自動抽出を行った."似た意味"の解釈を,単語の潜在的なトピックが同じであると仮定し,その潜在的トピックを推定する手法を提案した.単語の文脈として、直前のn単語を考慮するためにSuffix tree上にトピックの確率分布を仮定するモデルと構文情報を考慮するためにグラフのノード上にトピックの確率分布を仮定するモデルを提案し,WordNetと呼ばれる辞書を用いて評価した.
修論の感想

類義語の抽出は,重要な研究であるが,評価方法も確立されておらず,非常に難しいタスクであることがわかった.
page top



大学院 情報理工学系研究科 お問い合せ先 東京大学