 |
|
 |
留学生の方
(For International Students) |
|
|
|
|
|
|
|
|
 |
 |
Machine Learning of Probabilistic Generative Model Based on Bayesian Nonparametrics(ベイジアンノンパラメトリクスに基づく確率的生成モデルの機械学習) |
名前
(指導教員:中川 裕志 教授/数理言語情報学研究室)
同じ文脈を持つ単語は,似た意味を持つ傾向にあるという仮説 "Distributional Hypothesis" をノンパラメトリックベイズモデルによりモデル化し,新聞記事から類義語の自動抽出を行った."似た意味"の解釈を,単語の潜在的なトピックが同じであると仮定し,その潜在的トピックを推定する手法を提案した.単語の文脈として、直前のn単語を考慮するためにSuffix tree上にトピックの確率分布を仮定するモデルと構文情報を考慮するためにグラフのノード上にトピックの確率分布を仮定するモデルを提案し,WordNetと呼ばれる辞書を用いて評価した.
類義語の抽出は,重要な研究であるが,評価方法も確立されておらず,非常に難しいタスクであることがわかった.
|
 |
|