スパイキングニューラルネットワークと報酬調節シナプス可塑性に基づく強化学習

鶴海 杭之

(指導教員:田中 剛平 特任准教授/ 数理生命情報学研究室

資料PDF(tsurumi.pdf
研究概要

XOR問題の実験における報酬の推移の例
入力層・中間層・出力層からなるスパイキングニューラルネットワークと,シナプス可塑性に基づく学習則であるreward-modulated STDPを用いた強化学習において,ネットワークの結合構造や可塑性の適用の仕方が学習性能にどう影響するかを調べた.
修論の感想

スパイキングニューラルネットワークのパラメータの調整が大変だったが,なんとか結論を出すことができた.


>
ISTyくん