- 天正 新二郎 (仮)RAE-PIA:複数報酬環境下における最適政策の効率的強化学習
- 堀口 正一 (仮)同型POMDP学習エージェント集団による大規模離散MDP問題の強化学習
- 越智 悠太 感情計算モデルを利用した感情マッピングの相互学習
- 誉田 太朗 (仮)RAE-PIA:複数報酬環境下における最適政策の効率的強化学習
- 中尾 友圭子 (仮)動機付けルールを用いた相互作用的マルチエージェント強化学習
専攻科 卒業生
1999年度
- 内田 圭 Self-Rewarded RAE:学習の合理性と高速性を両立させた経験強化型学習法
2000年度
- 石村 健二 RAE-PIA:複数報酬環境下における最適政策の効率的強化学習
- 北村 由紀 r-確実探査法における学習環境の変動点検出手法
- 渡邊 亮介 同型POMDP学習エージェント集団による大規模離散MDP問題の強化学習
本科5年 卒業生
1998年度
- 石村 健二 Time-ad-DP法:環境変動を考慮した最適政策の強化学習
- 北村 由紀 r-確実探査法:強化学習のための変動する環境下での合理的な環境同定手法
- 中村 有作 Q値の変動を考慮したQ分散学習法の提案
- 渡邊 亮介 LD-LMS法:報酬からの距離と期待値との強化学習
1999年度
- 後藤 慎吾 感情的リアクションを導入したマルチエージェントモデルによる多様なインタラクションの実現
- 谷元 昭文 逆伝播法による報酬獲得効率の高速かつ柔軟な強化学習手法の提案
- 出水 将樹 強化信号の送受信による相互作用的マルチエージェント強化学習
- 中越 康太 中間目標を用いた協調行動の強化学習の高速化
- 藤原 哲也 重み付きk-確実探査法を用いた相手モデルの同定
2000年度
- 弦川 浩尚 POMDPモデルによる大規模MDP環境の近似的な強化学習法
- 天正 新二郎 優先掃き出し法による最適政策の効率的な強化学習
- 堀口 正一 ミラーエージェント:ユーザの行動履歴を可視化するユーザ支援システムの提案
- 丸川 亨 動機付けルールを用いた相互作用的マルチエージェント強化学習