山口研究室 OB・OG諸氏
専攻科 卒業生
卒業年度 | 氏 名 | 研究テーマ |
---|---|---|
1999 | 内田 圭 (Kei UCHIDA) |
Self-Rewarded RAE:学習の合理性と高速性を両立させた経験強化型学習法 |
2000 | 石村 健二 (Kenji ISHIMURA) |
RAE-PIA:複数報酬環境下における最適政策の効率的強化学習 |
北村 由紀 (Yuki KITAMURA) |
r-確実探査法における学習環境の変動点検出手法 | |
渡邊 亮介 (Ryosuke WATANABE) |
同型POMDP学習エージェント集団による大規模離散MDP問題の強化学習 | |
2002 | 天正 新二郎 (Shinjiro TENSYO) |
Undiscounted Prioritized Sweeping -最適政策の優先順序付き強化学習の効率化手法- |
堀口 正一 (Masakazu HORIGUCHI) |
マルチエージェント強化学習における強化信号の役割 | |
2004 | 大西 浩司 (Kouji OHNISHI) |
人間-エージェント間での読心ゲームにおける言い当て行動系列に依存したユーザモデルの推定 |
森田 晋作 (Shinsaku MORITA) |
MDPモデルに基づく強調行動の山登り法的改善 | |
2006 | 小林 幹浩 (Mikihiro KOBAYASHII) |
人とAIBOとのコミュニケーションにおける魅力的な首振り行動の実現 |
佐藤 和宏 (Kazuhiro SATOH) |
対話的強化学習のための多様な解を求める強化学習手法の開発 | |
2007 | 今谷 恵理 (Eri IMATANI) |
2エージェント強化学習における排他的学習法の提案 |
上利 宗久 (Munehisa AGARI) |
ユーザに対する緩やかで自然な適応インタフェースの設計 |
本科5年 卒業生
卒業年度 | 氏 名 | 研究テーマ |
---|---|---|
1998 | 石村 健二 (Kenji ISHIMURA) |
Time-ad-DP法:環境変動を考慮した最適政策の強化学習 |
北村 由紀 (Yuki KITAMURA) |
r-確実探査法:強化学習のための変動する環境下での合理的な環境同定手法 | |
中村 有作 (Yusaku NAKAMURA) |
Q値の変動を考慮したQ分散学習法の提案 | |
渡邊 亮介 (Ryosuke WATANABE) |
LD-LMS法:報酬からの距離と期待値との強化学習 | |
1999 | 後藤 慎吾 (Shingo GOTO) |
感情的リアクションを導入したマルチエージェントモデルによる多様なインタラクションの実現 |
谷元 昭文 (Akifumi TANIMOTO) |
逆伝播法による報酬獲得効率の高速かつ柔軟な強化学習手法の提案 | |
出水 将樹 (Masaki DEMIZU) |
強化信号の送受信による相互作用的マルチエージェント強化学習 | |
中越 康太 (Kota NAKAGOSHI) |
中間目標を用いた協調行動の強化学習の高速化 | |
藤原 哲也 (Tetsuya FUJIWARA) |
重み付きk-確実探査法を用いた相手モデルの同定 | |
2000 | 弦川 浩尚 (Hirotaka TSURUKAWA) |
POMDPモデルによる大規模MDP環境の近似的な強化学習法 |
天正 新二郎 (Shinjiro TENSYO) |
優先掃き出し法による最適政策の効率的な強化学習 | |
堀口 正一 (Masakazu HORIGUCHI) |
ミラーエージェント:ユーザの行動履歴を可視化するユーザ支援システムの提案 | |
丸川 亨 (Toru MARUKAWA) |
動機付けルールを用いた相互作用的マルチエージェント強化学習 | |
2001 | 越智 悠太 (Yuta OCHI) |
相互適応型インタフェースのフレームワーク |
誉田 太朗 (Taro KONDA) |
LC-learning : モデルに基づく段階的平均報酬強化学習手法 | |
中尾 友圭子 (Yukako NAKAO) |
マルチエージェント強化学習における協調行動学習の分析 | |
2002 | 岡本 正吾 (Shogo OKAMOTO) |
多様な協調行動獲得のための段階的行動決定システム |
西川 猛司 (Takeshi NISHIKAWA) |
確率的環境下での平均獲得報酬の最大化 | |
森田 晋作 (Shinsaku MORITA) |
大局的ゴールからの多様な協調サブゴールの生成 | |
2003 | 粟野 道保 (Michiho AWANO) |
多様な協調獲得のための段階的行動決定における下位階層の設計 |
楠本 彬 (Akira KUSUMOTO) |
確率的環境における最適政策探索の効率化 | |
村松 孝俊 (Takatoshi MURAMATU) |
ペットロボットと人間における円滑なコミュニケーション形成に関する研究 | |
米里 吉雄 (Yoshio YONEZATO) |
人間・エージェント間でのマインドマッピングの学習によるコミュニケーションの円滑化 | |
2004 | 赤坂 清隆 (Kiyotaka AKASAKA) |
ロボットをペットのようにしつけるための対話的強化学習システム |
上利 宗久 (Munehisa AGARI) |
視線行動の可視化による着眼スキル発想支援 | |
佐藤 和宏 (Kazuhiro SATOH) |
確率的環境における最適政策探索の効率化 | |
井澤 潤 (Jun IZAWA) |
環境の違いを反映した政策獲得のための報酬設計法 | |
吉田 善紀 (Yoshinori YOSHIDA) |
マルチエージェント強調学習におけるMultiple Timescales探査戦略 | |
2005 | 今谷 恵理 (Eri IMATANI) |
複合スケールPIAによるマルチエージェント学習の実現 |
衛藤 聡美 (Satomi ETOH) |
言い当てゲームにおける自然なコミュニケーションの実現 | |
松尾 隆佑 (Ryusuke MATSUO) |
ユーザが扱いやすい対話的強化学習システム | |
2006 | 衛藤 聖 (Hijiri ETOH) |
現目標列に対する寄り道解学習のための予測目標の生成 |
福井 梨恵 (Rie FUKUI) |
ユーザが適応しやすい学習型アンケートシステムの作成と評価 | |
松本 悠希 (Yuki MATSUMOTO) |
競争タスクにおける経験強化型行動学習の性能分析 | |
山本 優美 (Yumi YAMAMOTO) |
アイコンタクトを用いた人と犬型ロボットAIBOとの相互作用 | |
2007 | 井手ノ上 勇貴 (Yuki IDENOUE) |
色情報を用いた顔の向き推定 |
戎 昌也 (Masaya EBISU) |
相手に好かれるための犬型ロボットの振舞い方 | |
西村 卓馬 (Takuma NISHIMURA) |
ユーザに対する多様な旅行プランの推薦手法 | |
水谷 真人 (Masato MIZUTANI) |
ユーザの入力に適応する回答支援システムの作成と評価 |