山口智浩研究室 -OB・OG諸氏ー

山口研究室　OB・OG諸氏

専攻科　卒業生

卒業年度	氏　　名	研究テーマ
1999	内田　圭　（Kei UCHIDA）	Self-Rewarded RAE:学習の合理性と高速性を両立させた経験強化型学習法
2000	石村　健二　（Kenji ISHIMURA）	RAE-PIA：複数報酬環境下における最適政策の効率的強化学習
	北村　由紀　（Yuki KITAMURA）	r-確実探査法における学習環境の変動点検出手法
	渡邊　亮介　（Ryosuke WATANABE）	同型POMDP学習エージェント集団による大規模離散MDP問題の強化学習
2002	天正　新二郎　（Shinjiro TENSYO）	Undiscounted Prioritized Sweeping -最適政策の優先順序付き強化学習の効率化手法-
2002	堀口　正一　（Masakazu HORIGUCHI）	マルチエージェント強化学習における強化信号の役割
2004	大西　浩司　（Kouji OHNISHI）	人間-エージェント間での読心ゲームにおける言い当て行動系列に依存したユーザモデルの推定
2004	森田　晋作　（Shinsaku MORITA）	MDPモデルに基づく強調行動の山登り法的改善
2006	小林　幹浩　（Mikihiro KOBAYASHII）	人とAIBOとのコミュニケーションにおける魅力的な首振り行動の実現
2006	佐藤　和宏　（Kazuhiro SATOH）	対話的強化学習のための多様な解を求める強化学習手法の開発
2007	今谷　恵理　（Eri IMATANI）	2エージェント強化学習における排他的学習法の提案
2007	上利　宗久　（Munehisa AGARI）	ユーザに対する緩やかで自然な適応インタフェースの設計

本科5年　卒業生

卒業年度	氏　　名	研究テーマ
1998	石村　健二　（Kenji ISHIMURA）	Time-ad-DP法：環境変動を考慮した最適政策の強化学習
	北村　由紀　（Yuki KITAMURA）	r-確実探査法：強化学習のための変動する環境下での合理的な環境同定手法
	中村　有作　（Yusaku NAKAMURA）	Q値の変動を考慮したQ分散学習法の提案
	渡邊　亮介　（Ryosuke WATANABE）	LD-LMS法：報酬からの距離と期待値との強化学習
1999	後藤　慎吾　（Shingo GOTO）	感情的リアクションを導入したマルチエージェントモデルによる多様なインタラクションの実現
	谷元　昭文　（Akifumi TANIMOTO）	逆伝播法による報酬獲得効率の高速かつ柔軟な強化学習手法の提案
	出水　将樹　（Masaki DEMIZU）	強化信号の送受信による相互作用的マルチエージェント強化学習
	中越　康太　（Kota NAKAGOSHI）	中間目標を用いた協調行動の強化学習の高速化
	藤原　哲也　（Tetsuya FUJIWARA）	重み付きk-確実探査法を用いた相手モデルの同定
2000	弦川　浩尚　（Hirotaka TSURUKAWA）	POMDPモデルによる大規模MDP環境の近似的な強化学習法
	天正　新二郎　（Shinjiro TENSYO）	優先掃き出し法による最適政策の効率的な強化学習
	堀口　正一　（Masakazu HORIGUCHI）	ミラーエージェント：ユーザの行動履歴を可視化するユーザ支援システムの提案
	丸川　亨　（Toru MARUKAWA）	動機付けルールを用いた相互作用的マルチエージェント強化学習
2001	越智　悠太　（Yuta OCHI）	相互適応型インタフェースのフレームワーク
	誉田　太朗　（Taro KONDA）	LC-learning ：モデルに基づく段階的平均報酬強化学習手法
	中尾　友圭子　（Yukako NAKAO）	マルチエージェント強化学習における協調行動学習の分析
2002	岡本　正吾　（Shogo OKAMOTO）	多様な協調行動獲得のための段階的行動決定システム
	西川　猛司　（Takeshi NISHIKAWA）	確率的環境下での平均獲得報酬の最大化
	森田　晋作　（Shinsaku MORITA）	大局的ゴールからの多様な協調サブゴールの生成
2003	粟野　道保　（Michiho AWANO）	多様な協調獲得のための段階的行動決定における下位階層の設計
	楠本　彬　（Akira KUSUMOTO）	確率的環境における最適政策探索の効率化
	村松　孝俊　（Takatoshi MURAMATU）	ペットロボットと人間における円滑なコミュニケーション形成に関する研究
	米里　吉雄　（Yoshio YONEZATO）	人間・エージェント間でのマインドマッピングの学習によるコミュニケーションの円滑化
2004	赤坂　清隆　（Kiyotaka AKASAKA）	ロボットをペットのようにしつけるための対話的強化学習システム
	上利　宗久　（Munehisa AGARI）	視線行動の可視化による着眼スキル発想支援
	佐藤　和宏　（Kazuhiro SATOH）	確率的環境における最適政策探索の効率化
	井澤　潤　（Jun IZAWA）	環境の違いを反映した政策獲得のための報酬設計法
	吉田　善紀　（Yoshinori YOSHIDA）	マルチエージェント強調学習におけるMultiple Timescales探査戦略
2005	今谷　恵理　（Eri IMATANI）	複合スケールPIAによるマルチエージェント学習の実現
	衛藤　聡美　（Satomi ETOH）	言い当てゲームにおける自然なコミュニケーションの実現
	松尾　隆佑　（Ryusuke MATSUO）	ユーザが扱いやすい対話的強化学習システム
2006	衛藤　聖　（Hijiri ETOH）	現目標列に対する寄り道解学習のための予測目標の生成
	福井　梨恵　（Rie FUKUI）	ユーザが適応しやすい学習型アンケートシステムの作成と評価
	松本　悠希　（Yuki MATSUMOTO）	競争タスクにおける経験強化型行動学習の性能分析
	山本　優美　（Yumi YAMAMOTO）	アイコンタクトを用いた人と犬型ロボットAIBOとの相互作用
2007	井手ノ上　勇貴　（Yuki IDENOUE）	色情報を用いた顔の向き推定
	戎　昌也　（Masaya EBISU）	相手に好かれるための犬型ロボットの振舞い方
	西村　卓馬　（Takuma NISHIMURA）	ユーザに対する多様な旅行プランの推薦手法
	水谷　真人　（Masato MIZUTANI）	ユーザの入力に適応する回答支援システムの作成と評価

山口智浩研究室 How is AI-LIFE ?

山口智浩研究室
How is AI-LIFE ?