2001年
- 2001年3月6日(火) 9:00〜17:00, 大阪大学工学部 吹田キャンパス,
電子情報通信学会 関西支部 学生会, 学生研究発表講演会
- 石村 健二,山口 智浩, RAE-PIA: 複数報酬環境下における最適政策の効率的強化学習
- 北村 由紀,山口 智浩, r-確実探査法:学習環境の変動点推定による最近データでの強化学習
- 渡辺 亮介,山口 智浩,同型POMDP学習エージェント集団による大規模離散MDP問題の強化学習
- 天正 新二郎,山口 智浩,優先掃き出し法による最適政策の効率的な強化学習
- 堀口 正一,山口 智浩ミラーエージェント:ユーザの行動履歴を可視化するユーザ支援システムの提案
- 2001年3月8日(木) 10:00〜17:00, 中央電気倶楽部 ,
電気学会関西支部,平成12年度(第8回)高専卒業研究発表会,
大阪中央電気倶楽部511会議室 (大阪市北区堂島浜2-1-25)
(堂島地下街南詰を右に上がり、右へ50m、左側の煉瓦造り建物)
- 弦川 浩尚,山口 智浩,POMDPモデルによる大規模MDP環境の近似的な強化学習法,
電気学会関西支部
平成12年度(第8回)高専卒業研究発表会, pp.-, 2001.3.8
- 丸川 亨,山口 智浩,動機付けルールを用いた相互作用的マルチエージェント強化学習,
電気学会関西支部
平成12年度(第8回)高専卒業研究発表会, pp.-, 2001.3.8
- 2001年5月23日(水)〜25日(金) 2001年度人工知能学会全国大会(第15回),2001.5.23-25
- 渡辺, 亮介,堀口, 正一,山口,
智浩,同型POMDPエージェント集団による大規模MDPの強化学習
2001年度人工知能学会全国大会(第15回),2001.5.23-25
- 石村, 健二,天正, 新二郎,山口, 智浩, RAE-PIA:
複数報酬環境下における最適政策の効率的強化学習
2001年度人工知能学会全国大会(第15回),2001.5.23-25
2000年
- 北村 由紀,強化学習における重み付け同定による同定精度と探索効率との両立,
Be Ambitious Conference 2000 in
Kyoto(BAC2000), p.17-18, 2000.4.20-21
- 石村 健二,RAE-PIA:報酬獲得効率を最大化する政策の強化学習,
Be Ambitious Conference 2000 in
Kyoto(BAC2000), p.51-52, 2000.4.20-21
- 渡邊 亮介,他者評価を考慮することによる,協調行為の創発,
Be Ambitious Conference 2000 in
Kyoto(BAC2000), p.61-62, 2000.4.20-21
- 出水 将樹,山口 智浩,強化信号の送受信による相互作用的マルチエージェント強化学習,
電気学会関西支部
平成11年度(第7回)高専卒業研究発表会, 2000.3.3
- 谷元 昭文,山口 智浩,逆伝播法による報酬獲得効率の高速かつ柔軟な強化学習手法の提案,
電気学会関西支部
平成11年度(第7回)高専卒業研究発表会, pp.25-26, 2000.3.3
1999年
- 内田 圭,渡邊 亮介,山口 智浩,Self-Rewarded
RAE:学習の合理性と高速性を両立させた経験強化型学習法,
第13回人工知能学会全国大会論文集 ,pp.281-283, 1999
- 北村 由紀,r-確実探査法:強化学習のための変動する環境下での合理的な環境同定手法,
教育システム情報学会 関西支部
第13回学生によるコンピュータ利用研究発表会,p.21, 1999.3.13
- 渡邊 亮介,LD-LMS法:報酬からの距離と期待値との強化学習,
教育システム情報学会 関西支部
第13回学生によるコンピュータ利用研究発表会,p.22, 1999.3.13
- 石村 健二,Time-ad-DP法:環境変動を考慮した最適政策の強化学習,
教育システム情報学会 関西支部
第13回学生によるコンピュータ利用研究発表会,p.23, 1999.3.13
1998年
1997年
- (山口先生が奈良高専情報工学科にこられる。山口研究室の開始。)