山口智浩研究室

２００１年３月６日(火)　９：００～１７：００，大阪大学工学部吹田キャンパス，
電子情報通信学会　関西支部　学生会，学生研究発表講演会
- 石村健二，山口智浩， RAE-PIA: 複数報酬環境下における最適政策の効率的強化学習
- 北村由紀，山口　智浩， r-確実探査法：学習環境の変動点推定による最近データでの強化学習
- 渡辺亮介，山口　智浩，同型POMDP学習エージェント集団による大規模離散MDP問題の強化学習
- 天正　新二郎，山口　智浩，優先掃き出し法による最適政策の効率的な強化学習
- 堀口正一，山口　智浩ミラーエージェント:ユーザの行動履歴を可視化するユーザ支援システムの提案
２００１年３月８日(木) １０：００～１７：００，中央電気倶楽部，
電気学会関西支部，平成１２年度(第８回)高専卒業研究発表会,
大阪中央電気倶楽部５１１会議室 (大阪市北区堂島浜2-1-25)
　　　（堂島地下街南詰を右に上がり、右へ５０ｍ、左側の煉瓦造り建物）
- 弦川浩尚，山口智浩，POMDPモデルによる大規模MDP環境の近似的な強化学習法，
  電気学会関西支部平成１２年度(第８回)高専卒業研究発表会, pp.-, 2001.3.8
- 丸川亨，山口智浩，動機付けルールを用いた相互作用的マルチエージェント強化学習，
  電気学会関西支部平成１２年度(第８回)高専卒業研究発表会, pp.-, 2001.3.8
２００１年５月２３日(水)～２５日(金) 2001年度人工知能学会全国大会（第15回），2001.5.23-25
- 渡辺, 亮介，堀口, 正一，山口, 智浩，同型POMDPエージェント集団による大規模MDPの強化学習
  2001年度人工知能学会全国大会（第15回），2001.5.23-25
- 石村, 健二，天正, 新二郎，山口, 智浩， RAE-PIA: 複数報酬環境下における最適政策の効率的強化学習
  2001年度人工知能学会全国大会（第15回），2001.5.23-25

北村由紀，強化学習における重み付け同定による同定精度と探索効率との両立，
Be Ambitious Conference 2000 in Kyoto(BAC2000), p.17-18, 2000.4.20-21
石村健二，RAE-PIA:報酬獲得効率を最大化する政策の強化学習,
Be Ambitious Conference 2000 in Kyoto(BAC2000), p.51-52, 2000.4.20-21
渡邊亮介，他者評価を考慮することによる，協調行為の創発,
Be Ambitious Conference 2000 in Kyoto(BAC2000), p.61-62, 2000.4.20-21
出水将樹，山口智浩，強化信号の送受信による相互作用的マルチエージェント強化学習,
電気学会関西支部平成１１年度(第７回)高専卒業研究発表会, 2000.3.3
谷元昭文，山口智浩，逆伝播法による報酬獲得効率の高速かつ柔軟な強化学習手法の提案，
電気学会関西支部平成１１年度(第７回)高専卒業研究発表会, pp.25-26, 2000.3.3

内田圭，渡邊亮介，山口智浩，Self-Rewarded RAE:学習の合理性と高速性を両立させた経験強化型学習法，
第１３回人工知能学会全国大会論文集 ,pp.281-283, 1999
北村由紀，r-確実探査法：強化学習のための変動する環境下での合理的な環境同定手法，
教育システム情報学会関西支部第１３回学生によるコンピュータ利用研究発表会，p.21, 1999.3.13
渡邊亮介，LD-LMS法：報酬からの距離と期待値との強化学習，
教育システム情報学会関西支部第１３回学生によるコンピュータ利用研究発表会，p.22, 1999.3.13
石村健二，Time-ad-DP法：環境変動を考慮した最適政策の強化学習，
教育システム情報学会関西支部第１３回学生によるコンピュータ利用研究発表会，p.23, 1999.3.13

山口智浩研究室 How is AI-LIFE ?

山口智浩研究室
How is AI-LIFE ?