強化学習における報酬割当ての理論的考察 宮崎和光, 山村雅幸, 小林重信 人工知能学会誌 9 (4), 580-587, 1994 | 142* | 1994 |
マルチエージェント強化学習の方法論: Q-Learning と Profit Sharing による接近 荒井幸代, 宮崎和光, 小林重信 人工知能学会誌 13 (4), 609-618, 1998 | 126* | 1998 |
Reinforcement learning in POMDPs with function approximation H Kimura, K Miyazaki, S Kobayashi ICML 97, 152-160, 1997 | 116 | 1997 |
On the rationality of profit sharing in reinforcement learning K Miyazaki, M Yamamura, S Kobayashi 3rd International Conference on Fuzzy Logic, Neural Nets and Soft Computing …, 1994 | 88 | 1994 |
On the Rationality of Profit Sharing in Reinforcement Learning K MIYAZAKI, M YAMAMURA, S KOBAYASHI | 88* | 1994 |
Profit Sharing に基づく強化学習の理論と応用 宮崎和光, 木村元, 小林重信 人工知能学会誌 14 (5), 800-807, 1999 | 83* | 1999 |
強化学習システムの設計指針 木村元, 宮崎和光, 小林重信 計測と制御 38 (10), 618-623, 1999 | 81 | 1999 |
シラバスの文書クラスタリングに基づくカリキュラム分析システムの構築 野澤孝之, 井田正明, 芳鐘冬樹, 宮崎和光, 喜多一 情報処理学会論文誌 46 (1), 289-300, 2005 | 65* | 2005 |
エージェントの学習 (< 特集>「エージェントの基礎と応用」) 山村雅幸, 宮崎和光, 小林重信 人工知能 10 (5), 683-689, 1995 | 58* | 1995 |
Learning Deterministic Policies in Partially Observable Markov Decision Processes K Miyazaki, S Kobayashi 5th International Conference on Intelligent Autonomous System (IAS-5), 250-257, 1998 | 57 | 1998 |
これからの強化学習 牧野, 澁谷, 長史, 白川, 浅田 (No Title), 2016 | 48 | 2016 |
Profit Sharing の不完全知覚環境下への拡張: PS-r* の提案と評価 宮崎和光, 小林重信 人工知能学会論文誌= Transactions of the Japanese Society for Artificial …, 2003 | 48* | 2003 |
k-確実探査法: 強化学習における環境同定のための行動選択戦略 宮崎和光, 山村雅幸, 小林重信 人工知能 10 (3), 454-463, 1995 | 48* | 1995 |
POMDPs 環境下での決定的政策の学習 宮崎和光, 荒井幸代, 小林重信 人工知能学会誌 14 (1), 148-156, 1999 | 44 | 1999 |
Profit sharing を用いたマルチエージェント強化学習における報酬配分の理論的考察 宮崎和光, 荒井幸代, 小林重信 人工知能学会誌 14 (6), 1156-1164, 1999 | 43 | 1999 |
Exploitation-oriented learning PS-r K Miyazaki, S Kobayashi Journal of Advanced Computational Intelligence and Intelligent Informatics …, 2009 | 38 | 2009 |
Generating cooperative behavior by multi-agent reinforcement learning S Arai, K Miyazaki, S Kobayashi Proceedings of 6th European Workshop on Learning Robots, 143-157, 1997 | 35 | 1997 |
A Theory of Profit Sharing in Multi-Agent Reinforcement Learning. K MIYAZAKI, S ARAI, S KOBAYASHI 人工知能学会誌 14 (6), 1156-1164, 1999 | 32 | 1999 |
Reinforcement learning for penalty avoiding policy making K Miyazaki, S Kobayashi Smc 2000 conference proceedings. 2000 ieee international conference on …, 2000 | 30 | 2000 |
離散マルコフ決定過程下での強化学習 (< 特集> 強化学習) 宮崎和光, 小林重信 人工知能 12 (6), 811-821, 1997 | 28* | 1997 |