关注
Kazuteru Miyazaki
Kazuteru Miyazaki
National Institution for Academic Degrees and Quality Enhancement of Higher Education
在 niad.ac.jp 的电子邮件经过验证 - 首页
标题
引用次数
引用次数
年份
強化学習における報酬割当ての理論的考察
宮崎和光, 山村雅幸, 小林重信
人工知能学会誌 9 (4), 580-587, 1994
142*1994
マルチエージェント強化学習の方法論: Q-Learning と Profit Sharing による接近
荒井幸代, 宮崎和光, 小林重信
人工知能学会誌 13 (4), 609-618, 1998
126*1998
Reinforcement learning in POMDPs with function approximation
H Kimura, K Miyazaki, S Kobayashi
ICML 97, 152-160, 1997
1161997
On the rationality of profit sharing in reinforcement learning
K Miyazaki, M Yamamura, S Kobayashi
3rd International Conference on Fuzzy Logic, Neural Nets and Soft Computing …, 1994
881994
On the Rationality of Profit Sharing in Reinforcement Learning
K MIYAZAKI, M YAMAMURA, S KOBAYASHI
88*1994
Profit Sharing に基づく強化学習の理論と応用
宮崎和光, 木村元, 小林重信
人工知能学会誌 14 (5), 800-807, 1999
83*1999
強化学習システムの設計指針
木村元, 宮崎和光, 小林重信
計測と制御 38 (10), 618-623, 1999
811999
シラバスの文書クラスタリングに基づくカリキュラム分析システムの構築
野澤孝之, 井田正明, 芳鐘冬樹, 宮崎和光, 喜多一
情報処理学会論文誌 46 (1), 289-300, 2005
65*2005
エージェントの学習 (< 特集>「エージェントの基礎と応用」)
山村雅幸, 宮崎和光, 小林重信
人工知能 10 (5), 683-689, 1995
58*1995
Learning Deterministic Policies in Partially Observable Markov Decision Processes
K Miyazaki, S Kobayashi
5th International Conference on Intelligent Autonomous System (IAS-5), 250-257, 1998
571998
これからの強化学習
牧野, 澁谷, 長史, 白川, 浅田
(No Title), 2016
482016
Profit Sharing の不完全知覚環境下への拡張: PS-r* の提案と評価
宮崎和光, 小林重信
人工知能学会論文誌= Transactions of the Japanese Society for Artificial …, 2003
48*2003
k-確実探査法: 強化学習における環境同定のための行動選択戦略
宮崎和光, 山村雅幸, 小林重信
人工知能 10 (3), 454-463, 1995
48*1995
POMDPs 環境下での決定的政策の学習
宮崎和光, 荒井幸代, 小林重信
人工知能学会誌 14 (1), 148-156, 1999
441999
Profit sharing を用いたマルチエージェント強化学習における報酬配分の理論的考察
宮崎和光, 荒井幸代, 小林重信
人工知能学会誌 14 (6), 1156-1164, 1999
431999
Exploitation-oriented learning PS-r
K Miyazaki, S Kobayashi
Journal of Advanced Computational Intelligence and Intelligent Informatics …, 2009
382009
Generating cooperative behavior by multi-agent reinforcement learning
S Arai, K Miyazaki, S Kobayashi
Proceedings of 6th European Workshop on Learning Robots, 143-157, 1997
351997
A Theory of Profit Sharing in Multi-Agent Reinforcement Learning.
K MIYAZAKI, S ARAI, S KOBAYASHI
人工知能学会誌 14 (6), 1156-1164, 1999
321999
Reinforcement learning for penalty avoiding policy making
K Miyazaki, S Kobayashi
Smc 2000 conference proceedings. 2000 ieee international conference on …, 2000
302000
離散マルコフ決定過程下での強化学習 (< 特集> 強化学習)
宮崎和光, 小林重信
人工知能 12 (6), 811-821, 1997
28*1997
系统目前无法执行此操作,请稍后再试。
文章 1–20