Soichiro Nishimori 个人学术档案

202320247 16

Shin IshiiKyoto University在 i.kyoto-u.ac.jp 的电子邮件经过验证
Sotetsu KOYAMADAATR在 atr.jp 的电子邮件经过验证
Toshinori KitamuraThe University of Tokyo在 weblab.t.u-tokyo.ac.jp 的电子邮件经过验证
Tadashi KozunoOMRON SINIC X在 alumni.oist.jp 的电子邮件经过验证
Masashi SugiyamaDirector, RIKEN Center for Advanced Intelligence Project / Professor, The University of Tokyo在 k.u-tokyo.ac.jp 的电子邮件经过验证
Xin-Qiang CaiThe University of Tokyo在 ms.k.u-tokyo.ac.jp 的电子邮件经过验证
Johannes AckermannThe University of Tokyo在 g.ecc.u-tokyo.ac.jp 的电子邮件经过验证

Soichiro Nishimori

在 g.ecc.u-tokyo.ac.jp 的电子邮件经过验证


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Pgx: Hardware-accelerated parallel game simulators for reinforcement learning S Koyamada, S Okano, S Nishimori, Y Murata, K Habara, H Kita, S Ishii Advances in Neural Information Processing Systems 36, 2024	18	2024
Mjx: A framework for Mahjong AI research S Koyamada, K Habara, N Goto, S Okano, S Nishimori, S Ishii 2022 IEEE Conference on Games (CoG), 504-507, 2022	3	2022
A Policy Gradient Primal-Dual Algorithm for Constrained MDPs with Uniform PAC Guarantees T Kitamura, T Kozuno, M Kato, Y Ichihara, S Nishimori, A Sannai, ... arXiv preprint arXiv:2401.17780, 2024	2	2024
A Batch Sequential Halving Algorithm without Performance Degradation S Koyamada, S Nishimori, S Ishii arXiv preprint arXiv:2406.00424, 2024		2024
Leveraging Domain-Unlabeled Data in Offline Reinforcement Learning across Two Domains S Nishimori, XQ Cai, J Ackermann, M Sugiyama arXiv preprint arXiv:2404.07465, 2024		2024
JAX-CORL: Clean Sigle-file Implementations of Offline RL Algorithms in JAX S Nishimori https://github.com/nissymori/JAX-CORL, 2024		2024
End-to-End Policy Gradient Method for POMDPs and Explainable Agents S Nishimori, S Koyamada, S Ishii arXiv preprint arXiv:2304.09769, 2023		2023

系统目前无法执行此操作，请稍后再试。

文章 1–7

每年引用数