The paper describes an approach to reinforcement multi-agent learning. Due to the domain constrains the classical immediate-reward approach is inapplicable, a delayed reward technique has been introduced. The describes the RoboCup domain used as the tested for a multi-agent system and summarizes the first, preliminary phase of experiments.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.