Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 3

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  multi-agent environment
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
Most reinforcement learning benchmarks – especially in multi-agent tasks – do not go beyond observations with simple noise; nonetheless, real scenarios induce more elaborate vision pipeline failures: false sightings, misclassifications or occlusion. In this work, we propose a lightweight, 2D environment for robot soccer and autonomous driving that can emulate the above discrepancies. Besides establishing a benchmark for accessible multiagent reinforcement learning research, our work addresses the challenges the simulator imposes. For handling realistic noise, we use self-supervised learning to enhance scene reconstruction and extend curiosity-driven learning to model longer horizons. Our extensive experiments show that the proposed methods achieve state-of-the-art performance, compared against actor-critic methods, ICM, and PPO.
2
Content available remote Model środowiska wieloagentowego w neuroewolucyjnym sterowaniu statkiem
PL
W artykule tym przedstawiono propozycję użycia neuroewolucyjnego systemu wieloagentowego do wspomagania decyzji manewrowych sternika statku płynącego na ograniczonym obszarze wodnym. W środowisku tym sternik jest osobnikiem określonej populacji, która za pomocą algorytmów ewolucyjnych oraz metod uczenia ze wzmocnieniem dostosowuje się do wyznaczonego zadania, jakim jest bezpieczne przepłynięcie danego obszaru przez wyznaczone jednostki pływające.
EN
This paper presents the proposal of multi-agent environment to simulate and demonstrate learning behavior of helmsmen in ship maneuvering. Simulated helmsmen are treated as individuals in population, which through environmental sensing learn themselves to navigate in restricted waters selecting an optimum trajectory of a vessel. Learning phase of the task is to observe current situation and choose the best action. Neuroevolutionary algorithms are used to solve this task. The best fitted individuals from each population become parents for the next generation of helmsmen in simulated multi-agent navigational situation.
3
Content available Reinforcement Learning in Ship Handling
EN
This paper presents the idea of using machine learning techniques to simulate and demonstrate learning behaviour in ship manoeuvring. Simulated model of ship is treated as an agent, which through environmental sensing learns itself to navigate through restricted waters selecting an optimum trajectory. Learning phase of the task is to observe current state and choose one of the available actions. The agent gets positive reward for reaching destination and negative reward for hitting an obstacle. Few reinforcement learning algorithms are considered. Experimental results based on simulation program are presented for different layouts of possible routes within restricted area.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.