PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Baza danych w problemie koordynacji agentów za pomocą algorytmów uczenia ze wzmocnieniem

Autorzy
Identyfikatory
Warianty tytułu
EN
Database in multi-agent coordination problem using reinforcement learning alogorithms
Języki publikacji
PL
Abstrakty
PL
Artykuł opisuje użycie bazy danych PostgreSQL do przechowywania danych z procesu uczenia ze wzmocnieniem agenta koordynującego działanie innych agentów. Ponieważ agent koordynujący działania innych agentów powinien mieć dostęp do iloczynu kartezjańskiego akcji dla wszystkich koordynowanych agentów, liczba wszystkich akcji rośnie wykładniczo. Dlatego też należy rozważyć użycie bazy danych jako kontenera na dane dotyczące procesu uczenia.
EN
Article describes application of PostgreSQL database for storing learning process data. We consider reinforcement learning of the agent coordinating the other agents’ learning process. As the coordinator should have access to Cartesian product of particular agents’ actions, the size of the data grows exponentially. Thus the application of the database as the container for the learning process data is worth of consideration.
Czasopismo
Rocznik
Strony
163--173
Opis fizyczny
Bibliogr. 8 poz.
Twórcy
autor
  • Politechnika Warszawska, Instytut Automatyki i Informatyki Stosowanej, ul. Nowowiejska 15/19, 00-661 Warszawa, Poland
Bibliografia
  • 1. Barto A.G., Mahadevan S.: Recent advances in hierarchical reinforcement learning. Discrete Event Dynamic Systems, Vol. 13(4), 2003, s. 341÷379.
  • 2. Claus C., Boutilier C.: The dynamics of reinforcement learning in cooperative multi-agent systems. AAAI/IAAI, 1998, s. 746÷752.
  • 3. FLAME: Flexible large-scale agent modelling environment, http://www.flame.ac.uk/ (dostęp 23 lutego 2016 r.)
  • 4. Luntz J.E., Messner W., Choset H.: Distributed manipulation using discrete actuator arrays. The International Journal of Robotics Research, Vol. 20(7), 2001, s. 553÷583.
  • 5. Matignon L., Laurent G.J., Le Fort-Piat N.: Independent reinforcement learners in co-operative Markov games: a survey regarding coordination problems. The Knowledge Engineering Review, Vol. 27(1), 2012, s. 1÷31.
  • 6. Pałka P.: Coordination of reinforcement learning algorithms in cooperative multi-agent systems. Raport Instytutu Automatyki i Informatyki Stosowanej Politechniki Wars-zawskiej, 2015-21, 2015.
  • 7. Watkins C.J., Dayan P.: Q-learning. Machine Learning, Vol. 8.3-4, 1992, s. 279÷292.
  • 8. White III C.C., White D.J.: Markov decision processes. European Journal of Opera-tional Research, Vol. 39.1, 1989, 1÷16.
Uwagi
Opracowanie ze środków MNiSW w ramach umowy 812/P-DUN/2016 na działalność upowszechniającą naukę.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-995782be-a34d-4588-afe5-60c910a3b6d8
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.