In this paper we introduce an online algorithm that uses integral reinforcement knowledge for learning the continuous-time zero sum game solution for nonlinear systems with infinite horizon costs and partial knowledge of the system dynamics. This algorithm is a data based approach to the solution of the Hamilton-Jacobi-Isaacs equation and it does not require explicit knowledge on the system’s drift dynamics. A novel adaptive control algorithm is given that is based on policy iteration and implemented using an actor/ disturbance/critic structure having three adaptive approximator structures. All three approximation networks are adapted simultaneously. A persistence of excitation condition is required to guarantee convergence of the critic to the actual optimal value function. Novel adaptive control tuning algorithms are given for critic, disturbance and actor networks. The convergence to the Nash solution of the game is proven, and stability of the system is also guaranteed. Simulation examples support the theoretical result.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
W artykule przedstawiono wyniki analizy ekonomicznej funkcjonowania kopalni węgla brunatnego i elektrowni. Tandem kopalni i elektrowni potraktowano jako bilateralny monopol, co dzięki zastosowaniu algorytmu Lerchsa-Grossmanna umożliwiło znalezienie optymalnego rozwiązania dla całego układu w długim okresie. Zastosowanie metod teorii gier w tym schematu arbitrażowego Nasha oraz prezentacja poziomic cen węgla na wykresie podziału łącznego zysku dla poszczególnych optymalnych wyrobisk docelowych pozwala przeanalizować różne strategie obu stron i zbadać skłonność kopalni do oportunizmu. Polega on na rezygnacji kopalni z eksploatacji wyrobiska optymalnego dla całego układu na rzecz eksploatacji wyrobiska optymalnego tylko dla niej. Kierowanie się racjonalnością grupową zamiast indywidualnej może być osiągnięte nie tylko poprzez integrację pionową obu podmiotów, lecz również poprzez wybór ceny węgla na poziomie nie niższym niż cena optymalna lub poprzez oparcie formuły ceny bazowej węgla na wspólnie uzgodnionym podziale zysku -potraktowanie ceny węgla jako ceny transferowej. Przykładową analizę przeprowadzono dla hipotetycznej elektrowni i kopalni eksploatującej złoże węgla brunatnego, dla którego wygenerowano optymalne wyrobiska docelowe dla różnych poziomów cen bazowych węgla.W artykule przedstawiono wyniki analizy ekonomicznej funkcjonowania kopalni węgla brunatnego i elektrowni. Tandem kopalni i elektrowni potraktowano jako bilateralny monopol, co dzięki zastosowaniu algorytmu Lerchsa-Grossmanna umożliwiło znalezienie optymalnego rozwiązania dla całego układu w długim okresie. Zastosowanie metod teorii gier w tym schematu arbitrażowego Nasha oraz prezentacja poziomic cen węgla na wykresie podziału łącznego zysku dla poszczególnych optymalnych wyrobisk docelowych pozwala przeanalizować różne strategie obu stron i zbadać skłonność kopalni do oportunizmu. Polega on na rezygnacji kopalni z eksploatacji wyrobiska optymalnego dla całego układu na rzecz eksploatacji wyrobiska optymalnego tylko dla niej. Kierowanie się racjonalnością grupową zamiast indywidualnej może być osiągnięte nie tylko poprzez integrację pionową obu podmiotów, lecz również poprzez wybór ceny węgla na poziomie nie niższym niż cena optymalna lub poprzez oparcie formuły ceny bazowej węgla na wspólnie uzgodnionym podziale zysku - potraktowanie ceny węgla jako ceny transferowej. Przykładową analizę przeprowadzono dla hipotetycznej elektrowni i kopalni eksploatującej złoże węgla brunatnego, dla którego wygenerowano optymalne wyrobiska docelowe dla różnych poziomów cen bazowych węgla.
EN
The outcome of economic analysis of a lignite mine and a power plant operation is presented. Tandem of a mine and a power plant has been treated as a bilateral monopoly, what thanks to application of the Lerchs-Grossmann algorithm enable finding the optimal solution for the whole system in long run. Application of game theory methods including the Nash bargaining solution and the presentation of lignite contours on the chart of joint profit split between both partners for different optimal ultimate pits enables consideration of different price strategies of both sides and analyze mine's enhancement to opportunism. It can he described as the resignation by the mine from mining the pit, which is optimal for both sides on the pit, which is optimal only for the mine. Group rationality can be attained not only through vertical integration but also through careful choice of lignite price on the level not lower than the optimal price for the whole unit or basing the price formula on the agreed split of profit - treatment of lignite price as the transfer price. Example analysis is based on a hypothetical power plant and a mine excavating the lignite deposit for which the set of optimal ultimate pits has been generated for different levels of lignite price.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.