Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 10

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  approximate dynamic programming
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
The linear programming (LP) approach to solve the Bellman equation in dynamic programming is a well-known option for finite state and input spaces to obtain an exact solution. However, with function approximation or continuous state spaces, refinements are necessary. This paper presents a methodology to make approximate dynamic programming via LP work in practical control applications with continuous state and input spaces. There are some guidelines on data and regressor choices needed to obtain meaningful and well-conditioned value function estimates. The work discusses the introduction of terminal ingredients and computation of lower and upper bounds of the value function. An experimental inverted-pendulum application will be used to illustrate the proposal and carry out a suitable comparative analysis with alternative options in the literature.
EN
Differential games are a combination of game theory and optimum control methods. Their solutions are based on Bellman's principle of optimality. In this paper, the zero-sum differential game theory has been used for the purposes of controlling a mechatronic object: a single-link manipulator. In this case, analytical solutions are unavailable, thus approximate solutions were used. Two approximation methods were compared with the use of numerical simulations and selected quality indicators. The results confirm previous assumptions and the connection between the differential game theory and H∞ control problems.
PL
W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego w nieznanym środowisku ze statycznymi przeszkodami. Układ sterowania składa się z dwóch warstw, warstwy planowania trajektorii ruchu oraz warstwy realizacji ruchu. Warstwa planowania trajektorii generuje bezkolizyjną trajektorię ruchu robota w złożonym zadaniu typu „podążaj do celu z omijaniem przeszkód”. W warstwie planowania trajektorii ruchu zastosowano metody sztucznej inteligencji w formie układów z logiką rozmytą. Warstwę podrzędną hierarchicznego układu sterowania stanowi neuronowy algorytm sterowania ruchem nadążnym, w którym zastosowano algorytm aproksymacyjnego programowania dynamicznego w konfiguracji dualnego heurystycznego programowania dynamicznego, zrealizowany w formie dwóch struktur: aktora i krytyka. W strukturach aktora i krytyka zastosowano sztuczne sieci neuronowe z wagami warstwy wejściowej dobieranymi w sposób losowy w procesie inicjalizacji sieci i sigmoidalnymi bipolarnymi funkcjami aktywacji neuronów. Poprawności procesu generowania i realizacji trajektorii ruchu zweryfikowano poprzez serię testów numerycznych przeprowadzonych w środowisku obliczeniowym Matlab/Simulink z zastosowaniem emulatora mobilnego robota kołowego oraz toru pomiarowego.
EN
In the article the hierarchical control system of the wheeled mobile robot movement in the unknown environment with static obstacles was presented. The control system consists of two layers, the path planning layer and the tracking control layer. The path planning layer generates the collision-free trajectory of the robot in the complex “goal seeking and obstacle avoiding” task. In the path planning layer fuzzy logic systems were used. The subordinate layer of the hierarchical control system was the neural tracking control algorithm. In that layer the approximate dynamic programming algorithm in the dual heuristic dynamic programming configuration was used. It was realised in a form of two structures: the actor and the critic. In both the actor and the critic structures artificial neural networks with input layer weights chosen randomly in the network initialization process and sigmoidal bipolar neuron activation functions were used. Performance evaluation of the trajectory of generating and realisation processes was verified by the series of numerical tests performed in the Matlab/Simulink computational environment, using the wheeled mobile robot emulator and the laboratory environment emulator.
PL
Przedstawiono hierarchiczny układ sterowania ruchem mobilnego robota kołowego (MRK) Pioneer 2-DX w nieznanym środowisku. Układ ten składa się z: warstwy generowania trajektorii z zastosowaniem układów z logiką rozmytą oraz warstwy realizacji ruchu. W warstwie generowania trajektorii wykorzystano sterowanie behawioralne typu „omijaj przeszkody”. Do detekcji przeszkód posłużył skaner laserowy przestrzeni Hokuyo.
EN
The article presents hierarchical control system of a wheeled mobile robot in the unknown environment. The system consists of two layers: trajectory generating layer using fuzzy logic systems, and tracking control layer. Behavioral control concept arranged for the “avoid obstacles” instruction is employed in trajectory generator, but for detection of obstacles the Hokuyo scanning laser range finder is applied.
5
Content available remote Rozmyte sterowanie behawioralne mobilnym robotem kołowym w nieznanym środowisku
PL
W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego w nieznanym środowisku ze statycznymi przeszkodami. Układ sterowania składa się z generatora trajektorii realizującego sterowanie behawioralne z zastosowaniem układów z logiką rozmytą oraz neuronowego algorytmu sterowania ruchem nadążnym, w którym zastosowano algorytm aproksymacyjnego programowania dynamicznego. W warstwie planowania trajektorii ruchu zrealizowano sterowania behawioralne typu „podążaj do celu” oraz „omijaj przeszkody”. W prezentowanym hierarchicznym układzie sterowania sygnały sterowania warstwy planowania trajektorii są generowane przez dwa układy z logiką rozmytą, w których zastosowano model Takagi-Sugeno. W warstwie realizacji ruchu zastosowano algorytm aproksymacyjnego programowania dynamicznego w konfiguracji dualnego heurystycznego programowania dynamicznego, zbudowany z dwóch struktur: aktora i krytyka. Struktury aktora i krytyka zostały zrealizowane z zastosowaniem sztucznych sieci neuronowych. Poprawność zaproponowanych rozwiązań zweryfikowano numerycznie, stosując emulator mobilnego robota kołowego oraz laboratoryjnego toru pomiarowego, zrealizowane w środowisku obliczeniowym Matlab/Simulink.
EN
In the article the hierarchical control system of the wheeled mobile robot movement in the unknown environment with static obstacles was presented. The control system consists of the trajectory generator that realises the behavioural control using fuzzy logic system, and the neural tracking control system in which approximate dynamic programming algorithm is implemented. In the planning layer of movement trajectory the behavioural control tasks of the „goal-seeking” type and the „obstacle avoiding” type were realised. In the presented hierarchical control system the control signals of the trajectory planning layer were generated using two fuzzy logic systems in which Takagi-Sugeno model was utilized. In the movement control layer the approximate dynamic programming algorithm in the dual heuristic dynamic programming configuration was applied. It consists of two structures: the actor and the critic. Both the actor and the critic structures were realised using artificial neural networks. Performance of the proposed control algorithm was verified numerically using emulator of the wheeled mobile robot and the laboratory measuring track in the Matlab/Simulink computational environment.
PL
W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego Pionier 2-DX w nieznanym środowisku ze statycznymi przeszkodami. Układ sterowania składa się z dwóch warstw: warstwy planowania trajektorii i warstwy realizacji ruchu. Zadaniem warstwy planowania trajektorii jest generowanie parametrów ruchu kół robota w czasie rzeczywistym na podstawie sygnałów z układu sensorycznego. W warstwie tej zastosowano koncepcję sterowania behawioralnego, zrealizowanego z zastosowaniem układów z logiką rozmytą. Warstwa realizacji ruchu generuje sygnały sterowania modułami napędowymi robota, w warstwie tej zastosowano algorytmy aproksymacyjnego programowania dynamicznego. Weryfikację algorytmu sterowania przeprowadzono z zastosowaniem robota Pioneer 2-DX, wyposażonego w skaner laserowy przestrzeni.
EN
In the article a hierarchical control system of the Wheeled Mobile Robot Pioneer 2-DX movement in the unknown environment with static obstacles is presented. The control system consists of two layers: the path planning layer and the tracking control layer. On the basis of the sensory system signals the path planning layer generates the desired trajectory in real time. In this layer of the hierarchical control system, the conception of behavioural control was used. It was realised using Fuzzy Logic systems. The tracking control system is the lower layer of the hierarchical control system. It generates control signals for the WMR’s motors and is realised using Approximate Dynamic Programming algorithms. Using the WMR Pioneer 2-DX verification of the proposed hierarchical control system was performed. The WMR was equipped with the scanning laser range finder for obstacles detection.
PL
W pracy przedstawiono nowe podejście do generowania i realizacji ruchu mobilnego robota kołowego z zastosowaniem algorytmów aproksymacyjnego programowania dynamicznego (APD). Zaproponowano hierarchiczny układ sterowania ruchem robota w nieznanym środowisku ze statycznymi przeszkodami, składający się z warstwy generowania trajektorii oraz warstwy realizacji ruchu. W warstwie generowania trajektorii zrealizowano dwa podstawowe zadania: „podążaj do celu”, oraz „omijaj przeszkody”, stosując algorytmy APD w konfiguracji zależnego od sterowania heurystycznego programowania dynamicznego. Wygenerowana trajektoria ruchu jest realizowana przez układ sterowania ruchem nadążnym, w którym zastosowano algorytm dualnego heurystycznego programowania dynamicznego. Weryfikację algorytmu sterowania przeprowadzono z zastosowaniem robota Pioneer 2-DX.
EN
In the article a new approach to generating and realisation of the trajectory of the Wheeled Mobile Robot is presented. In this approach Approximate Dynamic Programming (APD) algorithms were used. The hierarchical control system of the WMR movement in the unknown environment with static obstacles was proposed. It consists of two layers: the trajectory generating layer and the tracking control layer. In the trajectory generating layer two basic tasks: the goal seeking task and the obstacle avoiding task, were realised. APD algorithms in the Action Dependant Heuristic Dynamic Programming configuration were used. Using the tracking control system the trajectory is realised. In the tracking control system APD algorithm in the Dual Heuristic Dynamic Programming configuration was used. Using the WMR Pioneer 2-DX verification of the proposed hierarchical control system was performed.
EN
Complex problems involving multiple agents exhibit varying degrees of cooperation. The levels of cooperation might reflect both differences in information as well as differences in goals. In this research, we develop a general mathematical model for distributed, semicooperative planning and suggest a solution strategy which involves decomposing the system into subproblems, each of which is specified at a certain period in time and controlled by an agent. The agents communicate marginal values of resources to each other, possibly with distortion. We design experiments to demonstrate the benefits of communication between the agents and show that, with communication, the solution quality approaches that of the ideal situation where the entire problem is controlled by a single agent.
9
Content available remote Approximate dynamic programming in robust tracking control of wheeled mobile robot
EN
In this work, a novel approach to designing an on-line tracking controller for a nonholonomic wheeled mobile robot (WMR) is presented. The controller consists of nonlinear neural feedback compensator, PD control law and supervisory element, which assure stability of the system. Neural network for feedback compensation is learned through approximate dynamic programming (ADP). To obtain stability in the learning phase and robustness in face of disturbances, an additional control signal derived from Lyapunov stability theorem based on the variable structure systems theory is provided. Verification of the proposed control algorithm was realized on a wheeled mobile robot Pioneer-2DX, and confirmed the assumed behavior of the control system.
PL
W pracy przedstawiono nowe ujęcie problematyki sterowania nadążnego mobilnym robotem dwukołowym. Algorytm bazuje na metodzie uczenia ze wzmocnieniem o strukturze aktor-krytyk i nie wymaga uczenia wstępnego, działa on-line bez znajomości modelu robota. Element generujący sterowania (aktor - ASE) oraz element generujący sygnał wewnętrznego wzmocnienia (krytyk - ACE) są zrealizowane w postaci sztucznej sieci neuronowej (SN). Prezentowany algorytm sterowania zweryfikowano na rzeczywistym obiekcie, dwukołowym robocie mobilnym Pioneer-2DX. Badania potwierdziły poprawność przyjętego rozwiązania.
10
Content available remote Approximating the solution of a dynamic, stochastic multiple knapsack problem
EN
We model an environment where orders arrive probabilistically over time, with their revenues and capacity requirements becoming known upon arrival. The decision is whether to accept an order, receiving a reward and reserving capacity, or reject an order, freeing capacity for possible future arrivals. We model the dynamic, stochastic multiple knapsack problem (DSMKP) with stochastic dynamic programming (SDP). Multiple knapsacks are used as orders may stay in the system for multiple periods. As the state space grows exponentially in the number of knapsacks and the number of possible orders per period, we utilize linear programming and duality to quickly approximate the end-of-horizon values for the SDP. This helps mitigate end-of-study effects when solving the SDP directly, allowing for the solution of larger problems and leading to increased quality in solutions.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.