Online scheduling has been an attractive field of research for over three decades. Some recent developments suggest that Reinforcement Learning (RL) techniques have the potential to deal with online scheduling issues effectively. Driven by an industrial application, in this paper we apply four of the most important RL techniques, namely Q-learning, Sarsa, Watkins's Q(λ), and Sarsa(λ), to the online single-machine scheduling problem. Our main goal is to provide insights on how such techniques perform. The numerical results show that Watkins's Q(λ) performs best in minimizing the total tardiness of the scheduling process.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
W artykule zaprezentowano algorytm strategii ewolucyjnej do szeregowania zadań na jednej maszynie przy kryterium minimalizacji ważonej sumy wyprzedzeń i opóźnień. Z problemami takimi można się coraz częściej spotkać w praktyce, gdyż narastająca konkurencja wymusza rygorystyczne dotrzymywanie terminów dostarczania wyrobów klientom. Wyniki badań wykazały, że proponowany algorytm może być wykorzystywany jako efektywne narzędzie planowania operatywnego produkcji, m.in. w zakładach odlewniczych.
EN
This paper focuses on scheduling jobs with varying processing times and distinct due dates on a single machine subject to symmetric earliness and tardiness penalties. The justification for this approach is that in JIT environment, an idea! schedule corresponds to one where all jobs complete precisely at their corresponding due dates. A non-specialized and non-hybridized evolutionary strategy (ES) is proposed for solving this problem. The computational experiment shows that the proposed heuristic perform well and can be used as a planning tool in foundries. Many aspects of the developed ES are quite general and can be adopted to more realistic assumptions.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.