Wyniki wyszukiwania - BazTech

Ograniczanie wyników

Powiadomienia systemowe

Sesja wygasła!

Znaleziono wyników: 2

Liczba wyników na stronie

Wyniki wyszukiwania

Wyszukiwano:
w słowach kluczowych: AlphaZero

Sortuj według:

Ogranicz wyniki do:

Co nieco o algorytmach szachowych

Słanina Piotr

MINUT Matematyka i Informatyka na Uczelniach Technicznych

2023

Nr 5

195-210

Algorytmy szachowe i ich implementacja od wielu lat są istotną częścią szachowego świata. Artykuł przybliża historię i działanie podstawowych algorytmów, wykorzystywanych w silnikach szachowych.

Overview of selected reinforcement learning solutions to several game theory problems

Jarosz Robert

Computer Science and Mathematical Modelling

2022

No. 15-16

13--22

This paper collects several applications of reinforcement learning in solving some problems related to game theory. The methods were selected to possibly show variety of problems and approaches. Selections includes Thompson Sampling, Q-learning, DQN and AlphaGo Zero using Monte Carlo Tree Search algorithm. Paper attempts to show intuition behind proposed algorithms with shallow explaining of technical details. This approach aims at presenting overview of the topic without assuming deep knowledge about statistics and artificial intelligence.

Artykuł gromadzi wybrane podejścia do rozwiązania problemów z teorii gier wykorzystując uczenie ze wzmocnieniem. Zastosowania zostały dobrane tak, aby przedstawić możliwie przekrojowo klasy problemów i podejścia do ich rozwiązania. W zbiorze wybranych algorytmów znalazły się: próbkowanie Thompsona, Q-learning (Q-uczenie), DQN, AlphaGo Zero. W artykule nacisk położono na przedstawienie intuicji sposobu działania algorytmów, koncentrując się na przeglądzie technologii zamiast na technicznych szczegółach.