Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04)

Widok

Metadane zasobu

Tytuł	Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04)
Osoby	Autorzy: Daniel Osman Partner: Instytut Badań Systemowych PAN w Warszawie
Opis	Rozprawa rozpatruje zagadnienia związane z problemem sterowania na przykładzie gry w anty-warcaby, a celem jest stworzenie algorytmu uczącego się w nie grać. Wykorzystano tu znany algorytm uczenia ze wzmocnieniem -- Temporal Difference TD(λ) który można stosować w sytuacji gdy ocena pracy agenta następuje dopiero po zakończeniu rozgrywki i znany jest jej wynik. Ważnym elementem wpływającym na skuteczność algorytmu uczącego był odpowiedni dobór strategii treningowej, co zostało szczegółowo opisane. W pracy został również wykorzystany algorytm pseudo-ewolucyjny EVO, którego zastosowanie umożliwiło porównanie skuteczności algorytmu TD(λ) z odmienną metodą nauczania taktyki agenta. Algorytm został zaimplementowany i przetestowany w języku Ocaml. (Polski)
Słowa kluczowe	"game theory"@en, "teoria gier"@pl
Klasyfikacja	Typ zasobu: praca dyplomowa Dyscyplina naukowa: Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018) Grupa docelowa: uczniowie, studenci, naukowcy Szkodliwe treści: Nie
Charakterystyka	Miejsce powstania: Warszawa Czas powstania: 2006 Liczba stron: 121 Promotor: Jacek Mańdziuk Język zasobu: Polski
Licencja	CC BY-SA 4.0
Informacje techniczne	Deponujący: Anna Wasilewska Data udostępnienia: 17-01-2023
Kolekcje	Kolekcja Instytutu Badań Systemowych PAN w Warszawie

Cytowanie

Skopiowano

Daniel Osman. Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04). [praca dyplomowa] Dostępny w Atlasie Zasobów Otwartej Nauki, . Licencja: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Data dostępu: DD.MM.RRRR.

Podobne zasoby

Własności rozwiązań kooperacyjnych w problemie przetargowym

Piotr Bronisz, praca dyplomowa, Instytut Badań Systemowych PAN w Warszawie, dziedzina nauk technicznych / automatyka i robotyka (2011)

Procedings of the seminar on "Nonconventional problems of optimization" * On the regularity in hierarchical games (PN-1986-12-05)

Tadeusz Selbirak, artykuł, rozdział, Instytut Badań Systemowych PAN w Warszawie, Dziedzina nauk ścisłych i przyrodniczych / matematyka (2018)

Procedings of the seminar on "Nonconventional problems of optimization" * Resource allocation and cost sharing in common Enterprise:A game approach (PN-1986-12-01)

Lech Kruś, Piotr Bronisz, artykuł, rozdział, Instytut Badań Systemowych PAN w Warszawie, Dziedzina nauk ścisłych i przyrodniczych / informatyka (2018)

Zobacz więcej