REPORT A PROBLEM
LINKS
Resource link (short)
http://www.zasobynauki.pl/zasoby/82864Resource link (repository)
https://id.e-science.pl/records/82864Resource metadata
Title |
Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04) |
---|---|
Persons |
Authors:
Daniel Osman
Partner: Systems Research Institute Polish Academy of Sciences, Warsaw |
Description |
Rozprawa rozpatruje zagadnienia związane z problemem sterowania na przykładzie gry w anty-warcaby, a celem jest stworzenie algorytmu uczącego się w nie grać. Wykorzystano tu znany algorytm uczenia ze wzmocnieniem -- Temporal Difference TD(λ) który można stosować w sytuacji gdy ocena pracy agenta następuje dopiero po zakończeniu rozgrywki i znany jest jej wynik. Ważnym elementem wpływającym na skuteczność algorytmu uczącego był odpowiedni dobór strategii treningowej, co zostało szczegółowo opisane. W pracy został również wykorzystany algorytm pseudo-ewolucyjny EVO, którego zastosowanie umożliwiło porównanie skuteczności algorytmu TD(λ) z odmienną metodą nauczania taktyki agenta. Algorytm został zaimplementowany i przetestowany w języku Ocaml. (Polish) |
Keywords | "game theory"@en, "teoria gier"@pl |
Classification |
Resource type:
thesis Scientific discipline: Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018) Destination group: pupils, students, scientists Harmful content: No |
Characteristics |
Place of creation: Warszawa
Creation time: 2006 Number of pages: 121 Supervisor: Jacek Mańdziuk Resource language: Polish |
License | CC BY-SA 4.0 |
Technical information |
Submitter: Anna Wasilewska Availability date: 17-01-2023 |
Collections | Kolekcja Instytutu Badań Systemowych PAN w Warszawie |
Citation
Daniel Osman. Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04). [thesis] Available in Atlas of Open Science Resources, . License: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Date of access: DD.MM.RRRR.
Similar resources
Własności rozwiązań kooperacyjnych w problemie przetargowym
Piotr Bronisz, thesis, Systems Research Institute Polish Academy of Sciences, Warsaw, dziedzina nauk technicznych / automatyka i robotyka (2011)
Procedings of the seminar on "Nonconventional problems of optimization" * On the regularity in hierarchical games (PN-1986-12-05)
Tadeusz Selbirak, article, chapter, Systems Research Institute Polish Academy of Sciences, Warsaw, Dziedzina nauk ścisłych i przyrodniczych / matematyka (2018)
Procedings of the seminar on "Nonconventional problems of optimization" * Resource allocation and cost sharing in common Enterprise:A game approach (PN-1986-12-01)
Lech Kruś, Piotr Bronisz, article, chapter, Systems Research Institute Polish Academy of Sciences, Warsaw, Dziedzina nauk ścisłych i przyrodniczych / informatyka (2018)