[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]

Файл: -(81 KB, 870x580)
81 No.3773830  

Здесь ведь были Сырны, понимающие MCTS?

На рисунке:

  • в каждом узле слева — число (симулированных) побед первого игрока, ну, а справа — второго;
  • красные победы у того, кто в позицию приходит (большое красное число — выгодная позиция);
  • пунктиром обозначены примечательные руты.

Судя по описанию на Википедии и по коду здесь → http://mcts.ai/code/python.html, MCTS выберет правый рут (потому что он немножко лучше протоптан) и закончит скорее всего в листе 0/4. Но я же не бака, я хочу налево и в лист 3/0! Почему при выборе направления MCTS не использует анализ с конца, исходя из выгодности листьев?

>> No.3774139  
> MCTS выберет правый рут (потому что он немножко лучше протоптан) и закончит скорее всего в листе 0/4.

MCTS выбирает те узлы, для которых вероятность победы максимальна же. Так что пойдёт налево. Алсо, при выборе узлов ещё учитывается, насколько этот путь хорошо протоптан, и предпочтение отдаётся менее протоптанным путям. Чтобы открывать новые неожиданные варианты, а не топтаться по одной дорожке. Обычно используется что-то типа формулы UCT, она каждому узлу присваивает очки на основе двух слагаемых: вероятность победы + непроторенность. В википедии про это написано.

>> No.3774415  
Файл: -(62 KB, 870x580)
62

>>3774139

> Так что пойдёт налево.

Нет-нет, няша, ты всё правильно говоришь про победность и непротоптанность как приоритеты в фазе "selection" (то есть, когда мы исследуем возможности), но в самом-то конце, когда время вышло и пора решать, куда сходить по-настоящему:

> Such rounds are repeated as long as the time allotted to a move is not up. Then, one of moves from the root of the tree is chosen but it is the move with the most simulations made rather than the move with the highest average win rate

Собственно, то же самое делается и в последней строчке функции UCT из http://mcts.ai/code/python.html.

Но здесь даже это оказывается не так уж важно: за одну симуляцию до ОП-пика было вот так: pic related я думаю, при желании можно было бы получить в обоих узлах одинаковую статистику. Суть в том, что статистика на верхних уровнях может не говорить ничего определённого при очень красноречивой статистике на листьях.

>> No.3775841  
Файл: -(4 KB, 200x200)
4



[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]