>>3774139
> Так что пойдёт налево.
Нет-нет, няша, ты всё правильно говоришь про победность и непротоптанность как приоритеты в фазе "selection" (то есть, когда мы исследуем возможности), но в самом-то конце, когда время вышло и пора решать, куда сходить по-настоящему:
> Such rounds are repeated as long as the time allotted to a move is not up. Then, one of moves from the root of the tree is chosen but it is the move with the most simulations made rather than the move with the highest average win rate
Собственно, то же самое делается и в последней строчке функции UCT из http://mcts.ai/code/python.html.
Но здесь даже это оказывается не так уж важно: за одну симуляцию до ОП-пика было вот так: pic related я думаю, при желании можно было бы получить в обоих узлах одинаковую статистику. Суть в том, что статистика на верхних уровнях может не говорить ничего определённого при очень красноречивой статистике на листьях.