Определить нижнюю и верхнюю цену игры размера 2на 2. Показать, что игра не имеет решения в чистых стратегиях. Решить игру в смешанных стратегиях аналитически для игроков А и В. Представить геометрическую интерпритацию решения игры.
Стратегии "B"
Стратегии "A" B1 B2
A1 10 5
A2 8 17
Ответ
Оптимальные смешанные стратегии игроков и , цена игры составляет
Решение
Определим нижнюю цену игры - α
Стратегии "B"
Стратегии "A" B1 B2 Минимумы строк
A1 10 5 5
A2 8 17 8*
В нашем случае нижняя цена игры равна: α = 8, и для того чтобы гарантировать себе выигрыш не хуже чем 8 мы должны придерживаться стратегии A2Определим верхнюю цену игры - β
Стратегии "B"
Стратегии "A" B1 B2 Минимумы строк
A1 10 5 5
A2 8 17 8*
Максимумы столбцов 10+ 17
В нашем случае верхняя цена игры равна: β = 10, и для того чтобы гарантировать себе проигрыш не хуже чем 10 противник ( игрок "B") должен придерживаться стратегии B1Шаг:3Сравним нижнюю и верхнюю цены игры, в данной задаче они различаются, т.е. α ≠ β, платежная матрица не содержит седловой точки. Это значит, что игра не имеет решения в чистых минимаксных стратегиях, но она всегда имеет решение в смешанных стратегиях.Смешанная стратегия, это чередуемые случайным образом чистые стратегии, с определенными вероятностями (частотами).Смешанную стратегию игрока "А" будем обозначать
SA =
A1 A2
p1 p2
где A1, A2 - стратегии игрока "A", а p1, p2 - соответственно вероятности (частоты), с которыми эти стратегии применяются, причем p1 + p2 = 1.Аналогично смешанную стратегию игрока "В" будем обозначать
SB =
B1 B2
q1 q2
где B1, B2 - стратегии игрока "B", а q1, q2 - соответственно вероятности, с которыми эти стратегии применяются, причем q1 + q2 = 1.
Найдем оптимальную смешанную стратегию для игрока "A": SA* =
A1 A2
p1 p2
где: p1 , p2 - вероятности (частоты) с которыми применяются соответственно стратегии A1 и A2если предположить, что игрок "В" будет пользоваться чистой стратегией B1, то средний выигрыш vсоставит:
k11p1 + k21p2 = v ( 1 )
где: kij - элементы платежной матрицы.C другой стороны, если предположить, что игрок "В" будет пользоваться чистой стратегией B2, то средний выигрыш составит:
k12p1 + k22p2 = v ( 2 )
Приравняв левые части уравнений (1) и (2) получим:
k11p1 + k21p2 = k12p1 + k22p2
А с учетом того, что p1 + p2 = 1 имеем:
k11p1 + k21(1 - p1) = k12p1 + k22(1 - p1)
Откуда несложно найти оптимальную частоту стратегии A1:
p1 = k22 - k21
k11 + k22 - k12 - k21
( 3 )
В данной задаче:
p1 = 17 - 8
10 + 17 - 5 - 8
= 9
14
Вероятность р2 найдем вычитанием р1 из единицы:
p2 = 1 - p1 = 1 - 9
14
= 5
14
Вычислим цену игры подставив р1, р2 в уравнение (1) :
v = k11p1 + k21p2 = 10 · 9
14
+ 8 · 5
14
= 65
7
Найдем оптимальную смешанную стратегию для игрока "B": SB* =
B1 B2
q1 q2
где: q1 , q2 - вероятности (частоты) с которыми применяются соответственно стратегии B1 и B2если предположить, что игрок "A" будет пользоваться чистой стратегией A1, то средний выигрыш v составит:
k11q1 + k12q2 = v ( 4 )
Поскольку цена игры v нам уже известна и учитывая, что q1 + q2 = 1, то оптимальная частота стратегии B1 может быть найдена как:
q1 = v - k12
k11 - k12
( 5 )
В данной задаче:
q1 = 65
7
- 5
10 - 5
= 6
7
Вероятность q2 найдем вычитанием q1 из единицы:
q2 = 1 - q1 = 1 - 6
7
= 1
7
Геометрическая интерпретация (графическое решение):
Ломанная (выделена красным) определяет минимальные возможные средние выигрыши игрока А при использовании им своих смешанных стратегий