Игрок взаимодействует с окружающей средой. Задана матрица игры с природой. Найдите опримальную стратегию игрока, используя критерии Байеса, Вальда, Сэвиджа и Гурвица.
S1 S2 S3
А1
3 -4 -2
А2
5 -1 7
А3 2 1 3
Решение
Критерий Байеса.
По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск r.
Считаем значения ∑(aijpj)
∑(a1,jpj) = 3∙0.33 + (-4)∙0.33 + (-2)∙0.33 = -0.99
∑(a2,jpj) = 5∙0.33 + (-1)∙0.33 + 7∙0.33 = 3.63
∑(a3,jpj) = 2∙0.33 + 1∙0.33 + 3∙0.33 = 1.98
Ai
П1
П2
П3 ∑(aijpj)
A1 0.99 -1.32 -0.66 -0.99
A2 1.65 -0.33 2.31 3.63
A3 0.66 0.33 0.99 1.98
pj
0.33 0.33 0.33
Выбираем из (-0.99; 3.63; 1.98) максимальный элемент max=3.63
Вывод: выбираем стратегию N=2.
Критерий Вальда.
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min aij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е
. этот критерий выражает пессимистическую оценку ситуации.
Ai
П1
П2
П3 min(aij)
A1 3 -4 -2 -4
A2 5 -1 7 -1
A3 2 1 3 1
Выбираем из (-4; -1; 1) максимальный элемент max=1
Вывод: выбираем стратегию N=3.
Критерий Сэвиджа.
Критерий минимального риска Сэвиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max rij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы