Принятия решений в условиях неопределенности.
Игрок взаимодействует с окружающей средой. Задана матрица игры с природой. Найдите опримальную стратегию игрока, используя критерии Байеса, Вальда, Сэвиджа и Гурвица.
S1 S2 S3
А1
2 3 -1
А2
5 -3 6
А3 4 1 -3
Решение
Применим к данным задачи критерий Байеса, Вальда, Сэвиджа и Гурвица, внесем данные в таблицу.
Критерий Байеса.
По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск r.
Считаем значения ∑(aijpj)
∑(a1,jpj) = 2*0,33 + 3*0,33 + (-1)*0,33 = 1,32
∑(a2,jpj) = 5*0,33 + (-3)*0,33 + 6*0,33 = 2,64
∑(a3,jpj) = 4*0,33 + 1*0,33 + (-3)*0,33 = 0,66
Ai
П1
П2
П3 ∑(aijpj)
A1 0,66 0,99 -0,33 1,32
A2 1,65 -0,99 1,98 2,64
A3 1,32 0,33 -0,99 0,66
pj
0,33 0,33 0,33
Выбираем из 1,32; 2,64; 0,66 максимальный элемент.
Вывод: выбираем стратегию N=2.
Критерий Вальда.
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е
. a=max(min aij).
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Ai
П1
П2
П3 min(aij)
A1 2 3 -1 -1
A2 5 -3 6 -3
A3 4 1 -3 -3
Выбираем из -1; -3; -3 максимальный элемент.
Вывод: выбираем стратегию N=1.
Критерий Севиджа.
Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается: a=min(max rij).
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий