Принятия решений в условиях неопределенности
Игрок взаимодействует с окружающей средой. Задана матрица игры с природой. Найдите оптимальную стратегию игрока, используя критерии Байеса, Вальда, Сэвиджа и Гурвица.
S1 S2 S3
А1 2 3 -1
А2 5 -3 6
А3 4 1 3
Решение
По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск r.
Считаем значения ∑(aijpj)
∑(a1,jpj) = 2×0,33 + 3×0,33 + (-1) ×0,33 = 1,32
∑(a2,jpj) = 5×0,33 + (-3) ×0,33 + 6×0,33 = 2,64
∑(a3,jpj) = 4×0,33 + 1×0,33 + 3×0,33 = 2,64
Ai S1 S2 S3 ∑(aijpj)
A1 0,66 0,99 -0,33 1,32
A2 1,65 -0,99 1,98 2,64
A3 1,32 0,33 0,99 2,64
pj
0,33 0,33 0,33
Выбираем из (1,32; 2,64; 2,64) максимальный элемент max=2,64
Вывод: выбираем стратегию N=2.
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min aij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е
. этот критерий выражает пессимистическую оценку ситуации.
Ai S1 S2 S3 min(aij)
A1 2 3 -1 -1
A2 5 -3 6 -3
A3 4 1 3 1
Выбираем из (-1; -3; 1) максимальный элемент max=1.
Вывод: выбираем стратегию N=3.
Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max rij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
1. Рассчитываем 1-й столбец матрицы рисков.
r11 = 5 - 2 = 3; r21 = 5 - 5 = 0; r31 = 5 - 4 = 1;
2