В конфликтной ситуации участвуют две стороны: А – государственная налоговая инспекция; В – налогоплательщик с определенным годовым доходом, налог с которого составляет Т условных денежных единиц.
У стороны А два возможных способа поведения. Один из них (А1) состоит в контролировании дохода налогоплательщика В и взимании с него:
– налога в размере Т, если доход заявлен и соответствует действительности,
– налога в размере Т и штрафа в размере W, если заявленный в декларации доход меньше действительного, или в случае сокрытия всего дохода.
Второй способ поведения А2 – не контролировать доход налогоплательщика B.
У стороны В три стратегии поведения: В1 – заявить о действительном доходе; B2 – заявить доход, меньший действительного, и, следовательно, налог С с заявленного дохода будет меньше Т; В3 – скрыть доход, тогда не надо будет платить налог.
Составить платежную матрицу – матрицу выигрышей игрока А.
Определить верхнюю и нижнюю цены игры (в чистых стратегиях), максиминные (чистые) стратегии игрока А и минимаксные (чистые) стратегии игрока В.
Положив Т = 13, W = 16, С = 8, свести игру к задаче линейного программирования и найти оптимальные (смешанные) стратегии игроков А и В и цену игры.
Как следует действовать игрокам А и В, если они придерживаются оптимальной стратегии?
Решение
Составляем платежную матрицу (матрица выигрышей игрока А):
B1 B2 B3
A1 13 29 29
A2 13 8 0
В игровой ситуации (A1, B1) выигрыш a11 = T = 13 (налоговая инспекция контролирует доход налогоплательщика и взимает налог в размере T, так как налогоплательщик заявил о действительном доходе).
В игровой ситуации (A1, B2) выигрыш a12 = T + W = 13 + 16 = 29 (налоговая инспекция контролирует доход налогоплательщика и взимает налог в размере T плюс штраф в размере W, так как налогоплательщик заявил доход, меньший действительного).
В игровой ситуации (A1, B3) выигрыш a13 = T + W = 13 + 16 = 29 (налоговая инспекция контролирует доход налогоплательщика и взимает налог в размере T плюс штраф в размере W, так как налогоплательщик скрыл весь свой доход).
В игровой ситуации (A2, B1) выигрыш a21 = T = 13 (налоговая инспекция не контролирует доход налогоплательщика, но он честно заявил о своем действительном доходе и уплатил налог в размере T).
В игровой ситуации (A2, B2) выигрыш a22 = С = 8 (налоговая инспекция не контролирует доход налогоплательщика, поэтому он заявил доход, меньший действительного, и уплатил ме́ньший налог в размере С).
В игровой ситуации (A2, B3) выигрыш a23 = 0 (налоговая инспекция не контролирует доход налогоплательщика, поэтому он скрыл весь свой доход и не уплатил налог).
Определяем верхнюю и нижнюю цены игры (в чистых стратегиях), а также максиминные (чистые) стратегии игрока А и минимаксные (чистые) стратегии игрока В.
B1 B2 B3 min
A1 13 29 29 13
A2 13 8 0 0
max 13 29 29
Анализируем платежную матрицу и для каждой чистой стратегии Ai первого игрока A находим минимальное значение αi ожидаемого выигрыша:
1) для чистой стратегии A1 имеем α1 = min(13, 29, 29) = 13;
2) для чистой стратегии A2 имеем α2 = min(13, 8, 0) = 0.
Теперь из всех αi выбираем наибольшее α = maxi(αi) и определяем соответствующую ему чистую стратегию Ai. Получаем: α = max(13, 0) = 13. Таким образом, максиминная стратегия A1 будет наиболее предпочтительной в данных условиях стратегией игрока А. Число α = 13 является нижней ценой игры (максимином). Оно показывает гарантированный выигрыш игрока A, то есть какой минимальный выигрыш он может получить при любых действиях игрока В.
Снова анализируем платежную матрицу и для каждой чистой стратегии Bj второго игрока B находим максимальное значение βj возможного проигрыша:
1) для чистой стратегии B1 имеем β1 = max(13, 13) = 13;
2) для чистой стратегии B2 имеем β2 = max(29, 8) = 29;
3) для чистой стратегии B3 имеем β3 = max(29, 0) = 29.
Теперь из всех βj выбираем наименьшее β = minj(βj) и определяем соответствующую ему чистую стратегию Bj. Получаем: β = min(13, 29, 29) = 13. Таким образом, минимаксная стратегия B1 будет наиболее предпочтительной в данных условиях стратегией игрока B. Число β = 13 является верхней ценой игры (минимаксом). Оно показывает гарантированный проигрыш игрока B, то есть какой минимальный проигрыш он может получить при любых действиях игрока A.
Нижняя цена игры α = 13 равна верхней цене игры β = 13. Это значит, что игра имеет седловую точку. Соответствующий седловой точке элемент a11 = 13 является одновременно наибольшим в своем столбце и наименьшим в своей строке. Его значение является чистой ценой игры v = α = β = 13. Для игрока А оптимальной стратегией является чистая стратегия A1, для игрока В оптимальной стратегией является чистая стратегия B1.
Если игроки А и В придерживаются оптимальной стратегии, то им следует действовать таким образом:
1) государственная налоговая инспекция контролирует доход налогоплательщика и взимает с него налог в размере T = 13, если доход заявлен и соответствует действительности, или взимает с него налог в размере T = 13 плюс штраф в размере W = 16, если налогоплательщик заявил в декларации доход меньше действительного или скрыл свой доход вовсе;
2) налогоплательщик честно заявляет о своем действительном доходе.
Сводим нашу игру к задаче линейного программирования (ЛП) и находим оптимальные (смешанные) стратегии игроков А и В и цену игры.
В матричной игре с платёжной матрицей
B1 B2 B3
A1 13 29 29
A2 13 8 0
определим такие значения вероятностей выбора стратегий для игрока A (p1, p2) и для игрока B (q1, q2, q3), при которых их выигрыши достигали бы своих оптимальных значений.
Так как данная платежная матрица не содержит отрицательных элементов, то цена нашей игры α ≤ v ≤ β при оптимальной стратегии будет положительной.
Если игрок В применяет только чистые стратегии, то при каждой из них выигрыш игрока А будет не меньше, чем v:
13·p1 + 13·p2 ≥ v,
29·p1 + 8·p2 ≥ v,
13·p1 + 0·p2 ≥ v.
Разделим левую и правую часть каждого из неравенств на положительную величину v и введем обозначения: x1 = p1 / v; x2 = p2 / v
.
Теперь неравенства можно переписать в следующем виде:
13·x1 + 13·x 2 ≥ 1,
29·x1 + 8·x2 ≥ 1,
13·x1 + 0·x2 ≥ 1,
где x1, x2 – неотрицательные переменные.
Так как p1 + p2 = 1, то переменные x1, x2 удовлетворяют условию x1 + x2 = 1 / v.
Учитывая, что игрок А стремится максимизировать v, получаем следующую задачу линейного программирования:
Zx = x1 + x2 min;
13·x1 + 13·x 2 ≥ 1,
29·x1 + 8·x2 ≥ 1,
13·x1 + 0·x2 ≥ 1,
x1, x2 ≥ 0.
Теперь из решения задачи ЛП находим цену игры v и оптимальную стратегию SA по формулам: v = 1 / Zx; SA = (p1; p2) = (x1 · v; x2 · v).
Аналогично находим оптимальную стратегию игрока В. Если игрок А применяет только чистые стратегии, то при каждой из них проигрыш игрока В будет не больше, чем v:
13·q1 + 29·q2 + 29·q3 ≤ v,
13·q1 + 8·q2 + 0·q3 ≤ v.
Разделим левую и правую части неравенств на положительную величину v и введем обозначения: y1 = q1 / v; y2 = q2 / v; y3 = q3 / v.
Теперь неравенства можно переписать в следующем виде:
13·y1 + 29·y2 + 29·y3 ≤ 1,
13·y1 + 8·y2 + 0·y3 ≤ 1,
где y1, y2, y3 – неотрицательные переменные.
Так как q1 + q2 + q3 = 1, то переменные y1, y2, y3 удовлетворяют условию y1 + y2 + y3 = 1 / v.
Учитывая, что игрок B стремится минимизировать положительную цену v, получаем следующую задачу ЛП:
Zy = y1 + y2 + y3 max;
13·y1 + 29·y2 + 29·y3 ≤ 1,
13·y1 + 8·y2 + 0·y3 ≤ 1,
y1, y2, y3 ≥ 0.
Теперь из решения задачи ЛП находим цену игры v и оптимальную стратегию SB по формулам: v = 1 / Zy; SB = (q1; q2; q2) = (y1 · v; y2 · v; y3 · v).
Решаем задачу ЛП для игрока А:
Zx = x1 + x2 min;
13·x1 + 13·x 2 ≥ 1,
29·x1 + 8·x2 ≥ 1,
13·x1 + 0·x2 ≥ 1,
x1, x2 ≥ 0.
Применяем графический метод, так как задача содержит две переменные.
В системе координат x1Ox2 строим область допустимых решений (ОДР) системы неравенств. Для этого неравенства системы заменяем равенствами и получаем уравнения прямых, образующих границу ОДР. При построении прямые выделяем цветом.
Определяем множество решений первого неравенства 13·x1 + 13·x 2 ≥ 1. Решением уравнения 13·x1 + 13·x 2 = 1 являются такие точки (–1/100; 2/23) и (1/10; –3/130). По этим точкам строим прямую, выделенную синим цветом. Множество решений строгого неравенства 13·x1 + 13·x 2 > 1 определяем при помощи проверочной точки (0; 0), координаты которой подставляем в неравенство. Так как неравенство не выполняется, то стрелки на прямой направляем в сторону от точки (0; 0).
Определяем множество решений второго неравенства 29·x1 + 8·x2 ≥ 1. Решением уравнения 29·x1 + 8·x2 = 1 являются точки (0; 1/8) и (1/25; –1/50). По этим точкам строим прямую, выделенную оранжевым цветом. Множество решений строгого неравенства 29·x1 + 8·x2 > 1 определяем при помощи проверочной точки (0; 0), координаты которой подставляем в неравенство. Так как неравенство не выполняется, то стрелки на прямой направляем в сторону от точки (0; 0).
Определяем множество решений третьего неравенства 13·x1 + 0·x2 ≥ 1. Решением уравнения 13·x1 + 0·x2 = 1 являются точки (1/13; –3/100) и (1/13; 7/50). По этим точкам строим прямую, выделенную красным цветом