Учебник Математические модели принятия решений в экономике - Розен В. В. - Глава: Лекция 13. антагонистические игры онлайн

Название: Математические модели принятия решений в экономике - Розен В. В.

Жанр: Экономика

Рейтинг:

Просмотров: 903

Лекция 13. антагонистические игры

• Антагонистическая игра как математическая модель принятия решения в условиях противоположности интересов • Матричные игры Нижняя и верхняя цена игры Устойчивое поведение и седловые точки Теорема о связи седловой точки с ценой игры • Смешанное расширение матричной игры Основные правила для функции выигрыша в смешанном расширении • Теорема фон Неймана и ее следствия • Задача 16 Профилактика нежелательного события

1. Продолжим системное описание задачи принятия решения (лекция 1): рассматривается некоторый объект управления, на который воздействует управляющая подсистема и среда. Управляющая подсистема всегда является целенаправленной, т.е. имеет определенную цель и ее управление направлено на достижение этой цели. Поведение среды может носить как целенаправленный, так и случайный характер. Если среда ведет себя как целенаправленная система, то такая ситуация принятия решения называется теоретико-игровой, а ее математическая модель игрой.

Неопределенность, существующая при выборе решения управляющей подсистемой, возникает за счет воздействия среды на объект управления. Однако следует различать неопределенность, имеющую случайный (или стохастический) характер, и неопределенность, имеющую целенаправленный характер. В первом случае получаем ЗПР в условияхнеопределенности (или в условиях риска), а во втором — в теоретико-игровых условиях. Если в ЗПР в условиях неопределенности (а также в ус ловиях риска) принятие решения рассматривается как индивидуальный выбор альтернативы

иравляющеи подсистемой, то в теоретико-игровой модели приня-^.йе решения рассматривается как совместный выбор допустимых _іЛьТЄрнатив (стратегий), который производится управляющей подсистемой и подсистемой, «олицетворяющей» среду. Поскольку при таком подходе различие между управляющей подсистемой и средой — в плане их воздействия на объект управления — стирается, удобно говорить о двух управляющих подсистемах; в теоретико-йгровой терминологии эти управляющие подсистемы называются игроками.

В случае, когда цели управляющей подсистемы и среды противоположны, получающаяся игра называется антагонистической Антагонистическая игра, для которой ее оценочная структура задается с помощью оценочной функции, может быть представлена в виде (X, У, /), где X — множество стратегий игрока 1, Y — множество стратегий игрока 2, / : XxF-^M — целевая функция. При этом для игрока 1 функция / рассматривается как функция выигрыша, а для игрока 2 — как функция потерь.

2. Если в антагонистической игре множества стратегий игроков конечны, то такая игра называется матричной. Матричная игра обычно задается в виде матрицы А = \aJt\ (г — 1, п: j = 1. го), которая называется матрицей выигрышей или платежной матрицей. В этом случае стратегии игрока 1 могут быть отождествлены с номерами строк, а стратегии игрока 2 с номерами столбцов платежной матрицы. Число о?г рассматривается одновременно как выигрыш игрока 1 и проигрыш игрока 2 в ситуации

Проанализируем, какие стратегии игроков в матричной игре можно рассматривать в качестве обоснованных Если принять за основу гипотезу крайней осторожности — гипотезу антагонизма (см. лекцию 8), то в качестве оценки стратегии ; игрока 1 выступает его минимальный возможный выигрыш при использовании им

й стратегии, т.е. а, = mina^. Число аг представляет собой с со-

держательной точки зрения гарантированный уровень стратегии г (т.е. выбрав стратегию г, игроке имеет полную гарантию, что его выигрыш, независимо от того, какую стратегию выберет игрок 2, будет не меньше, чем аг). Наибольший гарантированный выигрыш Игрока / в данной игре таков:

= maxa, = maxmina^. (13-1)

* » з

Число її] называется нижней ценой игры (или максимином), а стратегия, максимизирующая минимальный возможный вьіигрц^ игрока 1, т.е. стратегия г*, для которой аг» = v, — максиминноц стратегией игрока 1.

Теперь обратимся к игроку 2. Поскольку для него матрица, 4 представляет собой матрицу потерь, то оценкой стратегии j При принятии гипотезы антагонизма является максимум возможных при этой стратегии потерь, т.е. (З3 = maxaj. Стратегия і*

г J і

которая минимизирует максимальные возможные потери игрока 2 называется его минимаксной стратегией, а число

i>2 = min/?-' = min max а

З 3 г

(13.2)

— верхней ценой игры (или минимаксом). Имеет место следующее правило.

Правило 13.1. В матричной игре нижняя цена не превосходит верхней цены: «і < «2. Если нижняя и верхняя цена игры совпадают, то число v = v = «2 называется ценой игры.

Действительно, при любых г = 1,п, j = l,m выполняется условие аг < а и j33 > а3, откуда аг < (З3. Пусть г* — максиминная стратегия игрока 1, j* — минимаксная стратегия игрока 2. Тогда vi — а,. < /З3" = v2.

Практическое правило для нахождения нижней и верхней цены матричной игры состоит в следующем. Добавим к платежной матрице А столбец {аг)г~Тп строчных минимумов и строку (/3J)J=y7^ столбцовых максимумов. Наибольшее из чисел аг будет нижней ценой, а наименьшее из чисел j33 — верхней ценой. Этот способ продемонстрирован на примерах, приведенных ниже. В примере 13.1 игра не имеет цены (v < v2), в примере 13.2 v = v2 = v — игра имеет цену.

Следующая наша задача — проанализировать «на устойчивость» ситуацию, в которой игрок 1 использует максиминную стра^гйЮ, а игРок ^ — минимаксную стратегию. Например, в при- зере такой ситуацией будет (2,1). Эта ситуация является Устойчивой, так как в ней игроку 2 выгодно отклонение от нее за- меной стратегии 1 на стратегию 2: в этом случае его потери умень- шатся с 5 до 3. При этом ситуация (2,1) перейдет в ситуацию (2, 2). Однако ситуация (2, 2) также неустойчива, так как в ней игроку 1 вь1ГОДНО заменить стратегию 2 на стратегию 1, в результате чего „гра переходит в ситуацию (1, 2). В этой ситуации выгодным явля- ется одностороннее отклонение игроку 2, которое приводит к ситуа- ций (1, !)■ Наконец, в последней ситуации одностороннее отклонение 0т нее выгодно игроку 1, которое осуществляется заменой страте- гии 1 на стратегию 2. В итоге игра возвращается в первоначальную ситуацию (2,1) и т.д. до бесконечности. Таким образом, в игре при- мера 13.1 выбор ситуации (2,1) приводит к «бесконечному блужда- нию»: (2,1) -> (2, 2) -4 (1, 2) -4 (1,1) —> (2,1) —5- ..., что является свидетельством «неудачных» совместных решений игроков.

Напротив, в игре примера 13.2 выбор ситуации (2, 2) (первой компонентой которой является максиминная стратегия игрока 1, а второй — минимаксная стратегия игрока 2) — устойчив, так как в этой ситуации ни одному из игроков невыгодно одностороннее отклонение от нее. Учитывая, что игра примера 13.2 имеет цену, а игра примера 13.1 не имеет цены, можно связать наличие устойчивых ситуаций в матричной игре с наличием у нее цены. Теперь дадим формальное доказательство этого важного факта. Приведем следующее определение.

Определение. Пусть Та — матричная игра с платежной матрицей А — \а3г\. Ситуация (io, jo) называется седловой точкой в игре Та, если при всех і = 1,п, j = l,m выполняется двойное неравенство:

af < < < al . (13.3)

Соотношение 13.3 можно пояснить следующим образом.

Правило 13.2. Ситуация (to,io) — седловая точка игры Гд тогда и только тогда, когда элемент а3°о является одновременно Наименьшим элементом своей строки и наибольшим элементом своего столбца.

Ясно, что устойчивые в матричной игре ситуации — это и есть ее седловые точки: одностороннее отклонение от седловой точки не выгодно ни одному из игроков.

Теорема 13.1 (связь седловой точки с ценой игры).

Пусть (го, Jo) — седловая точка игры Та- Тогда:

а) го является максиминной стратегией игрока 1

б) jo является минимаксной стратегией игрока 2;

в) игра Г, имеет цену, причем исход в седловой точке совпа- дает с ценой игры а3°о = v

Пусть игра Та имеет цену v Тогда любая ситуация (го. Jo) где го — максиминная стратегия игрока 1, a jo — минимаксная стратегия игрока 2, — является седловой точкой игры Гд

Доказательство. Для доказательства 1) рассмотрим фрагмент платежной матрицы А (табл 13 1), к которой добавлен столбец строчных минимумов (аг)г=т-^ и строка столбцовых максимумов (Д7) -г—.г' Учитывая правило 13 2, получаем следующие равенства

аго = а?", j330 = а?°. Имеют место следующие очевидные соотношения (см. табл. 13.1):

V >< >а10 =0\% = (33°. (**)

Из (*) следует, что го — максиминная стратегия игрока 1. а из (**) следует, что jo — минимаксная с тратегия игрока 2 Утверждения а) и б) установлены Далее, используя (*) и (**), имеем

vi = max аг = аго = а3° v2 = mm (З3 = (З30 = а3°, і j

откуда «і = «2 = а3", что и заканчивает доказательство утверждения 1)

Докажем 2). Пусть игра имеет цену: v = v2 = v. Обозначая через го максиминную стратегию игрока 1 и через j0 — минимаксную стратегию игрока 2, изобразим фрагмент платежной матрицы

При этом нижняя цена игры V = аго, верхняя цена игры v2 = /З30 ■ Покажем, что (го, Jo) — седловая точка игры Гд. Имеем

af < Р° =v2 = vx= аго < а?°, < > а1о = = v2 = /У0 >

Итак, соотношение (13 3) установлено, что и завершает доказательство теоремы 13.1.

Отметим некоторые следствия доказанной теоремы

Следствие 1. В матричной игре наличие седловой точки эквивалентно наличию цены игры

Следствие 2. Истоды в седловых точках матричной игры совпадают между собой и совпадают с ценой игры

Положим X* - множество максиминных стратегий игрока 1, Y* — множество минимаксных стратегий игрока 2. Е — множество седловых точек в матричной игре Гд.

Следствие 3. Если игра Та имеет цену, то

E = X*xY*. (134)

Свойство 13.4 иногда называют свойством прямоуголъности

множества седловых точек

Сформулируем теперь основные выводы, получающиеся на основании теоремы 13 1 и ук. інных из нее следствий.

Если матричная игра ішіет цену, то в ней реализуются два принципа оптимальности принцип оптимальности стратегий (s качестве оптимальных выступают максиминные стратегии игрока 1 и минимаксные стратегии игрока 2), и принцип оптимальности ситуаций (е качестве оптимальных ситуаций выступают седловые точки) При этом оба принципа оптимальности оказываются согласованными между собой: если игроки выбцра. ют оптимальные стратегии, то возникающая ситуация являещ. ся оптимальной (т. е. седловой точкой); обратно — компонента, ми любой седловой точки служат оптимальные стратегии игроков. Кроме того, исход в любой седловой точке равен цене игры

К сожалению, не всякая матричная игра имеет цену. При отсутствии цены в матричной игре нет ни оптимальных стратегий ни оптимальных ситуаций, и это обстоятельство является главным препятствием для рекомендации указанных принципов оптимальности в приложениях теории игр.

Замечание. Хотя в любой матричной игре максиминная стратегия игрока 1 и минимаксная стратегия игрока 2 всегда существуют, их можно считать оптимальными только при наличии цены игры. Дело в том, что только в этом случае исход, гарантированный максиминной стратегией игроку 1, совпадает с исходом, гарантированным минимаксной стратегией игроку 2 (этот общий гарантированный обоим игрокам ис ход и есть цена игры). Если же в матричной игре нет цены, то всякий исход с, удовлетворяющий условию vi < с < г>2, не является гарантированным исходом ни одного из игроков; тем самым игра становится неопр еде ленной.

Однако существует общий метод, который позволяет для всякой матричной игры обеспечить наличие в ней цены в некотором обобщенном смысле. Этот метод, состоящий в переходе к смешанным стратегиям, впервые был обоснован в теории игр фон Нейманом и Моргенштерном. Краткое изложение основных результатов, связанных с построением смешанного расширения матричной игры, содержится в следующем пункте.

3. По-прежнему будем обозначать через Та матричную игру с платежной матрицей А = ||а^|| (г = l,n; j = 1,тп). Множество смешанных стратегий игрока 1 (напомним, что смешанные стратегии рассматривались в лекции 11), есть

Sn = {х = (хи...,хп) Є Mn : Xi>0, ^^=l},

і = 1

а множество смешанных стратегий игрока 2 таково:

Sm^{y = (yi,..-,ym)eRm: у3>0, ]>> = і}.

i=i

Применение в игре Гд игроком 1 смешанной стратегии х Є Sn может быть интерпретировано как проведение опыта, случайными исходами котрого являются элементы {1,.. . ,n}, причем Хі — вероятность выбора стратегии г. Аналогично интерпретируется при-менение в игре Гд смешанной стратегии у £ Sm игроком 2. Предположим теперь, что игрок 1 использует смешанную стратегию х, а игрок 2 — смешанную стратегию у. Тогда вероятность возникновения ситуации (г, j) (т.е. вероятность того, что исходом первого опыта будет г, а исходом второго опыта является j) по теореме умножения вероятностей равна произведению хгу^. (Заметим, что здесь предполагается независимость выборов игроками 1 и 2 своих смешанных стратегий, т.е. каждый игрок производит выбор своего вероятностного вектора, не имея информации о выборе другого игрока.) Так как в ситуации выигрыш игрока 1 равен а, получаем, что при использовании игроками 1 и 2 смешанных стратегий х и у соответственно выигрыш игрока 1 становится случайной вели-

чиной вида £ = 1 . Будем считать математическое

\_хіУз (i=T^;j=T^) ожидание М£ этой случайной величины выигрышем игрока 1 в ситуации в смешанных стратегиях (х, у).

Итак, по матричной игре Гд построена новая игра Гд, в которой множеством стратегий игрока 1 является множество вероятностных векторов Sn, множеством стратегий игрока 2 — множество вероятностных векторов Sm, а функция выигрыша определяется равенством

FA(x,y) = Mt= Y1 (13-5)

г~ 1,...,п j = l,...,m

Заметим, что стратегия і — 1,п игрока 1 в игре Та может быть отождествлена с вероятностным вектором (0,. .., 1,. . ., 0) Є Sn,

а стратегия j = l,m игрока 2 — с вероятностным вектором

(0,..., 1,..., 0) Є Sm. Таким образом, игра Гд является расширени-з

ем игры Гд, которое получается расширением множеств стратегий игроков и продолжением их функций выигрыша. При этом первоначальные стратегии игроков в игре Гд, рассматриваемые как стратегии в игре Гд, называются чистыми. Ситуация (х, у) Є Sn X Sm называется ситуацией в смешанных стратегиях в игре Гд.

Построенная игра Гд называется смешанным расширением игры Гд.

Рассмотрим основные правила для функции выигрыша в смешанном расширении матричной игры.

Правило 13.3 а) Если игрок 1 использует смешанную сгпра тегию х = [х,....хп) Є Sn, а игрок 2 — чистую страупеги^ j = 1,т, то значение функции выигрыша в полученной ситуацщ (x,j) равно взвешенной сумме элементов j-го столбца платежной матрицы с весами х,. . . ,хп соответственно:

FA{x,j) ^^х^. (13.6)

б) Если игрок 1 использует чистую стратегию г = Т~п а игрок 2 — смешанную стратегию у = {у,...,ут) Є Sm, ?По значение функции выигрыша в полученной ситуации (і,у) равно взвешенной сумме элементов г-й строки платежной матрицы с весами «/і, ут:

Ра(Ьу) =Y,Vjal (13?)

Доказательство, а) В ситуации (x,j) исходом будет слу- 'аЛ

чайная величина rjj = 1 (г = 1,п); ее математическое ожидание

хг

равно правой части формулы (13.6).

Правило 13.4 [разложение функции выигрыша по чистый стратегиям).

а) Значение функции выигрыша FA{x. у) есть взвешенная сумма

величин FA(x,j) с весами у3 (j = 1,т): FA(x.y) = VjFA{x,]). б) Значение функции выигрыша FA(x,y) есть взвешенная сумма

величин FA(i,y) с весами хг (г — 1,п): FA(x,y) = ]Р хгРА(г,у).

t=i

Доказательство, а) Используя правило 13.3 а), имеем

FA{x,y)= (х'УзН = YlHx\%y3a'

., ,п j =1 г —1

, ,т

п ТП

J=l 4=1 J=l

Лравило 13.5 [правило гарантирующей стратегии). Зафик-

сйрУеМ некотоРое число С.

а) Пусть ї° Є S„ — смешанная стратегия игрока 1, для кото- рой Щт Лю^ой чистой стратегии j = 1,т игрока 2 выполняется ^равенство Fa(x°,j) > с. Тогда и при любой смешанной стра- тегии у Є Sm будет выполняться неравенство і<д(:г0,у) > с.

б) Пусть у0 Є Srn — смешанная стратегия игрока 2, для ко- торой при любой чистой стратегии і = l,n игрока 1 выпол- няется неравенство Fx (г, у0) < С. Тогда и при любой смешан- ной стратегии х Є Sn игрока 1 будет выполняться неравенство

Теоретико-игровой смысл утверждения а) состоит в следующем. Бели стратегия х° гарантирует игроку 1 исход С против любой чистой стратегии игрока 2, то она гарантирует ему исход С также и против любой смешанной стартегии игрока 2. Аналогично интерпретируется утверждение б).

Доказательство, а) Пусть у = [у, ■ ■ -Ут) Є Sm. Умножая неравенство Fa(x°.j) > С на у3 > 0 и суммируя по j = 1,т, получаем

т т

По правилу 13.4,а) левая часть этого неравенства равна Fa{xq. у), а правая его часть равна С.

Правило 13.6 (правило наименьшего и наибольшего значения). Рассмотрим при произвольном фиксированном у0 Є Sm функцию Ра(х,у°) как функцию переменной х, определенную на множестве Sn.

Если функция Fa(x, у0) достигает наибольшего [наименьшего) значения при х = х°, то при любой чистой стратегии г Є Spx° выполняется условие і*д(г, У°) = Fa(x°, у0).

Замечание. Через Spx здесь и далее обозначается спектр смешанной стратегии х, т е множество номеров г — l,n, для которых хъ > О Спектр смешанной стратегии составляют те чистые стратегии, которые «используются» в ней с ненулевой вероятностью

Доказательство. Установим справедливость правила 13.6 Для наибольшего значения. Тогда для любого г — 1,п выполняется Неравенство

FA(i,y°)

Предположим, что для некоторого г' Є Sp ж0 имеет место стрОГо неравенство Fa (г', у0) < Fa (ж0, у0) Умножая обе части (13^ на суммируя по г = 1, , п и учитывая, что a:°FA(i',y0^ ^

< і»Faу0), получаем Е^(»,ї°) < 1>^дОЛу0) ЛеВая

1=1 t=i х

часть этого неравенства по правилу 13 46) равна Fa{x°, у0), прав^ его часть также равна Fa(x°, у°), и мы приходим к противоречию Аналогично формулируется правило наименьшего и наибольгце го значения функции Fx(:r0,y) при произвольном фиксированном

4. Рассмотрим теперь основной результат теории матричных игр — теорему фон Неймана, положившую начало современной теории игр

Теорема 13.2 (теорема фон Неймана) Для любой матричной игры Гд

max mm Fa (ж, у) = mm max Fa (ж, у) (13 9)

xeSn yeSm y€S,n xSSn

Другими словами в смешанном расширении любой матричной игры нижняя и верхняя цена игры совпадают Общее значение левой и правой части (13 9) называется ценой игры Га в смешанных стратегиях и обозначается через vA

Укажем основную идею доказательства теоремы 13 2 В игре с платежной матрицей А исход С 6 К называется гарантированным исходом игрока 1, если у игрока 1 существует такая смешанная стратегия х что при любой смешанной стратегии у игрока 2 выполняется неравенство Fa{x°, у) > с Исход с называется гарантированным исходом игрока 2, если у игрока 2 существует такая смешанная стратегия у0, что при любой смешанной стратегии х игрока 1 выполняется неравенство Fa(x,j/°) < с Если одно из этих неравенств выполняется как строгое то говорят, что исход с строго гарантируется игроку

Очевидно, что ни один исход С Є К не может одновременно строго гарантироваться игроку 1 и гарантироваться игроку 2 (тогда выполни лись бы неравенства Fa(x°,у°) > с и Рл(х°,у0) < С, что невозможно) Таким образом, множество строго гарантированных исходов игрока 1 и множество гарантированных исходов игрока 2 не пересекаются Утверж дение теоремы фон Неймана эквивалентно тому, что эти множества образуют покрытие действительной прямой, т е каждый исход С Є К либо строго гарантируется игроку 1, либо гарантируется игроку 2 В самом деле ясно что произвольный исход с Є К строго гарантируется игроку 1 тогда и только тогда, когда с < max mm Ра(х,у), гарантируется

mcv 2 тогда и только тогда, когда С > mm max Fa (х, у) Если бы вы

1іГрОЛ.Г yeSm x

ляялось неравенство max mm Рл(х,у) < mm max Fa(x, у), то любой

схоД С-* включенный между ними, не являлся бы ни строго гарантиро-дляым исходом игрока 1, ни гарантированным исходом игрока 2

Для доказательства теоремы фон Неймана достаточно доказать, что в произвольной матричной игре нулевой исход либо строго гарантирует-игроку 1, либо гарантируется игроку 2 (так как переход от нулевого йСХОда к исходу С осуществляется прибавлением константы С ко всем элементам платежной матрицы) Далее, в силу правила 13 5, гарантиро ванность исхода игрока против произвольной смешанной стратегии дру foro игрока равносильна гарантированности этого исхода против любой чистой стратегии другого игрока Таким образом, утверждение теоремы фон Неймана сводится к тому, что для произвольной матрицы А имеет место одна из следующих двух альтернатив

(а) Существует такой вероятностный вектор х° Є S„, что для всех j = 1, т выполняется неравенство Fa(x°,j) > О,

(fl) Существует такой вероятностный вектор у0 Є Sm, что для всех г= 1,п выполняется неравенство Fa(i У°) < О

Это так называемая лемма о двух альтернативах Доказательство леммы основано на теореме об отделяющей гиперплоскости Несложно проверить (см , например, [4]), что первая альтернатива реализу ется, если выпуклая оболочка системы векторов (ei e^b1, ,bm), где ei, ,е„ единичные векторы пространства R" и b1, ,bm — векторы-столбцы матрицы А, не содержат нулевой точки, в противном случае реализуется вторая альтернатива

Замечание Цена va игры Та в смешанных стратегиях удовлетво ряет двойному неравенству

где v — нижняя цена, v2 — верхняя цена матричной игры Та

Действительно, пусть г* — максиминная (чистая) стратегия игрока 1 в игре Та Тогда при любом j = 1, т выполняется неравенство FA(i*,j) > vi По правилу гарантирующей стратегии 13 5,а) отсюда следует, что при любой смешанной стратегии у Є Sm выполняется неравенство F^li* ,у) > vx, откуда mm Fa (г*, у) >

yesm

значит, max mm Fa (ж, у) > vi, т е va > щ Аналогично проверя-

x£Sny€Sm

ется неравенство г>д < v2 Таким образом, если матричная игра Гд Имеет цену в чистых стратегиях, то, согласно (13 10), цена игры Гд в чистых стратегиях и цена игры Гд в смешанных стратегиях сов падают

Из теоремы 13.2 вытекает ряд важных следствий, касающихСя оптимальных стратегий игроков и седловых точек в смешанном решении матричной игры. Понятие седловой точки в смешанном расширении игры Гд вводится аналогично понятию седловой точки матричной игры. А именно, она определяется как ситуация (ж0,)/1) в смешанных стратегиях, одностороннее отклонение от которои уменьшает (точнее, не увеличивает) выигрыш отклонившегося игрока FA(x,y°) < FA(x°,y°) < FA(x°,y) (х Є 5П, у Є Sm).

Далее, максиминные (минимаксные) стратегии игроков в смешанном расширении матричной игры определяют тем же способом, что и для матричной игры, — при замене оценочной функции аг = mina^ на оценочную функцию а(х) = min FA(x,y)

3 y€Sm '

и оценочной функции /З3 = maxa^ на оценочную функцию

/3(у) = max FA(x, у). Максиминная смешанная стратегия х° игро-

x€Sn

ка 1 характеризуется равенством

q(x°) = тахй(ж) = max min FA(x,y) = vA, (13.11)

а минимаксная смешанная стратегия у0 игрока 2 — равенством

Р{у°) = min Щу) = min maxFA(x,y) = vA. (13.12)

yeSm yeS„, x£S„

Доказательство теоремы 13.1 переносится на случай смешанного расширения матричной игры практически без изменений (с заменой оценочных функций аг и (З3 на а(х) и /3(у)). Учитывая теорему фон Неймана, имеем следующий результат.

Теорема 13.3. (связь седловой точки с ценой игры в смешанном расгиирении матричной игры).

Пусть (х°;у°) — седловая точка в смешанном расширении матричной игры Гд. Тогда:

а) х° — максиминная стратегия игрока 1;

б) у0 — минимаксная стратегия игрока 2;

в) исход в седловой точке равен цене игры.

Любая ситуация в смешанных стратегиях (х°,у°), где х° ~~ м.аксиминная стратегия игрока 1 и у0 — минимаксная стартегия игрока 2, является седловой точкой в смешанном расширении игры Гд.

Следствие 1. Для любой матричной игры Гд существует седловая точка в смешанных стратегиях.

Следствие 2. В смешанном расширении матричной игры исходы во всех седловых точках совпадают и равны цене игры в смешанных стратегиях.

Следствие 3. Пусть X — множество максиминных стратегий ЙГрока 1, Y — множество минимаксных стратегий игрока 2, Е — множество седловых точек в смешанным расширении игры Га-

Тогда _ _

£ = 1*хГ*. (13.13)

Для антагонистических игр, имеющих цену, можно ввести принципы оптимальности стратегий игроков и принцип оптимальности ситуаций следующим образом.

а) Под оптимальной стратегией игрока 1 будем понимать его максиминную стратегию;

б) под оптимальной стратегией игрока 2 будем понимать его минимаксную стратегию;

в) под оптимальной ситуацией будем понимать седловую точку.

В этих терминах теорема 13.2 означает, что для класса матричных игр введенные принципы оптимальности реализуются в смешанных расширениях этих игр. Следствие 3 показывает, что данные принципы оптимальности согласованы между собой, а следствие 2 — что они согласованы с принципом оптимальности исходов, согласно которому оптимальным исходом матричной игры является ее цена в смешанных стратегиях.

5. Задача 16. Профилактика нежелательного события.

Принимающий решение ожидает наступление одного из т нежелательных событий, не располагая никакими данными о вероятностях их наступления. В качестве нежелательных событий могут выступать, например, стихийные бедствия, неисправности в функционировании технической или организационной системы, проверки со стороны контролирующего органа и т.п. Величина ущерба При наступлении события j равна q3 > 0 (j = l,m) и известна принимающему решение.

Имеется п профилактических действий, направленных на Уменьшение ущерба от нежелательных событий; пусть рг > 0 — стоимость г-го профилактического действия (г = 1,п). Если принимающий решение выбирает профилактическое действие г, а «природа» осуществляет событие j, то итоговые потери для принимающего решение будут выражаться некоторой величиной Ь? (г = ^ l,n; j — l,m). Для простоты будем считать что всякое профи-

7 Розен В В

193

лактическое действие либо сводит ущерб от нежелательного собы тия до нуля (защищает от последствий этого события), либо не ока зывает никакого влияния на величину ущерба (не защищает от ц0 следствий нежелательного события). Тогда потери в ситуации ({, jj составляют

: I pi, если действие г защищает от последствий события j I Pi + Qj — в противном случае.

В результате получаем матричную игру принимающего решение (игрок 1) с природой (игрок 2), причем матрица ||^|| является матрицей потерь для принимающего решение.

Рассмотрим конкретный пример такой игры. Пусть ожидаемое нежелательное событие — наводнение, которое может иметь категорию с первой по пятую; профилактическое действие состоит в строительстве дамбы. Будем считать, что имеется пять вариантов выбора высоты дамбы h < h2 < /13 < /14 < h$, причем дамба высоты защищает от наводнения, имеющего категорию не выше г-й и не защищает от наводнения, имеющего категорию выше г-й. В табл. 13.3 приведены затраты на строительство дамбы, а в табл. 13.4 — величины ущерба от наводнения (в некоторых денежных ед.).

В данной матричной игре принимающий решение имеет шесть стратегий (не строить дамбу вообще или строить дамбу высоты Ы, і — 1,5); природа также имеет шесть стратегий (не осуществлять наводнение или осуществить наводнение j'-й категории, j = 1,5)-

Чтобы получить из табл. 13.5 матрицу выигрышей, достаточно у всех элементов поменять знак или ввести выигрыши по формуле

где С — любая константа (в данном случае константа С может интерпретироваться как сумма, выделенная на строительство дамбы, тогда выигрыш а представляет собой сэкономленную сумму). Взяв, например, С = 30, получаем матрицу выигрышей, заданную табл. 13.6.

В полученной матричной игре имеется единственная седловая точка (Л5;5).

Итак, рассматриваемая матричная игра имеет седловую точку в чистых стратегиях; стратегия г* = /15 является оптимальной (максиминной) стратегией игрока 1, а стратегия j* = 5 — оптимальной (минимаксной) стратегией игрока 2. Цена игры в чистых стратегиях существует и равна 10 денежным ед.

195

| Оглавление|

Лучшие книги

ВВЕДЕНИЕ В КУЛЬТУРОЛОГИЮ

Гражданский процесс: Вопросы и ответы

ЗАПАДНОЕВРОПЕЙСКОЕ ИСКУССТВО от ДЖОТТО до РЕМБРАНДТА

Коммерческое право России

Коммуникации стратегического маркетинга

Консультации по английской грамматике: В помощь учителю иностранного языка.

Международные экономические отношения

Налоги и налоговая система России

Основы права

Теория государства и права

Все материалы на сайте представлены исключительно для ознакомления. Все права на книги остаются за авторами. Если вы являетесь автором той или иной книги и не хотите видеть её на сайте, то напишите нам и мы в кротчайшие строки удалим её.

Лекция 13. антагонистические игры

Содержание