Название: Математические модели принятия решений в экономике - Розен В. В.

Жанр: Экономика

Рейтинг:

Просмотров: 904


Лекция 12. принятие решения в условиях риска с возможностью проведения экспериметпа

 

с Эксперимент как средство уточнения истинного состояния среды. ф Идеальный эксперимент; нахождение максимально допустимой сто­имости идеального эксперимента. • Байесовский подход к принятию решения в условиях риска. • Задача 15. Бурение нефтяной скважины.

1. При принятии решения в условиях неопределенности (или в условиях риска) принципиальная сложность выбора решения воз­никает из-за незнания принимающим решение истинного состоя­ния среды. В лекциях 8-11 рассмотрено несколько типов критери­ев, каждый из которых по-своему «борется» с неопределенностью: с помощью выдвижения гипотезы о поведении среды (критерии Лап­ласа, Вальда, Гурвица, Сэвиджа); с помощью усреднения получа­емых выигрышей (критерий ожидаемого выигрыша); с помощью учета как ожидаемого выигрыша, так и меры отклонения от него (обобщенный критерий q(M,o)) на базе субъективного отношения принимающего решение к риску (критерий ожидаемой полезности). Однако, каждый из этих подходов дает лишь способ рациональ­ного анализа неопределенности, не «.уничтожая» самой неопреде­ленности. «Уничтожение» (или хотя бы уменьшение) неопределен­ности может быть произведено только на основе уточнения истин­ного состояния среды.

На практике такое уточнение осуществляется, как правило, с помощьюсбора дополнительной информации, а также с помощью проведения экспериментов, по результатам которых судят об име­ющемся состоянии среды. Например, прежде, чем приступить к ле­чению больного при неясном диагнозе, врач проводит дополнитель­ные анализы; прежде, чем бурить дорогостоящую нефтяную сква­жину, геолог производит сейсморазведку; прежде, чем наладить производство какого-либо товара, предприниматель изготавливает пробную партию этого товара и т.д. В рамках теории принятия

6 Розен B.B.

161

решений все эти действия означают не что иное, как проведец^ эксперимента с целью уточнения состояния среды.

Эксперимент называется идеальным, если по его результату принимающий решение узнает истинное состояние среды. На прах тике наличие идеального эксперимента — явление достаточно pejJ кое. Чаще всего результат эксперимента дает некоторую информа цию, на основе которой может быть произведено уточнение состоя­ния среды. Например, в ситуации с неясным диагнозом о наличии болезни (А), ответ — после проведения дополнительного анализа —. будет не «у больного заболевание (А)», а например, «у больного по. вышенный лейкоцитоз». При желании врач может воспользоваться статистическими данными, из которых он узнает, например, что повышенный лейкоцитоз у людей с заболеванием (А) наблюдает­ся в 70\% случаев, но его повышение может вызываться и другими заболеваниями.

Как использовать результаты эксперимента и имеющиеся ста­тистические данные при принятии решений наиболее эффективно? В п. 3 данной лекции рассматривается одна из методик, позволяю­щая решить эту проблему. Она основана на формуле Байеса — фор­муле переоценки вероятностей событий с учетом результата прове­денного эксперимента.

Отметим, что не для всякой задачи принятия решения экспери­мент является возможным. Если для некоторой ЗПР эксперимент возможен, то возникает задача оценки целесообразности его про­ведения. Дело в том, что проведение эксперимента всегда требует затрат (материальных, организационных, временных и пр.). Соот­несение дополнительной выгоды, которую мы ожидаем получить от дополнительной информации, приобретаемой в результате экс­перимента, и затрат на его проведение — в этом и состоит суть проблемы целесообразности проведения эксперимента.

Следует иметь в виду, что особенно существенной является возможность проведения эксперимента для «уникальных» задач принятия решений, т.е. таких*, в которых решение принимается только один раз и связано с большими материальными затратами.

2. Рассмотрим задачу нахождения максимально допустимой стоимости идеального эксперимента. Пусть задача принятия ре­шения в условиях риска задана матрицей выигрышей ||а^|| (г = l,n; j = 1,тп), причем принимающему решение известен ве­роятностный вектор у = (уі,. .., 2/m), где у3 — вероятность наступ­ления состояния j (табл. 12.1).

 

 

Уі

Уз

Ут

 

1 ...

І

... т

1

 

 

 

і

 

 

п

 

 

 

max

 

 

 

Возьмем здесь в качестве оценки альтернативы і соответству-

m        

ющий ей ожидаемый выигрыш, т.е. число ^3 аІУ]  (* = 1>п)- Мак-

J = l

симальный ожидаемый выигрыш есть

 

(12.1)

3=1

Предположим, что принимающий решение может провести иде­альный эксперимент, т.е. такой эксперимент, по результату кото­рого он узнает истинное состояние среды. Обозначим через С сто­имость идеального эксперимента. Пусть в результате проведения эксперимента принимающий решение узнал, что среда находит­ся в состоянии j. Тогда, естественно, он выберет альтернативу, которая дает максимальный выигрыш в состоянии j, т.е. выиг­рыш (З3 = таха^. Так как вероятность того, что среда окажется

г

На £ =

Уз

в состоянии j, равна у3, а выигрыш в этом случае равен /З3, то получаем,что результатом идеального эксперимента (до его про­ведения) для принимающего решение является случайная величи-|>1

, которой соответствует ожидаемый выигрыш

(3 = 1,т)

М£ =      Р3У]- Вычитая отсюда стоимость эксперимента, находим

3=1

т

итоговый выигрыш при проведении эксперимента: ( ^3 Р3Уз ~ С)

3=1

Таким образом, идеальный эксперимент будет выгодным тогда и только тогда когда

163

Y^fv} - c > тах^а^у^.            (12 2)

 

Перенося член, из правой части неравенства (12.2) в левую его часть и используя тождество —тахХ   =  тт(—Х), получаем

т

min.J2(P3 ~ аг)Уз  > С- Вспоминая, что ft - а]г = г3 — рИск

1 3=1

в ситуации     (см. лекцию 8, п. 3), приходим к неравенству

m

min ^гІУз > С-

Итак, идеальный эксперимент является выгодным тогда и только тогда, когда его стоимость меньше минимального ожи­даемого риска.

га

Величина min     rlУз является максимально допустимой стои-

1    3 = 1

мостью идеального эксперимента.

3. Для изложения байесовского подхода к переоценке вероятнос­тей событий напомним некоторые понятия из элементарной теории вероятностей.

Условная вероятность события А при условии, что произошло событие В, обозначается через Рд(А) и вычисляется по формуле

 

Рассмотрим следующую теоретико-вероятностную схему. Пусть {А,...,Ат} — полная группа событий (иногда их называют гипотезами) и для каждой гипотезы А3, j — l,m известна ее вероятность Р(А>). Пусть произведен опыт, в результате которо­го произошло событие В. Если известны условные вероятности Рд (В) для всех j — l,m, тогда условная (послеопытная) веро­ятность события Aj (j — 1, m) может быть найдена по формуле Байеса *

р ,л s_P(A3nB) Р(А3)РА](В)

FB(A3) -         — = —            . (12.4)

£ P(Ak)PAk(B) fc=l

Рассмотрим теперь в схематической форме задачу принятия ре­шения в условиях риска, заданную с помощью матрицы выигры­шей, которая имеет вид табл. 12.2.

 

Аг

 

А3

 

Am

1

 

 

 

 

 

 

 

 

 

 

 

і

 

 

 

 

 

 

 

 

 

 

п

 

 

 

 

 

Здесь {1,..., n} — стратегии принимающего решение (игрока), {А, ■ ■ ■ ■ Агп} — состояния среды, — выигрыш игрока в ситу­ации, когда он выбирает стратегию ?, а среда принимает состоя­ние Aj. Принимающему решение (игроку) для каждого j = 1,т известна вероятность Р(А3) наступления состояния А,, причем

т

P(Aj) > О, Y^, Р{А-з) = 1- Предполагается, что среда может нахо­жі

диться в одном и только одном из состояний {А,.... Ат}, другими словами, случайные события {А,.. ., Ат} образуют полную груп­пу событий, поэтому их можно взять в качестве гипотез в рамках рассмотренной выше теоретико-вероятностной схемы. Известные игроку вероятности состояний среды Р(А), ■ ■ ■ , Р(Ат) являются безусловными (доопытными) вероятностями.

Предположим.что проводится некоторый эксперимент, резуль­тат которого как-то зависит от имеющегося состояния среды. Если в результате эксперимента наблюдается событие В и, кроме того, известны условные вероятности Paj(B) при всех j = 1,т, то ис­пользуя формулу Байеса (12.4), можно найти уточненные (послео-пытные) вероятности каждого состояния среды. Знание уточнен­ных вероятностей состояний среды позволяет более точно указать оптимальную стратегию игрока.

Описанный подход к принятию решений в условиях риска на­зывается байесовским, так как он основан на формуле Байсса. Этот подход иллюстрируется примером, рассмотренным в следую­щем пункте.

4. Задача 15. Бурение нефтяной скважины. Руководитель поисковой группы должен принять решение: бу­рить нефтяную скважину или нет. Скважина может оказаться

«сухой» (С), т.е. без нефти, «маломощной» (М), т.е. с малым со держанием нефти, и «богатой» (Б), т.е. с большим содержание^ нефти. Альтернативами руководителя группы являются: xj — Qy_ рить и хг — не бурить. Чистая прибыль (в тыс. долларов) цр^ выборе одной из этих альтернатив в зависимости от возможного типа скважины приведена в таблице прибылей (табл. 12.3).

Кроме того, руководителю поисковой группы известно, ЧТО в данной местности вероятности сухой, маломощной или богатой скважины таковы: Р(С) = 0,5; Р(М) = 0,3; Р{Б) = 0,2.

Руководитель поисковой группы может провести эксперимент с целью уточнения состояния среды. Этот эксперимент представ­ляет собой сейсморазведку, результатом которой будет ответ — ка­кова структура грунта в данной местности (но не ответ на вопрос о типе скважины!) В принципе структура грунта может быть ли­бо открытой (О), либо замкнутой (5). Руководитель группы имеет таблицу результатов экспериментов, проведенных в этой местности (табл. 12.4).

Эта таблица показывает, сколько раз на грунтах открытой и грунтах замкнутой структуры встречались скважины типа С, М, Б (т. е. она дает совместную статистику структуры грунта и типов скважин для данной местности).

Итак, руководитель группы должен принять решение:

а)         проводить ли эксперимент (его стоимость составля- ет 10тыс. долларов);

б)         если проводить, то как поступать в дальнейшем в зависи- мости от результата эксперимента.

Таким образом, получена многошаговая задача принятия реше­ний в условиях риска. Опишем методику нахождения оптимального решения по шагам.

Шаг 1. Построим дерево (рис. 12.1), на котором указаны все этапы процесса принятия решений — дерево решений. Ветви дерева соответствуют возможным альтернативам, а вершины — возника­ющим ситуациям. Альтернативами руководителя поисковой груп­пы являются: а — отказ от эксперимента, /3 — проведение экспе­римента, Х — бурить, Х2 — не бурить. Альтернативы природы: выбор типа скважины (С, М, Б), а. также выбор структуры грунта (О или 3).

Построенное дерево определяет игру руководителя группы (иг­рок 1) с природой (игрок 2). Позициями данной игры служат вер­шины дерева, а ходами игроков — выбираемые ими альтернативы. Позиции, в которых ход делает руководитель группы, изображе­ны прямоугольником; позиции, в которых ход делает природа, — кружком.

Пояснение. Игра протекает следующим образом. В начальной пози­ции ход делает игрок 1 (руководитель группы). Он должен принять ре­шение — отказаться от эксперимента (выбрать альтернативу а) или проводить эксперимент (выбрать альтернативу /3). Если он отказался от проведения эксперимента, то игра переходит в следующую позицию, в ко­торой руководитель группы должен принять решение: бурить (выбрать альтернативу х) или не бурить (выбрать альтернативу x-z). Если же он решает проводить эксперимент, то игра переходит в позицию, в которой ход делает природа, выбирая одну из альтернатив О или 3, соответству­ющих возможным результатам эксперимента, и т.д. Игра заканчивается тогда, когда она переходит в окончательную позицию (т.е. в вершину де­рева, для которой нет исходящих из нее ветвей).

Шаг 2. Для каждой альтернативы, которая является ходом при­роды (т.е. исходит из позиции, изображенной кружком), надо най­ти вероятность этого хода. Для этого поступаем следующим об­разом. Для каждой позиции дерева существует единственный путь, соединяющий эту позицию с начальной позицией. Если для позиции природы путь, соединяющий ее с начальной позицией, не проходит через позицию (Э), означающую проведение эксперимента, то ве­роятности состояний Р(С), Р(М) и Р{Б) являются безусловными (доопытными) и находятся из табл. 12.4:

Подпись:
а =рхах+ргаг+ръаъ    Ь2= max {Ьь Ъъ Ъъ)

Рис. 12.2         Рис. 12.3

 

Рели же для позиции природы путь, соединяющий ее с начальной позицией, проходит через позицию (Э), то вероятности состояний среды становятся условными вероятностями и находятся по форму­ле (12.4):

P°^=-T(0f = 0760 = 4' р^

п        Р{м п о)   оді п

 

Р0(Б) = ад^і = ^ = JL, ад)

Р(С П 3) _ ОДК _ 1 Р{3)    ~~ 0^40 ~~ 8'

Р(М П .?) _ 0Д9 _ 19 Р(3)     ~ 0,40 _ 40'

Р(5 П 3) _ ОДб _ 2 Р(3)     ~~ 0^40 ~ 5'

 

В позиции (Э) вероятности ходов, приводящих к позициям (О) и (3), находятся из табл. 12.4: Р(О) = 60/100 = 0,6; Р(3) = = 40/100 = 0,4.

Шаг 3. Произведем оценку всех позиций дерева игры, «спуска­ясь» от конечных позиций к начальной. Оценкой позиции служит ожидаемый выигрыш в этой позиции. Оценки конечных позиций находим из табл. 12.3. Укажем теперь способ нахождения оценки произвольной позиции дерева игры в предположении, что уже най­дены оценки всех следующих за ней позиций.

а)         Для позиции природы ее оценка находится как сумма попар- ных произведений оценок следующих за ней позиций на вероятности этих позиций (см. рис. 12.2). Другими словами, для позиции приро- ды ее оценка представляет собой ожидаемый выигрыш в соответ- ствующей лотерее.

б)         Для позиции игрока 1 оценкой служит максимум всех оценок следующих за ней позиций (рис. 12.3). Мотивировка: в «своей» Позиции игрок может сделать любой ход, поэтому он выберет

 

тот, который приводит к наибольшему возможному выигрыщу В каждой позиции игрока 1 помечаем черточкой ту ветвь дерева которая приводит к позиции, имеющей максимальную оценку.

При оценке позиции (Э), соответствующей проведению экспе­римента, вычитаем его стоимость.

Обратимся к рис. 12.1. Получаем, что в начальной позиции ожи- даемая прибыль без проведения эксперимента (альтернатива а)           

20тыс. долларов; ожидаемая прибыль с проведением эксперимента (альтернатива /3) — 28 тыс. долларов. Таким образом, целесообраз­ным является решение — проводить эксперимент (сейсморазведку). Далее, если эксперимент покажет, что грунт открытый, то бурение производить не следует, а если замкнутый, то нужно бурить.

В игре с природой произвольная стратегия игрока 1 задается указанием альтернативы, выбираемой в каждой его позиции. В дан­ной игре оптимальной будет та стратегия игрока 1, которая пред­писывает в каждой позиции выбор хода, соответствующего поме­ченной альтернативе.

Замечания. 1. В рассмотренном примере в качестве оценок позиций природы использовалось математическое ожидание выигрыша. Это озна­чает, что была принята гипотеза безразличия к риску. Если мы хотим учесть отношение принимающего решения к риску, то необходимо иметь дополнительно кривую денежных эквивалентов, заданную на интервале возможных выигрышей. Тогда для любой позиции природы ее оценка находится как ДДЭ соответствующей лотереи (см. лекцию 10, п.З). При этом, чтобы учесть стоимость проведения эксперимента, удобно ее сразу вычесть из оценок всех окончательных позиций, пути в которые проходят через позицию (Э).

2. Можно также дать оценку всех позиций рассматриваемой игры не в денежных единицах, а в единицах полезности. Для этого надо постро­ить на интервале возможных денежных выигрышей функцию полезности принимающего решение. В этом случае оценки всех окончательных по­зиций следует указывать не в деньгах, а в полезностях. Оценка позиции природы находится здесь как ожидаемая полезность лотереи в полезнос­тях, т.е. по формуле (10.5), а оценка позиции игрока 1 — как максимум оценок следующих за ней позиций.

РЕЗЮМЕ И ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ

 

I. Реализационная структура задачи принятия решения состо­ит из множества альтернатив (стратегий) X, множества состояний среды Y, множества исходов А и функции реализации F : ХхУч А. Принятие решения в условиях неопределенности характеризу­ется тем, что принимающий решение не имеет никакой дополни­тельной информации о появлении того или иного состояния среды, поэтому при выборе альтернативы і€Іон знает лишь, что будет реализован один из исходов F(x, у), где у Є Y.

Если оценочная структура задачи принятия решения задана в форме оценочной функции (р: А —> R, то такая ЗПР в услови­ях неопределенности может быть представлена в виде {X, Y, /), где / = (р о F — целевая функция. Число f(x, у) выражает полезность (ценность) для принимающего решение того исхода, который воз­никает в ситуации, когда он выбирает альтернативу х Є X, а среда принимает состояние у Є У.

Задача принятия решения в условиях неопределенности, в кото­рой множества X и Y конечны, может быть представлена в виде матрицы выигрышей (платежной матрицы) ||а^|| (г = 1,п; j = ~ 1,т); здесь {1,...,го} — множество стратегий (альтернатив) принимающего решение, {1,. . ., те} — множество состояний среды, а —выигрыш принимающего решение в ситуации

Единого принципа оптимальности для задач принятия решений в условиях неопределенности не существует. Сужение множества стратегий в такой задаче может быть произведено за счет отбрасы­вания доминируемых стратегий. Доминирование і > г'2 означает, Что при любом состоянии среды j = 1, те выполняется а?г > aJl2, при этом стратегия i называется доминирующей, а стратегия \%2 — доминируемой. Однако недоминируемых стратегий обычно бывает Иного, поэтому возникает проблема сравнения по предпочтитель­ности недоминируемых стратегий.

II. Для сравнения между собой стратегий по их предпочтите ности в ЗПР в условиях неопределенности используется ряд крИт " риев, каждый из которых основан на некоторой гипотезе о поведи нии среды.

(1) Критерий Лапласа базируется на гипотезе равновозмож;НОс ти (равновероятности) состояний среды. Этот критерий приводйт к оценке стратегии г в виде среднего арифметического выигрыщ^ возможных при выборе стратегии і:

 

m

j=i

Оптимальной при этом считается стратегия, максимизирующая оценку Ь(г).

(2)        Критерий Вальда основан на гипотезе антагонизма, при

этом оценкой стратегии г является W_(i) = mina^. Стратегия, мак-

з

симизирующая оценку W_(i), называется максиминной стратеги­ей, а принцип оптимальности, заключающийся в максимизации оценки W_(i), — принципом максимина. Если элементы платеж­ной матрицы рассматриваются как потери, то при гипотезе анта­гонизма оценкой стратегии г

W(t) — raaxaj. з

Стратегия, минимизирующая оценку W{i). называется минимакс-ной, а соответствующий ей принцип оптимальности — принци­пом минимакса.

Критерий Гурвица предполагает, что при любом выборе стратегии принимающим решение наихудший для него вариант реализуется с вероятностью а, а наилучший — с вероятностью 1 — a, где 0 < а < 1 — некоторое фиксированное число (показатель пессимизма). По Гурвицу оценкой стратегии г является число

HQ(i) = aminftf + (1 — a) max а?.

з з

Оптимальной по Гурвицу считается стратегия, максимизирующая оценку На(г).

По критерию Сэвиджа оптимальной считается стратегия, минимизирующая максимальный риск. (Риском в ситуации

(З3 - а{, где [З3 = nvaxa].)

0 общем случае оптимальные стратегии, полученные по ука-ацньім критериям, могут не совпадать. Это объясняется тем, что «ньіе критерии основываются на разных гипотезах, а всякая ги­потеза есть предположение, а не знание.

III. Принятие решения в условиях риска характеризуется тем, чТо существует некоторая вероятностная мера, в соответствии с ко­торой возникают те или иные состояния среды. Построение мате­матической модели принятия решения в условиях риска предпола­гает наличие у принимающего решение некоторой информации об этой вероятностной мере. Далее мы ограничиваемся рассмотрени­ем случая, когда множества X и Y конечны и вероятностная ме­ра на множестве состояний среды задана вероятностным вектором у z= (уі,..., Ут), который предполагается известным принимающе­му решение (здесь у3 есть вероятность наступления состояния j,

гп

yj > о, £ \% = і)-.7=1

В ЗПР в условиях риска исходом для принимающего решение при выборе им альтернативы г является некоторая случайная ве­личина £г; поэтому сравнение альтернатив сводится к сравнению соответствующих им случайных величин Наиболее естественной характеристикой случайной величины £г служит ее математичес­кое ожидание (ожидаемое значение) А/£,, которое в математичес­ких моделях принятия решений интерпретируется как ожидаемый выигрыш. Показано, что в ЗПР в условиях риска критерий ожидае­мого выигрыша не является адекватным и должен быть трансфор­мирован с учетом возможных отклонений случайной величины от ее ожидаемого значения. В качестве меры отклонения произвольной случайной величины £ от ее ожидаемого значения обычно берется среднеквадратичное отклонение (СКО) а^. где ст| = Л/(£ — М£)2. Характеризуя случайную величину £г парой показателей (М,,аг), где Мг = М^г — ожидаемый выигрыш, аг = erg, — показатель рис­ка, приходим в результате к двухкритериальной ЗПР. для нахож­дения оптимального решения которой можно использовать методы многокритериальной оптимизации (см. лекции 5-7).

Наиболее простой метод «превращения» многокритериальной ЗПР в однокритериальную состоит в построении обобщенного кри­терия. В лекции 9 рассмотрен обобщенный критерий

 

q(M, сг) = М - Лег,

который (при Л > 0) отражает стремление принимающего решение к увеличению ожидаемого выигрыша и уменьшению риска отклоне­ния от него; при этом Л можно рассматривать как субъективный по­казатель меры несклонности принимающего решение к риску (субъ­ективный показатель осторожности). Показано, что существуют «пороговые значения» показателя осторожности Л°, Л* такие, что если для принимающего решение выполняется условие 0 < Л < Л° то для него ранжирование Парето-оптимальных альтернатив по об­общенному критерию q(M,a) совпадает с ранжированием по вели­чине ожидаемого выигрыша; если А > А*, то ранжирование по кри­терию q(M, а) совппадает с ранжированием по величине показателя риска.

Нахождение оптимального решения без построения обобщенно­го критерия основано на отношении доминирования по Парето (см. лекцию 5). Первый шаг — выделение Парето-оптимальных ис­ходов. Второй шаг — выбор оптимального исхода из множества Парето-оптимальных — производится либо непосредственно при­нимающим решение, либо с предварительным сужением Парето-оптимального множества. При втором подходе требуется дополни­тельная информация от принимающего решение об относительной важности критериев М и сг. Здесь можно использовать, например, метод выделения главного критерия (субоптимизация) или метод упорядочения критериев по их относительной важности (лексико­графическая оптимизация).

IV. Оценка случайной величины (лотереи) £ парой показателей (М, сг), где М = М£ — ожидаемый выигрыш и сг = ст^ — пока­затель риска, не является единственно возможной. Существует об­щий метод нахождения субъективной оценки лотерей, состоящий в построении функции полезности принимающего решение. При построении этой функции основным является понятие детермини­рованного эквивалента (ДЭ) лотереи.

Под детерминированным денежным эквивалентом (ДДЭ) денеж­ной лотереи £ понимается денежная сумма х, которая для принима­ющего решение эквивалентна его участию в этой лотерее.

Для нахождения ДЭ произвольной лотереи, выигрыши которой »аключены между а и А, достаточно уметь находить ДЭ некоторых тростых лотерей (т.е. лотерей с двумя выигрышами: а и А).

Сравнение лотерей по их ДЭ дает способ сравнения альтернатив і ЗПР в условиях риска, учитывающий как величину возможных ьыитрышей, так и субъективное отношение принимающего реше­лие к риску. При этом для принимающего решение его несклонность к риску заключается в том, что указываемый им ДЭ произволь­ной лотереи меньше ожидаемого выигрыша; склонность к риску заключается в том, что ДЭ лотереи больше ожидаемого выигры­ша; безразличие к риску состоит в том, что ДЭ лотереи совпадает с ожидаемым выигрышем.

Остановимся теперь на понятии функции полезности. Пусть q — некоторый критерий (например, денежный или временной), значе­ния которого заключены между а и Л. Эмпирическая функция по­лезности критерия q есть функция и, которая каждому х Є [а, А] ставит в соответствие число и{х) = р Є [0,1] так, что х являет-

а А

ся детерминированным эквивалентом простои лотереи   ^ .

Линейное продолжение й функции и на множество лотерей с вы­игрышами из интервала [а, А] есть функция полезности лотерей. При этом для лотереи £ величина й(£) называется ожидаемой по­лезностью лотереи £. Важным свойством функции й является ее линейность (относительно операции «смешивания» лотерей). Ес­ли критерий q является монотонным (т.е. принимающий решение всегда стремится либо к его увеличению, либо к уменьшению), то сравнение лотерей по их детерминированным эквивалентам равно­сильно сравнению ожидаемых полезностей этих лотерей.

Аксиоматический подход к вопросу сравнения лотерей по пред­почтению впервые был предпринят Нейманом и Моргенштер-ном [41]. Основной их результат, полученный в этом направлении,

может быть описан следующим образом.

*

Пусть У — отношение нестрогого предпочтения лотерей (ко-торое представляет собой объединение строгого предпочтения У- и

отношения безразличия ~). Для отношения У вводятся две акси­омы (Al) и (А2), где аксиома (А1) носит чисто математический

характер и выражает непрерывность отношения У, а смысл аксио­мы (А2) состоит в том, что при «смешивании» двух безразличных лотерей с любой третьей получающиеся лотереи будут безразлич­ными. Результат Неймана и Моргенштерна состоит в следующем.

Всякое отношение предпочтения У, устанавливающее полное ранжирование множества лотерей и удовлетворяющее ак­сиомам (Al) и (А2), совпадает с предпочтением, которое устана­вливается по величине ожидаемой полезности лотерей для неко­торой функции полезности и рассматриваемого критерия. Щи этом функция и единственна с точностью до фиксирования .нас штаба и начала отсчета.

Замечание Полезно сравнить этот результат с правилом 7.2, ха­рактеризующим способы установления полного ранжирования вектор­ных оценок

V. В лекциях 11 и 12 для ЗПР в условиях риска рассматрива­ются способы уменьшения риска. В лекции 11 излагается способ уменьшения риска, осуществляемый за счет перехода к смешан­ным стратегиям. Пусть {1,п} — множество альтернатив (чистых стратегий) в задаче принятия решения в условиях риска. Смешан­ной стратегией называется вектор х = (х,.. .,хп), где хг > О

п

^2 хг — 1 Смешанная стратегия может быть реализована одним из

»=1

следующих трех способов: (а) введением механизма случайного вы­бора; (б) как «физическая смесь» чистых стратегий; (в) как доля соответствующих чистых стратегий при многократном принятии решения.

В ЗПР в условиях риска использование смешанных страте­гий с целью повышения ожидаемого выигрыша бесполезно. Однако «смешивание» стратегий может привести к снижению риска; эта возможность определяется характером корреляции случайных ве­личин (£г)г=у-^, являющихся результатом выбора чистых страте­гий. В частности, если случайные величины (£,) попарно не корре­лированны, применение смешанных стратегий снижает риск. При этом, если все дисперсии {&г)г=Гп ограничены в совокупности, то использование равномерно распределенной смешанной стратегии снижает риск до нуля, когда п —» сю.

В случае, когда имеется полная прямая корреляция, применение смешанных стратегий не приводит к снижению риска. Напротив при полной обратной корреляции использование смешанной стра­тегии может полностью исключить риск.

Важным примером реализации принципа «смешивания стра­тегий» в экономике является распределение капитала на рынке ценных бумаг. Если инвестор распределяет свой капитал между ценными бумагами п видов так, что х1 есть доля капитала, вложен­ного в ценные бумаги г-го вида, то вектор х — (xi,. . .,хп) (опре­деляющий структуру портфеля инвестора), представляет собой с математической точки зрения смешанную стратегию инвестора В возникающей здесь задаче принятия решения в условиях риска

качестве состояний среды выступают будущие значения курсо-^уг стоимостей ценных бумаг всех видов, обращающихся на рынке, предположим, что курсовые стоимости ценных бумаг видов г и j ^дзаны таким образом, что всякое приращение курсовой стоимости дедцых бумаг вида г сопровождается пропорциональным прираще­нием курсовой стоимости ценных бумаг вида j (с некоторым по-сТоянным коэффициентом пропорциональности к). Тогда при к > О имеет место полная прямая корреляция, а при к < 0 — полная об­ратная корреляция.

Остановимся на задаче оптимизации портфеля инвестора. Эф­фективность портфеля инвестора, имеющего структуру х = = (х. . . . ,хп), характеризуется векторной оценкой (М(х),о~(х)), где М(х) — ожидаемый доход (доход портфеля), о~(х) — пока­затель риска (риск портфеля). Поэтому задача оптимизации пор­тфеля является непрерывной задачей двухкритериальной оптими­зации. Один из методов, который может быть использован для решения задачи оптимизации портфеля инвестора, — метод суб-оптимиздции; здесь он реализуется следующим образом. Задается некоторое пороговое значение А/о ожидаемого дохода и среди всех смешанных стратегий х ищется такая, которая обеспечивает ожи­даемый доход Мо с наименьшим возможным риском. Для практи­ческого решения этой задачи требуются данные в форме вектора ожидаемых доходов ценных бумаг каждого вида, а также матри­цы показателей ковариации (приближенно эти данные могут быть получены на основе сведений о биржевом курсе ценных бумаг).

VI. Важный для практики способ уменьшения риска при приня­тии решения состоит в проведении эксперимента. Поскольку прове­дение эксперимента связано с материальными затратами, возника­ет проблема соотнесения выгоды от дополнительной информации, получаемой в результате проведения эксперимента, и затрат на его проведение. Одна из методик, предназначенных для решения этой проблемы, основана на известной в теории вероятностей формуле Вайеса. В схематичном виде она состоит в следующем. Рассмот­рим ЗПР в условиях риска, в которой {1,. . ., п} - - множество аль­тернатив принимающего решение, {Лі,..., Ат} ~ множество со­стояний среды, \аЦ (i = l,n; j = l,m) — матрица выигрышей. Предполагается, что события {Ai,.... Ат} образуют полную груп­пу событий, причем для каждого j = l,m принимающему решение Известна вероятность Р(А3) наступления события А3. Если прово­дится эксперимент, в результате которого наблюдается событие В, и, кроме того, известны условные вероятности Ра}(В), (j = T^Jj то уточненные (послеопытные) вероятности каждого состояния сре ды могут быть найдены по формуле Байеса. Знание уточненных вероятностей состояний среды позволяет уточнить оптимальную стратегию принимающего решение. На практике условные вер0 ятности Раз (В) могут быть приближенно получены на основании статистических данных.

Кратко охарактеризуем задачи части П. Задача Ц де_ монстрирует применение критериев Лапласа, Вальда, Гурвица, Сэ-виджа при принятии решения в условиях неопределенности (фор­мулировка задачи взята из [11]). Задача 12 иллюстрирует спосо­бы принятия решений в условиях риска по паре критериев (М, а) Задача 13 представляет собой схематический пример задачи при­нятия решения, в которой сравнение альтернатив по предпочте­нию производится с помощью построения эмпирической функции полезности. Задача 14 — это классическая задача распределения инвестиций, постановка которой принадлежит американскому ма­тематику Г. Марковицу (за решение этой задачи он был удосто­ен Нобелевской премии по экономике). Подробный разбор решения этой задачи содержится в книге [15]. Задача 15 является упрощен­ным примером, демонстрирующим применение байесовского подхо­да к ЗПР в условиях риска с возможностью проведения эксперимен­та (формулировка задачи заимствована из [47]).

Упражнения.

 

Для задачи аренды отеля (пример 8 1) постройте матрицу выигры­шей, взяв в качестве множества Y состояний среды следующие значения среднегодового спроса {5, 10,15,. ., 50} В полученной ЗПР в условиях неопределенности найдите оптимальные решения по критериям Лапласа, Вальда, Гурвица, Сэвиджа

Для задачи выбора проекта электростанции (задача 11) найдите оптимальное решение по критерию Гурвица с показателем пессимизма а = 0,3иа = 0,9

Покажите, что если альтернатива i является оптимальной по од­ному из критериев Лапласа, Вальда, Гурвица, Сэвиджа и гг доминиру­ет її, то альтернатива «г также будет оптимальной по соответствующему критерию

Для задачи выбора продаваемого товара (пример 9 1) найдите оптимальную альтернативу по обобщенному критерию g = М — Лег, взяв в качестве А свой (субъективный) показатель несклонности к риску

Часть III

ТЕОРЕТИКО-ИГРОВЫЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ

 


Оцените книгу: 1 2 3 4 5