Учебник Математические модели принятия решений в экономике - Розен В. В. - Глава: Лекция 12. принятие решения в условиях риска с возможностью проведения экспериметпа онлайн

Название: Математические модели принятия решений в экономике - Розен В. В.

Жанр: Экономика

Рейтинг:

Просмотров: 904

Лекция 12. принятие решения в условиях риска с возможностью проведения экспериметпа

с Эксперимент как средство уточнения истинного состояния среды. ф Идеальный эксперимент; нахождение максимально допустимой стоимости идеального эксперимента. • Байесовский подход к принятию решения в условиях риска. • Задача 15. Бурение нефтяной скважины.

1. При принятии решения в условиях неопределенности (или в условиях риска) принципиальная сложность выбора решения возникает из-за незнания принимающим решение истинного состояния среды. В лекциях 8-11 рассмотрено несколько типов критериев, каждый из которых по-своему «борется» с неопределенностью: с помощью выдвижения гипотезы о поведении среды (критерии Лапласа, Вальда, Гурвица, Сэвиджа); с помощью усреднения получаемых выигрышей (критерий ожидаемого выигрыша); с помощью учета как ожидаемого выигрыша, так и меры отклонения от него (обобщенный критерий q(M,o)) на базе субъективного отношения принимающего решение к риску (критерий ожидаемой полезности). Однако, каждый из этих подходов дает лишь способ рационального анализа неопределенности, не «.уничтожая» самой неопределенности. «Уничтожение» (или хотя бы уменьшение) неопределенности может быть произведено только на основе уточнения истинного состояния среды.

На практике такое уточнение осуществляется, как правило, с помощьюсбора дополнительной информации, а также с помощью проведения экспериментов, по результатам которых судят об имеющемся состоянии среды. Например, прежде, чем приступить к лечению больного при неясном диагнозе, врач проводит дополнительные анализы; прежде, чем бурить дорогостоящую нефтяную скважину, геолог производит сейсморазведку; прежде, чем наладить производство какого-либо товара, предприниматель изготавливает пробную партию этого товара и т.д. В рамках теории принятия

6 Розен B.B.

161

решений все эти действия означают не что иное, как проведец^ эксперимента с целью уточнения состояния среды.

Эксперимент называется идеальным, если по его результату принимающий решение узнает истинное состояние среды. На прах тике наличие идеального эксперимента — явление достаточно pejJ кое. Чаще всего результат эксперимента дает некоторую информа цию, на основе которой может быть произведено уточнение состояния среды. Например, в ситуации с неясным диагнозом о наличии болезни (А), ответ — после проведения дополнительного анализа —. будет не «у больного заболевание (А)», а например, «у больного по. вышенный лейкоцитоз». При желании врач может воспользоваться статистическими данными, из которых он узнает, например, что повышенный лейкоцитоз у людей с заболеванием (А) наблюдается в 70\% случаев, но его повышение может вызываться и другими заболеваниями.

Как использовать результаты эксперимента и имеющиеся статистические данные при принятии решений наиболее эффективно? В п. 3 данной лекции рассматривается одна из методик, позволяющая решить эту проблему. Она основана на формуле Байеса — формуле переоценки вероятностей событий с учетом результата проведенного эксперимента.

Отметим, что не для всякой задачи принятия решения эксперимент является возможным. Если для некоторой ЗПР эксперимент возможен, то возникает задача оценки целесообразности его проведения. Дело в том, что проведение эксперимента всегда требует затрат (материальных, организационных, временных и пр.). Соотнесение дополнительной выгоды, которую мы ожидаем получить от дополнительной информации, приобретаемой в результате эксперимента, и затрат на его проведение — в этом и состоит суть проблемы целесообразности проведения эксперимента.

Следует иметь в виду, что особенно существенной является возможность проведения эксперимента для «уникальных» задач принятия решений, т.е. таких*, в которых решение принимается только один раз и связано с большими материальными затратами.

2. Рассмотрим задачу нахождения максимально допустимой стоимости идеального эксперимента. Пусть задача принятия решения в условиях риска задана матрицей выигрышей ||а^|| (г = l,n; j = 1,тп), причем принимающему решение известен вероятностный вектор у = (уі,. .., 2/m), где у3 — вероятность наступления состояния j (табл. 12.1).

	Уі	Уз	Ут
	1 ...	І	... т
1
і		<
п
max

Возьмем здесь в качестве оценки альтернативы і соответству-

ющий ей ожидаемый выигрыш, т.е. число ^3 аІУ] (* = 1>п)- Мак-

J = l

симальный ожидаемый выигрыш есть

(12.1)

3=1

Предположим, что принимающий решение может провести идеальный эксперимент, т.е. такой эксперимент, по результату которого он узнает истинное состояние среды. Обозначим через С стоимость идеального эксперимента. Пусть в результате проведения эксперимента принимающий решение узнал, что среда находится в состоянии j. Тогда, естественно, он выберет альтернативу, которая дает максимальный выигрыш в состоянии j, т.е. выигрыш (З3 = таха^. Так как вероятность того, что среда окажется

На £ =

Уз

в состоянии j, равна у3, а выигрыш в этом случае равен /З3, то получаем,что результатом идеального эксперимента (до его проведения) для принимающего решение является случайная величи-|>1

, которой соответствует ожидаемый выигрыш

(3 = 1,т)

М£ = Р3У]- Вычитая отсюда стоимость эксперимента, находим

3=1

итоговый выигрыш при проведении эксперимента: ( ^3 Р3Уз ~ С)

3=1

Таким образом, идеальный эксперимент будет выгодным тогда и только тогда когда

6і

163

Y^fv} - c > тах^а^у^. (12 2)

Перенося член, из правой части неравенства (12.2) в левую его часть и используя тождество —тахХ = тт(—Х), получаем

min.J2(P3 ~ аг)Уз > С- Вспоминая, что ft - а]г = г3 — рИск

1 3=1

в ситуации (см. лекцию 8, п. 3), приходим к неравенству

min ^гІУз > С-

Итак, идеальный эксперимент является выгодным тогда и только тогда, когда его стоимость меньше минимального ожидаемого риска.

га

Величина min rlУз является максимально допустимой стои-

1 3 = 1

мостью идеального эксперимента.

3. Для изложения байесовского подхода к переоценке вероятностей событий напомним некоторые понятия из элементарной теории вероятностей.

Условная вероятность события А при условии, что произошло событие В, обозначается через Рд(А) и вычисляется по формуле

Рассмотрим следующую теоретико-вероятностную схему. Пусть {А,...,Ат} — полная группа событий (иногда их называют гипотезами) и для каждой гипотезы А3, j — l,m известна ее вероятность Р(А>). Пусть произведен опыт, в результате которого произошло событие В. Если известны условные вероятности Рд (В) для всех j — l,m, тогда условная (послеопытная) вероятность события Aj (j — 1, m) может быть найдена по формуле Байеса *

р ,л s_P(A3nB) Р(А3)РА](В)

FB(A3) - — = — . (12.4)

£ P(Ak)PAk(B) fc=l

Рассмотрим теперь в схематической форме задачу принятия решения в условиях риска, заданную с помощью матрицы выигрышей, которая имеет вид табл. 12.2.

	Аг	А3	Am
1

і		<

п

Здесь {1,..., n} — стратегии принимающего решение (игрока), {А, ■ ■ ■ ■ Агп} — состояния среды, — выигрыш игрока в ситуации, когда он выбирает стратегию ?, а среда принимает состояние Aj. Принимающему решение (игроку) для каждого j = 1,т известна вероятность Р(А3) наступления состояния А,, причем

P(Aj) > О, Y^, Р{А-з) = 1- Предполагается, что среда может нахожі

диться в одном и только одном из состояний {А,.... Ат}, другими словами, случайные события {А,.. ., Ат} образуют полную группу событий, поэтому их можно взять в качестве гипотез в рамках рассмотренной выше теоретико-вероятностной схемы. Известные игроку вероятности состояний среды Р(А), ■ ■ ■ , Р(Ат) являются безусловными (доопытными) вероятностями.

Предположим.что проводится некоторый эксперимент, результат которого как-то зависит от имеющегося состояния среды. Если в результате эксперимента наблюдается событие В и, кроме того, известны условные вероятности Paj(B) при всех j = 1,т, то используя формулу Байеса (12.4), можно найти уточненные (послео-пытные) вероятности каждого состояния среды. Знание уточненных вероятностей состояний среды позволяет более точно указать оптимальную стратегию игрока.

Описанный подход к принятию решений в условиях риска называется байесовским, так как он основан на формуле Байсса. Этот подход иллюстрируется примером, рассмотренным в следующем пункте.

4. Задача 15. Бурение нефтяной скважины. Руководитель поисковой группы должен принять решение: бурить нефтяную скважину или нет. Скважина может оказаться

«сухой» (С), т.е. без нефти, «маломощной» (М), т.е. с малым со держанием нефти, и «богатой» (Б), т.е. с большим содержание^ нефти. Альтернативами руководителя группы являются: xj — Qy_ рить и хг — не бурить. Чистая прибыль (в тыс. долларов) цр^ выборе одной из этих альтернатив в зависимости от возможного типа скважины приведена в таблице прибылей (табл. 12.3).

Кроме того, руководителю поисковой группы известно, ЧТО в данной местности вероятности сухой, маломощной или богатой скважины таковы: Р(С) = 0,5; Р(М) = 0,3; Р{Б) = 0,2.

Руководитель поисковой группы может провести эксперимент с целью уточнения состояния среды. Этот эксперимент представляет собой сейсморазведку, результатом которой будет ответ — какова структура грунта в данной местности (но не ответ на вопрос о типе скважины!) В принципе структура грунта может быть либо открытой (О), либо замкнутой (5). Руководитель группы имеет таблицу результатов экспериментов, проведенных в этой местности (табл. 12.4).

Эта таблица показывает, сколько раз на грунтах открытой и грунтах замкнутой структуры встречались скважины типа С, М, Б (т. е. она дает совместную статистику структуры грунта и типов скважин для данной местности).

Итак, руководитель группы должен принять решение:

а) проводить ли эксперимент (его стоимость составля- ет 10тыс. долларов);

б) если проводить, то как поступать в дальнейшем в зависи- мости от результата эксперимента.

Таким образом, получена многошаговая задача принятия решений в условиях риска. Опишем методику нахождения оптимального решения по шагам.

Шаг 1. Построим дерево (рис. 12.1), на котором указаны все этапы процесса принятия решений — дерево решений. Ветви дерева соответствуют возможным альтернативам, а вершины — возникающим ситуациям. Альтернативами руководителя поисковой группы являются: а — отказ от эксперимента, /3 — проведение эксперимента, Х — бурить, Х2 — не бурить. Альтернативы природы: выбор типа скважины (С, М, Б), а. также выбор структуры грунта (О или 3).

Построенное дерево определяет игру руководителя группы (игрок 1) с природой (игрок 2). Позициями данной игры служат вершины дерева, а ходами игроков — выбираемые ими альтернативы. Позиции, в которых ход делает руководитель группы, изображены прямоугольником; позиции, в которых ход делает природа, — кружком.

Пояснение. Игра протекает следующим образом. В начальной позиции ход делает игрок 1 (руководитель группы). Он должен принять решение — отказаться от эксперимента (выбрать альтернативу а) или проводить эксперимент (выбрать альтернативу /3). Если он отказался от проведения эксперимента, то игра переходит в следующую позицию, в которой руководитель группы должен принять решение: бурить (выбрать альтернативу х) или не бурить (выбрать альтернативу x-z). Если же он решает проводить эксперимент, то игра переходит в позицию, в которой ход делает природа, выбирая одну из альтернатив О или 3, соответствующих возможным результатам эксперимента, и т.д. Игра заканчивается тогда, когда она переходит в окончательную позицию (т.е. в вершину дерева, для которой нет исходящих из нее ветвей).

Шаг 2. Для каждой альтернативы, которая является ходом природы (т.е. исходит из позиции, изображенной кружком), надо найти вероятность этого хода. Для этого поступаем следующим образом. Для каждой позиции дерева существует единственный путь, соединяющий эту позицию с начальной позицией. Если для позиции природы путь, соединяющий ее с начальной позицией, не проходит через позицию (Э), означающую проведение эксперимента, то вероятности состояний Р(С), Р(М) и Р{Б) являются безусловными (доопытными) и находятся из табл. 12.4:

а =рхах+ргаг+ръаъ Ь2= max {Ьь Ъъ Ъъ)

Рис. 12.2 Рис. 12.3

Рели же для позиции природы путь, соединяющий ее с начальной позицией, проходит через позицию (Э), то вероятности состояний среды становятся условными вероятностями и находятся по формуле (12.4):

P°^=-T(0f = 0760 = 4' р^

п Р{м п о) оді п

Р0(Б) = ад^і = ^ = JL, ад)

Р(С П 3) _ ОДК _ 1 Р{3) ~~ 0^40 ~~ 8'

Р(М П .?) _ 0Д9 _ 19 Р(3) ~ 0,40 _ 40'

Р(5 П 3) _ ОДб _ 2 Р(3) ~~ 0^40 ~ 5'

В позиции (Э) вероятности ходов, приводящих к позициям (О) и (3), находятся из табл. 12.4: Р(О) = 60/100 = 0,6; Р(3) = = 40/100 = 0,4.

Шаг 3. Произведем оценку всех позиций дерева игры, «спускаясь» от конечных позиций к начальной. Оценкой позиции служит ожидаемый выигрыш в этой позиции. Оценки конечных позиций находим из табл. 12.3. Укажем теперь способ нахождения оценки произвольной позиции дерева игры в предположении, что уже найдены оценки всех следующих за ней позиций.

а) Для позиции природы ее оценка находится как сумма попар- ных произведений оценок следующих за ней позиций на вероятности этих позиций (см. рис. 12.2). Другими словами, для позиции приро- ды ее оценка представляет собой ожидаемый выигрыш в соответ- ствующей лотерее.

б) Для позиции игрока 1 оценкой служит максимум всех оценок следующих за ней позиций (рис. 12.3). Мотивировка: в «своей» Позиции игрок может сделать любой ход, поэтому он выберет

тот, который приводит к наибольшему возможному выигрыщу В каждой позиции игрока 1 помечаем черточкой ту ветвь дерева которая приводит к позиции, имеющей максимальную оценку.

При оценке позиции (Э), соответствующей проведению эксперимента, вычитаем его стоимость.

Обратимся к рис. 12.1. Получаем, что в начальной позиции ожи- даемая прибыль без проведения эксперимента (альтернатива а)

20тыс. долларов; ожидаемая прибыль с проведением эксперимента (альтернатива /3) — 28 тыс. долларов. Таким образом, целесообразным является решение — проводить эксперимент (сейсморазведку). Далее, если эксперимент покажет, что грунт открытый, то бурение производить не следует, а если замкнутый, то нужно бурить.

В игре с природой произвольная стратегия игрока 1 задается указанием альтернативы, выбираемой в каждой его позиции. В данной игре оптимальной будет та стратегия игрока 1, которая предписывает в каждой позиции выбор хода, соответствующего помеченной альтернативе.

Замечания. 1. В рассмотренном примере в качестве оценок позиций природы использовалось математическое ожидание выигрыша. Это означает, что была принята гипотеза безразличия к риску. Если мы хотим учесть отношение принимающего решения к риску, то необходимо иметь дополнительно кривую денежных эквивалентов, заданную на интервале возможных выигрышей. Тогда для любой позиции природы ее оценка находится как ДДЭ соответствующей лотереи (см. лекцию 10, п.З). При этом, чтобы учесть стоимость проведения эксперимента, удобно ее сразу вычесть из оценок всех окончательных позиций, пути в которые проходят через позицию (Э).

2. Можно также дать оценку всех позиций рассматриваемой игры не в денежных единицах, а в единицах полезности. Для этого надо построить на интервале возможных денежных выигрышей функцию полезности принимающего решение. В этом случае оценки всех окончательных позиций следует указывать не в деньгах, а в полезностях. Оценка позиции природы находится здесь как ожидаемая полезность лотереи в полезностях, т.е. по формуле (10.5), а оценка позиции игрока 1 — как максимум оценок следующих за ней позиций.

РЕЗЮМЕ И ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ

I. Реализационная структура задачи принятия решения состоит из множества альтернатив (стратегий) X, множества состояний среды Y, множества исходов А и функции реализации F : ХхУч А. Принятие решения в условиях неопределенности характеризуется тем, что принимающий решение не имеет никакой дополнительной информации о появлении того или иного состояния среды, поэтому при выборе альтернативы і€Іон знает лишь, что будет реализован один из исходов F(x, у), где у Є Y.

Если оценочная структура задачи принятия решения задана в форме оценочной функции (р: А —> R, то такая ЗПР в условиях неопределенности может быть представлена в виде {X, Y, /), где / = (р о F — целевая функция. Число f(x, у) выражает полезность (ценность) для принимающего решение того исхода, который возникает в ситуации, когда он выбирает альтернативу х Є X, а среда принимает состояние у Є У.

Задача принятия решения в условиях неопределенности, в которой множества X и Y конечны, может быть представлена в виде матрицы выигрышей (платежной матрицы) ||а^|| (г = 1,п; j = ~ 1,т); здесь {1,...,го} — множество стратегий (альтернатив) принимающего решение, {1,. . ., те} — множество состояний среды, а —выигрыш принимающего решение в ситуации

Единого принципа оптимальности для задач принятия решений в условиях неопределенности не существует. Сужение множества стратегий в такой задаче может быть произведено за счет отбрасывания доминируемых стратегий. Доминирование і > г'2 означает, Что при любом состоянии среды j = 1, те выполняется а?г > aJl2, при этом стратегия i называется доминирующей, а стратегия \%2 — доминируемой. Однако недоминируемых стратегий обычно бывает Иного, поэтому возникает проблема сравнения по предпочтительности недоминируемых стратегий.

II. Для сравнения между собой стратегий по их предпочтите ности в ЗПР в условиях неопределенности используется ряд крИт " риев, каждый из которых основан на некоторой гипотезе о поведи нии среды.

(1) Критерий Лапласа базируется на гипотезе равновозмож;НОс ти (равновероятности) состояний среды. Этот критерий приводйт к оценке стратегии г в виде среднего арифметического выигрыщ^ возможных при выборе стратегии і:

j=i

Оптимальной при этом считается стратегия, максимизирующая оценку Ь(г).

(2) Критерий Вальда основан на гипотезе антагонизма, при

этом оценкой стратегии г является W_(i) = mina^. Стратегия, мак-

симизирующая оценку W_(i), называется максиминной стратегией, а принцип оптимальности, заключающийся в максимизации оценки W_(i), — принципом максимина. Если элементы платежной матрицы рассматриваются как потери, то при гипотезе антагонизма оценкой стратегии г

W(t) — raaxaj. з

Стратегия, минимизирующая оценку W{i). называется минимакс-ной, а соответствующий ей принцип оптимальности — принципом минимакса.

Критерий Гурвица предполагает, что при любом выборе стратегии принимающим решение наихудший для него вариант реализуется с вероятностью а, а наилучший — с вероятностью 1 — a, где 0 < а < 1 — некоторое фиксированное число (показатель пессимизма). По Гурвицу оценкой стратегии г является число

HQ(i) = aminftf + (1 — a) max а?.

з з

Оптимальной по Гурвицу считается стратегия, максимизирующая оценку На(г).

По критерию Сэвиджа оптимальной считается стратегия, минимизирующая максимальный риск. (Риском в ситуации

(З3 - а{, где [З3 = nvaxa].)

0 общем случае оптимальные стратегии, полученные по ука-ацньім критериям, могут не совпадать. Это объясняется тем, что «ньіе критерии основываются на разных гипотезах, а всякая гипотеза есть предположение, а не знание.

III. Принятие решения в условиях риска характеризуется тем, чТо существует некоторая вероятностная мера, в соответствии с которой возникают те или иные состояния среды. Построение математической модели принятия решения в условиях риска предполагает наличие у принимающего решение некоторой информации об этой вероятностной мере. Далее мы ограничиваемся рассмотрением случая, когда множества X и Y конечны и вероятностная мера на множестве состояний среды задана вероятностным вектором у z= (уі,..., Ут), который предполагается известным принимающему решение (здесь у3 есть вероятность наступления состояния j,

гп

yj > о, £ \% = і)-.7=1

В ЗПР в условиях риска исходом для принимающего решение при выборе им альтернативы г является некоторая случайная величина £г; поэтому сравнение альтернатив сводится к сравнению соответствующих им случайных величин Наиболее естественной характеристикой случайной величины £г служит ее математическое ожидание (ожидаемое значение) А/£,, которое в математических моделях принятия решений интерпретируется как ожидаемый выигрыш. Показано, что в ЗПР в условиях риска критерий ожидаемого выигрыша не является адекватным и должен быть трансформирован с учетом возможных отклонений случайной величины от ее ожидаемого значения. В качестве меры отклонения произвольной случайной величины £ от ее ожидаемого значения обычно берется среднеквадратичное отклонение (СКО) а^. где ст| = Л/(£ — М£)2. Характеризуя случайную величину £г парой показателей (М,,аг), где Мг = М^г — ожидаемый выигрыш, аг = erg, — показатель риска, приходим в результате к двухкритериальной ЗПР. для нахождения оптимального решения которой можно использовать методы многокритериальной оптимизации (см. лекции 5-7).

Наиболее простой метод «превращения» многокритериальной ЗПР в однокритериальную состоит в построении обобщенного критерия. В лекции 9 рассмотрен обобщенный критерий

q(M, сг) = М - Лег,

который (при Л > 0) отражает стремление принимающего решение к увеличению ожидаемого выигрыша и уменьшению риска отклонения от него; при этом Л можно рассматривать как субъективный показатель меры несклонности принимающего решение к риску (субъективный показатель осторожности). Показано, что существуют «пороговые значения» показателя осторожности Л°, Л* такие, что если для принимающего решение выполняется условие 0 < Л < Л° то для него ранжирование Парето-оптимальных альтернатив по обобщенному критерию q(M,a) совпадает с ранжированием по величине ожидаемого выигрыша; если А > А*, то ранжирование по критерию q(M, а) совппадает с ранжированием по величине показателя риска.

Нахождение оптимального решения без построения обобщенного критерия основано на отношении доминирования по Парето (см. лекцию 5). Первый шаг — выделение Парето-оптимальных исходов. Второй шаг — выбор оптимального исхода из множества Парето-оптимальных — производится либо непосредственно принимающим решение, либо с предварительным сужением Парето-оптимального множества. При втором подходе требуется дополнительная информация от принимающего решение об относительной важности критериев М и сг. Здесь можно использовать, например, метод выделения главного критерия (субоптимизация) или метод упорядочения критериев по их относительной важности (лексикографическая оптимизация).

IV. Оценка случайной величины (лотереи) £ парой показателей (М, сг), где М = М£ — ожидаемый выигрыш и сг = ст^ — показатель риска, не является единственно возможной. Существует общий метод нахождения субъективной оценки лотерей, состоящий в построении функции полезности принимающего решение. При построении этой функции основным является понятие детерминированного эквивалента (ДЭ) лотереи.

Под детерминированным денежным эквивалентом (ДДЭ) денежной лотереи £ понимается денежная сумма х, которая для принимающего решение эквивалентна его участию в этой лотерее.

Для нахождения ДЭ произвольной лотереи, выигрыши которой »аключены между а и А, достаточно уметь находить ДЭ некоторых тростых лотерей (т.е. лотерей с двумя выигрышами: а и А).

Сравнение лотерей по их ДЭ дает способ сравнения альтернатив і ЗПР в условиях риска, учитывающий как величину возможных ьыитрышей, так и субъективное отношение принимающего решелие к риску. При этом для принимающего решение его несклонность к риску заключается в том, что указываемый им ДЭ произвольной лотереи меньше ожидаемого выигрыша; склонность к риску заключается в том, что ДЭ лотереи больше ожидаемого выигрыша; безразличие к риску состоит в том, что ДЭ лотереи совпадает с ожидаемым выигрышем.

Остановимся теперь на понятии функции полезности. Пусть q — некоторый критерий (например, денежный или временной), значения которого заключены между а и Л. Эмпирическая функция полезности критерия q есть функция и, которая каждому х Є [а, А] ставит в соответствие число и{х) = р Є [0,1] так, что х являет-

а А

ся детерминированным эквивалентом простои лотереи ^ .

Линейное продолжение й функции и на множество лотерей с выигрышами из интервала [а, А] есть функция полезности лотерей. При этом для лотереи £ величина й(£) называется ожидаемой полезностью лотереи £. Важным свойством функции й является ее линейность (относительно операции «смешивания» лотерей). Если критерий q является монотонным (т.е. принимающий решение всегда стремится либо к его увеличению, либо к уменьшению), то сравнение лотерей по их детерминированным эквивалентам равносильно сравнению ожидаемых полезностей этих лотерей.

Аксиоматический подход к вопросу сравнения лотерей по предпочтению впервые был предпринят Нейманом и Моргенштер-ном [41]. Основной их результат, полученный в этом направлении,

может быть описан следующим образом.

Пусть У — отношение нестрогого предпочтения лотерей (ко-торое представляет собой объединение строгого предпочтения У- и

отношения безразличия ~). Для отношения У вводятся две аксиомы (Al) и (А2), где аксиома (А1) носит чисто математический

характер и выражает непрерывность отношения У, а смысл аксиомы (А2) состоит в том, что при «смешивании» двух безразличных лотерей с любой третьей получающиеся лотереи будут безразличными. Результат Неймана и Моргенштерна состоит в следующем.

Всякое отношение предпочтения У, устанавливающее полное ранжирование множества лотерей и удовлетворяющее аксиомам (Al) и (А2), совпадает с предпочтением, которое устанавливается по величине ожидаемой полезности лотерей для некоторой функции полезности и рассматриваемого критерия. Щи этом функция и единственна с точностью до фиксирования .нас штаба и начала отсчета.

Замечание Полезно сравнить этот результат с правилом 7.2, характеризующим способы установления полного ранжирования векторных оценок

V. В лекциях 11 и 12 для ЗПР в условиях риска рассматриваются способы уменьшения риска. В лекции 11 излагается способ уменьшения риска, осуществляемый за счет перехода к смешанным стратегиям. Пусть {1,п} — множество альтернатив (чистых стратегий) в задаче принятия решения в условиях риска. Смешанной стратегией называется вектор х = (х,.. .,хп), где хг > О

^2 хг — 1 Смешанная стратегия может быть реализована одним из

»=1

следующих трех способов: (а) введением механизма случайного выбора; (б) как «физическая смесь» чистых стратегий; (в) как доля соответствующих чистых стратегий при многократном принятии решения.

В ЗПР в условиях риска использование смешанных стратегий с целью повышения ожидаемого выигрыша бесполезно. Однако «смешивание» стратегий может привести к снижению риска; эта возможность определяется характером корреляции случайных величин (£г)г=у-^, являющихся результатом выбора чистых стратегий. В частности, если случайные величины (£,) попарно не коррелированны, применение смешанных стратегий снижает риск. При этом, если все дисперсии {&г)г=Гп ограничены в совокупности, то использование равномерно распределенной смешанной стратегии снижает риск до нуля, когда п —» сю.

В случае, когда имеется полная прямая корреляция, применение смешанных стратегий не приводит к снижению риска. Напротив при полной обратной корреляции использование смешанной стратегии может полностью исключить риск.

Важным примером реализации принципа «смешивания стратегий» в экономике является распределение капитала на рынке ценных бумаг. Если инвестор распределяет свой капитал между ценными бумагами п видов так, что х1 есть доля капитала, вложенного в ценные бумаги г-го вида, то вектор х — (xi,. . .,хп) (определяющий структуру портфеля инвестора), представляет собой с математической точки зрения смешанную стратегию инвестора В возникающей здесь задаче принятия решения в условиях риска

качестве состояний среды выступают будущие значения курсо-^уг стоимостей ценных бумаг всех видов, обращающихся на рынке, предположим, что курсовые стоимости ценных бумаг видов г и j ^дзаны таким образом, что всякое приращение курсовой стоимости дедцых бумаг вида г сопровождается пропорциональным приращением курсовой стоимости ценных бумаг вида j (с некоторым по-сТоянным коэффициентом пропорциональности к). Тогда при к > О имеет место полная прямая корреляция, а при к < 0 — полная обратная корреляция.

Остановимся на задаче оптимизации портфеля инвестора. Эффективность портфеля инвестора, имеющего структуру х = = (х. . . . ,хп), характеризуется векторной оценкой (М(х),о~(х)), где М(х) — ожидаемый доход (доход портфеля), о~(х) — показатель риска (риск портфеля). Поэтому задача оптимизации портфеля является непрерывной задачей двухкритериальной оптимизации. Один из методов, который может быть использован для решения задачи оптимизации портфеля инвестора, — метод суб-оптимиздции; здесь он реализуется следующим образом. Задается некоторое пороговое значение А/о ожидаемого дохода и среди всех смешанных стратегий х ищется такая, которая обеспечивает ожидаемый доход Мо с наименьшим возможным риском. Для практического решения этой задачи требуются данные в форме вектора ожидаемых доходов ценных бумаг каждого вида, а также матрицы показателей ковариации (приближенно эти данные могут быть получены на основе сведений о биржевом курсе ценных бумаг).

VI. Важный для практики способ уменьшения риска при принятии решения состоит в проведении эксперимента. Поскольку проведение эксперимента связано с материальными затратами, возникает проблема соотнесения выгоды от дополнительной информации, получаемой в результате проведения эксперимента, и затрат на его проведение. Одна из методик, предназначенных для решения этой проблемы, основана на известной в теории вероятностей формуле Вайеса. В схематичном виде она состоит в следующем. Рассмотрим ЗПР в условиях риска, в которой {1,. . ., п} - - множество альтернатив принимающего решение, {Лі,..., Ат} ~ множество состояний среды, \аЦ (i = l,n; j = l,m) — матрица выигрышей. Предполагается, что события {Ai,.... Ат} образуют полную группу событий, причем для каждого j = l,m принимающему решение Известна вероятность Р(А3) наступления события А3. Если проводится эксперимент, в результате которого наблюдается событие В, и, кроме того, известны условные вероятности Ра}(В), (j = T^Jj то уточненные (послеопытные) вероятности каждого состояния сре ды могут быть найдены по формуле Байеса. Знание уточненных вероятностей состояний среды позволяет уточнить оптимальную стратегию принимающего решение. На практике условные вер0 ятности Раз (В) могут быть приближенно получены на основании статистических данных.

Кратко охарактеризуем задачи части П. Задача Ц де_ монстрирует применение критериев Лапласа, Вальда, Гурвица, Сэ-виджа при принятии решения в условиях неопределенности (формулировка задачи взята из [11]). Задача 12 иллюстрирует способы принятия решений в условиях риска по паре критериев (М, а) Задача 13 представляет собой схематический пример задачи принятия решения, в которой сравнение альтернатив по предпочтению производится с помощью построения эмпирической функции полезности. Задача 14 — это классическая задача распределения инвестиций, постановка которой принадлежит американскому математику Г. Марковицу (за решение этой задачи он был удостоен Нобелевской премии по экономике). Подробный разбор решения этой задачи содержится в книге [15]. Задача 15 является упрощенным примером, демонстрирующим применение байесовского подхода к ЗПР в условиях риска с возможностью проведения эксперимента (формулировка задачи заимствована из [47]).

Упражнения.

Для задачи аренды отеля (пример 8 1) постройте матрицу выигрышей, взяв в качестве множества Y состояний среды следующие значения среднегодового спроса {5, 10,15,. ., 50} В полученной ЗПР в условиях неопределенности найдите оптимальные решения по критериям Лапласа, Вальда, Гурвица, Сэвиджа

Для задачи выбора проекта электростанции (задача 11) найдите оптимальное решение по критерию Гурвица с показателем пессимизма а = 0,3иа = 0,9

Покажите, что если альтернатива i является оптимальной по одному из критериев Лапласа, Вальда, Гурвица, Сэвиджа и гг доминирует її, то альтернатива «г также будет оптимальной по соответствующему критерию

Для задачи выбора продаваемого товара (пример 9 1) найдите оптимальную альтернативу по обобщенному критерию g = М — Лег, взяв в качестве А свой (субъективный) показатель несклонности к риску

Часть III

ТЕОРЕТИКО-ИГРОВЫЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ

| Оглавление|

Лучшие книги

ВВЕДЕНИЕ В КУЛЬТУРОЛОГИЮ

Гражданский процесс: Вопросы и ответы

ЗАПАДНОЕВРОПЕЙСКОЕ ИСКУССТВО от ДЖОТТО до РЕМБРАНДТА

Коммерческое право России

Коммуникации стратегического маркетинга

Консультации по английской грамматике: В помощь учителю иностранного языка.

Международные экономические отношения

Налоги и налоговая система России

Основы права

Теория государства и права

Все материалы на сайте представлены исключительно для ознакомления. Все права на книги остаются за авторами. Если вы являетесь автором той или иной книги и не хотите видеть её на сайте, то напишите нам и мы в кротчайшие строки удалим её.

Лекция 12. принятие решения в условиях риска с возможностью проведения экспериметпа

Содержание