При каких значениях лямбда критерий гурвица обращается в критерий вальда
Принцип построения обобщенного критерия Гурвица похож на предыдущий. Всем принимаемым в расчет исходам присваивается некоторый "удельный вес". Значение критерия для альтернативы рассчитывается как взвешенная сумма ее исходов. Однако чтобы избежать недостатков "предшественника", обобщенный критерий учитывает все исходы каждой альтернативы.
Тогда, формула для расчета обобщенного критерия для i -й альтернативы может быть записана следующим образом:
λq - коэффициент для q -го значения i -й альтернативы,
Получается, что для использования обобщенного критерия Гурвица необходимо назначить М (!) коэффициентов λq . Конечно, можно было бы это сделать произвольно. Но при большом количестве состояний М это становится весьма трудоемко, так как необходимо, чтобы коэффициенты удовлетворяли как минимум двум условиям:
1) сумма всех весовых коэффициентов должна быть равна единице:
2) величины коэффициентов должны отражать отношение ЛПР к неопределенности:
- а) для оптимистичного ЛПР лучшие исходы должны иметь больший "вес", причем, чем лучше исход, тем больше "вес";
- б) для пессимистичного ЛПР - все наоборот - больший "вес" у худших исходов, и чем хуже исход - тем больше "вес":
Чтобы не назначать коэффициенты произвольно по отдельности были предложены формализованные методы их расчета, один и которых мы и рассмотрим ниже.
Порядок применения обобщенного критерия Гурвица
1. Упорядочиваем матрицу игры таким образом, чтобы исходы каждой альтернативы располагались в порядке неубывания. При этом в одном столбце матрицы могут оказаться исходы, относящиеся к разным состояниям - это не существенно. В результате вместо "старой" матрицы игры Х мы получаем "новую" матрицу Y , где в каждой строке исходы располагаются от самого маленького до самого большого:
2. Рассчитываем суммы исходов по каждому столбцу новой матрицы Y :
3. Рассчитываем сумму все исходов матрицы:
4. Далее коэффициенты λq определяются в зависимости от отношения ЛПР к неопределенности.
4.1. Если ЛПР оптимист, то коэффициент λq для любого q -го столбца определяется по формуле:
Поскольку для каждой альтернативы соблюдается условие:
То есть, чем лучше исход, тем больше удельный вес ему присваивается.
Кроме того, так как
то обеспечивается выполнение равенства:
Таким образом, полученные формальным путем коэффициенты отвечают необходимым условиям.
4.2. Если ЛПР пессимист, то определение коэффициентов немного сложнее. Мы должны обеспечить соблюдение условия: худшим исходам - большие веса. Это можно сделать, зеркально поменяв местами коэффициенты, рассчитанные для оптимистичного ЛПР:
а) при нечетном количестве состояний М :
б) при четном количестве состояний М :
Формальная запись зависимости для расчета коэффициентов λq при пессимистично настроенном ЛПР выглядит следующим образом:
5. Теперь, имея все значения коэффициентов λq , можно рассчитать величину обобщенного коэффициента Гурвица для каждой i -й альтернативы:
6. Оптимальной является стратегия, у которой наибольшее значение обобщенного критерия Гурвица:
Пример применения обобщенного критерия Гурвица
Применим обобщенный критерий Гурвица для поиска оптимального решения в условиях задачи из п.2.7 (табл.2.2) для оптимистически и пессимистически настроенного ЛПР.
Будем действовать в соответствии с изложенным выше алгоритмом.
1. Упорядочим матрицу игры, расположив исходы в порядке неубывания (см.табл.2.4).
2. Рассчитаем суммы yq по столбцам упорядоченной матрицы:
3. Рассчитаем сумму всех исходов:
Альтернативы ( Xi ) | Номер столбца ( q ) | ||
---|---|---|---|
1 | 2 | 3 | |
Х1 | 25 | 45 | 50 |
X2 | 20 | 25 | 60 |
yq = ∑yiq | 45 | 70 | 110 |
y = ∑ yq | 225 | ||
λq O оптимист | 0.20 | 0.31 | 0.49 |
λq П пессимист | 0.49 | 0.31 | 0.20 |
4. Рассчитаем коэффициенты для каждого ЛПР.
4.1. коэффициенты для ЛПР оптимиста:
λ3 О = 110/225 = 0.49
4.2. коэффициенты для ЛПР пессимиста рассчитывать нет необходимости - главное, правильно поменять местами уже найденные коэффициенты:
5. Рассчитать значения обобщенного критерия Гурвица для каждого проекта для каждого ЛПР:
6. Сравнить полученные значения обобщенного коэффициента Гурвица. Оптимальными для каждого ЛПР являются проекты с максимальным значением критерия:
Здесь и для оптимистичного, и для пессимистичного ЛПР оптимальным по обобщенному критерию Гурвица является первый проект.
Благодаря тому, что в оценке учитываются все исходы, обобщенный критерий Гурвица лишен недостатка обычного критерия. Кроме того, формальный подход к расчету коэффициентов максимально снижает степень субъективности. ЛПР достаточно определить лишь общий характер своего отношения к неопределенности - оптимистичный или пессимистичный, тогда как при использовании обычного критерия требовалось еще и самому задать уровень оптимизма.
1 .При каких значениях а критерий Гурвица обращается в критерий Вальда? а)gt;0. б)=1 (*ответ*) nbsp;в)lt;0.
2.В чем отличие критерия Сэвиджа от других изученных критериев принятия решения:
а) Он минимизируется (*ответ*)
б) Он максимизируется.
в) Он не всегда дает однозначный ответ.
3 .Антагонистическая игра может быть задана:
а) обильем стратегий обоих игроков и седловой точкой.
б) обилием стратегий обоих игроков и функцией выигрыша первого игрока (*ответ*)
4.Матричная забава - это частный случай антагонистической забавы, при котором обязательно производится одно из требований:
а) один из игроков имеет неисчерпаемое число стратегий.
б) оба игрока имеют бесконечно много стратегий.
в) оба игрока имеют одно и то же число стратегий.
г) оба игрока имеют конечное число стратегий (*ответ*)
5.Пусть матричная игра задана матрицей, в которой все элементы положительны. Стоимость забавы положительна:
а) да (*ответ*)
б) нет.
в) нет конкретного ответа.
6.Стоимость забавы всегда меньше верхней цены забавы, если обе цены существуют:
а) да.
б) нет (*ответ*)
в) вопрос некорректен.
7.Лучшая смешанная стратегия для матричной забавы меньше любой иной стратегии.
а) да.
б) нет.
в) вопрос некорректен (*ответ*)
г) нет однозначного ответа.
8.Цена игры существует для матричных игр в смешанных стратегиях всегда.
а) да (*ответ*)
б) нет.
9.Каких стратегий в матричной игре размерности, хорошей от 1*, больше:
а) незапятнанных.
б) смешанных (*ответ*)
в) поровну и тех, и тех.
10.Если в матрице все столбцы схожи и имеют вид (450 1), то какая стратегия оптимальна для 2-го игрока?
а) 1-ая.
б)2-ая (*ответ*)
в)неважно какая из 4.
11 .Какое максимальное число седловых точек может быть в забаве
размерности 2*3 (матрица может содержать любые числа)
а) 2.
б)3.
в)6 (*ответ*)
12. Максимум по x минимума по y и минимум по y максимума по x функции выигрыша первого игрока:
а) всегда различные числа, 1-ое больше второго.
б) nbsp;не всегда разные числа; первое не больше второго (*ответ*)
в) связаны каким-то иным образом.
Назначение сервиса . С помощью онлайн калькулятора выбирается оптимальная стратегия по критерию Гурвица. Результаты вычислений оформляются в отчете формата Word (см. Пример оформления).
Критерий Гурвица устанавливает баланс между случаями крайнего пессимизма и крайнего оптимизма путем взвешивания обоих способов поведения соответствующими весами (1 — y ) и y , где 0 y y от 0 до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или к оптимизму. При отсутствии ярко выраженной склонности y = 0,5 представляется наиболее разумной.
Пример . Исходные данные:
8 | 4 | 6 | 20 |
7 | 7 | 7 | 7 |
6 | 12 | 8 | 10 |
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min aij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Ai | П1 | П2 | П3 | П4 | min(aij) |
A1 | 8 | 4 | 6 | 20 | 4 |
A2 | 7 | 7 | 7 | 7 | 7 |
A3 | 6 | 12 | 8 | 10 | 6 |
Вывод: выбираем стратегию N=2.
Критерий Севиджа.
Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:
a = min(max rij)
Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Находим матрицу рисков.
Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r11 = 8 - 8 = 0; r21 = 8 - 7 = 1; r31 = 8 - 6 = 2;
2. Рассчитываем 2-й столбец матрицы рисков.
r12 = 12 - 4 = 8; r22 = 12 - 7 = 5; r32 = 12 - 12 = 0;
3. Рассчитываем 3-й столбец матрицы рисков.
r13 = 8 - 6 = 2; r23 = 8 - 7 = 1; r33 = 8 - 8 = 0;
4. Рассчитываем 4-й столбец матрицы рисков.
r14 = 20 - 20 = 0; r24 = 20 - 7 = 13; r34 = 20 - 10 = 10
Ai | П1 | П2 | П3 | П4 |
A1 | 0 | 8 | 2 | 0 |
A2 | 1 | 5 | 1 | 13 |
A3 | 2 | 0 | 0 | 10 |
Ai | П1 | П2 | П3 | П4 | max(aij) |
A1 | 0 | 8 | 2 | 0 | 8 |
A2 | 1 | 5 | 1 | 13 | 13 |
A3 | 2 | 0 | 0 | 10 | 10 |
Вывод: выбираем стратегию N=1.
Критерий Гурвица.
Критерий Гурвица является критерием пессимизма - оптимизма. За оптимальную принимается та стратегия, для которой выполняется соотношение:
max(si)
где si = y min(aij) + (1-y)max(aij)
При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс).
Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.
Рассчитываем si.
s1 = 0.5•4+(1-0.5)•20 = 12
s2 = 0.5•7+(1-0.5)•7 = 7
s3 = 0.5•6+(1-0.5)•12 = 9
Ai | П1 | П2 | П3 | П4 | min(aij) | max(aij) | y min(aij) + (1-y)max(aij) |
A1 | 8 | 4 | 6 | 20 | 4 | 20 | 12 |
A2 | 7 | 7 | 7 | 7 | 7 | 7 | 7 |
A3 | 6 | 12 | 8 | 10 | 6 | 12 | 9 |
Вывод: выбираем стратегию N=1.
Обобщенный критерий Гурвица.
Данный критерий является некоторым обобщением критериев крайнего пессимизма и крайнего оптимизма и также представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей при следующем допущении:
λ1=1-λ, λ2=λ3=…=λn-1=0, λn=λ, где 0 ≤ λ ≤ 1
Тогда показатель эффективности стратегии Ai по Гурвицу есть:
Gi=(1-λ)min aij + λmax aij
Оптимальной стратегией Ai0 считается стратегия с максимальным значением показателя эффективности.
Строим вспомогательную матрицу B, полученную путем упорядочивания показателей доходностей в каждой строке.
Подход пессимиста. λ выбирается из условия невозрастания среднего:
G1 = 0.304 • 4+(1-0.304) • 20 = 15.143; G2 = 0.304 • 7+(1-0.304) • 7 = 7; G3 = 0.304 • 6+(1-0.304) • 12 = 10.179;
Подход оптимиста. λ выбирается из условия неубывания среднего:
G1 = 0.696 • 4+(1-0.696) • 20 = 8.857; G2 = 0.696 • 7+(1-0.696) • 7 = 7; G3 = 0.696 • 6+(1-0.696) • 12 = 7.821
Ai | П1 | П2 | П3 | П4 | min(aij) | max(aij) | Подход пессимиста | Подход оптимиста |
A1 | 4 | 6 | 8 | 20 | 4 | 20 | 15.14 | 8.86 |
A2 | 7 | 7 | 7 | 7 | 7 | 7 | 7 | 7 |
A3 | 6 | 8 | 10 | 12 | 6 | 12 | 10.18 | 7.82 |
Вывод: выбираем стратегию N=1.
Оптимальные стратегии по обобщенному критерию Гурвица.
b = 17 + 21 + 25 + 39 = 102
Показатели эффективности по Гурвицу.
Подход пессимиста
Подход оптимиста
Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A1.
Обычный (или простой) критерий Гурвица учитывает только крайние исходы xi max и xi min каждой альтернативы:
Он позволяет учесть субъективное отношение применяющего данный критерий ЛПР за счет придания этим исходам разных "весов". Для этого в расчет критерия введен "коэффициент оптимизма" λ, 0 ≤ λ ≤ 1 . Формула для расчета критерия Гурвица для i -й альтернативы с коэффициентом оптимизма λ выглядит следующим образом:
Если исходы представляют возможные выигрыши, то оптимальной признается альтернатива с максимальным значением критерия Гурвица:
Как видно из формулы, правильный выбор коэффициента оптимизма λ оказывает существенное влияние на результат применения критерия. Остановимся подробнее на логике подбора λ .
Если ЛПР настроен пессимистически, то для него важнее меньше потерять при плохом развитии событий, пусть даже это означает не такой большой выигрыш при удачном состоянии. Значит, удельный вес наихудшего исхода xi min в оценке альтернативы должен быть выше, чем для xi mах . Это обеспечивается, когда λ находится в пределах от 0 до 0.5 , исключая последнее значение.
При λ = 0 критерий Гурвица "вырождается" в критерий Вальда и подходит только для очень пессимистично настроенных ЛПР.
Оптимистичный ЛПР, напротив, ориентируется на лучшие исходы, так как для него важнее больше выиграть, а не меньше проиграть. Больший удельный вес в оценке наилучшего исхода достигается при λ больше 0.5 и до 1 включительно. При λ = 1 критерий Гурвица становится критерием "максимакса", который учитывает исключительно наибольший исход каждой альтернативы.
Если у ЛПР нет ярко выраженного уклона ни в сторону пессимизма, ни оптимизма, коэффициент λ принимается равным 0.5 .
Пример применения критерия Гурвица
В условиях задачи из п.2.7 (табл.2.2) рассмотрим принятие решения по критерию Гурвица для ЛПР, настроенного оптимистически ( λ = 0.8 ), и ЛПР-пессимиста ( λ = 0.3 ). Порядок действий таков:
1. Найдем максимальные xi max и минимальные xi min исходы для каждого проекта:
x1 max = max (45, 25, 50) = 50 x1 min = min (45, 25, 50) = 25
x2 max = max (20, 60, 25) = 60 x2 min = min (20, 60, 25) = 20
2. Рассчитаем величину критерия Гурвица при заданных значениях коэффициента оптимизма:
H1 ( 0.8 ) = λ x1 max + ( 1 - λ ) x1 min = 0.8×50 + ( 1 - 0.8 ) ×25 = 45
H2 ( 0.8 ) = λ x2 max + ( 1 - λ ) x2 min = 0.8×60 + ( 1 - 0.8 ) ×20 = 52
3. Сравним полученные величины. Оптимальными для каждого ЛПР будут альтернативы с максимальным значением критерия Гурвица:
ЛПР-оптимист ( λ = 0.8 ):
ЛПР-пессимист ( λ = 0.3 ):
Как мы видим, выбор оптимальной альтернативы в одних и тех же условиях существенным образом зависит от отношения ЛПР к риску. Если для пессимиста оба проекта примерно равноценны, то оптимист, который надеется на лучшее, выберет второй проект. Его высокая наилучшая прибыль ( 60 ) при больших значениях коэффициента λ значительно повышает ценность данного проекта по критерию Гурвица.
Недостатком обычного критерия Гурвица является его "нечувствительность" к распределению исходов между крайними значениями. Это может приводить к неправильным решениям. Например, альтернатива А по критерию Гурвица с "оптимистичным" коэффициентом λ = 0.7 лучше альтернативы В , так как:
HА (0.7) = 0.7×1000 + (1 - 0.7)×100 = 730
HВ (0.7) = 0.7×950 + (1 - 0.7)× 100 = 695
Однако, если посмотреть внимательнее на возможности, которые предоставляет В , то становится заметно, что она выгоднее. Ее "внутренние" исходы ( 750 и 850 ) существенно лучше, чем у А (150 и 200) , а максимальный выигрыш лишь немногим хуже ( 950 против 1000 ). В реальной жизни логичнее было бы выбрать В .
Формула оптимального решения
В итоги оптимальным вариантом выбора программы по критерию среднего выигрыша является вариант первой программы.
Формула критерия Вальда или максимина
Формула оптимального решения по критерию Лапласа
По критерию Вальда оптимальным решением является выбор первой программы.
Формула критерия максимакса
Формула оптимального решения по критерию максимакса
По критерию максимакса оптимальным решением является выбор третьей программы.
Формула критерия Лапласа
Формула оптимального решения по критерию Лапласа
По критерию Лапласа оптимальным решением является выбор первой программы.
Формула критерия Гурвица
Формула оптимального решения по Гурвица критерию
Коэффициент α принимает значения от 0 до 1. Если α стремится к 1, то критерий Гурвица приближается к критерию Вальда, а при α стремящемуся к 0, то критерий Гурвица приближается к критерию максимакса.
По критерию Гурвица оптимальным решением является выбор третьей программы.
Формула критерия Сэвиджа для построения матрицы потерь
Формула для выбора максимального значения из матрицы потерь
Формула оптимального решения по критерию Сэвиджа
Строим матрицу потерь по столбцам выбираем максимальное значение и поочередно вычитаем значения каждой ячейки соответствующего столбца согласно формуле, в итоге получим матрицу вида
По критерию Сэвиджа оптимальным решением является выбор первой или четвёртой программы.
Таким образом, в соответствии со всеми приведёнными критериями большинство решений указывает на выбор первой программы.
10642
Читайте также: