Применение теории игр для оптимизации принимаемых решений

Список использованной литературы

Искусство принятия наилучших решений, основанное на опыте и интуиции, является сущностью любой сферы человеческой деятельности. Наука о выборе приемлемого варианта решения сложилась сравнительно недавно, а математической теории принятия решений — около 50 лет.

Основы теории принятия решений разработаны Джоном фон Нейманом и Отто Моргенштерном.

По мере усложнения задач появилось много различных направлений этой науки, которые имеют дело с одной и той же проблемой анализа возможных способов действия с целью нахождения оптимального в данных условиях решения проблемы [1].

Общая теория принятия решений (ТПР) сформировалась в начале 60-х годов, тогда же была сформулирована основная цель этой теории — рационализировать процесс принятия решений.

В последующие годы была создана и прикладная теория статистических решений, позволяющая анализировать и решать широкий класс управленческих задач, связанных с ограниченным риском — проблемы выбора, размещения, распределения и т.п.

В настоящее время теория принятия решений применяется преимущественно для анализа тех деловых проблем, которые можно легко и однозначно формализовать, а результаты исследования адекватно интерпретировать.

Так, например, методы ТПР используют в самых различных областях управления — при проектировании сложных программных и организационных систем, планировании развития городов, выборе программ развития экономики и энергетики регионов, организации новых экономических зон и т.п.

Необходимость использования подходов и методов ТПР в управлении очевидна: быстрое развитие и усложнение экономических связей, выявление зависимости между отдельными сложными процессами и явлениями, которые раньше казались не связанными друг с другом, приводят к резкому возрастанию трудностей принятия обоснованных решений.

Затраты на их осуществление непрерывно увеличиваются, последствия ошибок становятся все серьезнее, а обращение к профессиональному опыту и интуиции не всегда приводит к выбору наилучшей стратегии.

Использование методов ТПР позволяет решить эту проблему, причем быстро и с достаточной степенью точности [2].

Актуальность темы дипломного проекта обосновывается тем, что подавляющее большинство социально-экономических решений приходится принимать с учетом противоречивых интересов, относящихся либо к различным лицам или организациям, либо к различным аспектам рассматриваемого явления, либо к тому и другому.

4 стр., 1969 слов

Решение задач оформление экономической документации

... и установить флажок "Показать номера страниц" Нажать ОК. Решение задач оформление экономической документации При оформлении экономических документов необходимо уделять внимание, как форме, так и содержанию ... табличных, графических и формульных данных. Процесс оформления экономической документации состоит из ряда этапов: Ввод формул Структуризация документов Оформление табличных ...

В таких случаях невозможно применить традиционные методы оптимизации. В обычных экстремальных задачах речь идет о выборе решения одним лицом, и результат решения зависит от этого выбора, то есть определяется действиями только одного лица.

В такую схему не укладываются ситуации, где решения, оптимальные для одной стороны, совсем не оптимальны для другой и результат решения зависит от всех конфликтующих сторон.

Конфликтный характер таких задач не предполагает вражды между участниками, а свидетельствует о различных интересах. Необходимость анализировать подобные ситуации вызвала к жизни специальный математический аппарат — теорию игр.

Теория игр представляет собой часть обширной теории, изучающей процессы принятия оптимальных решений. Она дает формальный язык для описания процессов принятия сознательных, целенаправленных решений с участием одного или нескольких лиц в условиях неопределенности и конфликта, вызываемого столкновением интересов конфликтующих сторон.

Неопределенность может быть вызвана не только стремлением противников скрыть свои действия в игре, но и дефицитом информации и данных о рассматриваемом явлении.

В этом случае можно говорить о конфликте человека с природой [2].

Целью теории игр является выработка рекомендаций по рациональному образу действий участников в конфликтных ситуациях, то есть определение оптимальной стратегии каждого из них.

Объектом исследования дипломного проекта являются методы решения задач в условиях неопределенности.

Целью данного проекта является разработка программного приложения для автоматизации расчетов. Требования к программе:

1. информация должна отображаться в полной форме;

2. должна иметь понятный (интуитивный) интерфейс, который позволяет максимально облегчить работу пользователя.

  • не требовать больших ресурсов оперативной памяти.
  • быть совместимой с операционной системой Windows любой версии.

Теоретической и методологической основой проведения исследования явились литература по теме работы.

Методом исследования послужил сбор специализированной литературы в данной сфере, анализ имеющихся источников, исследования документации, систематизирование полученной информации.

Во введении обоснована актуальность выбора темы, практическое значение, описан объект исследования, поставлены цель и задачи проекта.

Первая часть проекта посвящена аналитическому исследованию в предметной области, т.е. рассмотрены основные понятии теории игр, как метода приятия решения, приведена классификация игр, методы решения задач в условиях неопределенности, рассмотрен пример решения задачи.

Во второй части описывается создание и работа с программным приложением.

Третья часть посвящена охране труда и технике безопасности, как немаловажной стороне при работе с вычислительной техникой.

Даны некоторые назначения и рекомендации при организации рабочего места, предостережения о возможных опасных моментов в работе и способах их избежание.

Разумная человеческая деятельность в большинстве случаев состоит в том, что человеку для достижения тех или иных целей приходится принимать решения.

При этом представляется вполне естественным стремление принимать оптимальные решения, которые реализуют поставленные цели в наибольшей степени.

6 стр., 2630 слов

Методы исследования в магистерской диссертации «Экономические ...

... исторических исследованиях; документация предприятий, организаций и учреждений. Очевидно, что данный метод также является и неотъемлемым процессуальным компонентом любой научной работы, в том числе он будет применен при подготовке магистерской диссертации, ...

Научные постановки вопроса о выборе оптимальных решений встречались и встречаются в различных теоретических и прикладных дисциплинах — медицине, праве, военном деле, экономике, технике и т. д.

По мере развития и математизации этих дисциплин соответствующие процессы принятия решений формализуются и приобретают характер математических моделей.

Теория математических моделей принятия оптимальных решений составляет ныне обширную отрасль науки, называемую исследованием операций.

Особое место среди условий, в которых приходится принимать решения, занимают условия конфликта.

Это особое положение определяется, во-первых, практической важностью, которую имеют конфликты в жизни и развитии общества, и, во-вторых, специфической сложностью конфликта как явления, в связи с которым приходится принимать решение.

Дело в том, что в условиях конфликта принимающему решения субъекту приходится считаться не только со своими собственными целями, но также с теми целями, которые ставят перед собой его партнеры.

Помимо этого, он должен учитывать, кроме объективных, известных ему обстоятельств конфликта, еще и те решения, которые принимают его противники и которые ему самому, вообще говоря, неизвестны.

Отсюда следует, что раздел исследования операций, занимающийся теорией математических моделей принятия оптимальных решений в условиях конфликтов, является весьма специфическим и весьма сложным. Этим разделом является теория игр [3].

Поскольку теория игр есть теория моделей принятия решений, она не занимается этими решениями как психологическими, волевыми актами; не занимается она и вопросами их фактической реализации. В рамках теории игр принимаемые решения выступают как достаточно упрощенные и идеализированные схемы реальных явлений.

При этом, разумеется, степень этого упрощения не должна превосходить известных пределов, за которыми модель уже утрачивает существенные черты явления.

Теория игр есть теория математических моделей; она является разделом математики. Это значит, что конструируемые в ней модели являются формальными, знаковыми (а не макетными или аналоговыми) моделями и их формирование и средства их анализа также формальны.

В частности, формально должны вводиться в рассмотрение и основные понятия теории игр.

Практически это означает, что эти понятия должны задаваться своими основными свойствами, которым тем самым придается смысл аксиом.

Дальнейшее образование понятий и установление свойств может вестись уже без повторного обращения к их содержательному смыслу и без того, чтобы прибегать к каким-либо «интуитивным» соображениям.

Сказанное отнюдь не оспаривает практической целесообразности использования интуиции, особенно как способа практической проверки формально полученных результатов [4].

При решении ряда практических задач (в области экономики, военного дела и т. д.) приходится анализировать ситуации, где налицо две (или более) враждующие стороны, преследующие противоположные цели, причем результат каждого мероприятия одной из сторон зависит от того, какой образ действий выберет противник.

Такие ситуации называются «конфликтными ситуациями» [5].

Можно привести многочисленные примеры конфликтных ситуаций из различных областей практики. Любая ситуация, возникающая в ходе военных действий, принадлежит к конфликтным ситуациям: каждая из борющихся сторон принимает все доступные ей меры для того, чтобы воспрепятствовать противнику достигнуть успеха.

12 стр., 5568 слов

Теории игр в начальной школе

... теории игр. Терминология, заимствованная из практики таких игр, применяется и при анализе других конфликтных ситуаций: стороны, участвующие в них, условно именуются " игроками ", а результат столкновения - "выигрышем " одной из сторон. правилами игры" Стратегией, ... теоретических моделей в экономике и социологии. Методы теории игр используются также в теории операций и в линейном программировании. В ...

К конфликтным принадлежат и ситуации, возникающие при выборе системы вооружения, способов его боевого применения и вообще при планировании военных операций: каждое из решений в этой области должно приниматься в расчете на наименее выгодные для нас действия противника.

Ряд ситуаций в области экономики (особенно при наличии свободной конкуренции) принадлежит к конфликтным ситуациям; в роли борющихся сторон выступают торговые фирмы, промышленные предприятия и т. д.

Необходимость анализировать подобные ситуации вызвала к жизни специальный математический аппарат.

Теория игр по существу представляет собой не что иное, как математическую теорию конфликтных ситуаций.

Цель теории — выработка рекомендаций по рациональному образу действий каждого из противников в ходе конфликтной ситуации.

Каждая непосредственно взятая из практики конфликтная ситуация очень сложна, и анализ ее затруднен наличием многочисленных привходящих факторов.

Чтобы сделать возможным математический анализ ситуации, необходимо отвлечься от второстепенных, привходящих факторов и построить упрощенную, формализованную модель ситуации. Такую модель называется «игрой».

От реальной конфликтной ситуации игра отличается тем, что ведется по вполне определенным правилам.

Человечество издавна пользуется такими формализованными моделями конфликтных ситуаций, которые являются играми в буквальном смысле слова.

Примерами могут служить шахматы, шашки, карточные игры и т. д. Все эти игры носят характер соревнования, протекающего по известным правилам и заканчивающегося «победой» (выигрышем) того или иного игрока [6].

Такие формально регламентированные, искусственно организованные игры представляют собой наиболее подходящий материал для иллюстрации и усвоения основных понятий теории игр.

Терминология, заимствованная из практики таких игр, применяется и при анализе других конфликтных ситуаций: стороны, участвующие в них, условно именуются «игроками», а результат столкновения — «выигрышем» одной из сторон.

В игре могут сталкиваться интересы двух или более противников; в первом случае игра называется «парной», во втором — «множественной». Участники множественной игры могут в ее ходе образовывать коалиции — постоянные или временные.

При наличии двух постоянных коалиций множественная игра обращается в парную. Наибольшее практическое значение имеют парные игры.

Выбор и осуществление одного из предусмотренных правилами действий называется ходом игрока. Ходы могут быть личными и случайными. Личный ход — это сознательный выбор игроком одного из возможных действий (например, ход в шахматной игре).

Случайный ход — это случайно выбранное действие (например, выбор карты из перетасованной колоды).

В дальнейшем мы будем рассматривать только личные ходы игроков.

Стратегией игрока называется совокупность правил, определяющих выбор его действия при каждом личном ходе в зависимости от сложившейся ситуации.

Обычно в процессе игры при каждом личном ходе игрок делает выбор в зависимости от конкретной ситуации.

Однако в принципе, возможно, что все решения приняты игроком заранее (в ответ на любую сложившуюся ситуацию).

Это означает, что игрок выбрал определенную стратегию, которая может быть задана в виде списка правил или программы. (Так можно осуществить игру с помощью ЭВМ).

Игра называется конечной, если у каждого игрока имеется конечное число стратегий, и бесконечной — в противном случае [7].

Для того чтобы решить игру, или найти решение игры, следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности, т.е. один из игроков должен получать максимальный выигрыш, когда второй придерживается своей стратегии.

В то же время второй игрок должен иметь минимальный проигрыш, если первый придерживается своей стратегии. Такие стратегии называются оптимальными.

Оптимальные стратегии должны также удовлетворять условию устойчивости, т.е. любому из игроков должно быть невыгодно отказаться от своей стратегии в этой игре.

Если игра повторяется достаточно много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной партии, а средний выигрыш (проигрыш) во всех партиях.

Целью теории игр является определение оптимальной стратегии для каждого игрока.

При выборе оптимальной стратегии естественно предполагать, что оба игрока ведут себя разумно с точки зрения своих интересов.

Важнейшее ограничение теории игр — единственность выигрыша как показателя эффективности, в то время как в большинстве реальных экономических задач имеется более одного показателя эффективности.

Классификация игр

Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д. [8].

В зависимости от количества игроков различают игры двух и n игроков. Первые из них наиболее изучены.

Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения.

По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий, игра называется бесконечной.

По характеру взаимодействия игры делятся на бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции; коалиционные (кооперативные) – могут вступать в коалиции.

В кооперативных играх коалиции заранее определены.

По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой.

По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые и др.

Матричная игра – это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 1, столбец – номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).

Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.

Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)

Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной.

Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.

Если функция выигрышей является выпуклой, то такая игра называется выпуклой.

Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока.

Такая задача решается сравнительно легко.

Запись матричной игры в виде платёжной матрицы

В общем виде матричная игра может быть записана следующей платёжной матрицей [9, 10] (таблица 1),

Таблица 1

Общий вид платёжной матрицы матричной игры

B1

B2

Bn

A1

A11

A12

  • ..

A1n

A2

A21

A22

  • ..

A2n

  • ..
  • ..
  • ..
  • ..

Am

am1

am2

  • ..

amn

где Ai — названия стратегий игрока 1, Bj — названия стратегий игрока 2, aij — значения выигрышей игрока 1 при выборе им i — й стратегии, а игроком 2 — j — й стратегии. Поскольку данная игра является игрой с нулевой суммой, значение выигрыша для игрока 2 является величиной, противоположенной по знаку значению выигрыша игрока 1.

Понятие о нижней и верхней цене игры.

Каждый из игроков стремится максимизировать свой выигрыш с учётом поведения противодействующего ему игрока.

Поэтому для игрока 1 необходимо определить минимальные значения выигрышей в каждой из стратегий, а затем найти максимум из этих значений, то есть определить величину Vн = maxi minj aij, или найти минимальные значения по каждой из строк платёжной матрицы, а затем определить максимальное из этих значений.

Величина Vн называется максимином матрицы или нижней ценой игры [11].

Величина выигрыша игрока 1 равна, по определению матричной игры, величине проигрыша игрока 2. Поэтому для игрока 2 необходимо определить значение Vв = minj maxi aij.

Или найти максимальные значения по каждому из столбцов платёжной матрицы, а затем определить минимальное из этих значений. Величина Vв называется минимаксом матрицы или верхней ценой игры.

В случае, если значения Vн и Vв не совпадают, при сохранении правил игры (коэффициентов aij ) в длительной перспективе, выбор стратегий каждым из игроков оказывается неустойчивым. Устойчивость он приобретает лишь при равенстве Vн = Vв = V.

В этом случае говорят, что игра имеет решение в чистых стратегиях, а стратегии, в которых достигается V — оптимальными чистыми стратегиями. Величина V называется чистой ценой игры. [8].

Например, в матрице (таблица 2)

Таблица 2

Платёжная матрица, в которой существует решение в чистых стратегиях

B1

B2

B3

B4

Minj

A1

7

6

5

4

4

A2

1

8

2

3

1

A3

8

1

3

2

1

Maxi

8

8

5

4

существует решение в чистых стратегиях. При этом для игрока 1 оптимальной чистой стратегией будет стратегия A1, а для игрока 2 — стратегия B4.

В матрице (таблица 3)

Таблица 3

Платёжная матрица, в которой не существует решения в чистых стратегиях

B1

B2

B3

B4

Minj

A1

7

6

5

2

2

A2

1

8

2

3

1

A3

8

1

3

2

1

Maxi

8

8

5

3

решения в чистых стратегиях не существует, так как нижняя цена игры достигается в стратегии A1 и её значение равно 2, в то время как верхняя цена игры достигается в стратегии B4 и её значение равно 3.

Уменьшение порядка платёжной матрицы

Порядок платёжной матрицы (количество строк и столбцов) может быть уменьшен за счёт исключения доминируемых и дублирующих стратегий [12].

доминируемой стратегией K**, если при любом варианте поведения противодействующего игрока выполняется соотношение Ak* < Ak**, где Ak* и Ak** — значения выигрышей при выборе игроком, соответственно, стратегий K* и K**.

В случае, если выполняется соотношение Ak* = Ak**, стратегия K* называется дублирующей по отношению

Например, в матрице (таблица 4)

Таблица 4

Платёжная матрица с доминируемыми и дублирующими стратегиями

B1

B2

B3

B4

B5

B6

A1

1

2

3

4

4

7

A2

7

6

5

4

4

8

A3

1

8

2

3

3

6

A4

8

1

3

2

2

5

доминируемой по отношению к стратегии A2, стратегия B6 является доминируемой по отношению к стратегиям B3, B4 и B5, а стратегия B5 является дублирующей по отношению к стратегии B4. Данные стратегии не будут выбраны игроками, так как являются заведомо проигрышными и удаление этих стратегий из платёжной матрицы не повлияет на определение нижней и верхней цены игры, описанной данной матрицей.

Множество недоминируемых стратегий, полученных после уменьшения размерности платёжной матрицы, называется ещё множеством Парето (по имени итальянского экономиста Вильфредо Парето, занимавшегося исследованиями в данной области) [7].

Понятие о матричных играх со смешанным расширением

Исследование в матричных играх начинается с нахождения её чистой цены. Если матричная игра имеет решение в чистых стратегиях, то нахождением чистой цены заканчивается исследование игры.

Если же в игре нет решения в чистых стратегиях, то можно найти нижнюю и верхнюю цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры.

Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии.

Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью [13].

Смешанной стратегией игрока называется полный набор чистых стратегий, применённых в соответствии с установленным распределением вероятностей.

Матричная игра, решаемая с использованием смешанных стратегий, называется игрой со смешанным расширением.

Стратегии, применённые с вероятностью, отличной от нуля, называются активными стратегиями.

Доказано [1, 2, 4, 7, 8, 11], что для всех игр со смешанным расширением существует оптимальная смешанная стратегия, значение выигрыша при выборе которой находится в интервале между нижней и верхней ценой игры: Vн £ V £ Vв.

При этом условии величина V называется ценой игры.

Кроме того, доказано, что, если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры V, независимо от того, каких стратегий придерживается другой игрок, если только он не выходит за пределы своих активных стратегий.

Поэтому, для достижения наибольшего гарантированного выигрыша второму игроку также необходимо придерживаться своей оптимальной смешанной стратегии [14].

Принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует не со вторым игроком, а с окружающей средой.

Объективно окружающая среда не заинтересована в проигрыше игрока.

В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени [15].

Принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует не со вторым игроком, а с окружающей средой.

Матричная игра, в которой игрок взаимодействует с окружающей средой, не заинтересованной в его проигрыше, и решает задачу определения наиболее выгодного варианта поведения с учётом неопределённости состояния окружающей среды, называется статистической игрой или «игрой с природой».

Игрок в этой игре называется лицом, принимающим решение (ЛПР).

[3,6,9,10].

В общем виде платёжная матрица статистической игры приведена в таблице 5.

Таблица 5

Общий вид платёжной матрицы статистической игры

S1

S2

Sn

A1

A11

A12

  • ..

A1n

A2

A21

A22

  • ..

A2n

  • ..
  • ..
  • ..
  • ..

An

am1

am2

  • ..

amn

В данной игре строки матрицы (Ai ) — стратегии ЛПР, а столбцы матрицы (Sj) — состояния окружающей среды.

Критерии принятия решения

ЛПР определяет наиболее выгодную стратегию в зависимости от целевой установки, которую он реализует в процессе решения задачи.

Результат решения задачи ЛПР определяет по одному из критериев принятия решения. Для того, чтобы прийти к однозначному и по возможности наиболее выгодному варианту решению, необходимо ввести оценочную (целевую) функцию. При этом каждой стратегии ЛПР (Ai) приписывается некоторый результат Wi, характеризующий все последствия этого решения.

Из массива результатов принятия решений ЛПР выбирает элемент W, который наилучшим образом отражает мотивацию его поведения [16].

Критерий максимального математического ожидания выигрыша применяется в тех случаях, когда ЛПР известны вероятности состояний окружающей среды.

Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой значение математического ожидания выигрыша при выборе соответствующей стратегии ЛПР:

Критерии принятия решения 1 , (1.4.1)

где pj -вероятность j-го состояния окружающей среды [17].

Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение математического ожидания выигрыша максимально: W = max Wi

Применение критерия максимального математического ожидания выигрыша, таким образом, оправдано, если ситуация, в которой принимается решение, следующая:

  • ЛПР известны вероятности всех состояний окружающей среды;
  • Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша.

Необходимость иметь информацию о вероятностях состояний окружающей среды ограничивает область применения данного критерия.

1.4.2 Критерий недостаточного основания Лапласа

Данный критерий используется при наличии неполной информации о вероятностях состояний окружающей среды в задаче принятия решения. Вероятности состояний окружающей среды принимаются равными и по каждой стратегии ЛПР в платёжной матрице определяется, таким образом, среднее значение выигрыша:

 критерий недостаточного основания лапласа 1 (1.4.2)

Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение среднего выигрыша максимально: W = max Wi

Использование данного критерия оправдано в следующей ситуации:

  • ЛПР не имеет информации, либо имеет неполную информацию о вероятностях состояний окружающей среды;
  • Вероятности состояний окружающей среды близки по своим значениям;
  • Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша [18].

1.4.3 Максиминный критерий Вальда

Правило выбора решения в соответствии с максиминным критерием (ММ-критерием) можно интерпретировать следующим образом:

Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой минимальное значение выигрыша в соответствующей стратегии ЛПР: Wi = minj aij

Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой минимальное значение выигрыша максимально: W = max Wi

Выбранная таким образом стратегия полностью исключает риск.

Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется.

Это свойство позволяет считать ММ-критерий одним из фундаментальных.

Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая:

  • О возможности появления состояний окружающей среды ничего не известно;
  • Решение реализуется только один раз;
  • Необходимо исключить какой бы то ни было риск [19].

1.4.4 Критерий минимаксного риска Сэвиджа

Величина (amax j — aij ), где amax j — максимальный элемент j — го столбца, может быть интерпретирована как дополнительный выигрыш, получаемый в условиях состояния окружающей среды Sj при выборе ЛПР наиболее выгодной стратегии, по сравнению с выигрышем, получаемым ЛПР при выборе в тех же условиях любой другой стратегии.

Эта же разность может быть интерпретирована как величина возможного проигрыша при выборе ЛПР I — й стратегии по сравнению с наиболее выгодной стратегией.

На основе данной интерпретации разности выигрышей производится определение наиболее выгодной стратегии по критерию минимаксного риска [20].

Для определения оптимальной стратегии по данному критерию на основе платёжной матрицы рассчитывается матрица рисков, каждый коэффициент которой (rij) определяется по формуле: rij = amax j — aij

Матрица рисков дополняется столбцом, содержащим максимальные значения коэффициентов rij по каждой из стратегий ЛПР: Ri = maxj rij

Оптимальной по данному критерию считается та стратегия, в которой значение Ri минимально: W = min Ri

Ситуация, в которой оправдано применение критерия Сэвиджа, аналогична ситуации ММ-критерия, однако наиболее существенным в данном случае является учёт степени воздействия фактора риска на величину выигрыша.

1.4.5 Критерий пессимизма-оптимизма Гурвица

В практике принятия решений ЛПР руководствуется не только критериями, связанными с крайним пессимизмом или учётом максимального риска.

Стараясь занять наиболее уравновешенную позицию, ЛПР может ввести оценочный коэффициент, называемый коэффициентом пессимизма, который находится в интервале [0, 1] и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма.

Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях [21].

Платёжная матрица дополняется столбцом, коэффициенты которого рассчитываются по формуле:

Wi = C×minj aij + (1-C) ×maxj aij (1.4.3)

Где C — коэффициент пессимизма.

Оптимальной по данному критерию считается стратегия, в которой значение Wi максимально: W = max Wi

При С=1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий “азартного игрока”, делающего ставку на то, что «выпадет» наилучший случай.

Критерий Гурвица применяется в ситуации, когда :

  • Информация о состояниях окружающей среды отсутствует или недостоверна;
  • Необходимо считаться с появлением каждого состояния окружающей среды;
  • Реализуется только малое количество решений;

1.4.6 Критерий Ходжа-Лемана

Этот критерий опирается одновременно на ММ-критерий и критерий максимального математического ожидания выигрыша. При определении оптимальной стратегии по этому критерию вводится параметр достоверности информации о распределении вероятностей состояний окружающей среды, значение которого находится в интервале [0, 1].

Если степень достоверности велика, то доминирует критерий максимального математического ожидания выигрыша, в противном случае – ММ-критерий

Платёжная матрица дополняется столбцом, коэффициенты которого определяются по формуле:

 критерий ходжа лемана 1 (1.4.4)

где u — параметр достоверности информации о вероятностях состояний окружающей среды.

Оптимальной по данному критерию считается та стратегия, в которой значение Wi максимально: W = max Wi

Данный критерий применим в следующем случае [21]:

  • Имеется информация о вероятностях состояний окружающей среды, однако эта информация получена на основе относительно небольшого числа наблюдений и может измениться;
  • Принятое решение теоретически допускает бесконечно много реализаций;
  • При малом числе реализации допускается некоторый риск.

Пример решения статистической игры

Рассмотрим пример решения статистической игры в экономической задаче.

Сельскохозяйственное предприятие производит капусту. Оно имеет возможность хранить произведённую капусту в течение всего сезона реализации — с осени до начала лета следующего года.

Хозяйство может выбрать одну из трёх стратегических программ реализации капусты в течение сезона реализации:

  • A1 — реализовать всю капусту осенью, непосредственно после уборки;
  • A2 — заложить часть капусты на хранение и реализовать её в течение осенних и зимних месяцев;
  • A3 — заложить всю капусту на хранение и реализовать её в весенние месяцы.

Сумма затрат на производство, хранение и реализацию капусты для хозяйства при выборе им каждой из стратегий составляет соответственно 20, 30 и 40 тыс. денежных единиц.

На региональном рынке капусты может сложиться одна из следующих трёх ситуаций:

  • S1 — поступление капусты на рынок происходит равномерно в течение всего сезона реализации и рынок не испытывает сезонных колебаний цен реализации продукта;
  • S2 — в осенние месяцы на рынок поступает капусты немного больше, чем зимой и весной. В связи с этим наблюдаются небольшие сезонные колебания цен — в начале зимы цены немного возрастают по сравнению с осенним уровнем и держатся стабильными в течение всех последующих месяцев сезона реализации;
  • S3 — в осенние месяцы на рынок поступает капусты значительно больше, чем зимой и весной.

Объёмы капусты, поступающей в течение сезона реализации, постоянно уменьшаются. Поэтому рынок испытывает значительные сезонные колебания цен.

Значения суммы выручки предприятия от реализации капусты при выборе каждой из стратегий реализации и формировании различных ситуаций на рынке представлены в таблице 6.

Таблица 6.

Выручка от реализации капусты, тыс. д.е.

Стратегии хозяйства

Выручка от реализации капусты, тыс. д.е.

S1

S2

S3

A1

30

25

22

A2

30

40

33

A3

30

40

60

В задаче необходимо определить:

  • Какая стратегия хозяйства является наиболее выгодной, если известны значения вероятностей состояний рынка капусты региона: 0,3, 0,6 и 0,1 соответственно;
  • Какая стратегия хозяйства является наиболее выгодной, если информация о вероятностях состояний рынка капусты отсутствует и предприятию необходимо:
  • а) получить минимально гарантированный выигрыш;
  • б) учесть значения риска от принятия различных решений;
  • в) определить наиболее выгодную стратегию, если коэффициент пессимизма равен 0,3;
  • Определить наиболее выгодную стратегию, если информация о вероятностях состояний рынка не является вполне достоверной и параметр достоверности информации равен 0,7;
  • Дать экономическую интерпретацию результатов решения задачи.

Решение

1. Составим платёжную матрицу данной игры. Её коэффициентами будут значения прибыли от производства капусты, получаемые как разница суммы выручки от реализации капусты и затрат на производство, хранение и реализацию капусты (таблица 7).

Таблица 7

Платёжная матрица задачи определения наиболее выгодной стратегии реализации капусты

S1

S2

S3

A1

10

5

2

A2

0

10

3

A3

-10

0

20

2. Определим наиболее выгодную стратегию по критерию максимального математического ожидания выигрыша по формуле

W1 = 10×0,3 + 5×0,6 + 2×0,1 = 6,2

W2 = 0×0,3 + 10×0,6 + 3×0,1 = 6,3

W3 = -10×0,3 + 0×0,6 + 20×0,1 = -1

Таблица 8

Определение оптимальной стратегии в статистической игре по критерию максимального математического ожидания

S1

S2

S3

Wi

Pj

0,3

0,6

0,1

A1

10

5

2

6.2

A2

0

10

3

6.3

A3

-10

0

20

-1

W = max Wi = W2

Оптимальной по данному критерию при указанных значениях вероятностей состояния рынка капусты будет стратегия A2 (W = 6,3)

  • Определим наиболее выгодные стратегии предприятия по ММ-критерию, критерию недостаточного основания Лапласа (НО-критерий) и критерию пессимизма-оптимизма (на рисунке — ПО-критерий, таблица 9).

Таблица 9

Определение оптимальной стратегии в статистической игре по максиминному критерию, критерию недостаточного основания Лапласа и критерию пессимизма-оптимизма

S1

S2

S3

Wi (ММ)

Wi (НО)

Wi (ПО)

A1

10

5

2

2

5,67

7,6

A2

0

10

3

0

4,33

7

A3

-10

0

20

-10

3,33

11

Значения Wi для ММ-критерия найдём по формуле:

W1 = min (10, 5, 2) = 2= min (0, 10, 3) = 0= min (-10, 0 20) =-10 = max Wi = W1

Оптимальной стратегией по максиминному критерию является стратегия A1 (W = 2).

Определим оптимальную стратегию по критерию недостаточного основания Лапласа.

По данному критерию оптимальной является стратегия A1 (W = 5,67).

По критерию пессимизма-оптимизма при коэффициенте пессимизма, равном 0,3 (формула (6)) — стратегия A3 (W = 11).

  • Определим наиболее выгодную стратегию по критерию минимаксного риска. Для этого рассчитаем матрицу рисков (таблица 10).

Таблица 10

Определение оптимальной стратегии в статистической игре по критерию минимаксного риска с помощью построения матрицы рисков

S1

S2

S3

Ri

A1

0

5

18

18

A2

10

0

17

17

A3

20

10

20

20

Оптимальной стратегией по критерию минимаксного риска является стратегия A2 (W = 17).

  • Определим наиболее выгодную стратегию пользователя по критерию Ходжа-Лемана (таблица 11).

Таблица 11

Определение оптимальной стратегии в статистической игре по критерию Ходжа-Лемана

S1

S2

S3

Wi

Pj

0,3

0,6

0,1

A1

10

5

2

4,94

A2

0

10

3

4,41

A3

-10

0

20

-3,7

По критерию Ходжа-Лемана оптимальной для хозяйства будет стратегия A1 (W = 4,94).

  • Проведём экономическую интерпретацию результатов решения задачи.

Если предприятие имеет информацию о вероятностях состояния рынка капусты и значения этих вероятностей соответствуют исходным данным задачи, наиболее выгодной стратегией является продажа части капусты в осенние месяцы и хранение оставшейся капусты для реализации в течение зимних месяцев (прибыль составит 6,3 тыс. д.е.).

Эта же стратегия является наиболее эффективной, если информация о вероятностях состояний рынка капусты отсутствует и пользователю необходимо минимизировать степень возможного риска потери прибыли в процессе принятия решения (значение возможного риска составит 17 тыс. д.е.).

В случае, когда при отсутствии информации о состоянии рынка наиболее существенным для пользователя является не максимизация прибыли в абсолютном выражении, а получение её гарантированного объема, хотя бы и минимального, наиболее целесообразным решением является реализация всей капусты в осенние месяцы (прибыль составит 2 тыс. д.е.).

Это же стратегия является наиболее выгодной, если пользователь имеет информацию о вероятностях состояний рынка, соответствующую исходным данным, но эта информация не вполне достоверна (в случае, если информация имеет достоверность 0,7, прибыль составит 4,94 тыс. д.е.).

В случае, если информация о вероятностях состояний рынка отсутствует и риск значительных потерь не является для пользователя определяющим фактором при принятии решения, или если есть основания для оптимистической оценки ситуации на рынке капусты, при котором пользователь имеет возможность получить наибольшую прибыль от производства капусты, ему следует сохранить произведённую продукцию и реализовать её в весенние месяцы (прибыль составит соответственно 5.7 и 11 тыс. д.е.).

принятие решение оптимальный программный

Для написания данной дипломной работы использовался язык объектно-ориентированного программирования DELPHI.

Программирование в Delphi строится на тесном взаимодействии двух процессов: процесса конструирования визуального проявления программы и процесса написания кода, придающего элементам этого окна и программе в целом необходимую функциональность.

Для написания кода используется окно кода, для конструирования программы — остальные окна Delphi, и прежде всего — окно формы [22].

Между содержимым окон формы и кода существует неразрывная связь, которая строго отслеживается Delphi.

Это означает, что размещение на форме компонента приводит к автоматическому изменению кода программы и наоборот — удаление тех или иных автоматически вставленных фрагментов кода может привести к удалению соответствующих компонентов.

С самого начала работы над новой программой Delphi создает минимально необходимый код, обеспечивающий ее нормальное функционирование в Windows.

Таким образом, простейшая программа готова сразу после выбора опции File | New | Application, и остается просто запустить программу.

В первом приближении можно считать модулем самостоятельный раздел программы, в чем-то подобный главе в книге.

Модуль создается каждый раз, когда создается новая форма (в программе может быть и, чаще, бывает не одна, а несколько — иногда несколько десятков форм и связанных с ними модулей).

При компиляции программы Delphi создает файлы с расширениями pas, dfm и оси для каждого модуля: pas-файл содержит копию текста из окна кода программы, в файле с расширением dfm хранится описание содержимого окна формы, а в оси-файле — результат преобразования в машинные инструкции текста из обоих файлов.

Файлы dcu создаются компилятором и дают необходимую базу для работы компоновщика, который преобразует их в единый загружаемый файл с расширением ехе.

По умолчанию заголовок окна совпадает с заголовком формы: Formi. Чтобы изменить заголовок, нужно обратиться к окну Инспектора объектов.

Функциональность программы определяется совокупностью ее реакций на те или иные события. В связи с этим каждый компонент помимо свойств характеризуется также набором событий, на которые он может реагировать.

Слово procedure извещает компилятор о начале подпрограммы-процедуры (в Delphi могут использоваться также подпрограммы-функции; в этом случае вместо procedure (процедура) используется слово function (функция); разницу между процедурами и функциями мы обсудим позже).

За ним следует имя процедуры TFormi.ButtonlClick. Это имя — составное: оно состоит из имени класса TForm1 и собственно имени процедуры Button1Click.

Классами в Delphi называются функционально законченные фрагменты программ, служащие образцами для создания подобных себе экземпляров.

Однажды создав класс, пользователь может включать его экземпляры (копии) в разные программы или в разные места одной и той же программы. Такой подход способствует максимально высокой продуктивности программирования за счет использования ранее написанных фрагментов программ. В состав Delphi входит несколько сотен классов, созданных программистами корпорации Borland (так называемых стандартных классов).

Совокупность стандартных классов определяет мощные возможности этой системы программирования [23].

Каждый компонент принадлежит к строго определенному классу, а все конкретные экземпляры компонентов, вставляемые в форму, получают имя класса с добавленным числовым индексом.

По используемому в Delphi соглашению все имена классов начинаются с буквы Т. Таким образом, имя TFormi означает имя класса, созданного по образцу стандартного класса TForm. Если посмотреть начало текста в окне кода, то можно увидеть примерно следующие строки:

  • type= class(TForm): TButton;: TLabel;ButtonlClick(Sender: TObject);

{ Private declarations }

{ Public declarations };: TForm1; class(TForm)

определяет новый класс Tform1, который порожден от (создан по образцу) стандартного класса TForm. Строка

Form1: Tform1;

— создает экземпляр этого класса с именем Formi. Стандартный класс TForm описывает пустое Windows-окно, в то время как класс TFormI описывает окно с уже вставленными в него компонентами метка и кнопка. Описание этих компонентов содержат строки

Button1: TButton;

  • Label 1: TLabel;
  • Они указывают, что компонент Buttoni (Кнопка!) представляет собой экземпляр стандартного класса TButton, а компонент Label 1 (Метка 1) — экземпляр класса TLabel.

За именем процедуры TFormi. Buttoniciick в круглых скобках следует описание параметра вызова: TObject

(параметр с именем Sender принадлежит классу TObject).

Процедуры могут иметь не один, а несколько параметров вызова или не иметь их вовсе.

Параметры вызова (если они есть) служат для настройки реализованного в процедуре алгоритма на выполнение конкретной работы. Параметр Sender вставлен Delphi “на всякий случай”: с его помощью подпрограмма Button1Click может при желании определить, какой именно компонент создал событие OnClick. Вся строка в целом procedure TFormI.Buttoniciick(Sender: TObject);

  • называется заголовком процедуры. Ее завершает символ “;”. Этот символ играет важную роль в Object Pascal, т. к. показывает компилятору на конец предложения языка.

Из отдельных предложений составляется весь текст программы. В конце каждого предложения нужно ставить точку с запятой — это обязательное требование синтаксиса языка.

Следующие строки определяют тело процедуры:;

— Слово begin (начало) сигнализирует компилятору о начале последовательности предложений, описывающих алгоритм работы процедуры, а слово end (конец) — о конце этой последовательности. Delphi лишь создала заготовку для процедуры, но она ничего “не знает” о том, для чего эта процедура предназначена. Наполнить тело нужными предложениями — задача программиста [24].

Каждый раз при нажатии кнопки Button1 управление будет передаваться в тело процедуры, а значит, между словами begin и end мы можем написать фрагмент программы, который будет выполняться в ответ на это событие.

Структура программ Delphi.

Любая программа в Delphi состоит из файла проекта (файл с расширением dpr) и одного или нескольких модулей (файлы с расширениями pas).

Каждый из таких файлов описывает программную единицу Object Pascal.

Файл проекта представляет собой программу, написанную на языке Object Pascal и предназначенную для обработки компилятором. Эта программа автоматически создается Delphi и содержит лишь несколько строк. Чтобы увидеть их, необходимо запустить Delphi и щелкнуть по опции Project | View Source главного меню. Delphi покажет окно кода с закладкой Project1, содержащее такой текст:

  • program Projecti;, Unit1 in ‘Unit1.pas’ {fmExample};
  • {$R *.RES}.Initialize;.CreateForm(TfmExample, fmExample);.Run;.

В окне кода жирным шрифтом выделяются так называемые зарезервированные слова, а курсивом — комментарии (так же выделяются зарезервированные слова и комментарии в книге).

Текст программы начинается зарезервированным словом program и заканчивается словом end с точкой за ним.

Сочетание end со следующей за ней точкой называется терминатором программной единицы: как только в тексте программы встретится такой терминатор, компилятор прекращает анализ программы и игнорирует оставшуюся часть текста [25].

Зарезервированные слова играют важную роль в Object Pascal, придавая программе в целом свойство текста, написанного на почти естественном английском языке.

Каждое зарезервированное слово (а их в Object Pascal несколько десятков) несет в себе условное сообщение для компилятора, который анализирует текст программы так же, как читаем его и мы: слева направо и сверху вниз.

Комментарии, наоборот, ничего не значат для компилятора, и он их игнорирует. Комментарии важны для программиста, который с их помощью поясняет те или иные места программы.

Наличие комментариев в тексте программы делает ее понятнее и позволяет легко вспомнить особенности реализации программы, которую вы написали несколько лет назад. В Object Pascal комментарием считается любая последовательность символов, заключенная в фигурные скобки. В приведенном выше тексте таких комментариев два, но строка

{$R *.RES}

на самом деле не является комментарием. Этот специальным образом написанный фрагмент кода называется директивой компилятора (в нашем случае — указание компилятору на необходимость подключения к программе так называемого файла ресурсов).

Директивы начинаются символом $, который стоит сразу за открывающей фигурной скобкой.

В качестве ограничителей комментария могут также использоваться пары символов (*, *) и //. Скобки (*…*) используются подобно фигурным скобкам т. е. комментарием считается находящийся в них фрагмент текста, а символы // указывают компилятору, что комментарий располагается за ними и продолжается до конца текущей строки: