Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву
Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Понятие игры. Классификация игрСодержание книги Похожие статьи вашей тематики
Поиск на нашем сайте Теорией игр называется математическая теория принятия оптимальных решений в конфликтных ситуациях. Поясним это определение. Простейшие модели принятия решений рассматриваются в курсах математического анализа и оптимизации. В этих моделях лицо, принимающее решение (ЛПР), выбирает свое действие из некоторого множества стратегий. Считается, что задана целевая функция, которая отражает интересы ЛПР и зависит от выбранной им стратегии. Задача принятия решений в такой постановке состоит, как правило, в том, чтобы найти стратегию, доставляющую максимум целевой функции. Отличие конфликтной ситуации заключается в том, что решения принимаются не одним индивидуумом, а несколькими участниками, и функция выигрыша каждого индивидуума зависит не только от его стратегии, но также и от решения других участников. Математическая модель такого рода конфликта называется игрой, а участники конфликта – игроками. Таким образом, игра – это идеализированная математическая модель коллективного поведения: несколько индивидуумов (участников, игроков) влияют на ситуацию, причем их интересы (выигрыши при различных возможных ситуациях) различны.
Игры можно классифицировать по следующим признакам:
1. По возможности ведения игроками предварительных переговоров игры делятся на: 1) бескоалиционные игры (игроки действуют самостоятельно, независимо друг от друга, и если какие-то соглашения заключаются, то они не являются обязывающими); 2) кооперативные (коалиционные) игры (игроки объединяются в коалиции в предположении, что существует механизм, обеспечивающий выполнение совместного принятого решения).
2. По свойствам выигрыша различают: 1) антагонистические игры (выигрыш одного игрока равен проигрышу второго); 2) неантагонистические (с ненулевой суммой) игры.
3. По характеру получения информации выделяют: 1) игры в нормальной форме (игроки получают информацию до начала игры); 2) динамические игры (игроки получают информацию в процессе развития игры). 4. По числу стратегий игры делятся на: 1) конечные (множество стратегий каждого из игроков конечно); 2) бесконечные (множество стратегий хотя бы одного из игроков бесконечно).
Антагонистические игры в нормальной форме Определение антагонистической игры в нормальной форме. Матричные игры Рассмотрим игру, в которой принимают участие два игрока – P1 и Р2. Первый игрок выбирать любое действие (стратегию, чистую стратегию) x из множества допустимых стратегий X, а второй игрок соответственно стратегию y из множества Y. Пара Для каждого игрока задана функция выигрыша Полагаем, что каждый игрок знает до начала игры информацию о множествах стратегий и функциях выигрыша.
Определение 1. Система
Определение 2. Антагонистическая игра, в которой множества стратегий игроков являются конечными множествами, называется матричной игрой.
Пусть m – количество стратегий игрока 1, тогда Примеры
Пример 1. Рассмотрим следующую игру. Игроки выбирают одновременно одно из трех чисел: «один», «два», «три». Выигрыш Р1 (проигрыш Р2) положителен и равен названному числу, если он правильно угадал выбор второго игрока и 0 в противном случае.
В данной задаче
Пример 2. Оборона города (игра полковника Блотто). Полковник Блотто (игрок Р1) имеет 4 полка, а его противник (Р2) – 3 полка. Противник защищает 2 позиции. Позиция будет занята полковником Блотто, если на ней наступающие полки окажутся в численном превосходстве. При этом, если у полковника Блотто на позиции полков больше, чем у противника, то его выигрыш на этой позиции равен числу полков противника плюс один (за захват позиции). Если у Р2 полков больше, то Р1 теряет все свои полки и 1 за позицию. Если число полков Р1 и Р2 на позиции одинаково, то имеет место ничья и никто ничего не получает. Считая, что суммарный выигрыш Р1 равен сумме его выигрышей по двум позициям и игра является антагонистической, сформировать матрицу игры.
Решение Стратегией первого игрока является пара
Рассмотрим формирование элементов матрицы на примере
3.2 Ситуация равновесия в чистых стратегиях: понятие и существование
Рассмотрим антагонистическую игру В теории игр предполагается, что оба игрока ведут себя рационально, то есть стремятся получить максимально возможную величину гарантированного выигрыша. Пусть игрок 1 выбрал стратегию
Замечание 1. Для матричной игры
Лемма 1. Для любой антагонистической игры
Рассмотрим вопрос оптимального поведения игроков. Ситуация
Определение 3. В антагонистической игре
Так как
Замечание 2. В матричной игре ситуация
Свойства ситуаций равновесия Пусть 1) 2) Необходимые и достаточные условия существования ситуации равновесия в чистых стратегиях доказываются следующей теоремой.
Теорема 1. Для того, чтобы в игре
и выполнялось равенство: Доказательство 1. Необходимость. Пусть По определению ситуации равновесия:
Тогда Так как
Аналогично:
Из (*), (**) следует: 2. Достаточность. Пусть существуют Пусть
Докажем, что
Тогда, так как правые части неравенств равны по условию, то
В случае если верхняя цена игры и нижняя совпадают, величину Для антагонистической игры справедлива следующая лемма о масштабе.
Лемма 2. (Лемма о масштабе) Пусть
Примеры Пример 1. Найти верхнюю и нижнюю цены игры и ситуацию равновесия, при условии, что она существует, если матрица имеет вид:
Решение Найдем нижнюю цену игры. Если Р1 выберет первую стратегию, то он получит гарантированно Если Р1 выберет стратегию 2, то он получит гарантированно Если Р1 выберет стратегию 3, то он получит гарантированно Тогда выбором своей стратегии Р1 может получить, по крайней мере не меньше Найдем верхнюю цену игры. Если Р2 выберет первую стратегию, то он проиграет гарантированно не больше Если Р2 выберет стратегию 2, то он проиграет гарантированно не больше Если Р2 выберет стратегию 3, то он проиграет гарантированно не больше Тогда выбором своей стратегии Р2 может проиграть, по крайней мере, не меньше
Пример 2. Пусть дана матрица выигрышей игрока P1 Решение В данной игре
Упражнения к § 3.1. – 3.2
№ 1. Найдите верхнюю, нижнюю цену игры, ситуации равновесия (если они существуют) для игр, заданных следующими матрицами: 1) 4)
№ 2. В игре Морра с тремя пальцами каждый игрок показывает 1, 2 или 3 пальца одновременно, называя число пальцев, которые покажет его оппонент. Выигрывает тот, кто правильно назовет число пальцев, показанных противником. Выигрыш равен сумме пальцев, показанных обоими игроками. Написать матрицу игры и показать, что она не имеет ситуации равновесия.
№ 3. Каждый из двух игроков имеет n рублей. Они хотят получить некоторый предмет стоимостью C>0. Каждый дает за него i рублей (
№ 4. (Дискретная игра типа дуэли). Игроки продвигаются навстречу друг другу на n шагов одновременно. После каждого сделанного шага игрок может выстрелить или нет, но во время игры он может выстрелить только один раз. Считается, что вероятность того, что игрок попадет в своего противника, если выстрелит, продвинувшись на k шагов, равна
№ 5. В системе ПВО объекта могут применяться 3 типа средств поражения воздушной цели (1, 2, 3), которые должны быть распределены между двумя стартовыми установками. У противника (P2) имеется 2 типа самолетов (тип 1, тип 2). Вероятности поражения самолета одним средством сведены в таблицу
Предполагается, что возможно нападение только одним из самолетов. Выигрыш первого игрока равен вероятности поражения самолета системой ПВО. Построить матрицу игры и выяснить, имеет ли игра решение в чистых стратегиях.
№ 6. На каждой из двух торговых баз ассортиментный минимум составляет один и тот же набор из n видов товаров. Каждая база должна поставить в свой магазин только один из этих видов товара. Магазины, обозначим их A и B, конкурируют между собой. Один и тот же вид товара в обоих магазинах продается по одной и той же цене. Однако, товар, поставляемый в магазин B, более высокого качества. Если магазин A завезет с базы товар i -го вида Требуется формализовать данную конфликтную ситуацию и построить матрицу игры при n=3.
№ 7. Торговый агент должен встретиться с иногородним клиентом и собирается лично вручить ему заказ на 3000 у.д.ед. Если агент поедет поездом, то потеряет день на работе, который принес бы ему 1500 у.д.ед. Полет самолетом позволит сократить рабочий день, но если самолет не полетит из-за тумана, то личная встреча с клиентом не состоится и день на работе не будет потерян. В этом случае придется говорить с клиентом по телефону, что уменьшит сумму заказа до 500 у.д.ед. Вероятность тумана оценивается как 0,1. Требуется формализовать данную конфликтную ситуацию и построить матрицу игры.
№ 8. Фирма А производит некоторый сезонный товар, имеющий спрос в течение n единиц времени, и который она может поставить на рынок в один из моментов i Для конкурентной борьбы с фирмой А дочерняя фирма В концерна D, не заботясь о собственных доходах, производит аналогичный товар, который поступает на рынок в один из моментов j Требуется построить функцию выигрыша фирмы А, где под выигрышем понимается доход этой фирмы, зависящий от складывающихся ситуаций. Используя функцию выигрыша, составить матрицу игры для случая n =4 и выписать конкретный вид этой матрицы, который она приобретает в случае, когда доход с =6 денежным единицам.
3.3 Смешанное расширение игры
Если игра не имеет ситуации равновесия в чистых стратегиях, то игроки, применяя свои максиминную и минимаксную чистые стратегии, создают неустойчивую ситуацию, которую один из игроков может изменить с выгодой для себя. С другой стороны, представляется, что ничего другого осторожным игрокам рекомендовать нельзя. И все-таки из этого положения есть выход. Каждый из игроков может выбирать свои чистые стратегии случайно, то есть может определить распределение вероятностей на множестве чистых стратегий, а затем предоставить выбор конкретной чистой стратегии случайному механизму. Выбор игроками своих чистых стратегий с некоторыми заранее заданными вероятностями – по существу один из планов проведения игры и в этом смысле тоже является некоторой стратегией. В отличие от первоначально заданных (чистых), такие стратегии называются смешанными. Рассмотрим матричную игру
Пусть При выборе смешанной стратегии игроки руководствуются критерием максимизации математического ожидания своего выигрыша. Отсутствие обмена информацией между игроками делает их случайные выборы своих чистых стратегий независимыми. Поэтому, если они применяют свои смешанные стратегии
Определение 4. Тройка
Определение 5. Решением смешанного расширения матричной игры
Для смешанного расширения игры
Лемма 3. Пусть
Сформулируем несколько теорем, представляющих свойства оптимальных смешанных стратегий в антагонистической игре, используя которые в дальнейшем (п. 2.5), сможем доказать теорему о существовании ситуации равновесия в смешанных стратегиях.
Свойства оптимальных стратегий и цены смешанного расширения игры 1. Пусть
2. Пусть
При этом
3. Для матричной игры
4. Для того чтобы ситуация
5. Пусть Приведем доказательство свойства 2 оптимальных стратегий.
Доказательство свойства 2 1. Необходимость. Пусть
для всех
2. Достаточность. Пусть
Пусть
а из правой части (*)
При этом имеем:
Подставляя данные равенства в (**) и учитывая произвольность стратегий x и y, получаем равновесность ситуации Свойство доказано.
3.4 Методы решения матричных игр
Рассмотрим методы решения матричных игр, основанные на использовании свойств оптимальных стратегий.
1. Сведение игры к системе неравенств
Свойство 2 оптимальных стратегий означает, что любая матричная игра может быть сведена к системе уравнений и неравенств. Пусть
Решением системы двух уравнений и m+n неравенств, содержащих m+n+1 переменную, являются оптимальные стратегии игроков В случае, если размерность задач оказывается достаточно небольшой, возможно найти решение системы, заменив неравенства уравнениями. Рассмотрим следующий пример. Примеры Пример 1. Найти цену и оптимальные стратегии игроков в игре с матрицей Решение Пусть
Заменяя системы уравнений и неравенств равенствами и решая полученную систему линейных уравнений, получаем значения искомых величин:
2. Графический (графоаналитический) метод решения игры
Если число стратегий хотя бы одного из игроков равна 2, то оптимальную стратегию этого игрока и оптимальное значение цены игры возможно найти графическим методом, используя свойство 3 оптимальных стратегий:
1. Рассмотрим игру, в которой игрок 1 имеет две стратегии, а игрок 2 имеет n стратегий. Матрица игры в этом случае представима в виде:
Пусть игрок 1 выбрал смешанную стратегию
Геометрически оно представляет собой прямую в координатах
является нижняя огибающая семейства прямых (3). Точка
Примеры Пример 2. Рассмотрим игру с матрицей Для каждого
Нижняя огибающая Максимум | ||||||||||||
|
| Поделиться: |
Познавательные статьи:
Последнее изменение этой страницы: 2016-04-26; просмотров: 1064; Нарушение авторского права страницы; Мы поможем в написании вашей работы!
infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.217.128 (0.011 с.)