Рефераты по БЖД

Теория управления. Принципы системного анализа

б) (За, За, Против, За, Воздержался, … , Против);

в) (5 рублей, 3 рубля), (5 рублей, 7 рублей).

Заинтересованность игроков в конкретных ситуациях проявляется в том, что каждому игроку i в каждой ситуации s присваивается число, выражающее степень удовлетворения его интересов в данной ситуации. Это число называется выигрышем игрока i и обозначается Нi(s).

Вернемся к указанным выше примерам.

В игре в орлянку.

Н1(Орел, Орел) = Н1(Решка, Решка) = 1,

Н1(Орел, Решка ) = Н1 (Решка, Орел ) = -1,

Н2(Орел, Орел) = Н2(Решка, Решка) = -1,

Н2(Орел, Решка) = Н2(Решка, Орел) = 1.

Видно, что в любой ситуации Н1 + Н2 = 0.

Запишем это в виде матрицы выигрышей, где строки будут соответствовать стратегиям 1-го игрока, столбцы - стратегиям 2-го игрока.

При этом или Н1 + Н2 = 0.

Таким образом, орлянка является примером игры с нулевой суммой.

При голосовании в парламенте считается, что вопрос прошел при большем количестве проголосовавших «За», чем «Против», в противном случае – вопрос не прошел. Получаем:

В случае взаимодействия на рынке двух продавцов предположим, что потребитель приобретет товар у фирмы, объявившей меньшую цену, или распределит свой спрос поровну между фирмами в случае, если цены равны.

Если d(p) - функция спроса в зависимости от цены на товар, то функция выигрыша.

Определение бескоалиционной игры

Бескоалиционной игрой будем называть такую игру, в которой целью каждого игрока является получение по возможности большего индивидуального выигрыша.

Обозначим.

I - множество всех игроков. Далее будем считать I конечным. Обычно принято различать игроков по номерам, т.е. считать I = {1, 2, ., n};

Si - множество стратегий игрока , т.е. множество возможных действий, имеющихся в распоряжении игрока i. Считается, что Si содержит не менее двух возможных стратегий, иначе его действия заранее определены.

Процесс игры состоит в выборе каждым из игроков одной своей стратегии . Таким образом, в результате каждой партии игры складывается система стратегий s = (s1, s2, .,sn), которая называется ситуацией.

Множество всех ситуаций S=S1×S2×…×Sn, т.е. S является декартовым произведением множеств стратегий всех игроков. Обозначим: Hi(s) - выигрыш игрока i в ситуации s. Функция Hi, определенная на множестве всех ситуаций, называется функцией выигрыша игрока i.

Hi: S → R, т.е. каждой ситуации Hi - сопоставляет вещественное число.

Бескоалиционной игрой называется система , в которой I и Si () являются множествами, а Hi - функции на множестве S=S1×S2×…×Sn, принимающие вещественные значения.

Бескоалиционная игра называется игрой с постоянной суммой, если существует такое постоянное число C, что , т.е. сумма выигрышей игроков постоянна в любой ситуации.

Приемлемые ситуации и ситуации равновесия

Ситуацию s в игре Г естественно считать приемлемой для игрока i, если этот игрок, изменяя в ситуации s свою стратегию на какую-либо другую, не может увеличить этим своего выигрыша.

Пусть s = (s1, s2, ., si-1, si, si+1, ., sn) - произвольная ситуация в игре, а si - некоторая стратегия игрока i.

Рассмотрим новую ситуацию , получившуюся из ситуации s заменой стратегии si игрока i на s'i . Очевидно, что s||s'i = s, если s'i совпадает с si (s'i = si).

Ситуация s в игре Г называется приемлемой для игрока i, если

Смысл названия «приемлемая» состоит в том, что, если в некоторой ситуации s для игрока i найдется такая стратегия s΄i, что то игрок i в случае складывающейся ситуации s может получить больший выигрыш, выбирая s΄i, вместо si. В этом смысле ситуация s для игрока может считаться неприемлемой.

Ситуация s называется ситуацией равновесия (или равновесной ситуацией), если она приемлема для всех игроков, т.е.

Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии.

Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из равновесных ситуаций игры.

Процесс нахождения ситуаций равновесия в бескоалиционной игре называется решением игры.

Примеры игровых задач

«Дилемма заключенных»

Предположим, игроками 1 и 2 являются преступники, находящиеся в предварительном заключении по подозрению в тяжком преступлении. Прямых улик против них нет, и возможность их обвинения в значительной мере зависит от того, сознаются ли преступники сами.

Судья предложил каждому следующую сделку. Если он сознается в преступлении, а другой нет, то сознавшийся получает 1 год наказания, а несознавшийся – 10 лет. Если сознаются оба, то каждый получит по 7 лет. Заключенным известно, что если никто из них не сознается, то оба получат по 3 года.

Запишем функции выигрышей (потерь) игроков в рассмотренной игре.

Пусть П – признание, Н – непризнание, H1 – выигрыш 1-го игрока, H2 – выигрыш 2-го игрока.

H1 (П, П) = H2 (П, П) = -7,

H1 (Н, Н) = H2 (Н, Н) = -3,

H1 (П, Н) = H2 (Н, П) = -1,

H1 (Н, П) = H2 (П, Н) = -10.

Игру можно представить с помощью следующей матрицы, в клетках которой слева вверху стоит выигрыш первого заключенного, а справа внизу – второго.

 

Второй игрок

сознаться

не сознаваться

Первый игрок

сознаться

-7

-7

-1

-10

не сознаваться

-10

-1

-3

-3

Перейти на страницу номер:
 1  2  3  4  5  6  7  8  9  10  11  12  13  14  15 
 16  17  18  19  20  21  22  23  24  25  26  27  28  29  30 
 31  32  33  34  35  36  37  38  39  40  41  42  43  44  45 
 46  47  48  49  50  51  52  53  54  55  56  57  58  59  60 
 61  62  63  64  65  66  67  68  69  70  71  72  73 


Другие рефераты:

© 2010-2024 рефераты по безопасности жизнедеятельности