б) (За, За, Против, За, Воздержался, … , Против);
в) (5 рублей, 3 рубля), (5 рублей, 7 рублей).
Заинтересованность игроков в конкретных ситуациях проявляется в том, что каждому игроку i в каждой ситуации s присваивается число, выражающее степень удовлетворения его интересов в данной ситуации. Это число называется выигрышем игрока i и обозначается Нi(s).
Вернемся к указанным выше примерам.
В игре в орлянку.
Н1(Орел, Орел) = Н1(Решка, Решка) = 1,
Н1(Орел, Решка ) = Н1 (Решка, Орел ) = -1,
Н2(Орел, Орел) = Н2(Решка, Решка) = -1,
Н2(Орел, Решка) = Н2(Решка, Орел) = 1.
Видно, что в любой ситуации Н1 + Н2 = 0.
Запишем это в виде матрицы выигрышей, где строки будут соответствовать стратегиям 1-го игрока, столбцы - стратегиям 2-го игрока.
При этом или Н1 + Н2 = 0.
Таким образом, орлянка является примером игры с нулевой суммой.
При голосовании в парламенте считается, что вопрос прошел при большем количестве проголосовавших «За», чем «Против», в противном случае – вопрос не прошел. Получаем:
В случае взаимодействия на рынке двух продавцов предположим, что потребитель приобретет товар у фирмы, объявившей меньшую цену, или распределит свой спрос поровну между фирмами в случае, если цены равны.
Если d(p) - функция спроса в зависимости от цены на товар, то функция выигрыша.
Определение бескоалиционной игры
Бескоалиционной игрой будем называть такую игру, в которой целью каждого игрока является получение по возможности большего индивидуального выигрыша.
Обозначим.
I - множество всех игроков. Далее будем считать I конечным. Обычно принято различать игроков по номерам, т.е. считать I = {1, 2, ., n};
Si - множество стратегий игрока , т.е. множество возможных действий, имеющихся в распоряжении игрока i. Считается, что Si содержит не менее двух возможных стратегий, иначе его действия заранее определены.
Процесс игры состоит в выборе каждым из игроков одной своей стратегии . Таким образом, в результате каждой партии игры складывается система стратегий s = (s1, s2, .,sn), которая называется ситуацией.
Множество всех ситуаций S=S1×S2×…×Sn, т.е. S является декартовым произведением множеств стратегий всех игроков. Обозначим: Hi(s) - выигрыш игрока i в ситуации s. Функция Hi, определенная на множестве всех ситуаций, называется функцией выигрыша игрока i.
Hi: S → R, т.е. каждой ситуации Hi - сопоставляет вещественное число.
Бескоалиционной игрой называется система , в которой I и Si () являются множествами, а Hi - функции на множестве S=S1×S2×…×Sn, принимающие вещественные значения.
Бескоалиционная игра называется игрой с постоянной суммой, если существует такое постоянное число C, что , т.е. сумма выигрышей игроков постоянна в любой ситуации.
Приемлемые ситуации и ситуации равновесия
Ситуацию s в игре Г естественно считать приемлемой для игрока i, если этот игрок, изменяя в ситуации s свою стратегию на какую-либо другую, не может увеличить этим своего выигрыша.
Пусть s = (s1, s2, ., si-1, si, si+1, ., sn) - произвольная ситуация в игре, а si - некоторая стратегия игрока i.
Рассмотрим новую ситуацию , получившуюся из ситуации s заменой стратегии si игрока i на s'i . Очевидно, что s||s'i = s, если s'i совпадает с si (s'i = si).
Ситуация s в игре Г называется приемлемой для игрока i, если
Смысл названия «приемлемая» состоит в том, что, если в некоторой ситуации s для игрока i найдется такая стратегия s΄i, что то игрок i в случае складывающейся ситуации s может получить больший выигрыш, выбирая s΄i, вместо si. В этом смысле ситуация s для игрока может считаться неприемлемой.
Ситуация s называется ситуацией равновесия (или равновесной ситуацией), если она приемлема для всех игроков, т.е.
Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии.
Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из равновесных ситуаций игры.
Процесс нахождения ситуаций равновесия в бескоалиционной игре называется решением игры.
Примеры игровых задач
«Дилемма заключенных»
Предположим, игроками 1 и 2 являются преступники, находящиеся в предварительном заключении по подозрению в тяжком преступлении. Прямых улик против них нет, и возможность их обвинения в значительной мере зависит от того, сознаются ли преступники сами.
Судья предложил каждому следующую сделку. Если он сознается в преступлении, а другой нет, то сознавшийся получает 1 год наказания, а несознавшийся – 10 лет. Если сознаются оба, то каждый получит по 7 лет. Заключенным известно, что если никто из них не сознается, то оба получат по 3 года.
Запишем функции выигрышей (потерь) игроков в рассмотренной игре.
Пусть П – признание, Н – непризнание, H1 – выигрыш 1-го игрока, H2 – выигрыш 2-го игрока.
H1 (П, П) = H2 (П, П) = -7,
H1 (Н, Н) = H2 (Н, Н) = -3,
H1 (П, Н) = H2 (Н, П) = -1,
H1 (Н, П) = H2 (П, Н) = -10.
Игру можно представить с помощью следующей матрицы, в клетках которой слева вверху стоит выигрыш первого заключенного, а справа внизу – второго.
Второй игрок | |||
сознаться |
не сознаваться | ||
Первый игрок |
сознаться |
-7 -7 |
-1 -10 |
не сознаваться |
-10 -1 |
-3 -3 |