Теория показывает, что в стационарной среде, в условиях, когда смена состояний среды происходит случайно, но вероятности каждого из состояний не изменяются во времени, автомат с линейной тактикой демонстрирует целесообразное поведение. При неограниченном увеличении числа состояний памяти автомат с линейной тактикой способен получить выигрыш, максимально возможный в данной среде.
Теория коллективного поведения рассматривает семейство автоматов, близких к автомату с линейной тактикой. Среди них особый интерес представляет автомат В. Крылова. При поощрении он ведет себя как автомат с линейной тактикой. А при наказании он с равной вероятностью либо увеличивает на единичку состояние памяти, либо, наоборот, уменьшает ее на единицу. Автомат Крылова фаталист. Столкнувшись с неудачей, он предпочитает, фигурально выражаясь, как бы подбросить монетку и целиком ей доверяется. Если монета упала кверху орлом, автомат настораживается, а если решкой — успокаивается. Теория говорит нам, что можно поступать и так. Во всех стационарных случайных средах автоматы Крылова не только демонстрируют целесообразное поведение, но и способны добиться максимального выигрыша при неограниченном увеличении количества состояний памяти.
Существенным здесь является то, что среда стационарна. Однажды привыкнув к такой среде, автомат в дальнейшем может ни о чем не беспокоиться, потому что среда не меняет своих свойств. Иначе обстоит дело в переключаемых средах, у которых вероятности различных состояний изменяются время от времени.
Теория коллективного поведения утверждает, что в переключаемой среде автомат с линейной тактикой хотя и демонстрирует целесообразное поведение, но не может достичь максимального выигрыша. Лучшее, чего он может добиться, это некоторого выигрыша, и то при определенном количестве состояний памяти. Выигрыш снижается, в обоих случаях, если количество состояний памяти увеличивается или уменьшается.
В условиях переключаемой случайной среды существенное значение имеет «зрелость» автомата. «Пожилой» автомат, накопивший большой жизненный опыт, прекрасно ведет себя в неизменных условиях, но плохо приспосабливается к изменениям условий. «Юный» автомат, вообще не имеющий никакого опыта, также не может претендовать на существенный выигрыш. Выигрывает тот, кто, обладая достаточным опытом, все еще гибок и легко меняет свои привычки.
До сих пор мы говорили об одиночных автоматах. А как же коллектив? Ведь теория, выводы которой мы сейчас рассматриваем, называется теорией коллективного поведения автоматов.
Коллективное поведение ярче всего проявляется, когда автоматы играют друг с другом в различные игры. При этом для каждого конкретного автомата все остальные автоматы-партнеры представляют собой среду.
Методы исследования поведения одного из автоматов в данной среде могут быть перенесены на случай игры нескольких автоматов. Правда, в таком случае среду нельзя считать стационарной или даже переключаемой, поскольку каждый автомат постоянно меняет свою стратегию и соответственно этому меняются свойства среды.
Наиболее ярким примером игр нескольких автоматов служит игра в размещения. Она напоминает следующую ситуацию. Имеется некоторое количество источников с разной производительностью. Например, источник номер один, выдающий в час сколько-то единиц чего-то, источник номер два, выдающий в час еще какое-то количество чего-то, и так далее. Имеется несколько потребителей, в интересы которых входит получить как можно больше от источников. При этом каждый потребитель в данный момент времени может питаться лишь от одного источника, но не знает, питаются ли уже от этого источника другие потребители.
Предположим, в процессе приспособления некоторому потребителю удалось подсоединиться к источнику, дающему максимум, например 50 единиц в час. Второй потребитель в результате аналогичного процесса приспособления подсоединился к тому же источнику, и вдвоем они начали получать только по 25 единиц. А при этом существует источник меньшей мощности, дающий, скажем, 37 единиц.
Есть основания предположить, что в описанных условиях потребители каким-то образом распределятся между источниками, но при этом они вряд ли сумеют получить максимум, хотя бы потому, что никто не захочет питаться от источника с минимальной производительностью и продукция этого источника будет расходоваться впустую. Правда, у них есть возможность получать максимум продукции. Она состоит в том, чтобы каждый потребитель получал продукцию неважно от какого источника, лишь бы все источники были заняты. Имеется в виду, что количество потребителей равно или превышает число источников. Затем весь полученный продукт они складывают вместе и делят поровну между всеми потребителями. Поведение потребителей, додумавшихся до такой возможности и использовавших ее, мы, наверное, назовем вполне разумным.