Доверие и Дилемма Заключенного

В 1980 году профессор Роберт Аксельрод провёл чемпионат, чтоб найти лучшее решение для Дилеммы Заключенного.

Дилемма Заключенного состоит в том, что перед двумя соперникам (независимо друг-от-друга) ставится выбор: предать другого и получить свободу, или довериться. Если тот, кто доверился, будет предан, то получит максимальный срок. Если оба предадут, то получат средний срок. Итого есть четыре исхода:

🞿 Оба доверяют друг другу и выходят на свободу через некоторое время.
🞿 Два варианта: один предает другого. На свободу сразу выходит тот кто предал, другой получает максимальный срок.
🞿 Оба предают друг друга и получают средний срок заключения.

В результате чемпионата Роберта Аксельрода победил алгоритм «Око за око» (8 из 14 мест).

Суть стратегии:

🞿 На первом шаге нужно всегда сотрудничать.
🞿 На последующем шаге повторять действия соперника.

Таким образом, если на втором шаге соперник предавал, то мы тоже должны были предавать. Если соперник сотрудничал, то мы так же должны были сотрудничать.

Однако это не самый совершенный алгоритм. Самым эффективным оказывался:

🞿 На первом шаге всегда сотрудничаем.
🞿 На втором шаге сотрудничаем, даже если нас обманули.
🞿 На третьем шаге предаем, если нас два раза обманули, но возвращаемся к сотрудничеству, когда было сотрудничество от соперника (возвращаемся на 1 шаг).

При таком алгоритме чаще выигрывали те, кто использовал первую (око за око) и вторую стратегию. Доверять все равно оказывается выгоднее, чем предавать.

Поиграться с дилеммой заключенного и эволюцией доверия можно по этой ссылке:

https://notdotteam.github.io/trust/