Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр
“Рецепт Счастья” — увлекательная игра в жанре «соедини предметы»! Помогите Эмили раскрыть тайны пропавшего родственника, найти сокровища и восстановить её любимое кафе.

Рецепт Счастья

Казуальные, Головоломки, Новеллы

Играть

Топ прошлой недели

  • Rahlkan Rahlkan 1 пост
  • Tannhauser9 Tannhauser9 4 поста
  • alex.carrier alex.carrier 5 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
0 просмотренных постов скрыто
5
SlyVolunteer
SlyVolunteer
7 месяцев назад
Серия Происхождение экономических систем

Продолжение поста «Равновесие Нэша и дилемма заключенного: как математика связана с развитием человеческой цивилизации?»⁠⁠3

Равновесие Нэша - это рациональная математическая концепция, которая на первый взгляд кажется универсальным решением для построения гармоничных социальных систем. Однако, как подчеркивают участники дискуссии в комментариях к исходному посту, реальная жизнь вносит свои коррективы. Именно асоциальные элементы и психопатические (предельно эгоистические) стратегии могут нарушать любые попытки стабилизировать общество, если не предусмотрены механизмы их выявления и устранения.

Как пишет @Stellbard, «всегда будут асоциальные личности, которые при любой коммуникации забьют на договоренности» [#comment_334168427]. Это подчеркивает, что даже в кооперативной системе достаточно одного индивидуума, действующего против интересов группы, чтобы создать эффект домино. Именно это и ведет к эскалации насилия, дестабилизации и разрушению доверия внутри системы. Пикабушник @BozZiLLA добавляет: «Капитализмом движет не инновации и благополучие человечества, а страх потерять имущество и жажда прибыли» [#comment_334109297]. Это усиливает понимание необходимости контроля и регулирования эгоистичных стратегий.

Для решения этой проблемы на ум приходят два подхода:

1) идентификация и исправление/изоляция деструктивных элементов. Современные технологии (искусственный интеллект и нейросети) могут помочь выявлять манипуляторов и лиц с психопатическими наклонностями на ранних этапах.

2) образование и воспитание. Увеличение уровня знаний о теории игр, истории, политэкономии и кибернетике может уменьшить вероятность появления деструктивных стратегий. Однако, как отмечает @Pauluzzz, не все люди от природы склонны к обучению и пониманию сложных систем [#comment_334299419]. Я в комментариях предложил рассматривать социальный рейтинг как элемент воспитания, где корреляция денег и общественной пользы могла бы мотивировать людей действовать во благо общества [#comment_334111446].

Психопатические стратегии не раз проявляли себя в истории. Вот некоторые примеры, предложенные участниками обсуждения:

1) Колонизация Америки - конкистадоры использовали доверие коренных народов, чтобы затем манипулировать ими и эксплуатировать их ресурсы [#comment_334196637].

2) Манипуляции финансовых рынков в начале XX века, закончившиеся кризисом 1929 года - крупные игроки манипулировали доверием инвесторов, накачивая активы фиктивной стоимостью, чтобы потом обогатиться, обрушив рынок [#comment_334228121].

3) Вторая мировая война - нацисты под угрозой глобальной войны в начале довольно долго решали свои задачи, постепенно получая все больше ресурсов и влияния до начала столкновения [#comment_334218061].

4) Развал СССР - лидеры республик и партийные функционеры, декларируя приверженность общим целям, действовали в своих интересах, манипулируя массовым сознанием [#comment_334196637].

5) Кризис доткомов - создание фиктивной стоимости активов и манипуляции доверием инвесторов для извлечения максимальной выгоды [#comment_334218061].

Эти примеры показывают, что кооперативные системы, стремящиеся к равновесию Нэша, с высокой степенью доверия могут стать уязвимыми к действиям «психопатических игроков».

Возможно использовать возможности нейросетей и цифровизации для раннего выявления манипуляций и подрыва общественной ценности. Искусственный интеллект способен анализировать сложные паттерны поведения и сигнализировать о рисках. Например, нейросети могут быть полезны для диагностики психопатии и предотвращения деструктивных стратегий, основанных на манипуляции доверием.

Однако возникают вопросы:

1) Как гарантировать, что эти технологии не будут использоваться самими психопатами?

2) Как сбалансировать права личности и безопасность общества?

Многие участники дискуссии считают, что ключевую роль в построении устойчивой системы играет образование. Но, как замечает @Pauluzzz, невозможно добиться одинаково высокого уровня интеллекта у всех людей [#comment_334312109]. Тем не менее, я утверждаю, что интеллект можно развивать, приводя примеры обучения подопытных животных и собственного опыта, где мотивация и доступное объяснение помогли преодолеть трудности в обучении [#comment_334305180]. @BozZiLLA указывает, что в условиях коммунистической идеологии, несмотря на её антирелигиозный настрой, воспитывалась духовность, тогда как либеральная идеология капитализма часто фокусируется на материальных ценностях [#comment_334109297].

Еще один важный аспект - незамкнутость государств. В глобальном мире интересы отдельных групп могут идти вразрез с интересами государства. Например, перенос производств в страны с более низкими издержками труда подрывает экономику родной страны [#comment_334288664]. Решением здесь может стать кооперация на глобальном уровне (многополярный мир) и создание равновесия Нэша между государствами [#comment_334297651].

Наконец, обсуждение затронуло вопрос смысла существования человечества. @Pauluzzz скептически относится к идее космической экспансии и считает, что научное познание вряд ли станет универсальным смыслом для большинства людей [#comment_334299419]. Я обратил внимание на те же нейросети как на инструмент, способный компенсировать ограниченность человеческой жизни и способствовать достижению глобальных целей [#comment_334305180].

Вывод

Для достижения устойчивости в равновесном по Нэшу (многополярном) обществе необходимо учитывать:

1) Использование технологий для мониторинга и предотвращения манипуляций.

2) Раннее выявление и исправление/изоляцию деструктивных элементов.

3) Повышение уровня образованности и научности.

4) Кооперацию на глобальном уровне (многополярный мир) для создания равновесия интересов.

Какие еще подходы вы можете предложить, чтобы человечество смогло минимизировать влияние психопатических/эгоистических стратегий и направить развитие цивилизации в русло прогресса и гармонии?

P.S. В дебатах «Кооперативный капитализм vs Технологический коммунизм» проголосовало 76 человек, из них кооперативный капитализм выбрало 25%, за технологический коммунизм проголосовало 75%.

Показать полностью
[моё] Развитие Будущее Теория игр Равновесие Джон Нэш Дилемма заключенного Капитализм Коммунизм Социализм Цивилизация Критическое мышление Научпоп Ответ на пост Текст Длиннопост
16
1
Thorium232
Thorium232
7 месяцев назад
Лига идей

Приложение организации племён как альтернатива приложениям знакомств⁠⁠

Давайте признаем, у приложений знакомств есть куча фундаментальных проблем, которые надо решать. Поэтому у меня есть немного глупая идея. Что если создать приложение, где:

- Знакомятся не с одним человеком а сразу с группой людей, назовём их племенем. Конечно лучше чтобы они были в одном с вами городе, но возможны варианты.

- Племена не получится выбирать и сложно покинуть. Выбор даётся только из нескольких вариантов. Если часто меняешь племена то это записывается в репутацию, а аккаунт сменить невозможно (каким то образом такое ограничение наверное возможно создать).

Почему такое жестокое приложение может быть полезно? Потому что в нём имеет значение репутация. Если поссоришься с кем нибудь то это надолго, будешь много обманывать - об этом в конце концов узнают. А вместе с репутацией появляется доверие. Если племя просуществует какое то время, то вы уже не будете какими то анонимами с интернета, а вполне хорошими знакомыми. Можете помогать друг другу или организовывать какие то действия.

Приложения для знакомства просто довольно плохое место с точки зрения теории игр. Слишком много одноразовых взаимодействий. Всякие обманщики и психопаты могут просто наделать кучу заявок и легко найти себе жертву, а честным людям из-за них приходиться придумывать множество проверок чтобы их отсеить из-за которых они уже не могут довериться друг другу. Почему множественные однократные воздействия благоприятны для обманщиков хорошо объясняется тут https://notdotteam.github.io/trust/

[моё] Психология Сайт знакомств Идея Теория игр Рассуждения Социальный эксперимент Текст
11
SlyVolunteer
SlyVolunteer
7 месяцев назад
Серия Происхождение экономических систем

Продолжение поста «Равновесие Нэша и дилемма заключенного: как математика связана с развитием человеческой цивилизации?»⁠⁠3

Дебаты Развитие Будущее Теория игр Равновесие Джон Нэш Дилемма заключенного Капитализм Коммунизм Социализм Цивилизация Критическое мышление Ответ на пост
4
78
SlyVolunteer
SlyVolunteer
7 месяцев назад
Наука | Научпоп
Серия Происхождение экономических систем

Равновесие Нэша и дилемма заключенного: как математика связана с развитием человеческой цивилизации?⁠⁠3

Равновесие Нэша [1] - это концепция из теории игр, которая объясняет, как в ситуациях с несколькими участниками каждый игрок может принимать решения, не желая менять свою стратегию, если остальные тоже остаются при своих. В равновесии Нэша все участники действуют оптимально относительно друг друга, даже если их действия не приводят к наилучшему личному результату [2].

Пример из фильма «Игры разума» помогает визуализировать эту идею. В одной из сцен Джон Нэш с друзьями сидит в баре, когда в помещение заходят несколько девушек, включая одну очень привлекательную блондинку. Друзья решают, что все должны попробовать привлечь внимание блондинки, ведь она самая красивая. Однако Нэш замечает, что если каждый будет пытаться ухаживать за блондинкой, они будут мешать друг другу, и в итоге никто не добьётся успеха — блондинка отвергнет всех, а остальные девушки почувствуют себя второстепенными и тоже откажут.

Тогда Нэш предлагает иную стратегию: никто из них не обращается к блондинке. Вместо этого каждый выбирает одну из её подруг. Это минимизирует конкуренцию и увеличивает шансы на успех, так как остальные девушки почувствуют себя ценными.

Вот этот отрывок из фильма, смотрите с 14 секунды, чтобы пропустить заставку канала:

Реальная математика за этой концепцией сложнее, но её можно представить как «баланс интересов», где каждый действует, учитывая действия других, и никому невыгодно действовать иначе. Хотя на самом деле принцип равновесия Нэша был известен человечеству уже более 19 столетий.

Равновесие Нэша и библейский принцип «возлюби ближнего своего, как самого себя» могут быть неожиданно связаны через идею гармоничного взаимодействия людей в обществе, где индивидуальные и коллективные интересы сбалансированы.

В равновесии Нэша каждый участник выбирает стратегию, которая оптимальна для него, учитывая действия других. Это не означает альтруизм, но предполагает, что участник осознаёт влияние своих действий на других. Если никто не может улучшить своё положение, не ухудшив положение остальных, достигается баланс. Принцип «возлюби ближнего своего, как самого себя» также олицетворяет баланс. Он призывает относиться к другим с такой же заботой, как к самому себе, не ставя свои интересы выше, но и не игнорируя их. Это создаёт основу для гармоничного сосуществования, где личные и общие блага взаимосвязаны.

В обоих случаях ключевой идеей является необходимость учитывать не только свои интересы, но и интересы окружающих. В равновесии Нэша это делается рационально, чтобы достичь устойчивого результата, а в библейском принципе - морально, чтобы построить справедливое общество. Если каждый будет действовать, думая и о себе, и о других (равновесие Нэша), либо любить ближнего, как себя (библейский принцип), то создаётся система, где меньше конфликтов и больше взаимной выгоды.

Представьте ситуацию, где несколько человек делят ограниченный ресурс, например, воду или еду. Принцип Нэша подскажет им найти баланс: никто не возьмёт больше, чем ему нужно, чтобы остальные не начали нарушать договорённости. Принцип любви к ближнему добавляет моральное измерение: люди добровольно ограничивают себя из заботы о других, возможно, даже жертвуя чем-то ради общего блага.

Фильм «Платформа» (2019) — это мощная метафора социального неравенства, идеально иллюстрирующая ситуации, где равновесие Нэша нарушается, а библейский принцип «возлюби ближнего своего, как самого себя» игнорируется. Башня представляет собой вертикальную тюрьму с множеством этажей. Ежедневно через башню движется платформа с едой, начиная с верхних этажей. Количество еды достаточно для всех, если бы её делили равномерно. Но на практике верхние уровни берут больше, чем им нужно, не оставляя ничего для нижних. Те, кто живут ниже, страдают от голода, злости и отчаяния.

Равновесие Нэша и дилемма заключенного: как математика связана с развитием человеческой цивилизации? Развитие, Будущее, Теория игр, Равновесие, Джон Нэш, Дилемма заключенного, Капитализм, Коммунизм, Социализм, Цивилизация, Критическое мышление, Видео, Длиннопост, RUTUBE

Нижние этажи страдают от голода, злости и отчаяния

В таком обществе каждый действует исходя из своих интересов, игнорируя последствия для других. На верхних этажах рационально предположить, что если ты не возьмёшь еду сейчас, то, оказавшись на нижних уровнях, можешь остаться без неё. Это приводит к тому, что каждый игрок берёт как можно больше еды, не думая о тех, кто ниже. Это стратегия индивидуального выживания, но она разрушает возможность устойчивого равновесия.

В результате система становится нестабильной: нижние этажи страдают, а высшие боятся, что в любой момент могут оказаться среди обделённых. Если бы узники следовали принципу «возлюби ближнего своего, как самого себя», они могли бы организовать равномерное распределение еды. Например, каждый мог бы взять ровно столько, сколько ему нужно. Это обеспечило бы выживание всех обитателей башни, стабилизировало систему и уменьшило бы насилие.

Почему система не достигает равновесия Нэша?

1) Недостаток доверия

Люди не верят, что другие придерживаются договорённостей, и предпочитают действовать эгоистично.

2) Отсутствие коммуникации

Узники изолированы и не могут договориться, что увеличивает хаос.

3) Принудительная система

Башня сама по себе стимулирует конкуренцию, а не сотрудничество.

«Платформа» показывает, как эгоистичное поведение разрушает общее благо. Чтобы выйти из замкнутого круга неравенства, необходимо больше, чем просто рациональный расчёт — нужна эмпатия, доверие и готовность делиться ресурсами. Это напоминает, что для устойчивости общества важно сочетать рациональность (равновесие Нэша) и моральные принципы.

Дилемма заключенного

Дилемма заключённого [3] - это классический пример из теории игр, который прекрасно иллюстрирует проблему недостатка доверия и его влияние на принятие решений. Она показывает, как рациональное поведение в условиях недоверия может привести к худшему исходу для всех участников.

Два подозреваемых арестованы и изолированы друг от друга. Им предложены варианты:

1) Если один сдаёт другого (предательство), а второй молчит, предатель освобождается, а молчащий получает максимальный срок (например, пожизненное заключение).

2) Если оба молчат, они получают минимальный срок (например, 1 год).

3) Если оба предают, они оба получают средний срок (например, 5 лет).

Поскольку игроки не могут доверять друг другу, логично предположить, что другой выберет предательство, чтобы минимизировать свой срок. Поэтому оба обычно выбирают предательство, что приводит к среднему сроку для каждого, хотя если бы они доверяли друг другу и молчали, их срок был бы минимальным.

В дилемме заключенного участники не могут договориться или гарантировать выполнение соглашения, поэтому действуют из страха быть обманутыми. Каждый участник пытается защитить себя от максимального наказания, что приводит к взаимному предательству. В условиях недоверия участники ориентируются только на свои интересы, не принимая во внимание возможные преимущества совместных действий.

Пример фильма «Платформа» показывает, что еда распределяется аналогично дилемме заключённого:

1) Если верхние этажи «молчат» (берут только свою долю), еды хватит всем.

2) Если они «предают» (берут больше, чем нужно), нижние этажи страдают.

Из-за недостатка доверия (верхние этажи предполагают, что если они не возьмут больше, кто-то другой с их этажа это сделает) система разваливается. Взаимное недоверие ведёт к хаосу, где каждый действует эгоистично.

Как преодолеть недостаток доверия?

1) Коммуникация

Если участники смогут договориться, шансы на кооперацию возрастут.

2) Внешние правила

Вмешательство третьей стороны (например, строгие законы или контроль) может стабилизировать систему.

3) Долгосрочные отношения

В повторяющихся играх участники склонны сотрудничать, так как понимают, что их действия влияют на будущее взаимодействие.

Дилемма заключённого и её связь с недоверием - это универсальная модель, применимая в реальной жизни: от социальных конфликтов до экономических систем. Она учит, что для достижения наилучшего коллективного результата необходимы не только рациональность, но и готовность к доверию и сотрудничеству.

Общественный строй и математика

Сравнение капитализма и коммунизма через призму равновесия Нэша и дилеммы заключённого позволяет выявить их сильные и слабые стороны в контексте кооперации, доверия и эффективности решения социальных проблем.

Капитализм поощряет каждого участника системы (предприятия, работников, потребителей) действовать в своих собственных интересах. Это часто приводит к ситуации, где каждый принимает оптимальное решение для себя, но не всегда для общества. Конкуренция стимулирует инновации и развитие, но приводит к неравномерному распределению ресурсов (например, богатство концентрируется у элит).

Капитализм создаёт множество ситуаций, где компании или люди принимают решения, основанные на недоверии. Например, загрязнение окружающей среды выгодно для отдельных корпораций, даже если оно наносит ущерб обществу. Недостаток кооперации и ориентация на краткосрочную выгоду затрудняют решение глобальных проблем, таких как изменение климата или социальное неравенство.

Коммунизм стремится к тому, чтобы участники действовали в интересах всего общества. В идеальной коммунистической системе люди выбирают стратегии, которые максимизируют общественное благо. Таким образом, коммунизм приводит к равновесию, где ресурсы распределяются справедливо, что снижает социальное напряжение.

Коммунизм предполагает высокую степень доверия между участниками системы. Если кто-то начинает действовать эгоистично (например, злоупотреблять ресурсами), система становится нестабильной. Исторически попытки реализации коммунизма сталкивались с проблемой морального риска: когда люди считают, что могут получать выгоды, не внося вклад, доверие разрушается.

Какой строй более выгоден для цивилизации?

Идеальный ответ может лежать в синтезе лучших черт обеих систем:

1) Кооперативный капитализм - модель, в которой рыночная конкуренция сочетается с сильными социальными гарантиями и глобальным сотрудничеством для решения общих проблем.

2) Технологический коммунизм - система, где технологии (например, искусственный интеллект и автоматизация) устраняют необходимость жёсткой иерархии, позволяя справедливо распределять ресурсы.

Капитализм быстрее продвигает технологии из-за конкуренции. Коммунизм эффективнее в устранении социальных неравенств, что ускоряет развитие человеческого потенциала в долгосрочной перспективе. Капитализм решает проблемы выборочно, ориентируясь на прибыль. Коммунизм направлен на системное решение проблем, но часто сталкивается с трудностями в реализации. Для устойчивого развития цивилизации в долгосрочной перспективе потребуется гибридная модель, объединяющая технологический прогресс капитализма с кооперативными и справедливыми принципами коммунизма. Это позволит эффективно решать социальные проблемы и одновременно сохранять высокий темп инноваций.

Литература

[1] Nash, John F. (1950) Equilibrium points in n-person games // PNAS. 36 (1): 48–49. doi:10.1073/pnas.36.1.48

[2] Мазалов В. В. Математическая теория игр и приложения. — Изд-во Лань, 2010, 446 с.

[3] Poundstone, William (1992) Prisoner’s Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb. — Doubleday. ISBN 0-385-41567-2.

Показать полностью 1
[моё] Развитие Будущее Теория игр Равновесие Джон Нэш Дилемма заключенного Капитализм Коммунизм Социализм Цивилизация Критическое мышление Видео Длиннопост RUTUBE
132
MargaritaZm
MargaritaZm
8 месяцев назад

Дуэль 3х игроков. Проверим как тут работает формат видео⁠⁠

[моё] Теория игр Продюсер Стартап Предпринимательство Малый бизнес Бизнес Развитие Видео Вертикальное видео
18
Вопрос из ленты «Эксперты»
KapelaH
8 месяцев назад

Теория игр помогите⁠⁠

Помогите решить игру графическим методом по теории игр

Теория игр помогите Вопрос, Спроси Пикабу, Математика, Теория игр
Вопрос Спроси Пикабу Математика Теория игр
8
44
BurlyOlenka
1 год назад

Теория игр: Дилемма заключенного⁠⁠

Итак, теория игр — это теория математических моделей принятия решений в условиях неопределенности, когда принимающий решение субъект («игрок») располагает информацией лишь о множестве возможных ситуаций, в одной из которых он в действительности находится, о множестве решений («стратегий»), которые он может принять, и о количественной мере того «выигрыша», который он мог бы получить, выбрав в дан‑ной ситуации данную стратегию

В теории игр используется мощный математический аппарат. Это значит, что можно написать или придумать симуляцию для каждой игры и посмотреть на возможные результаты при разных стратегиях игры. Часть стратегий получает строгое математическое доказательство, другая — процентную вероятность успеха при выборе той или иной стратегии.

Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что равносильно, минимально возможный средний проигрыш). При выборе игроком этой стратегии за основу берется предположение, что его противник является вполне разумным и делает все, что‑ бы помешать ему добиться своей цели.

Дилемма заключенного

В политическом реализме сценарий дилеммы часто используется для иллюстрации проблемы двух государств, вовлечённых в гонку вооружений. Предполагается, что у каждой страны есть выбор между высоким или низким уровнем вооружений.

3 сентября 1949 года американский самолет для наблюдения за погодой взял пробы воздуха над Японией. В этих пробах были обнаружены следы радиоактивных материалов. Военно-морской флот быстро собрал и протестировал пробы дождевой воды со своих кораблей и баз по всему миру. Они также обнаружили небольшое количество церия-141 и иттрия-91. Но период полураспада этих изотопов составляет один-два месяца, поэтому они, должно быть, были получены недавно, и единственное место, откуда они могли появиться, - это ядерный взрыв. Но в тот год США не проводили никаких испытаний, поэтому единственным возможным выводом было то, что Советский Союз придумал, как создать ядерную бомбу. Это была новость, которой боялись американцы. Их военное превосходство, достигнутое благодаря Манхэттенскому проекту, быстро сходило на нет.

С ядерным оружием нужно было что-то делать, и быстро. Но что? В 1950 году базирующийся в США аналитический центр RAND Corporation изучал этот вопрос. И в рамках этого исследования они обратились к теории игр. В том же году два математика из RAND изобрели новую игру, которая, о чем они тогда не подозревали, очень напоминала американо-советский конфликт. Эта игра теперь известна как "дилемма заключенного".

Итак, давайте поиграем в игру. Банкир с сундуком, полным золотых монет, приглашает вас и другого игрока сыграть друг против друга. У каждого из вас есть два варианта. Вы можете сотрудничать или дезертировать. Если вы оба будете сотрудничать, каждый из вас получит по три монеты. Если один из вас сотрудничает, а другой отказывается, то тот, кто дезертировал, получает пять монет, а другой не получает ничего. И если вы оба откажетесь, то каждый из вас получит по монете. Цель игры проста: собрать как можно больше монет.

Что ж, вы можете сотрудничать и не получить ни одной монеты, а можете дезертировать и получить хотя бы одну монету. Так что, что бы ни делал ваш оппонент, лучшим вариантом для вас всегда будет дезертировать. Теперь, если ваш оппонент также рационален, он придет к такому же выводу и, следовательно, тоже отступит. В результате, когда вы оба действуете рационально, вы оба оказываетесь в неоптимальной ситуации, получая по одной монете каждый, тогда как могли бы получить три.

В случае с США и Советским Союзом это привело к тому, что обе страны создали огромные ядерные арсеналы, насчитывающие десятки тысяч единиц ядерного оружия в каждом, которых было более чем достаточно, чтобы многократно уничтожить друг друга. Но поскольку у обеих стран было ядерное оружие, ни одна из них не могла его использовать. И обе страны потратили на разработку этого оружия около 10 триллионов долларов. Обоим было бы лучше, если бы они объединились и согласились не развивать эту технологию дальше. Но поскольку они оба действовали в своих собственных интересах, в итоге они оказались в ситуации, когда всем стало хуже.

Наиболее предпочтительный исход для каждой страны - это когда они выбирают высокое вооружение, а их соперники низкое, получая явное военное преимущество. Наименее предпочтительный исход - обратный. Однако второй лучший исход для каждого из них - это когда оба выбирают низкий уровень; если преимущество не достигается, предполагается, что это дешевле и безопаснее, чтобы избежать гонки вооружений.

Повторяющаяся дилемма заключенного

Импалы, обитающие в лесах Африки и саваннах, подвержены заражению клещами, которые могут привести к инфекционным заболеваниям, параличу и даже смерти. Поэтому для импал важно удалять клещей, и они делают это, но не могут добраться до всех мест на своем теле, и поэтому нуждаются в помощи другой импалы.

Это требует затрат слюны, электролитов, времени и внимания - всех жизненно важных ресурсов под жарким африканским солнцем, где хищник может напасть в любой момент. Итак, все импалы стоят перед выбором: ухаживать им друг за другом или нет? Другими словами, они должны сотрудничать или дезертировать? Ну, если они взаимодействуют только один раз, то рациональным решением всегда будет дезертировать.Но особенность многих проблем в том, что они не являются дилеммой одного заключенного. Импалы видят друг друга изо дня в день, и одна и та же ситуация повторяется снова и снова. Это меняет суть проблемы, потому что вместо того, чтобы играть в "дилемму заключенного" всего один раз, теперь вы играете в нее много-много раз. И если я дезертирую сейчас, то мой оппонент узнает, что я дезертировал, и сможет использовать это против меня в будущем. Итак, какова наилучшая стратегия в этой повторяющейся игре? Вот что хотел выяснить Роберт Аксельрод, политолог.

В 1970-х годах Роберт Аксельрод вывел игру на следующий логический этап и инициировал повторяющуюся дилемму заключенного.Предметом своего анализа автор выбрал классическую игровую модель, известную как “дилемма заключенного”, которая требует от игроков постоянно выбирать между сотрудничеством и предательством.

Имея возможность проанализировать выбор, сделанный в предыдущем раунде, каждый игрок может подумать о намерениях или манере игры соперника: ‘хороший’ (сотрудничающий) или ‘подлый’ (перебежчик).

Аксельрод получил четырнадцать дискет с программами своих ученых коллег, заинтересовавшихся соревнованием. У каждой программы были различные законы поведения (у самых простых код поведения умещался в две строчки, у самых сложных – в сотню строк). Они различались по алгоритмической сложности, начальной враждебности, способности к прощению и так далее.

Турнир Аксельрода был организован таким образом, что взаимное сотрудничество приносило 3 очка, взаимное отступничество - 1 очко, эксплуатация кооператора приносила 5 очков.

С учетом этого предательство для играющего по горизонтали выгодно всегда и вне зависимости от того, какой выбор сделает его противник. Следовательно, оптимальная стратегия игры – предательство, а не сотрудничество. Такая же логика имеет силу и для второго игрока, который тоже должен неизменно выбирать предательство. Таким образом, желая всегда оставаться в выгоде, обе стороны всякий раз должны предавать друг друга. Однако при таком сценарии игроки набирают лишь по одному очку. Это гораздо меньше, чем можно получить, выбрав сотрудничество, за которое начисляется три очка. Получается самый настоящий парадокс: рациональное поведение игроков ведет к получению ими наименьшей выгоды. В этом и состоит суть “дилеммы заключенного”.

Логика этой игры радикально меняется, если количество раундов становится неограниченным. В ситуации, когда игроки не знают, какой ход будет последним, сотрудничество оказывается более выигрышной стратегией, чем предательство

В ситуации неопределенности сотрудничество становится возможным, так как оба игрока понимают, что в дальнейшем им придется еще неоднократно вступать во взаимодействие. Иными словами, будущее здесь влияет на настоящее. Впрочем, как и в реальной жизни, выгоды, получаемые игроком сейчас, кажутся более привлекательными, чем те, которые будут получены в будущем.

“На самом деле источником желания сотрудничать является не доверие людей друг к другу, а длительность взаимодействия”.

«Жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более альтруистические стратегии работали лучше, с точки зрения собственного интереса. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально чисто эгоистические, через естественный отбор.

Каждая программа была 200 раз противопоставлена каждому из конкурентов.
Всех победила программа Анатолия Рапапорта, оборудованная правилом поведения СВП (сотрудничество, взаимоуважение, прощение), также называемая «Око за око».

Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: начать с сотрудничества, а затем имитировать предыдущий ход противника, быть милым, прощающим, мстительным и ясным.

  • Более того. Программа СВП, помещенная наугад среди других программ, вначале проигрывала агрессивным программам, но в итоге побеждала и даже становилась «заразной», если ей давали достаточно времени. Соседние программы, видя, что она наиболее эффективна, в конце концов начинали применять тот же подход. Так что в долговременной перспективе правило СВП является наиболее рентабельным.

Анализируя стратегии, набравшие лучшие результаты, Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат:

  • Добрая. Важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми.

  • Мстительная. Успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример прощающей стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим.

  • Прощающая. Другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш.

  • Не завидуйте: сосредоточьтесь на максимизации собственного "балла", а не на том, чтобы ваш балл был выше, чем у вашего "партнера".

    Уроки, описанные выше, применимы в средах, поддерживающих сотрудничество, но поддерживается ли сотрудничество вообще, в решающей степени зависит от вероятности (называемой ω [омега]) того, что игроки встретятся снова. Когда ω невелико – то есть у игроков есть ничтожно малый шанс встретиться снова – каждое взаимодействие фактически представляет собой игру с дилеммой заключенного с одним выстрелом. Но в повторяющемся PD ценность повторяющихся кооперативных взаимодействий может стать больше, чем выгода от единичного использования .

    Но все-таки в повторяющейся дилемме заключенного нет единой наилучшей стратегии. Стратегия, которая работает наилучшим образом, всегда зависит от других стратегий, с которыми она взаимодействует.Например, если вы применяете принцип "Око за око" в среде, где есть только самые отъявленные хулиганы из "always defect", то принцип "Око за око" стоит на последнем месте.

Представьте себе мир, который является действительно неприятным местом для жизни, более или менее населенный игроками, которые постоянно дезертируют, за исключением небольшой группы игроков, сражающихся друг с другом, которые живут в своего рода ядре, и им приходится много играть друг с другом, потому что они географически изолированы. Они начнут набирать обороты, а также, поскольку это приводит к появлению потомства, они начнут захватывать население.

Таким образом, Аксельрод показал, что маленький островок сотрудничества может возникнуть и распространиться и в конечном итоге захватить весь мир. Как может возникнуть сотрудничество среди игроков, которые руководствуются личными интересами? Вам не обязательно быть альтруистами. Вы могли бы заботиться о себе и своих интересах. И все же сотрудничество все еще возможно, потому что приносит пользу обоим.Некоторые утверждают, что это может объяснить, как мы перешли от мира, полного абсолютно эгоистичных организмов, где каждый заботился только о себе, к миру, где возникло и процветало сотрудничество

Что произойдет, если в игре возникнет небольшая случайная ошибка?

Некоторые помехи в системе. Например, один из игроков пытается сотрудничать, но это воспринимается как дезертирство. Подобные мелкие ошибки случаются в реальном мире постоянно.

Как и в 1983 году, советская спутниковая система раннего предупреждения зафиксировала запуск межконтинентальной баллистической ракеты из США, но США ничего не запустили. Советская система приняла солнечный свет, отраженный от облаков на большой высоте, за баллистическую ракету. К счастью, Станислав Петров, советский дежурный офицер, отклонил сигнал тревоги. Но этот пример показывает потенциальную цену ошибки в сигнале

Если одно сотрудничество воспринимается как отступничество, то другой "Око за око" принимает ответные меры, и это запускает цепочку чередующихся ответных мер. И если очередное сотрудничество воспринимается как дезертирство, то остальная часть игры - это постоянное взаимное дезертирство. Таким образом, в долгосрочной перспективе оба участника получат лишь треть от того количества баллов, которое они получили бы в идеальных условиях. Взаимность может привести от очень хороших результатов к плохим.

Показать полностью
Политика Теория игр Текст Длиннопост
4
nkz135
nkz135
1 год назад

Кем быть выгоднее в жизни: наглецом или добряком?⁠⁠

Теория игр Стратегия Дилемма Видео YouTube
0
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии