Понимание игровой теории (перевод)

Всем доброго времени суток! Предлагаю вашему вниманию еще один перевод. За статью спасибо нашему форумчанину ShevaDimon

Хочу сразу же уточнить несколько терминов - в статье используются прилагательные в активном и пассивном залоге, к примеру, "использующий" и "используемый". Так что слова "эксплуатационный" и "эксплуатируемый" обозначают именно активное действие того, кто эксплуатирует, или использует, помарки в игре оппонента, и пассивное действие "эксплуатируемого" игрока.

Снова повторюсь, что тот факт, что я что-то перевел, не означает, что я со всем согласен .

Понимание игровой теории как ключ к пониманию сути холдема

Теория игры в холдем стала популярной и в то же время несколько превратно понимаемой темой для обсуждений. Целью данной статьи является дать вам фундаментальное представление о том, какова оптимальная стратегия игры с точки зрения игровой теории, как она работает и как влияет на игру в холдем. До того, как мы перейдем к самой статье, мы остановимся на нескольких ключевых определениях. Данные определения не всегда будут совпадать с определениями, используемыеми другими авторами.

Оптимальная эксплуатационная стратегия: стратегия, которая дает вам максимально возможное EV против стратегии вашего оппонента. Например, если в игре камень-ножницы-бумага стратегия вашего оппонента – каждый раз выбирать камень, то вашей оптимальной эксплуатационной стратегией будет каждый раз выбирать бумагу. То же самое справедливо и для случая, когда стратегия вашего оппонента – 50% камень, 25% бумага и 25% ножницы.

Суб-оптимальная стратегия: стратегия, которая работает хуже оптимальной эксплуатационной стратегии. Например, если стратегия вашего оппонента – каждый раз выбирать камень, то в том случае, если вы в 50% случаев выбираете бумагу, а в 50% - камень, вы все равно следуете выигрышной стратегии. EV стратегии бумага-и-камень, конечно, ниже, чем стратегия использования исключительно бумаги. Таким образом, стратегия бумага-и-камень является суб-оптимальной.

Оптимальная теория игры (GTO): стратегия, которая дает вам максимально возможное EV (или, другими словами, “является оптимальной”), если ваш оппонент всегда использует против вас лучшую контр-стратегию. В игре камень-ножницы-бумага стратегия GTO состоит в том, чтобы сделать выбор случайным образом между равным образом распределенными бумагой, ножницами и камнями. Если вы используете камень меньше, чем бумагу, ваше эквити будет меньше ? против стратегии «только ножницы». Отсюда следует, что вы должны использовать бумагу по крайней мере так же часто, как ножницы, а ножницы так же часто, как камень. В результате вы должны использовать в игре бумагу, ножницы и камни с одинаковой частотой для того, чтобы обеспечить себе ? эквити против всех стратегий. Пока ваг оппонент продолжает выбирать оптимальную контр-стратегию в ответ на любую стратегию, которую вы используете, никакая из ваших стратегий не может иметь большее EV, чем эта.

Стратегия эксплуатации: любая стратегия, EV которой выше, чем у стратегии GTO против определенного оппонента.

Эксплуатируемая стратегия: стратегия, EV которой ниже против некоторых стратегий эксплуатации по сравнению со стратегией GTO. Все не-GTO стратегии являются эксплуатируемыми.

Когда мы анализируем оптимальные стратегии, стратегии эксплуатации, мы рассматриваем стратегию оппонента как известную нам. Например: “мой оппонент всегда выбирает камень.” В реальности стратегия нашего оппонента неизвестна, и мы часто действуем на основании предположений и наблюдений, чтобы определить, что именно мы будет считать стратегией нашего оппонента. Чтобы определить стратегию GTO, мы должны предположить, что наш оппонент всегда выбирает оптимальную стратегию эксплуатации для противодействия любой стратегии, которую мы можем использовать, а не играет при помощи какой-то одной, строго определенной стратегии.

Холдем является намного более сложной игрой, чем камень-ножницы-бумага, и в ней никто не захочет играть против оппонента, который всегда пользуется стратегией GTO (или же “неэксплуатируемой”) стратегией. Это важный момент, так как стратегия GTO не обязательно является стратегией с самым высоким EV. Например, если стратегией нашего оппонента является «только камень», то в таком случае стратегия GTO, предполагающая случайный выбор из бумаги, ножниц и камня, имеет меньше EV, чем стратегия «только бумага».

Игра GTO оказывает большое влияние на стратегию игры в холдем. Даже с учетом того, что у стратегии GTO EV может быть меньше, чем у эксплуатационной стратегии, понимание того, что представляет из себя стратегия GTO и способность распознать, насколько сильно отклоняется от нее стратегия ваших оппонентов может помочь вам лучше использовать слабости ваших оппонентов. Кроме того, понимание стратегии GTO также может помочь вам в создании сбалансированных стратегий игры, эксплуатировать которые вашим противникам будет сложно. Данные стратегии могут использоваться в качестве защиты против сильных оппонентов, которые ищут в вашей игре зацепку, которую можно было бы использовать.

В холдеме, как и во многих более простых играх, таких, как камень-ножницы-бумага, стратегия GTO часто идентифицируется путем нахождения «точки неопределенности». Это означает, что благодаря использованию стратегии GTO ваши действия будут настолько разнообразны, что вашему оппоненту будет безразлично, какое из двух действий выбрать, то есть сразу решиться он не сможет. В результате ваша стратегия будет неэксплуатируемой.

Хотя модель холдема и не была полностью решена, были решены модели многих мини-игр, которые моделируют реальные ситуации из холдема и используют как полные, так и неполные варианты игры. Поняв, где находятся «точки неопределенности» в различных сценариях игры в холдем, вы сможете идентифицировать отклонения игры вашего оппонента от стратегии GTO и воспользоваться этим по максимуму. На базовом уровне холдем остается очень простой игрой: мы играем не с использованием вариантов камень-ножницы-бумага, а с чередованием вариантов «блеф» и «не блеф». Поняв принцип работы самых простых мини-игр, вы сможете значительно улучшить свою игру.

Простым примером неполного варианта игры будет игра, в которой у нас сразу есть руки, которые либо сразу выигрывают, либо сразу проигрывают, когда мы доходим до шоудауна. Мы можем сделать либо ставку, либо чек, а наш оппонент может сделать только колл или фолд. Если он делает колл, происходит шоудаун. Часто аналогичный сценарий происходит в реальном игре в холдем на ривере, когда диапазон рук нашего оппонента достаточно узок, а наш полярен. Разобравшись в модели мини-игры, мы сможем увидеть, что стратегия GTO состоит в том, чтобы блефовать на сумму, пропорциональную той, в которую мы оцениваем «цену» колла нашего оппонента. Например, если мы ставим $1 в банк $2, пропорция ставки составит 3:1, а стратегия GTO состоит в том, чтобы блефовать в 25% случаев, когда мы делаем ставки. Нашему оппоненту будет «безразлично», колить или фолдить. В результате мы увидим, что в том случае, если мы отклонимся от этой стратегии, наш оппонент сможет этим воспользоваться, либо колируя, когда мы будем больше блефовать, либо всегда всегда пасуя, если мы будем блефовать меньше.

В то же время, в данном сценарии соотношение банка к размеру нашего блефа 2:1, и поэтому нам «безразлично», делать ли ставку или чекать с нашим блефом, если оппонент колирует в 67% случаев. Это стратегия GTO нашего оппонента. Если же оппонент отклоняется от этой стратегии, мы можем «эксплуатировать» его, всегда блефуя, если он коллирует реже, или никогда не блефуя, если он коллирует больше.

Если наш оппонент отклоняется от стратегии GTO в предыдущем примере, у оптимальной эксплуатационной стратегии, заключающейся в том, чтобы всегда фолдить или всегда блефовать, EV будет выше, чем у любой эксплуатационной стратегии, которая предполагает блефы или фолды менее, чем в 100% случаев. Слабые оппоненты являются таковыми не только потому, что они выбирают для игры эксплуатируемые стратегии, но также и потому, что в игре мы можем прибегать к значительным отклонениям от точек неопределенности, а они не могут приспособится к этому, чтобы эксплуатировать недостатки нашей игры.

Не все решения GTO сводятся к тому, чтобы найти точку неопределенности. Например, предположим, что мы играем в вариант игры камень-ножницы-бумага, в которой есть четвертый вариант выбора — динамит, который побеждает все остальные. Стратегия GTO — всегда выбирать динамит. Но у вашего оппонента остается возможность выбора доминируемой стратегии, а именно выбор между бумагой, ножницами или камнем. Похожие ситуации случаются и в холдеме, например, тогда, когда натсы составляют настолько большую долю наших рук, что мы просто не можем блефовать достаточно часто дял того, чтобы нашему оппоненту было «безразлично», делать колл или фолд.

Это значит, что стратегию GTO эксплуатировать, конечно, нельзя, и она никогда не может быть проигрышной стратегией в холдеме (если нет рейка), но в то же время ваши оппонеты могут принимать решения в рамках своей доминируемой стратегии, которые могут привести их к поражению, а вас к победе. Таким образом, стратегии GTO часто будут суб-оптимальны, но все же возможности, которые открывают эти «неуязвимые стратегии» будут очень привлекательны для думающих игроков, анализирующих игровую теорию, особенно на высоких уровнях игры.

Сильный оппонент силен только потому, что он или она принимает намного меньше суб-оптимальных стратегических решений, чем слабый игрок. У самых сильных игроков чрезвычайно развита способность «чувствовать» игру в динамике. Если вы выбираете стратегию «только камень», он ли она быстро распознает ее и станет использовать стратегию «только бумага» и так далее. Такие игроки быстро идентифицируют основные особенности вашей игры и могут прибегнуть к упреждающим контр-мерам против вашей игры, что может дать им возможность эксплуатировать ваши не-GTO стратегии с пугающей частотой и точностью.

Нам хотелось бы думать, что, выбирая стратегии GTO, наши оппоненты могут только проигрывать. Тем не менее, даже самые сильные оппоненты используют в своей игре стратегии эксплуатации (которые потенциально могут стать эксплуатируемыми стратегиями), а холдем в любой случае был и остается игрой с неполной информацией. Если вы играете против очень сильного оппонента, который, как вам известно, использует стратегию, аналогичную 33% бумаги, 20% ножниц и 47% камня, то будет просто глупо прибегать против него к стратегии «только бумага». Так как ваш оппонент силен, то он по определению быстро адаптируется и начнет эксплуатировать вас. Но вы все же можете играть «эксплуатирующе», если поймете, где находятся точки неопределенности, и начав делать отклонения от них. Даже самые сильные «акулы» - не ясновидящие, и если вы прибегнете к эксплуатирующей стратегии 40; бумаги, 30% ножниц и 30% камня, как они могут догадаться об этом?

Авторы: Брюс Парадис и Дуглас Зар

Оригинал: http://forumserver.twoplustwo.com/94/stoxpoker-com/understanding-game-theory-holdem-245479/

Если кому-то попадется интересная статья, отрывок из книги, видео - присылайте мне, переведу в свободное время.

Следить за новыми комментариями

reimm, Август 27, 2012 - 20:02.

Прочитал,есть над чем подумать!!!!!!!

Добавить комментарий

cooler, Январь 7, 2012 - 15:47.

спасибо за информацию.. мне как новичку было интересно прочитать -
да именно почитать, т.к. на практике не могу еще применить
нужно обдумать

ve4a, Декабрь 14, 2011 - 00:48.

Спс

mao, Сентябрь 8, 2011 - 12:28.

Спасибо за интересный матерьял. Чуть доступеней бьы

.

Осталось только не забыть это все помножить на практику и тогда получим некий навык.

ДО ФЛОПА ВСЕ РАВНЫ И ЧЕРТ И БОГ. А ВОТ У ПРОРОКА ПРИИМУЩЕСВО,

icefr, Сентябрь 8, 2011 - 12:23.

Спасибо за друг.

А целом, если очень грубо оценить, то суть сводиться к давно известному факту, надо играть " от опоннета", так сказать "против стола".

Oksana87, Сентябрь 7, 2011 - 18:27.

интересная статья

Tolian222, Сентябрь 7, 2011 - 17:46.

Статья отличная,попробуй следующий раз отредактировать и сократить,что бы смысл легче дошел,по крайней мере как сам видишь ситуацию,а кому полность надо ты ссылку даешь.

Олександр, Сентябрь 7, 2011 - 13:49.

Спасибо, Леша! Отличный материал.

Жаль вчера не заметил, можно было в рассылке упомянуть.

DanShu222, Сентябрь 7, 2011 - 10:20.

фуууууух, еле осилил, но прочитал до конца.... такое в башке должно быть

... спасибо за труд...

madevgenii, Сентябрь 7, 2011 - 08:45.

более приземлённо-бумага это фолд а камень рейз?

volodiabond, Сентябрь 7, 2011 - 08:13.

Спасибо!!!

engener, Сентябрь 7, 2011 - 01:00.

Спасибо почитаю на досуге

VitalicS, Сентябрь 7, 2011 - 00:27.

Т.е., смысл не только хорошо играть, но играть так, чтобы твою стратегию не смог эксплуатировать оппонент!

Спасибо за статью - она отличная! Хоть и немного сложно написанная

Но если вдуматься, то открывается много интересного!

ShevaDimon, Сентябрь 7, 2011 - 00:23.

Спасибо за перевод,а то я пробежал глазами её в английском варианте и запутался

Оказывается правильно запутался,хотя сама по себе статья это азы покера.

mamamio57, Сентябрь 6, 2011 - 21:48.

Не боюсь сказать-все это есть фуфло! В онлайне есть только знание алгоритма программы того или иного рума!

icefr, Сентябрь 8, 2011 - 12:22.

И много алгоритмов Вы знаете?

mao, Сентябрь 8, 2011 - 12:35.

ПОЛНОСТЬЮ С ТОБОЙ СОГЛАСЕН.
АГА ОСОБЕНО У ДИЛЕРА "ЖАНЫ" или "ЭДУАРДА" КАКОЙ АЛГОРИТМ ЗАМЕСА КАРТ В РУЧНУЮ.

КОГДА ОН или ОНА тебе неприятны, когда достают и выкладывают на РИВЕР тебе С.М.Е.Р.Т.Ь.

REBAY PLZ

sot956, Сентябрь 6, 2011 - 19:24.

Ваши переводы-это всегда клёво !

+++++