Преферанс -> Статистика и причинно-следственная связь -> 11-20. Форумы клуба Гамблер

» 23/07/2019, 11:24, Байкер

Невозмутимый (23 июля 2019, 09:26)

... сделать прогу которая будет всех дрючить в преферанс задача вообще елементарная

И 20 лет не прошло, как этот тезис перестал вызывать "всеобщее" возмущение. Когда я в 2000-м году его здесь озвучивал, "толпа" шулеров, математиков (теория игр...) и просто "зевак" от преферанса готова была меня растерзать: самое нежное было - "Ты ничего в этом не понимаешь".
Будем считать, что я просто угадал, выбрав правильный вариант из двух возможных. )

Однако "элементарная" эта задача лишь с точки зрения проблем программирования. А как коснешься алгоритмизации и начнешь "вникать" - один за другим вылезает череда "нюансов", о некоторых из которых до начала работы со "статистикой" и не подозревал. Казалось бы, что такого технически сложного в заявке мизер или заказе игры при структуре 4*4? То-то Сашуну это показалось плёвым делом. А как попробуешь всё формализовать сам - мама родная!

Сложность преферанса очень недооценивается. Причем, большинством "оценщиков". Если измерять сложность любой игры требуемым количеством единичных процедур и функций для реализации алгоритма, обыгрывающего "чемпиона мира" - так для оценки сложности делали те самые шахматные алгоритмисты, - то лично я расставил бы игры по сложности так: шахматы, преферанс, покер, бридж. Сугубо личное мнение, конечно, но оно именно такое. Да, шахматы и бридж предъявляют очень высокие требования к памяти участников игры, тем более "чемпиона", но с алгоритмической точки зрения преферанс точно сложнее бриджа: возни с ним 100% окажется больше.

Это сообщение отредактировал Байкер - 23/07/2019, 11:27

» 23/07/2019, 12:45, Pochemuk

Невозмутимый (23 июля 2019, 09:26)

совсем недавно парни выпустили прогу Pluribus которая без проблем надрюкала довольно квалифицированных игроков в 6-max NL Holdem причем на ресурсе стоимость которого прога по сути окупит в 1ый же день если ее выпустить на Pokerstars

Да, стоимость проекта впечатляет.

Это железо по самым нескромным подсчетам вряд ли намного больше десяти килобаксов стоит. Плюс стоимость электричества на время обучения ...

Я не совсем разобрался, как это им удалось. Они как-то разделили ИНС на несколько параллельных сетей со своим крайним поведением каждая. И потом происходило сближение крайностей. А не как обычно - задается одно какое-то случайное поведение, а затем оно корректируется. За счет этого подхода удалось существенно ограничить число вариантов на каждом шагу и ускорить обучение.

UPD: Прочитал, что обучение производилось на облачных ресурсах и их аренда стоила всего $150 ...

Это сообщение отредактировал Pochemuk - 23/07/2019, 12:51

» 23/07/2019, 14:22, Сашун

Байкер (22 июля 2019, 02:31)

... давайте, покажите эту самую психологию в действии. Я сажусь на коленки, вы играете, встречаете ситуацию, когда ПО АЛГОРИТМУ ВЫХОДИТ ОДНО, ПО ПСИХОЛОГИИ - ДРУГОЕ, ВЫ УКАЗЫВАЕТЕ ОБА РЕШЕНИЯ И ИГРАЕТЕ ПО ПСИХОЛОГИИ.

Я, чисто на "психологии" на первой руке

Т Д

К В 9 8

Т В

10 9

заявил 6

. Чтоб не взять 5 взяток на распасовке и не проиграть 34 виста.
Ну и прикупил

К и

Д. Выхода - не увидел, понадеялся снова на "психологию" и снес

Д В.

Потом снова понадеялся на "психологию" и атаковал

9.

Я, как хочет Байкер, указал ОБА РЕШЕНИЯ - см. цитату вверху. Ответ - https://www.gambler.ru/protocol/371346063.45 . Показал я "психологию в действии" - судить не мне.

Какой результат в этой сдаче был бы "по статистике" у Байкера?

--------------------

С уважением, А.Малышев

» 23/07/2019, 18:19, Невозмутимый

Байкер (23 июля 2019, 03:24)

Невозмутимый (23 июля 2019, 09:26)

... сделать прогу которая будет всех дрючить в преферанс задача вообще елементарная

И 20 лет не прошло, как этот тезис перестал вызывать "всеобщее" возмущение. Когда я в 2000-м году его здесь озвучивал, "толпа" шулеров, математиков (теория игр...) и просто "зевак" от преферанса готова была меня растерзать: самое нежное было - "Ты ничего в этом не понимаешь".
Будем считать, что я просто угадал, выбрав правильный вариант из двух возможных. )

Однако "элементарная" эта задача лишь с точки зрения проблем программирования. А как коснешься алгоритмизации и начнешь "вникать" - один за другим вылезает череда "нюансов", о некоторых из которых до начала работы со "статистикой" и не подозревал. Казалось бы, что такого технически сложного в заявке мизер или заказе игры при структуре 4*4? То-то Сашуну это показалось плёвым делом. А как попробуешь всё формализовать сам - мама родная!

Сложность преферанса очень недооценивается. Причем, большинством "оценщиков". Если измерять сложность любой игры требуемым количеством единичных процедур и функций для реализации алгоритма, обыгрывающего "чемпиона мира" - так для оценки сложности делали те самые шахматные алгоритмисты, - то лично я расставил бы игры по сложности так: шахматы, преферанс, покер, бридж. Сугубо личное мнение, конечно, но оно именно такое. Да, шахматы и бридж предъявляют очень высокие требования к памяти участников игры, тем более "чемпиона", но с алгоритмической точки зрения преферанс точно сложнее бриджа: возни с ним 100% окажется больше.

так байкер писал (и до сих пор пишет) про то что конкретно "его" алгоритм будет всех дрючить а не то что если создатели deep blue увлекутся преферансом поставленная задача будет им под силу, а ето две большие разницы

в любом случае методы, которыми ети задачи решаются, кардинально отличаются от тех про которые писал байкер, алгоритма там вообще по сути никакого нет

ранжировать можно все как тебе нравится, но фактически покер - игра с неполной информацией против 5 оппонентов будет иметь дерево решений как минимум в тысячи раз (скорее даже в сотни тысяч) больше преферансного

» 23/07/2019, 18:58, Байкер

Невозмутимый (23 июля 2019, 18:19)

так байкер писал (и до сих пор пишет) про то что конкретно "его" алгоритм будет всех дрючить а не то что если создатели deep blue увлекутся преферансом поставленная задача будет им под силу, а ето две большие разницы

в любом случае методы, которыми ети задачи решаются, кардинально отличаются от тех про которые писал байкер, алгоритма там вообще по сути никакого нет

Ничего подобного, спор всегда был "концептуальным", типа "может ли вообще существовать алгоритм, способный обыгрывать "василей?" Ответ долгие годы был "Нет, не может", потому что "психология" и потому что "отсутствие оптимальности" из-за нелобового характера игры.
До моего алгоритма в таких дискуссиях чаще всего дело вообще не доходило, тем более и сейчас его многие считают элементарно несуществующим. Но сам я, конечно, верю, что если перевести мои труды по готовым аспектам с табличной формы в "машинную", то конечно "он" будет "всех дрючить". По той причине, что физически человек не сможет выполнить ту работу, которая под силу железке.
Разумеется, я мог озвучивать такое свое мнение, но это (качество именно моей работы) никогда не было с моей стороны основным содержанием споров по теме "обыграет ли компьютер человека в преферанс". Я не настолько честолюбив. Если иное, то "вам" просто так казалось.

Что касается методов, то, конечно, у меня и методы неправильные. Про сашуновскую белиберду по заказу с рукой 4+4+Т ни слова критики, а у меня априори всё плохо. Ну, ну...
Но "вообще" замечу, что любой алгоритм это не более чем формальный способ нахождения оптимального решения из любых имеющихся исходных данных. Главное, чтобы алгоритм был "правильным", и неважно, какими именно методами он был найден.

» 23/07/2019, 19:16, Pochemuk

Невозмутимый (23 июля 2019, 18:19)

покер - игра с неполной информацией против 5 оппонентов будет иметь дерево решений как минимум в тысячи раз (скорее даже в сотни тысяч) больше преферансного

Читал где-то, что для игры в NL Holdem против 5 оппонентов ИНС должна иметь нейронов больше, чем число атомов в видимой части Вселенной.

Каким образом создателям удалось ужать ее до вменяемого размера без потери эффективности - моему уму не постичь

Тем более, что я с ИНС на "Вы" и очень издалека

Но в преферансе есть одно существенное отличие от покера. Покер, конечно, сложен и многовариантен. Но он, все же, линеен. В том смысле, что есть вполне ощутимая корреляция между силой руки и выигрышем.

В преферансе же слабая рука может дать даже более ощутимый выигрыш, чем сильная (на мизере или распасах). Так что зависимость тут уже нелинейная.

ИНС можно научить и с таким справляться. Но при этом она становится сложнее, неустойчивее и хуже обучаемой.

Это сообщение отредактировал Pochemuk - 23/07/2019, 19:16

» 23/07/2019, 19:31, Невозмутимый

теоретически да тк можно делать ставку от 1бб до размера стека, поетому парни упростили разбив на 14 вариантов

сильные и слабые руки придуманы людьми, прога с етим вообще заморачиваться не будет - наверняка в процессе обучения она многие тысячи раз зарыла тузов префлоп в различных ситуациях пока не осознала что ето фигня )

» 23/07/2019, 19:48, Кутруповезет

По исходному вопросу, который поставил ув. Меф: о двух подходах к игре – причинно-следственном и статистическом.
Байкер выше верно заметил, что выражение «причинно-следственный» здесь неудачно, и по смыслу можно предположить, что речь идет о двух подходах – игре на основе опыта (и его производной – интуиции), и на основе статистики.

Но я бы еще добавил третий подход – с помощью компьютерных программ. Напомню, что 2-3 года назад здесь, на форуме, Extasy продемонстрировал программу, сделанную им совместно с Pochemuk (в этой теме: https://www.gambler.ru/forum/index.php?show...dpost&p=1510107 и тут: https://www.gambler.ru/forum/index.php?show...post&p=1519860). Результаты выглядели внушительно. Уже тогда, 2 года назад, программа могла находить лучший снос, лучший первый ход, могла оценивать МО руки до взятия прикупа. (Похоже, демонстрация программы впечатлила не только меня. С тех пор прекратились публикации обновлений титанического труда Морозко «Расчеты вероятностей ловли дырок на мизере…». Ему (Морозке) можно даже посочувствовать – тяжело увидеть, что труд, на который ты потратил многие годы, может быть сделан и продолжен с идеальным качеством за пару вечеров…)

После этой демонстрации Extasy обещал выложить программу в общий доступ, но за два года так и не выложил. Использует ли он имеющуюся у него программу в личных интересах? – Разумеется, нет, как порядочный человек…

Кроме программы Extasy/Pochemukа, есть и другие преферансные программы-инструменты, хотя и не так далеко продвинутые – программа Словеснова, а также, кажется, интересный результат показывала программа Фрэда (по второй ссылке выше). Думаю, что на сегодняшний день этот компьютерный подход в онлайн-преферансе уже используется некоторыми игроками практически. Пока, наверное, таких игроков единицы.

Это сообщение отредактировал Кутруповезет - 23/07/2019, 19:51

» 23/07/2019, 23:11, платан

Заманив громкими тэгами, ТС попросту обманул нас. Ни Байкера, ни Сашуна в его опусах нет, с таким же успехом можно Бузову и Киркорова добавить, чего не сделаешь ради пиара!

» 24/07/2019, 00:25, Меф

Pochemuk (23 июля 2019, 19:16)

Покер, конечно, сложен и многовариантен. Но он, все же, линеен. В том смысле, что есть вполне ощутимая корреляция между силой руки и выигрышем.

Очень спорное утверждение, Pochemuk.
Если вы почитаете статьи и глянете видео, где прога играет, то обратите внимание на то, что она часто совершает действия, которые могут быть отнесены в категорию блефа. И побеждает часто.

Спасибо Борису (Невозмутимый) за информацию о покерной программе Плурибус.
Как я понял, статья в научном журнале вышла менее двух недель назад. Почитал сегодня днём об этом. Если кто не искал в сети, то рекомендую посмотреть ссылки ниже и прочесть по ним текст - там много интересного.

https://www.gipsyteam.ru/news/6503-eksperim...ligera-v-6-maks --- большая и весьма квалифицированная статья на данную тему на русском.

https://www.smart-poker.ru/novosti-pokera/b...-menee-150.html -- и это на русском, но с меньшим кол-вом букв (эта статья слегка дополняет предыдущую)

https://www.facebook.com/FacebookAI/videos/2087259478050682/ -- видео трёх сдач, сыгранных программой

Ниже несколько цитат из статей:

"Программа работала не на суперкомпьютере, а на двух 14-ядерных процессорах и с памятью 128 Гб.
...
В этом эксперименте участвовали 13 человек: ...
Каждый игрок получал псевдоним, который просили скрывать от остальных участников эксперимента, компьютер играл под своим именем. Каждый день играли от трёх до восьми часов, в среднем часа четыре. Рассадка выбиралась в начале дня случайным образом,.."

"В первом эксперименте слабее других выступил Даррен Элиас, проигравший 4.02 бб/100 (стандартное отклонение 2.19 бб/100), Крис Фергюсон проиграл 2.52 бб/100 (стандартное отклонение 2.02). В статье в журнале Science эти результаты объединяют, что даёт Плурибусу винрейт 3.27 бб/100 со стандартным отклонением 1.49 бб/100 и обеспечивает общую победу с доверительным интервалом 95%.

В статье в блоге AI Facebook есть нюанс – третий участник эксперимента, LLinusLLove, показал винрейт -0.5 бб/100 со стандартным отклонением 1 бб/100.
Возможно, объединение этого результата с двумя другими вело к какой-нибудь «статистической ничьей», так что в Science обошлись без Линуса. В любом случае, респект таким парням!"

"При обучении Плурибус превзошёл среднего игрока в покер за 7 часов, превзошёл элитный уровень через 20 часов и... окончательно отказался от лимпов со свободных позиций через 60 часов."

"Если бы в покерных олл-инах требовался микроконтроль, компьютер выигрывал бы у людей 100% выставлений AxKx в QxQx и выработать плюсовую стратегию стало бы совсем просто."

Ещё раз спасибо Невозмутимому. Это было очень интересно.
А по самой теме я напишу что-нибудь позже - как комментарий к постам озвучивших свой взгляд на те три вопроса.
Во-первых, искал для иллюстрации примеры из старых собственных тем в форуме, почти ничего не нашёл - тяжело искать темы, когда я публиковал их разными никами, большая часть тех ников умерла и не распознаётся поисковиком. Во-вторых, погода у нас сменилась с дождливой на солнечную - сами понимаете. :)