Здравствуйте, гость | Правила · Помощь |
» Статистика и причинно-следственная связь, преферанс, игра, Байкер, Сашун, языки описания |
|
||
Да, стоимость проекта впечатляет. Это железо по самым нескромным подсчетам вряд ли намного больше десяти килобаксов стоит. Плюс стоимость электричества на время обучения ... Я не совсем разобрался, как это им удалось. Они как-то разделили ИНС на несколько параллельных сетей со своим крайним поведением каждая. И потом происходило сближение крайностей. А не как обычно - задается одно какое-то случайное поведение, а затем оно корректируется. За счет этого подхода удалось существенно ограничить число вариантов на каждом шагу и ускорить обучение. UPD: Прочитал, что обучение производилось на облачных ресурсах и их аренда стоила всего $150 ... Это сообщение отредактировал Pochemuk - 23/07/2019, 12:51 |
||
|
||
Я, чисто на "психологии" на первой руке Т Д К В 9 8 Т В 10 9 заявил 6 . Чтоб не взять 5 взяток на распасовке и не проиграть 34 виста. Ну и прикупил К и Д. Выхода - не увидел, понадеялся снова на "психологию" и снес Д В. Потом снова понадеялся на "психологию" и атаковал 9. Я, как хочет Байкер, указал ОБА РЕШЕНИЯ - см. цитату вверху. Ответ - Какой результат в этой сдаче был бы "по статистике" у Байкера? -------------------- С уважением, А.Малышев |
||
» 23/07/2019, 18:19, Невозмутимый
|
||||
так байкер писал (и до сих пор пишет) про то что конкретно "его" алгоритм будет всех дрючить а не то что если создатели deep blue увлекутся преферансом поставленная задача будет им под силу, а ето две большие разницы в любом случае методы, которыми ети задачи решаются, кардинально отличаются от тех про которые писал байкер, алгоритма там вообще по сути никакого нет ранжировать можно все как тебе нравится, но фактически покер - игра с неполной информацией против 5 оппонентов будет иметь дерево решений как минимум в тысячи раз (скорее даже в сотни тысяч) больше преферансного |
||||
|
||
Ничего подобного, спор всегда был "концептуальным", типа "может ли вообще существовать алгоритм, способный обыгрывать "василей?" Ответ долгие годы был "Нет, не может", потому что "психология" и потому что "отсутствие оптимальности" из-за нелобового характера игры. До моего алгоритма в таких дискуссиях чаще всего дело вообще не доходило, тем более и сейчас его многие считают элементарно несуществующим. Но сам я, конечно, верю, что если перевести мои труды по готовым аспектам с табличной формы в "машинную", то конечно "он" будет "всех дрючить". По той причине, что физически человек не сможет выполнить ту работу, которая под силу железке. Разумеется, я мог озвучивать такое свое мнение, но это (качество именно моей работы) никогда не было с моей стороны основным содержанием споров по теме "обыграет ли компьютер человека в преферанс". Я не настолько честолюбив. Если иное, то "вам" просто так казалось. Что касается методов, то, конечно, у меня и методы неправильные. Про сашуновскую белиберду по заказу с рукой 4+4+Т ни слова критики, а у меня априори всё плохо. Ну, ну... Но "вообще" замечу, что любой алгоритм это не более чем формальный способ нахождения оптимального решения из любых имеющихся исходных данных. Главное, чтобы алгоритм был "правильным", и неважно, какими именно методами он был найден. |
||
|
||
Читал где-то, что для игры в NL Holdem против 5 оппонентов ИНС должна иметь нейронов больше, чем число атомов в видимой части Вселенной. Каким образом создателям удалось ужать ее до вменяемого размера без потери эффективности - моему уму не постичь Тем более, что я с ИНС на "Вы" и очень издалека Но в преферансе есть одно существенное отличие от покера. Покер, конечно, сложен и многовариантен. Но он, все же, линеен. В том смысле, что есть вполне ощутимая корреляция между силой руки и выигрышем. В преферансе же слабая рука может дать даже более ощутимый выигрыш, чем сильная (на мизере или распасах). Так что зависимость тут уже нелинейная. ИНС можно научить и с таким справляться. Но при этом она становится сложнее, неустойчивее и хуже обучаемой. Это сообщение отредактировал Pochemuk - 23/07/2019, 19:16 |
||
» 23/07/2019, 19:31, Невозмутимый
|
теоретически да тк можно делать ставку от 1бб до размера стека, поетому парни упростили разбив на 14 вариантов
сильные и слабые руки придуманы людьми, прога с етим вообще заморачиваться не будет - наверняка в процессе обучения она многие тысячи раз зарыла тузов префлоп в различных ситуациях пока не осознала что ето фигня ) |
» 23/07/2019, 19:48, Кутруповезет
|
По исходному вопросу, который поставил ув. Меф: о двух подходах к игре – причинно-следственном и статистическом.
Байкер выше верно заметил, что выражение «причинно-следственный» здесь неудачно, и по смыслу можно предположить, что речь идет о двух подходах – игре на основе опыта (и его производной – интуиции), и на основе статистики. Но я бы еще добавил третий подход – с помощью компьютерных программ. Напомню, что 2-3 года назад здесь, на форуме, Extasy продемонстрировал программу, сделанную им совместно с Pochemuk (в этой теме: После этой демонстрации Extasy обещал выложить программу в общий доступ, но за два года так и не выложил. Использует ли он имеющуюся у него программу в личных интересах? – Разумеется, нет, как порядочный человек… Кроме программы Extasy/Pochemukа, есть и другие преферансные программы-инструменты, хотя и не так далеко продвинутые – программа Словеснова, а также, кажется, интересный результат показывала программа Фрэда (по второй ссылке выше). Думаю, что на сегодняшний день этот компьютерный подход в онлайн-преферансе уже используется некоторыми игроками практически. Пока, наверное, таких игроков единицы. Это сообщение отредактировал Кутруповезет - 23/07/2019, 19:51 |
|
Заманив громкими тэгами, ТС попросту обманул нас. Ни Байкера, ни Сашуна в его опусах нет, с таким же успехом можно Бузову и Киркорова добавить, чего не сделаешь ради пиара!
|
|
||
Очень спорное утверждение, Pochemuk. Если вы почитаете статьи и глянете видео, где прога играет, то обратите внимание на то, что она часто совершает действия, которые могут быть отнесены в категорию блефа. И побеждает часто. Спасибо Борису (Невозмутимый) за информацию о покерной программе Плурибус. Как я понял, статья в научном журнале вышла менее двух недель назад. Почитал сегодня днём об этом. Если кто не искал в сети, то рекомендую посмотреть ссылки ниже и прочесть по ним текст - там много интересного. Ниже несколько цитат из статей: "Программа работала не на суперкомпьютере, а на двух 14-ядерных процессорах и с памятью 128 Гб. ... В этом эксперименте участвовали 13 человек: ... Каждый игрок получал псевдоним, который просили скрывать от остальных участников эксперимента, компьютер играл под своим именем. Каждый день играли от трёх до восьми часов, в среднем часа четыре. Рассадка выбиралась в начале дня случайным образом,.." "В первом эксперименте слабее других выступил Даррен Элиас, проигравший 4.02 бб/100 (стандартное отклонение 2.19 бб/100), Крис Фергюсон проиграл 2.52 бб/100 (стандартное отклонение 2.02). В статье в журнале Science эти результаты объединяют, что даёт Плурибусу винрейт 3.27 бб/100 со стандартным отклонением 1.49 бб/100 и обеспечивает общую победу с доверительным интервалом 95%. В статье в блоге AI Facebook есть нюанс – третий участник эксперимента, LLinusLLove, показал винрейт -0.5 бб/100 со стандартным отклонением 1 бб/100. Возможно, объединение этого результата с двумя другими вело к какой-нибудь «статистической ничьей», так что в Science обошлись без Линуса. В любом случае, респект таким парням!" "При обучении Плурибус превзошёл среднего игрока в покер за 7 часов, превзошёл элитный уровень через 20 часов и... окончательно отказался от лимпов со свободных позиций через 60 часов." "Если бы в покерных олл-инах требовался микроконтроль, компьютер выигрывал бы у людей 100% выставлений AxKx в QxQx и выработать плюсовую стратегию стало бы совсем просто." Ещё раз спасибо Невозмутимому. Это было очень интересно. А по самой теме я напишу что-нибудь позже - как комментарий к постам озвучивших свой взгляд на те три вопроса. Во-первых, искал для иллюстрации примеры из старых собственных тем в форуме, почти ничего не нашёл - тяжело искать темы, когда я публиковал их разными никами, большая часть тех ников умерла и не распознаётся поисковиком. Во-вторых, погода у нас сменилась с дождливой на солнечную - сами понимаете. :) |
||
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
0 Пользователей: