Применение нейронных сетей для игр с неполной информацией

как поведёт себя нейронка

Как научишь — так и поведёт

Реально ли в таких случаях научить нейронную сеть правильно играть?

Да. Её даже в магазин за пивом ходить научить более чем реально. И даже выбирать пиво по вкусу хозяина.

Нейронки тупые в том плане, что сами они что-нибудь новое придумать не могут в принципе. Но если задать им вектор обучения и цели, то любую рутину они делают отлично.

Goury ★★★★★
(19.09.15 01:17:03 MSK)

Ответ на: комментарий от Goury 19.09.15 01:17:03 MSK

А как же творческое начало в человеке?
(тоже ведь нейронка, только сделанная по другой технологии)

torvn77 ★★★★★
(19.09.15 01:25:51 MSK)

Ответ на: комментарий от Goury 19.09.15 01:17:03 MSK

Но нейронная сеть может же принять решение, даже если при обучении ИМЕННО ТАКОГО не было. Или я не прав? Ведь если скормить ей 100500 изображений котиков, то она распознает 100501 котика. Пусть картинка будет и другая. А в случае игры дурака, то я представляю себе это так : ну если в процессе обучения попадалась такая ситуация, то хорошо, у нас уже было такое, мы что-то помним. Если же нет, то у нас же были похожие состояния. На их основании мы можем принять решения.

Безусловно, мы должны учитывать много-много факторов(это основная проблема). Но это же вроде как возможно.

Если аналогию на пиво, то если я укажу все-все данные о моём любимом пиве, то не найдя пула моих любимых марок пива она купит что-то похожее, которое соответствует большему кол-ву параметров(естественно, что всё зависит от коэффициентов значимости каждого фактора, но это мелочи).

zamazan4ik ★★
(19.09.15 01:29:10 MSK) автор топика

Ответ на: комментарий от torvn77 19.09.15 01:25:51 MSK

По сути, это и есть жалкая попытка накодить человека :)

zamazan4ik ★★
(19.09.15 01:29:50 MSK) автор топика

Ссылка

Ответ на: комментарий от zamazan4ik 19.09.15 01:29:10 MSK

ну если в процессе обучения попадалась такая ситуация, то хорошо, у нас уже было такое, мы что-то помним.

Ну зачем вот так сразу за перебор картотеки приниматься?
Почему бы не поставить стратегические цели, или не сделать алгоритм для реализации определённой тактики?

Для упрощения задачи можно считать что дурак подкидно-переводной.
в нём очень большой оборот карт что позволяет применить тактику накопления козырей, которые после накопления в достаточном количестве в некотором порядке, чтобы противники не усилились на них вываливаются.
конечно с такой тактикой будешь выходить одним из последних, но не тем, кто остался с картами в конце игры.

torvn77 ★★★★★
(19.09.15 01:37:04 MSK)

Ответ на: комментарий от torvn77 19.09.15 01:37:04 MSK

Я правильно понял, что Вы предлагаете поставить нейронной сети некоторые цели, расставить между ними коэффициенты-приоритеты, и чтобы она старалась достичь этих минимумов?

А как тогда здесь скажется процесс обучения?

zamazan4ik ★★
(19.09.15 01:42:53 MSK) автор топика

Ответ на: комментарий от zamazan4ik 19.09.15 01:42:53 MSK

Нет, я предлагаю составить математическую модель игры,
а потом по ней уже сделать некую базовую сеть,
которую потом развивать и менять по ходу эксплуатации.
Может это будет делать другая нейросеть, которая будет оперировать «блоками функциональностей».

torvn77 ★★★★★
(19.09.15 01:50:57 MSK)

Ссылка

Ответ на: комментарий от zamazan4ik 19.09.15 01:42:53 MSK

А вообще мне кажется что задача мозга в целом, как центра принятия решения телом, именуемым человеком, это включить в себя или распространить своё влияние на максимальное количество атомов в мире, не в ущерб долговечности и функциональности конечно, чтоб не стать динозавром или едой.

torvn77 ★★★★★
(19.09.15 01:55:48 MSK)

Ссылка

Реально ли в таких случаях научить нейронную сеть правильно играть?

Мозг же умеет. Или игры с неполной информацией даются человеку с божией помощью?

anonymous
(19.09.15 02:05:07 MSK)

Ссылка

Ответ на: комментарий от torvn77 19.09.15 01:25:51 MSK

Творческое начало это как раз то «что-нибудь новое придумать», которое нейронки пока не научились и на ближайшие лет десять перспектив пока не видно в этом поле.

Goury ★★★★★
(19.09.15 02:15:58 MSK)

Ссылка

Ответ на: комментарий от zamazan4ik 19.09.15 01:29:10 MSK

Ненене, «укажу все данные» и «ИМЕННО ТАКОГО» это не про нейронки, это именно про классическое программирование. Нейронки совсем не так работают.

В примере с пивом нормальная нейронка будет поить тебя всем чем попало и смотреть на твою реакцию на этапе обучения. А потом посчитает какие факторы на что влияли и будет выбирать то, которое под них наиболее подходит.

Goury ★★★★★
(19.09.15 02:18:37 MSK)

Не путай нейронку, ЭВМ и мозги. Это разные вещи. Нейронку можно научить играть в дурака, но пока ты будешь её учить, сам дураком станешь. Пиши классический алгоритм с деревом ходов и альфа-бета отсечением, по идее он должен быть довольно простым. Анализируй на несколько ходов вперёд в зависимости от уровня сложности или допускай элемент рандома на простой сложности.

peregrine ★★★★★
(19.09.15 02:28:15 MSK)

Ответ на: комментарий от peregrine 19.09.15 02:28:15 MSK

да,я знаю такой алгоритм игры. Но хотелось бы попробовать именно нейронную сеть. Вы думаете, что она много хуже покажет себя(даже если при обучении её использовать алгоритм с альфа-бета отсечением)?

zamazan4ik ★★
(19.09.15 07:59:37 MSK) автор топика

Ссылка

Ответ на: комментарий от Goury 19.09.15 02:18:37 MSK

но если дать ей изначально набор из «годных» напитков, то она быстрее поёмет, что хозяину нравится. точнее, не поймет, а так ссвязи сложатся внутри неё

zamazan4ik ★★
(19.09.15 08:08:39 MSK) автор топика

Ответ на: комментарий от peregrine 19.09.15 02:28:15 MSK

просто не раз читал статьи, что да, альфа-бета алгоритм неплох так в таких вот случаях. Но и нейронные сети очень и очень хорошо себя показывают. После обучения, естественно.

Правда я не знаю, во что сложнее научить играть нейронку - в шахматы те же или шашки, или же в такого дурака. Тут я не совсем осознаю. Объясните, если несложно.

zamazan4ik ★★
(19.09.15 09:18:49 MSK) автор топика

Научить реально, смысла не так много.

Solace ★★
(19.09.15 10:57:55 MSK)

Ссылка

Ответ на: комментарий от zamazan4ik 19.09.15 08:08:39 MSK

Неа, она так не поймёт что хозяину не нравится и будет делать ошибки.
Подбор материалов для обучения — это самый сложный и самый значащий фактор.

Goury ★★★★★
(19.09.15 11:12:45 MSK)

Ответ на: комментарий от zamazan4ik 19.09.15 09:18:49 MSK

В шашки проще должно быть, в шахматы интересней.
Хочешь интересной задачи — заставь учитсья её играть в шахматы саму с собой

Goury ★★★★★
(19.09.15 11:15:20 MSK)

Ссылка

Ответ на: комментарий от peregrine 19.09.15 02:28:15 MSK

на простой сложности

И на сложной простоте тоже

~~ambiguousnick~~
(19.09.15 11:33:07 MSK)

Ссылка

А что в этом году за взрыв интереса к нейронкам и ИИ произошел?

vazgen05 ★★★
(19.09.15 11:40:07 MSK)

Ответ на: комментарий от vazgen05 19.09.15 11:40:07 MSK

Не в этом году и даже не в этом десятилетии. Дешёвые gpu и множество наработок позволяют использовать сети куда большему количеству человек.

Solace ★★
(19.09.15 12:06:19 MSK)

Ссылка

Реально ли в таких случаях научить нейронную сеть правильно играть?

Да, например, самоорганизующаяся карта Кохонена © применяется для поиска закономерностей в больших массивах данных.

quickquest ★★★★★
(19.09.15 12:11:30 MSK)

Ссылка

Ответ на: комментарий от Goury 19.09.15 01:17:03 MSK

Нейронки тупые в том плане, что сами они что-нибудь новое придумать не могут в принципе.

Могут, если в тупиковых ситуациях задействовать случайный выбор. Например, если робот понял, что шагая с оптимальным импульсом толчков ногами он не может выбраться из 2D лабиринта, то включив случайный импульс ног, он может случайно выпрыгнуть из него, возможно, через «мильёны» попыток или лет :)

Для робота новизна — это случайная удача, закреплённая в «памяти удач». А эволюция — иерархическая система таких удач.

P.S. SOINN — один из примеров.

quickquest ★★★★★
(19.09.15 12:13:24 MSK)

Ответ на: комментарий от quickquest 19.09.15 12:13:24 MSK

Например, если робот понял, что шагая с оптимальным импульсом толчков ногами он не может выбраться

Что означает в данном контексте «понял»? Как происходит это понимание?

~~ambiguousnick~~
(19.09.15 12:24:05 MSK)

Ответ на: комментарий от ambiguousnick 19.09.15 12:24:05 MSK

Что означает в данном контексте «понял»? Как происходит это понимание?

Понял — обошёл весь лабиринт, но не вышел, зациклился. В этот момент (например, по переполнению счётчика числа обходов лабиринта) включаются случайные действия, не предусмотренные в штатном режиме.

quickquest ★★★★★
(19.09.15 12:29:24 MSK)

Ответ на: комментарий от quickquest 19.09.15 12:29:24 MSK

Это нельзя называть пониманием. Это заранее заложенное детерминированное поведение. Банальщина. Обычная программа, ничего особенного.

~~ambiguousnick~~
(19.09.15 12:33:59 MSK)

Ответ на: комментарий от ambiguousnick 19.09.15 12:33:59 MSK

Это нельзя называть пониманием.

Твоё определение понимания — в студию!

Это заранее заложенное детерминированное поведение. Банальщина.

Жизнь хомо сапиенсов — аналогичная банальщина, с поведением, заложенным в ДНК и модифицируемым внешними случайными условиям.

Обычная программа, ничего особенного.

Дык, это можно сказать про любую программу :)

quickquest ★★★★★
(19.09.15 12:46:39 MSK)

Ответ на: комментарий от Goury 19.09.15 11:12:45 MSK

Насколько сложно организовать игру нейронки самой с собой? Чтобы она самообучалась?

zamazan4ik ★★
(19.09.15 12:56:46 MSK) автор топика

Ответ на: комментарий от quickquest 19.09.15 12:46:39 MSK

Твоё определение понимания — в студию!

Допустим, ты просишь кого-то пойти в какую-то комнату, и посчитать стулья. Ты не говоришь ему, «считай считай стулья, а когда они кончатся остановись, и возвращайся с результатом», человек сам понимает, когда ему остановиться. Вот это и есть примитивный случай понимания.

Жизнь хомо сапиенсов — аналогичная банальщина, с поведением, заложенным в ДНК и модифицируемым внешними случайными условиям.

Весьма узкий взгляд.

Дык, это можно сказать про любую программу

Вряд ли. Напомню, что нейронные сети — это самообучающиеся программы. А то что ты тут приводишь — это обычные ветвления.

~~ambiguousnick~~
(19.09.15 13:01:25 MSK)

Ответ на: комментарий от quickquest 19.09.15 12:46:39 MSK

Твоё определение понимания — в студию!

Что за интерес кормить шизофреника, тем более в сезон. Оно же сейчас всю тему загадит.

anonymous
(19.09.15 13:13:15 MSK)

Ссылка

Ответ на: комментарий от ambiguousnick 19.09.15 13:01:25 MSK

Понять - это означает найти модель наблюдаемого явления, которая обладает объяснительной и предсказательной силой, а также может быть использована в корыстных целях.

Говорить о нейронных сетях, как о самообучающихся программах - это как бы да, но нет. Истинное самообучение - это reinforcement learning. А в нем NN - никто. С натяжкой самообучением NN можно назвать unsupervised learning, но тут опять материал для кластеризации готовит обучающий.

rubic ★
(19.09.15 13:22:35 MSK)

Ссылка

Ответ на: комментарий от ambiguousnick 19.09.15 13:01:25 MSK

человек сам понимает, когда ему остановиться.

Человек сам понимает и останавливается, когда в голове срабатывает триггер уже учтённого стула. Нет отличий от робота.

Весьма узкий взгляд.

Алгоритм «божественной души» — в студию! :)

Напомню, что нейронные сети — это самообучающиеся программы. А то что ты тут приводишь — это обычные ветвления.

Напомню, что самообучение нейронных сетей — обычные множественные параллельные ветвления, с ограничениями, заданными аппаратно архитектурой сети и программно целевой функцией.

quickquest ★★★★★
(19.09.15 13:23:26 MSK)

Я не специалист, но считаю, что нейросеть плохо подойдёт для решения поставленной задачи. Потому что при игре в дурака применяются в чистом виде логические расссуждения и подсчёт вероятностей, то есть, именно то, с чем нейросеть справляется относительно плохо. Надо использьзовать какие-нибудь разновидности минимакса с построением дерева возможных ситуаций и назначением вероятностей.

Deleted
(19.09.15 13:30:26 MSK)

Ответ на: комментарий от quickquest 19.09.15 13:23:26 MSK

Человек сам понимает

Угу, причем в днк ты не найдешь программы подсчета стульев. А сам днк, внезапно, мутирует, в отличии от твоей фигни if-else-then.

в студию! :)

не ясно, что ты имеешь в виду, но волюнтаризм теперь подкреплен квантовой неопределенностью. Это ли ни есть наилучшее доказательство.

~~ambiguousnick~~
(19.09.15 13:30:47 MSK)

Ответ на: комментарий от ambiguousnick 19.09.15 13:30:47 MSK

А сам днк, внезапно, мутирует, в отличии от твоей фигни if-else-then.

Мутация ДНК — это if успех then живём_далее else мутируем_или_умираем.

волюнтаризм теперь подкреплен квантовой неопределенностью

В нашем контексте философия ортогональна как к квантовой физике, так и к программированию.

quickquest ★★★★★
(19.09.15 13:42:37 MSK)

Ответ на: комментарий от quickquest 19.09.15 13:42:37 MSK

Мутация ДНК — это if успех then живём_далее else мутируем_или_умираем.

Твоя программа не мутирует, а днк — мутирует, вот в чем различие. Развитие генотипа и фенотипа особи недетерминировано.

~~ambiguousnick~~
(19.09.15 13:45:32 MSK)

Ответ на: комментарий от zamazan4ik 19.09.15 09:18:49 MSK

Тупо у тебя на нейронку уйдёт больше времени.

peregrine ★★★★★
(19.09.15 13:54:07 MSK)

Ссылка

Ответ на: комментарий от ambiguousnick 19.09.15 13:45:32 MSK

Твоя программа не мутирует, а днк — мутирует, вот в чем различие.

Дык, это наипростейший пример только для понимания. Никто не мешает написать самомодифицирующуюся программу (привет лисперы! :)).

И эксперименты с аппаратной модификацией (мутацией) нейросетей тоже проводились.

Развитие генотипа и фенотипа особи недетерминировано.

Недетерминированость — следствие исключительно внешнего воздействия на ДНК (химия, радиация, ...).

quickquest ★★★★★
(19.09.15 13:57:01 MSK)

Ответ на: комментарий от quickquest 19.09.15 13:57:01 MSK

следствие исключительно внешнего воздействия на ДНК (химия, радиация, ...).

Во первых, это не важно. Во-вторых это все можно обобщить — условно «неблагоприятные» условия. Или даже просто *условия*. Тут важен вопрос не почему это происходит, а тот факт, что это возможно, что гены имеют данные свойства. Причем, что интересно, где тот момент, когда непосредственно происходит *принятие решения* о модификации? Нет такого момента. Это просто происходит.

~~ambiguousnick~~
(19.09.15 14:07:04 MSK)

Ответ на: комментарий от ambiguousnick 19.09.15 13:45:32 MSK

Мутирующие нейронки - не новость.

Solace ★★
(19.09.15 14:08:32 MSK)

Ссылка

Ответ на: комментарий от quickquest 19.09.15 12:13:24 MSK

А вот бить дерево до тех пор пока не получатся брёвна, переплавить брёвна в доски, сделать из досок кирку, бить киркой камни пока не получатся камни, сделать из досок и камней новую кирку, бить камни новой киркой пока не получится железная руда и уголь, построить из камней печку, переплавить углём в печке железную руду в железо, сделать из железа и досок железную кирку и железной киркой сделать проход в лабиринте оно уже не придумает.

Мораль: не пори херню, алгоритмов изобретательства для нейронок не существует даже в теории на сегодняшний день. То, что робот для дурака сможет научиться раскладывать пасьянсы и может быть сливать в покер — не достижение. Вот когда робот для похода за пивом научится хотя бы варить это самое пиво — тогда и будет о чём говорить.

Goury ★★★★★
(19.09.15 14:21:07 MSK)

Ответ на: комментарий от zamazan4ik 19.09.15 12:56:46 MSK

На ~30% сложнее чем организовать игру с живым человеком.
Не слишком сложно.
Для лучшего обучения надо заложить немного рандома в обучающую часть и не забывать доучивать её тоже.

Goury ★★★★★
(19.09.15 14:22:50 MSK)

Ссылка

Ответ на: комментарий от ambiguousnick 19.09.15 13:01:25 MSK

нейронные сети — это самообучающиеся программы

Довольно некорректное определение.
Во-первых нейронная сеть это не программа, программы это отдельные нейроны и управляющие детали.
Во-вторых самообучаемость это не обязательная черта нейронки. Рыбы и черки это тоже нейронные сети, но нихрена они ничему не обучаются: как родились с матрицей данных так и живут с ней всю жизнь.

Goury ★★★★★
(19.09.15 14:25:32 MSK)

Ответ на: комментарий от Goury 19.09.15 14:21:07 MSK

А вот бить дерево до тех пор пока не получатся брёвна, переплавить брёвна в доски, сделать из досок кирку, бить киркой камни пока не получатся камни, сделать из досок и камней новую кирку, бить камни новой киркой пока не получится железная руда и уголь, построить из камней печку, переплавить углём в печке железную руду в железо, сделать из железа и досок железную кирку и железной киркой сделать проход в лабиринте оно уже не придумает.

Относительно недавно выяснили, что при переходе к более сложным орудиям труда у человека начало работать правое полушарие, как композитор всего мозга.
Несостоятельность нейронных цепей - вопрос конструктивной сложности мозга. Не вопрос самой концепции сети.

Solace ★★
(19.09.15 14:32:39 MSK)

Ссылка

Ответ на: комментарий от Goury 19.09.15 14:25:32 MSK

Рыбы и черки это тоже нейронные сети, но нихрена они ничему не обучаются: как родились с матрицей данных так и живут с ней всю жизнь.

Давно это было, в детстве, был у меня аквариум, и, если я ничего не путаю, рыбки нарабатывали условный рефлекс, по стуку, они плыли к кормушке.

~~ambiguousnick~~
(19.09.15 14:40:44 MSK)

Ответ на: комментарий от ambiguousnick 19.09.15 14:40:44 MSK

У тебя, вестимо, были особо умные рыбы.

Goury ★★★★★
(19.09.15 14:43:47 MSK)

Ответ на: комментарий от Goury 19.09.15 14:43:47 MSK

откуда вообще инфа? давай пруф

есть даже книга вот

http://www.twirpx.com/file/775685/

~~ambiguousnick~~
(19.09.15 14:50:10 MSK)

Ссылка

Ответ на: комментарий от ambiguousnick 19.09.15 14:07:04 MSK

Причем, что интересно, где тот момент, когда непосредственно происходит *принятие решения* о модификации?

«Принятие решений» непосредственно происходит репликационной вилкой.

алгоритмов изобретательства для нейронок не существует даже в теории на сегодняшний день.

Сложных пока нет (знаний и ресурсов у человечества маловато), простых — куча: любая кластеризация «без учителя» — «изобретение».

Вот когда робот для похода за пивом научится хотя бы варить это самое пиво — тогда и будет о чём говорить.

Это задача не для роботов (пиво им ненужно), а для тебя, неумеющего сотворить «алгоритм хождения за пивом» из простых шагов :)
«Переход количества в качество» — не только философская категория, но и один их способов решения задач.

quickquest ★★★★★
(19.09.15 15:55:48 MSK)

Ответ на: комментарий от quickquest 19.09.15 15:55:48 MSK

Нормально ты процитировал, молодец.

~~ambiguousnick~~
(19.09.15 15:59:42 MSK)

Ссылка

Ответ на: комментарий от Deleted 19.09.15 13:30:26 MSK

получается, в играх нейронные сети неприменимы? Или в каких играх они могут применяться?

Да и вообще, может кто-нибудь расписать, какие наиболее перспективные направления применения нейросети?

zamazan4ik ★★
(19.09.15 16:06:04 MSK) автор топика

Похожие темы