LINUX.ORG.RU

Да что вы носитесь с этими «точками»? В мире не происходит ничего более интересного?

Stahl ★★☆
()

Матч остался за компьютером

Искренне рад. Не всё ещё потеряно - надо на допинг AlphaGo проверить!

ChudoYudo
()
Ответ на: комментарий от Harald

процессор оверклокнутый был!

Вон оно как - не спортивно! Мне ещё показалось, что ему второй процессор подсказывает, не заявленный. Вот если бы у Ли была помощь ЛОРа, то всё могло сложиться иначе ...

ChudoYudo
()
Ответ на: комментарий от aidan

Войны, революции и прочий нацпол.

Предлагаю матч:

Армия роботов гугла, управляемая ИИ, против армии США. Вот это веселее будет.

Deleted
()

Просто AlphaGo понял, что выиграл турнир и дальше играл на расслабоне, не заботясь о счёте )).

dotcoder ★★★★★
()
Ответ на: комментарий от Deleted

Может, в брокерских конторах попросили? В комментариях писали, что программа не нашла лучших вариантов.

Sakka
() автор топика
Ответ на: комментарий от Sakka

Ну, комментарии форумных спицалистов они, конечно, ценны, но не официальны. Я, например, увидел во всём этом фундаментальную проблему неправильности самого подхода к машинному обучению. Хоть и не являюсь даже и близко специалистом, но икспертное мнение представить могу.

Deleted
()
Ответ на: комментарий от Deleted

Ты про это?

Если судить по словам разработчиков, то первая ошибка (на 79 ходу) — это ошибка именно value network. AlphaGo некорректно оценивала свою позицию, как выигрышную, вплоть до 87 хода.

А вот дальнейшие «ошибки» это уже видимо следствие алгоритма MCTS и методики обучения. AG проигрывала небольшое количество очков (по оценкам комментатаров в пределах коми) и на столе были возможности отыграть там пару, там пару и может быть в отдаленной концовке удалось бы уравнять, особенно если навязать сложный ко-файт. Но сети AlphaGo были обучены только на бинарную оценку (победа/поражение), потому уменьшение отставания для нее не было приоритетом (грубо говоря, она не видала разницы между поражением в 20 и в 1 очко). Потому при анализе дерева отдавалось предпочтение ветвям, которые в пределах просчета давали видимые шансы именно на победу. Для наступления такой победы требовались маловероятные (крайне ошибочные) ответные ходы от Ли Седоля, но алгоритм из-за своей архитектуры отдавал предпочтение таким ветвям перед более безопасными, но не дающими очевидных шансов. Вот и получился тот набор ошибок AI в конце, когда тот играл «детские» ходы (а по сути в надежде на детскую ошибку оппонента), которые Ли Седоль тут же наказывал.

https://geektimes.ru/post/272534/#comment_9093004

mandala ★★★★★
()
Ответ на: комментарий от Solace

Сформировать точную оценку позиции, сложнее, чем просто выигрыш/проигрыш. И рассчёты вести сложнее — при простом выигрышь/проигрышь «плохие» ветви просто отсекаются, а так будут участвовать в рассчётах. В общем, инженеры гугла не дураки: раз выбрали более простой способ рассчёта, значит на то была причина.

Впрочем, я исхожу из предоставленных мне местными аналитиками данных, а они могут быть ошибочными.

next_time ★★★★★
()
Последнее исправление: next_time (всего исправлений: 1)

Круто. Это же какие перспективы открываются. Кому интересно как смотреть на то как регулярно выигрывает машина. А теперь оказалось что люди просто плохо играют, может с популяризацией го, будет и уровень мастеров расти. Надеюсь, все не подстроено.

Esteban_Garcia
()
Ответ на: комментарий от mandala

Эпл c гуглом как бы давно ведут эту партию в го. не зря же телефоны белые и черные бывают. Люди — это клетки. Если на человеке стоит андроид телефон, то айфон туда не поставить. Если окружить человека с андроидом людьми с айфонами и не оставить воздуха, то андроид-телефон снимается.

Esteban_Garcia
()
Ответ на: комментарий от next_time

1) Это небольшая сетка, она работает с метаинформацией о ходах. 2) Обучение не волнует, а применение как мы видели практически реалтайм (кроме монтекарло просчета).

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

1) отсортировать уже непросто на столь большой выборке

2) отсортированные ветви всё равно нужно обрабатывать

next_time ★★★★★
()

Обещают игру в старткрафт, вот это уже будет более менее прорыв, можно будет говорить что ИИ гугла способен состязаться с людьми в разных других областях.

reality_hacker
()
Ответ на: комментарий от Deleted

ну игра такая что кол-во вариаций гигантское, поэтому ветвиться далеко нельзя. вся игра построена на паттернах т.е. как уже кто-то когда-то играл. просто программа не знала о такой вариации которую сыграл седол и думала что это не страшно. Потому что училась она не на профессиональных партиях, а на любительских доступных нахаляву в интернете - видимо гугл решил не париться с покупкой профессиональных баз ибо надеялись что обучение на игре с собой всё равно сыграет бОльшую роль. тут видимо какой-то глюк, в результате которого вариации такого варианта не рассматривались слишком глубоко, поэтому об ошибке игра догадалась слишком поздно, когда уже нельзя было ничего изменить.

после этого выиграть с ее точки зрения было невозможно, поэтому играла как попало. Все ходы ведут к поражению, а значит одинаково «хороши» с ее точки зрения - минимизировать очки проигрыша ее просто не научили. логично было бы сдаться, но критерий сдачи слишком занижен.

вообще эта игра была именно тем что пытались получить организаторы матча. у них был профессионал довольно низкого уровня, который не мог ввиду своего низкого ранга как-то напрячь движок. потому и договорились (не просто так конечно) о матче с топовым игроком - чтобы потестить на пределе возможностей. видимо так вышло, что просто нельзя найти эти глюки, не играя лучше чем сама программа...

вообще думаю, что само устройство алгоритма таково что прыгнуть выше профессионалов-людей почти невозможно. дело в том что на топовом уровне игры выигрываются инновационными ходами, которые никто никогда не использовал - тогда оппонент не может полностью просчитать все вариации и не знает как там играть, поэтому делает ошибки. программа должна сама придумывать такие ходы но т.к. она обучается на существующих партиях, нестандартные ходы просто не рассматриваются как валидные. а чтобы выиграть, нужны нестандартные ходы.

конечно, какие-то нестандартные приемы всё же имеются - из самообучения, но вот видеть и анализировать нестандартные ходы оппонента ее видимо не научили. дело в том что при анализе вариаций алгоритм использует тот же принцип, по кторому отбираются «осмысленные» ходы - ходы которые когда-то играли в партиях на которых сеть обучалась (или полученные из самообучения), то есть все нестандартные ходы нейронная сеть вообще не видит - ни как вариант для себя, ни когда их ходит оппонент, то есть даже в вариациях они, видимо, отсекаются. хотя это лишь предположение на основе того что рассказывали об алгоритме публично.

olegsov
()
Последнее исправление: olegsov (всего исправлений: 2)
Ответ на: комментарий от olegsov

Вот это и есть проблема. Я просто поражён, неужели даже в такой сложной программе тупо патерны и числовые рейтинги? Неужели всё тупо держится на гигагерцах, ядрах и раме, а внутре у ней начина от какогонить KiGo?

Deleted
()
Ответ на: комментарий от Deleted

нет конечно. внутри гигантская нейронка, обученная сначала на партиях доступных нахаляву. а потом на самообучении (миллионы игр с собой с применением рандомайзера дабы находить какие-то новые вариации, не виденные ранее). Именно за счет этого самообучения и найдены нестандартные ходы, которыми были выиграны первые 3 партии.

эта нейронка отличает осмысленные ходы от бессмысленных при переборе вариантов ходов. Эта же нейронка используется для анализа вариаций ответов оппонента (то есть для отсечения веток для минимизации размеров дерева, чтобы можно было как-то его посчитать в разумные сроки). поэтому вариации с нестандартными (но хорошими) ходами тоже не рассматриваются, кроме тех которые вновь найдены во время самообучения (маловероятно что их кто-то будет использовать перед тем как увидят в исполнении этого движка).

т.е. основное слабое место алгоритма - игнорирование сильных нестандартных ходов оппонента. По моему скромному мнению, конечно.

olegsov
()
Ответ на: комментарий от olegsov

игнорирование сильных нестандартных ходов оппонента.

А по моему, не игнорирование, а отсутствие такой штуки в алгоритме. И именно эта штука могла бы приравнивать сильноразвитый компьютер к ИИ. А так, просто сильноразвитая перечислялка ходов с рандомайзером для придания солидности. Я тут и на KiGo шпилюсь и компу по чёрному вдуваю :)

Это, конечно, тоже только моё скромное мнение.

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.