Да что вы носитесь с этими «точками»? В мире не происходит ничего более интересного?

~~Stahl~~ ★★☆
(13.03.16 15:06:32 MSK)

Ответ на: комментарий от Stahl 13.03.16 15:06:32 MSK

Вот захватит гугл всю вселенную, тогда будут «точки».

mandala ★★★★★
(13.03.16 15:18:08 MSK)

Ответ на: комментарий от Stahl 13.03.16 15:06:32 MSK

Ну-с, поведай же нам, что интересного происходит в мире?

h31 ★★★★
(13.03.16 15:24:17 MSK)

Матч остался за компьютером

Искренне рад. Не всё ещё потеряно - надо на допинг AlphaGo проверить!

ChudoYudo ★
(13.03.16 15:25:32 MSK)

Есть к чему стремиться

~~sudopacman~~ ★★★★★
(13.03.16 15:28:00 MSK)

Ссылка

Ответ на: комментарий от ChudoYudo 13.03.16 15:25:32 MSK

процессор оверклокнутый был!

Harald ★★★★★
(13.03.16 15:52:35 MSK)

Ответ на: комментарий от Harald 13.03.16 15:52:35 MSK

процессор оверклокнутый был!

Вон оно как - не спортивно! Мне ещё показалось, что ему второй процессор подсказывает, не заявленный. Вот если бы у Ли была помощь ЛОРа, то всё могло сложиться иначе ...

ChudoYudo ★
(13.03.16 16:25:27 MSK)

Ссылка

Ответ на: комментарий от h31 13.03.16 15:24:17 MSK

Ну-с, поведай же нам, что интересного происходит в мире?

Войны, революции и прочий нацпол.

aidan ★★★★
(13.03.16 16:33:19 MSK)

Ответ на: комментарий от aidan 13.03.16 16:33:19 MSK

Войны, революции и прочий нацпол.

Предлагаю матч:

Армия роботов гугла, управляемая ИИ, против армии США. Вот это веселее будет.

Deleted
(13.03.16 16:51:25 MSK)

Ссылка

Просто AlphaGo понял, что выиграл турнир и дальше играл на расслабоне, не заботясь о счёте )).

dotcoder ★★★★★
(13.03.16 16:54:10 MSK)

Ссылка

А почему этот Альфа дурковать посреди матча начал, не объяснили ещё?

Deleted
(13.03.16 17:01:38 MSK)

Ответ на: комментарий от Deleted 13.03.16 17:01:38 MSK

Может, в брокерских конторах попросили? В комментариях писали, что программа не нашла лучших вариантов.

Sakka ★
(13.03.16 17:38:08 MSK) автор топика

Ответ на: комментарий от Sakka 13.03.16 17:38:08 MSK

Ну, комментарии форумных спицалистов они, конечно, ценны, но не официальны. Я, например, увидел во всём этом фундаментальную проблему неправильности самого подхода к машинному обучению. Хоть и не являюсь даже и близко специалистом, но икспертное мнение представить могу.

Deleted
(13.03.16 17:48:13 MSK)

Ссылка

Ответ на: комментарий от Deleted 13.03.16 17:01:38 MSK

Ты про это?

Если судить по словам разработчиков, то первая ошибка (на 79 ходу) — это ошибка именно value network. AlphaGo некорректно оценивала свою позицию, как выигрышную, вплоть до 87 хода.
А вот дальнейшие «ошибки» это уже видимо следствие алгоритма MCTS и методики обучения. AG проигрывала небольшое количество очков (по оценкам комментатаров в пределах коми) и на столе были возможности отыграть там пару, там пару и может быть в отдаленной концовке удалось бы уравнять, особенно если навязать сложный ко-файт. Но сети AlphaGo были обучены только на бинарную оценку (победа/поражение), потому уменьшение отставания для нее не было приоритетом (грубо говоря, она не видала разницы между поражением в 20 и в 1 очко). Потому при анализе дерева отдавалось предпочтение ветвям, которые в пределах просчета давали видимые шансы именно на победу. Для наступления такой победы требовались маловероятные (крайне ошибочные) ответные ходы от Ли Седоля, но алгоритм из-за своей архитектуры отдавал предпочтение таким ветвям перед более безопасными, но не дающими очевидных шансов. Вот и получился тот набор ошибок AI в конце, когда тот играл «детские» ходы (а по сути в надежде на детскую ошибку оппонента), которые Ли Седоль тут же наказывал.

https://geektimes.ru/post/272534/#comment_9093004

mandala ★★★★★
(13.03.16 17:48:33 MSK)

Ответ на: Ты про это? от mandala 13.03.16 17:48:33 MSK

Навесят еще одну сетку, которая будет следить только за оценкой «глубины проигрыша» :)

psv1967 ★★★★★
(13.03.16 18:19:49 MSK)

Ответ на: комментарий от psv1967 13.03.16 18:19:49 MSK

Это потребует намного бОльших аппаратных ресурсов.

next_time ★★★★★
(13.03.16 18:54:51 MSK)

Ответ на: комментарий от next_time 13.03.16 18:54:51 MSK

Нет

Solace ★★
(13.03.16 19:10:25 MSK)

Ответ на: комментарий от Solace 13.03.16 19:10:25 MSK

Сформировать точную оценку позиции, сложнее, чем просто выигрыш/проигрыш. И рассчёты вести сложнее — при простом выигрышь/проигрышь «плохие» ветви просто отсекаются, а так будут участвовать в рассчётах. В общем, инженеры гугла не дураки: раз выбрали более простой способ рассчёта, значит на то была причина.

Впрочем, я исхожу из предоставленных мне местными аналитиками данных, а они могут быть ошибочными.

next_time ★★★★★
(13.03.16 19:40:51 MSK)
Последнее исправление: next_time 13.03.16 19:41:54 MSK (всего исправлений: 1)

Круто. Это же какие перспективы открываются. Кому интересно как смотреть на то как регулярно выигрывает машина. А теперь оказалось что люди просто плохо играют, может с популяризацией го, будет и уровень мастеров расти. Надеюсь, все не подстроено.

~~Esteban_Garcia~~
(13.03.16 20:02:09 MSK)

Ссылка

Ответ на: комментарий от mandala 13.03.16 15:18:08 MSK

Эпл c гуглом как бы давно ведут эту партию в го. не зря же телефоны белые и черные бывают. Люди — это клетки. Если на человеке стоит андроид телефон, то айфон туда не поставить. Если окружить человека с андроидом людьми с айфонами и не оставить воздуха, то андроид-телефон снимается.

~~Esteban_Garcia~~
(13.03.16 20:05:49 MSK)

Ссылка

Ответ на: комментарий от next_time 13.03.16 18:54:51 MSK

1) Это небольшая сетка, она работает с метаинформацией о ходах. 2) Обучение не волнует, а применение как мы видели практически реалтайм (кроме монтекарло просчета).

psv1967 ★★★★★
(13.03.16 23:06:34 MSK)

Ссылка

Ответ на: комментарий от next_time 13.03.16 19:40:51 MSK

Ветви будут просто отсортированы по приоритету их обработки.

psv1967 ★★★★★
(13.03.16 23:07:51 MSK)

Ответ на: комментарий от psv1967 13.03.16 23:07:51 MSK

1) отсортировать уже непросто на столь большой выборке

2) отсортированные ветви всё равно нужно обрабатывать

next_time ★★★★★
(13.03.16 23:10:22 MSK)

Ответ на: комментарий от next_time 13.03.16 23:10:22 MSK

ветви и так надо обрабатывать

psv1967 ★★★★★
(14.03.16 11:50:58 MSK)

Ссылка

Обещают игру в старткрафт, вот это уже будет более менее прорыв, можно будет говорить что ИИ гугла способен состязаться с людьми в разных других областях.

reality_hacker
(14.03.16 21:12:41 MSK)

Ссылка

Ответ на: комментарий от Deleted 13.03.16 17:01:38 MSK

ну игра такая что кол-во вариаций гигантское, поэтому ветвиться далеко нельзя. вся игра построена на паттернах т.е. как уже кто-то когда-то играл. просто программа не знала о такой вариации которую сыграл седол и думала что это не страшно. Потому что училась она не на профессиональных партиях, а на любительских доступных нахаляву в интернете - видимо гугл решил не париться с покупкой профессиональных баз ибо надеялись что обучение на игре с собой всё равно сыграет бОльшую роль. тут видимо какой-то глюк, в результате которого вариации такого варианта не рассматривались слишком глубоко, поэтому об ошибке игра догадалась слишком поздно, когда уже нельзя было ничего изменить.

после этого выиграть с ее точки зрения было невозможно, поэтому играла как попало. Все ходы ведут к поражению, а значит одинаково «хороши» с ее точки зрения - минимизировать очки проигрыша ее просто не научили. логично было бы сдаться, но критерий сдачи слишком занижен.

вообще эта игра была именно тем что пытались получить организаторы матча. у них был профессионал довольно низкого уровня, который не мог ввиду своего низкого ранга как-то напрячь движок. потому и договорились (не просто так конечно) о матче с топовым игроком - чтобы потестить на пределе возможностей. видимо так вышло, что просто нельзя найти эти глюки, не играя лучше чем сама программа...

вообще думаю, что само устройство алгоритма таково что прыгнуть выше профессионалов-людей почти невозможно. дело в том что на топовом уровне игры выигрываются инновационными ходами, которые никто никогда не использовал - тогда оппонент не может полностью просчитать все вариации и не знает как там играть, поэтому делает ошибки. программа должна сама придумывать такие ходы но т.к. она обучается на существующих партиях, нестандартные ходы просто не рассматриваются как валидные. а чтобы выиграть, нужны нестандартные ходы.

конечно, какие-то нестандартные приемы всё же имеются - из самообучения, но вот видеть и анализировать нестандартные ходы оппонента ее видимо не научили. дело в том что при анализе вариаций алгоритм использует тот же принцип, по кторому отбираются «осмысленные» ходы - ходы которые когда-то играли в партиях на которых сеть обучалась (или полученные из самообучения), то есть все нестандартные ходы нейронная сеть вообще не видит - ни как вариант для себя, ни когда их ходит оппонент, то есть даже в вариациях они, видимо, отсекаются. хотя это лишь предположение на основе того что рассказывали об алгоритме публично.

olegsov ★
(14.03.16 23:28:45 MSK)
Последнее исправление: olegsov 14.03.16 23:38:24 MSK (всего исправлений: 2)

Ответ на: комментарий от olegsov 14.03.16 23:28:45 MSK

Вот это и есть проблема. Я просто поражён, неужели даже в такой сложной программе тупо патерны и числовые рейтинги? Неужели всё тупо держится на гигагерцах, ядрах и раме, а внутре у ней начина от какогонить KiGo?

Deleted
(14.03.16 23:39:10 MSK)

Ответ на: комментарий от Deleted 14.03.16 23:39:10 MSK

нет конечно. внутри гигантская нейронка, обученная сначала на партиях доступных нахаляву. а потом на самообучении (миллионы игр с собой с применением рандомайзера дабы находить какие-то новые вариации, не виденные ранее). Именно за счет этого самообучения и найдены нестандартные ходы, которыми были выиграны первые 3 партии.

эта нейронка отличает осмысленные ходы от бессмысленных при переборе вариантов ходов. Эта же нейронка используется для анализа вариаций ответов оппонента (то есть для отсечения веток для минимизации размеров дерева, чтобы можно было как-то его посчитать в разумные сроки). поэтому вариации с нестандартными (но хорошими) ходами тоже не рассматриваются, кроме тех которые вновь найдены во время самообучения (маловероятно что их кто-то будет использовать перед тем как увидят в исполнении этого движка).

т.е. основное слабое место алгоритма - игнорирование сильных нестандартных ходов оппонента. По моему скромному мнению, конечно.

olegsov ★
(14.03.16 23:50:43 MSK)

Ответ на: комментарий от olegsov 14.03.16 23:50:43 MSK

игнорирование сильных нестандартных ходов оппонента.

А по моему, не игнорирование, а отсутствие такой штуки в алгоритме. И именно эта штука могла бы приравнивать сильноразвитый компьютер к ИИ. А так, просто сильноразвитая перечислялка ходов с рандомайзером для придания солидности. Я тут и на KiGo шпилюсь и компу по чёрному вдуваю :)

Это, конечно, тоже только моё скромное мнение.

Deleted
(15.03.16 09:29:23 MSK)

Ссылка

Ты про это?

Похожие темы