Почему нейросети такие?

machine learning, нейронные сети, я познаю мир

0

0

Смотрю я на новую нейросеть ruDALL-E от Сбера. Она генерирует либо какие-то смазанно-пластилиновые изображения, либо искажает текст до невозможности. Собственно, а почему так нейросети делают? Во втором даже немного угадывается оригинальное изображение, на котором обучали нейросеть. Ладно, человеческий мозг. Но это же компьютер. До нейросетей изображения генерировались по примитивным алгоритмам. А сейчас генерация изображения похожа на результат работы человеческого мозга.

Ссылка

←	Чем отличается STM32Fn от STM32Ln?

собрать пакет на основании /var/lib/dpkg

→

← 1 2 3 →

~~fernandos~~ https://i.ibb.co/kMJy0f9/Screenshot-2021-11-03-at-10-50-15-Russian-DALL-E.png

~~LikeABoss~~
(03.11.21 07:51:10 MSK) автор топика

IMHO основная проблема нейросетей — это объём и качество данных для их тренировок. Если тренировочных данных мало, то соответственно начинается «лажа». Особенно интересны редкие кейсы, которые редкие, соответственно входных данных нужно не просто много, а на порядки больше.

Evgueni ★★★★★
(03.11.21 08:19:09 MSK)
Последнее исправление: Evgueni 03.11.21 08:20:10 MSK (всего исправлений: 1)

Это скорее результат работы мозга под мощными такими грибами, все мажет, не видно ниче. А вообще от этих картинок у меня какой то эффект зловещей долины

karton1 ★★★★★
(03.11.21 08:38:00 MSK)

Ответ на: комментарий от LikeABoss 03.11.21 07:51:10 MSK

Похож.

ashot ★★★★
(03.11.21 09:20:38 MSK)

Ссылка

У меня он вот таким получился:
https://pic4a.ru/111/nAy.jpg
Вбил «Фернандос» по-русски.

ashot ★★★★
(03.11.21 09:30:55 MSK)

Ответ на: комментарий от ashot 03.11.21 09:30:55 MSK

Представил, как оно говорит «если бы Вы были поумнее…»

~~LikeABoss~~
(03.11.21 09:35:00 MSK) автор топика

Ссылка

Ответ на: комментарий от ashot 03.11.21 09:30:55 MSK

Чем-то на Ларри Эллисона смахивает.

Shadow ★★★★★
(03.11.21 09:44:00 MSK)

Ссылка

Собственно, а почему так нейросети делают?

Если ты работаешь с формой и не ведёшь работы со смыслом то наивно ожидать другого результата.

sin_a ★★★★★
(03.11.21 10:14:06 MSK)

«Всемирное потепление. Грета Тунберг. Мы все утонем.»
https://pic4a.ru/111/J8T.jpg

ashot ★★★★
(03.11.21 10:23:58 MSK)

Ссылка

https://rudalle.ru/check_image/34d5e85689c54034b7e7f40e6aa92aab/%D0%9B%D1%8F%D1%81%D1%8C%D0%BA%D0%B8-%D0%BC%D0%B0%D1%81%D1%8F%D1%81%D1%8C%D0%BA%D0%B8/

Ну а че, норм.

Zhbert ★★★★★
(03.11.21 10:52:22 MSK)

А нейросети по-твоему - это какие-то крутые алгоритмы?

xmikex ★★★★
(03.11.21 11:04:50 MSK)

Ссылка

Ответ на: комментарий от Zhbert 03.11.21 10:52:22 MSK

ляськи-масяськи

Как-то именно так я их себе и представлял.

Nervous ★★★★★
(03.11.21 11:08:57 MSK)

Ответ на: комментарий от Nervous 03.11.21 11:08:57 MSK

Как-то именно так я их себе и представлял.

Ага, хорошо сработала.

Zhbert ★★★★★
(03.11.21 11:10:04 MSK)

Ответ на: комментарий от Zhbert 03.11.21 11:10:04 MSK

Иногда действительно крутые результаты выдаёт.

https://rudalle.ru/share_image/23

~~fernandos~~ ★★★
(03.11.21 11:13:18 MSK)

Ссылка

сейчас генерация изображения похожа на результат работы человеческого мозга

Потому что нейросети и являются моделями мозга. /thread

no-such-file ★★★★★
(03.11.21 11:14:55 MSK)

Ссылка

Ответ на: комментарий от Evgueni 03.11.21 08:19:09 MSK

Нет. Основная проблема в том что они плохо обобщают в сравнении с головой и не фантазируют (хотя это решаемо частично и является одним из самых сильных методов машинного обучения, когда мало данных или есть редкие случаи, гуглить в сторону генерации синтетических данных для обучения). Хотя насколько я знаю, поскольку синтетика генерируется относительно равномерно обычно по всей выборке, т.к. её не нейронка генерит так как надо, а человек так как придумал генерить на основе векторного пространства признаков, то не всё так хорошо (например для каких-то редких данных было бы логичнее генерить больше похожей синтетики и т.д.).

peregrine ★★★★★
(03.11.21 11:15:47 MSK)

Ответ на: комментарий от sin_a 03.11.21 10:14:06 MSK

Смысл у тебя в голове тоже с формы получается. Просто масштаб вычислений и сложность вычислителя на порядки отличаются.

peregrine ★★★★★
(03.11.21 11:17:17 MSK)

Ответ на: комментарий от Zhbert 03.11.21 10:52:22 MSK

А нету где инструкции как это развидеть?

apt_install_lrzsz ★★★
(03.11.21 11:17:30 MSK)

Ответ на: комментарий от peregrine 03.11.21 11:15:47 MSK

Проблема с редкими данными, что они редкие — де факто основные систематики из-за этой неизвестности (не понятно где эти самые редкие данные брать дабы их размножить) и вылезают.

Evgueni ★★★★★
(03.11.21 11:18:30 MSK)

Ответ на: комментарий от Evgueni 03.11.21 11:18:30 MSK

Проблема с редкими данными, что они редкие

Нету никакой проблемы с редкими данными именно потому, что они редкие и их можно не учитывать. Суть нейросетей заключается в обобщении данных как бы.

no-such-file ★★★★★
(03.11.21 11:21:49 MSK)

Ответ на: комментарий от peregrine 03.11.21 11:17:17 MSK

Ну, то есть ты можешь конечно нарастить мощности чтобы нейросети сами понимали смысл того, с чем имеют дело, но немного дешевле было бы немного поработать и формализовать модель.

sin_a ★★★★★
(03.11.21 11:23:27 MSK)

Ответ на: комментарий от no-such-file 03.11.21 11:21:49 MSK

Для того, чтобы условно нарисовать что-то с 10% точностью редкие данные не нужны, но если хочется «точности» 1%, то придётся учитывать все 0.1% вклады, а в случае 0.1% не только 0.01% вклады, но и их корреляции в обязательном порядке. Как-то так.

Evgueni ★★★★★
(03.11.21 11:24:51 MSK)

Ответ на: комментарий от Evgueni 03.11.21 11:18:30 MSK

Не, тут не всё так тривиально как ты хочешь видеть. Представь себе что у тебя есть нейронка, которая распознаёт лица, но не по ключевым точкам которые люди научились находить и выделять в предобработке, а более тупо, по картинке без предобработки и поиска критически важных точек людьми (ну и эвристикой разумеется на реальных данных). И представь себе что каждый сотый человек у тебя с пирсингом на роже, а каждый 500 с татушкой на роже, а ещё может быть клоун в гриме раз в 5000 человек, при этом в обучающую выборку попало 5 клоунов (25 000 фото выборка пускай). Если человек никогда не видел людей с пирсингом или тату или в клоунском гриме, то он без проблем скажет, что на фото человек, а с нейронкой придётся много и долго возиться, подгоняя под неё данные по каким-то более специфичным признакам, хотя человек просто может наложить в голове грим на лицо и понять что у нас тут лицо. А вот нейронка так никогда принципиально сделать не сможет, по крайней мере в том виде, в котором они сейчас есть и применяются, просто потому что не умеет работать с такими сложными абстракциями.

peregrine ★★★★★
(03.11.21 11:30:29 MSK)
Последнее исправление: peregrine 03.11.21 11:31:02 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от no-such-file 03.11.21 11:21:49 MSK

На одном обобщении далеко не уедешь. Погрешность в 1% маленькая, но если нейронка в утопичном мире будет управлять ядерным реактором и ошибаться в 1% случаев, взрывая его, то мало не покажется. Как раз таки и хочется чтобы она не просто обобщала, а умела корректно работать со всеми данными, тем более в реальности небольшого числа похожих объектов вполне хватает чтобы выделить под них отдельный класс, а вот нейронки так не умеют, точнее умеют, но плохо, проигрывая людям очень-очень сильно.

peregrine ★★★★★
(03.11.21 11:35:55 MSK)

Ответ на: комментарий от sin_a 03.11.21 11:23:27 MSK

Ну вот например наше с тобой общение пока никто не придумал как формализовать. Много какие задачи мы вообще формализовать не можем, например ИИ. Что говорить, мы даже критерии к нему не можем предъявить.

peregrine ★★★★★
(03.11.21 11:37:50 MSK)

Ответ на: комментарий от peregrine 03.11.21 11:37:50 MSK

И как на небо пока никто не придумал как полететь… Много чего мы вообще не можем.

например ИИ. Что говорить, мы даже критерии к нему не можем предъявить.

Трудно предъявить критерии к случайному набору случайных слов. Хотя да, как показал предыдущий оратор, «Ляськи-масяськи» нейросеть осилила и даже успешно.

sin_a ★★★★★
(03.11.21 11:48:49 MSK)

Ссылка

Ответ на: комментарий от Evgueni 03.11.21 11:24:51 MSK

придётся учитывать все 0.1% вклады, а в случае 0.1% не только 0.01% вклады

Это так не работает. Если ты будешь пихать больше специальных данных в нейросеть, то произойдёт переобучение и сетка вместо обобщения будет тупо запоминать кейсы. На тестовом наборе всё будет ок, но на реальных данных она обосрётся и точность будет ниже чем без «0.01% вкладов».

no-such-file ★★★★★
(03.11.21 11:58:29 MSK)
Последнее исправление: no-such-file 03.11.21 11:58:48 MSK (всего исправлений: 1)

Ответ на: комментарий от karton1 03.11.21 08:38:00 MSK

Под слабыми грибами. Например пространство пока ещё всего лишь трехмерно, не видно суперпозицию на макроуровне

~~vertexua~~ ★★★★★
(03.11.21 12:02:33 MSK)
Последнее исправление: vertexua 03.11.21 12:03:04 MSK (всего исправлений: 2)

Ответ на: комментарий от peregrine 03.11.21 11:35:55 MSK

проигрывая людям очень-очень сильно

Потому что у людей сетки в мозге объединены в комплексы, работа которых на метауровне происходит с помощью символов (языка). Ждём когда структуралисты смахнут пыль с ЛИСПа и Пролога, да.

no-such-file ★★★★★
(03.11.21 12:02:53 MSK)

Ссылка

Ответ на: комментарий от no-such-file 03.11.21 11:58:29 MSK

Не «переобучение», а возникновение случайных корреляций. Это тоже следствие «редких данных».

Evgueni ★★★★★
(03.11.21 12:04:19 MSK)

Ладно, человеческий мозг.

Что человеческий моск? В части зрения точно развивался миллионы лет. Что ты хочешь от нейросетей, которые появились в эволюционном смысле «только что»? «Шоткатнуть» развитие без выживательного отбора в дикой саванне получится не так быстро как хотелось бы :)

slackwarrior ★★★★★
(03.11.21 12:05:55 MSK)