LINUX.ORG.RU

Дип лёрнинг: быстрый старт

 , ,


3

3

Есть навыки говнокодинга на разных языках. Хочется попробовать вот эти ваши нейронки и прочий дип лёрнинг. Только без мозгодробильной математики и нудных книжек. Чтобы понять на своей шкуре, что это такое и хочется ли этим заниматься. Есть ли какой-нибудь простенький курс для не очень одарённых, в котором не только теория, но и практика типа вот мы тут фигачим код и теперь нейроночка находит котиков на картинке?


Ответ на: комментарий от reprimand

/0

Да ну ладно, 3D рендереры мне удавалось самому пилить, хоть в линейной алгебре (или как оно правильно?) я — дуб дубом. Не думаю, что тут нужно быть семи пядей во лбу, чтобы что-то банальное сделать.

beaver
() автор топика

Дип лёрнинг - это не про «фигачим код», а про «берем очень много данных и скармливаем спец. вычислителю». Основная сложность - где найти эти данные и где взять спец. вычислитель. У тебя есть очень большая база котиков, у тебя есть спец. оборудование?

anonymous
()

1)Заходишь на ozon.ru 2)Набираешь в поиске «глубокое обучение» 3)ищешь через гугл или на rutracker.net сканы найденных книг

Nereus
()
Ответ на: комментарий от anonymous

У тебя есть очень большая база котиков

Я могу их загрузить с этих ваших интернетов.

у тебя есть спец. оборудование?

У меня есть комплюктер.

beaver
() автор топика
Ответ на: комментарий от Nereus

1)Заходишь на ozon.ru 2)Набираешь в поиске «глубокое обучение» 3)ищешь через гугл или на rutracker.net сканы найденных книг

Это очевидно. Но, если бы я так изучал любую тематику, я бы ничерта не добился. В своё время, например, по OpenGL были хорошие уроки от NeHe и книжка Краснова по этой теме на Delphi — без них я, может быть, совсем не разобрался в теме бы, а с ними (хоть и с трудом) въехал и писал нужный мне софт. Я потому и спрашиваю, может есть какие-то хорошие и лаконичные материалы... ну или хотя бы посоветуйте, что именно на озоне искать, ведь литературы много, но большая часть — треш.

beaver
() автор топика
Ответ на: комментарий от beaver

У тебя есть очень большая база котиков

Я могу их загрузить с этих ваших интернетов.

Сперва загрузи *именно* котиков, а не несортированный мусор из интернетов. Заодно не-котиков.

Да-да, дип-лёрнинг - это не «фигачить код», а подобрать правильные данные. А «фигачить код» придется для добычи этих правильных данных.

У меня есть комплюктер.

Твой комплюктер - преимущественно однозадачен. А вся фишка дип-лёрнинг в сетях (нейронных), которые очень хорошо параллелятся. Ты будешь: или заниматься обучением чего-то несложнее элемента xor, или будешь месяцами обучать и ничего дельного не получишь.

anonymous
()
Ответ на: комментарий от anonymous

Онан правильно говорит, хоть и не совсем ясно. Суть в том, что формализация задачи, то есть, превращение груды беспорядочных сырых данных в обучающий и тестовый наборы - это и есть большая часть всего обучения. Может, в глубоком ситуация и отличается, но я сомневаюсь.

byko3y ★★★★
()
Ответ на: комментарий от anonymous

Дип лёрнинг - это не про «фигачим код», а про «берем очень много данных и скармливаем спец. вычислителю».

Раньше были веб-макаки, которые скармливали жабоскрипт с цссом браузеру, теперь появились нейронко-макаки, которые скармливают очень много данных «спец. вычислителю» в пхытоно-обёртке и понятия не имеют, что там происходит.

«Фигачить код» в области нейронок можно для этих их «спец. вычислителей» со всякими оптимизациями по энергопотреблению во встраиваемых системах и прочей годнотой. А матан таки нужен, ага.

anonymous
()
Ответ на: комментарий от anonymous

«Фигачить код» в области нейронок можно для этих их «спец. вычислителей» со всякими оптимизациями по энергопотреблению во встраиваемых системах и прочей годнотой.

Там уже обученные и необучаемые. А неизменяемая нейросетка - это практически моментальный ответ на входные сигналы, это практически реалтайм система. Что там имеет смысл оптимизировать в части нейросетей?

anonymous
()

Handbook of Neuroevolution Through Erlang.

Мозгодробительной математики там нет.

unfo ★★★★★
()

критическое количество гугла.

хз, книги чет.... имхо на втором этапе.

на первом --- говностатейки с примерами, ну и неплохо бы себе придумать задачу, с которой и бороться, ибо беспредметно --- бесполезно.

Rastafarra ★★★★
()

Я тоже такое когда-то хотел, даже что-то нашел. Но мне покоя не давало как оно на самом деле работает, у меня от магии наоборот голова взрывается. А теория там скука эталонная.

WitcherGeralt ★★
()
Ответ на: комментарий от anonymous

http://www.image-net.org/search?q=cat

Погуглил, не изменилось ли что-то с тех пор как я в прошлый раз смотрел, вроде нет.

Тут найдутся датасеты на все случаи жизни: https://en.m.wikipedia.org/wiki/List_of_datasets_for_machine-learning_research

А оборудование — это скорее вопрос соошения количства времени+терпения к количеству денег, которые готов потратить.

WitcherGeralt ★★
()

Только без мозгодробильной математики и нудных книжек.

Иди дальше на пхп сайты делай.

crutch_master ★★★★★
()

попробовать без мозгодробильной математики и нудных книжек

Нанять специалиста?

DonkeyHot ★★★★★
()

Тебе именно дипленинг нужен? Мне кажется что вообще машинное обучение и бог дата. Начни с kaggle. Там тебе и датасеты будут и какие-то чужие наработки найти сможешь. Но сами нейронам очень любят ресурсы. Компьютер не справится уже на уровне хорошего диплома на огромном классе интересных задач. И это, готовься много гуглить на английском, т.к. вся теория либо дикий метан, который нужен косвенно и от которого потенциально большой Профит в решении конкретной задачи, либо общие указания и советы, следуя которым можно получить что-то хорошее, а можно и фигу получить.

Для практических задач, если не лезть в разработку новых алгоритмов и теорий всей бигдаты сложнее всего собрать датасет, провести его исследования (а он вообще годный и есть ли в нем нужная нам информация, которую мы как-то будем нейронке скармливать), привести этот датасет в удобоваримый вид, выполнить его предобработку и начать учить. Вот тут и вылезет проблема с компьютером - обучение от пары часов до нескольких суток на не слабой машине (и это если не настоящая бигдата, которая начинается от датасета в 4 террабайта, а всякие хелловорлды или простые задачи на 1 гигабайт максимум). Усложнит дело то, что столь большой датасет глазками ты не посмотришь, хотя то же glogg поможет с маленькими датасетами и писать код для его обработки придется очень аккуратно, чтобы датасет был нормальный. Ну и для практической реализации тебе придется обучать несколько раз, т.к. скорее всего будут и проблемы с датасетом из-за ошибок в коде и из-за неправильных гипотез и из-за неудобноваримого для нейросети представления этого датасета... Так что запасайся терпением и временем. Нормальная задача уровня диплома займет у тебя не меньше 3 месяцев непрерывной полноценной работы.

anonymous
()
Ответ на: комментарий от anonymous

Сорри за опечатки. Клятый t9

anonymous
()
Ответ на: комментарий от anonymous

Раньше были веб-макаки, которые скармливали жабоскрипт с цссом браузеру, теперь появились нейронко-макаки, которые скармливают очень много данных «спец. вычислителю» в пхытоно-обёртке и понятия не имеют, что там происходит.

Так и есть. Получилось, что какой-нибудь pytorch поставить легко, скормить ему данные легко, а вот получить вменяемый результат уже сложно. Теперь «специалистов» по дип лернингу тыщи, а хоть какой-то вменяемый результат генерируют единицы.

anonymous
()
Ответ на: комментарий от next_time

в сбер решил податься?

Нет, я спятил, но не настолько.

beaver
() автор топика
Ответ на: комментарий от anonymous

На каком же оборудовании, помимо довольно экзотического стекла, ты предложишь запустить свою неизменяемую нейросетку чтобы ответ был «моментальным» (<0.001 ns)?

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.