История изменений
Исправление peregrine, (текущая версия) :
Короче, чтобы обмазаться нейронками и не случайно, а понимая что и зачем ты делаешь, ты скорее всего должен быть кандидатом наук или около того в плане соображалки. Я не говорю что большинство ML разрабов такие, но то большинство и не занимается проектированием и разработкой моделек, они всякую обезьянью работу выполняют как то разметка данных (самые слабенькие, должны уметь пользоваться компом и, возможно, писать простые скрипты), очистка данных (те которые чуть посильнее и что-то знают про регулярки и сложные SQL запросы), анализ данных (эти уже математическую статистику знать должны ко всем предыдущим пунктам), ну а дальше идут те самые челики которые модельку выбирают и то как данные для неё закодировать надо, они всё должны знать + кучу матана, понимать что в кишках у машинного обучения происходит, уметь программировать (пусть и не так хорошо и правильно, как промышленные программисты), а потом ещё челики есть, которые параметры модели подтюнят, те тоже особо соображать не должны, им достаточно скрипты сделать которые с разными параметрами модельки покрутят и подберут лучшую комбинацию. Правда крутить надо не всё подряд, а немного думая (например варьируя параметр не от 1 до 1000 а скажем 1, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 а дальше уже выбирать наиболее перспективные цифры и смотреть что там вокруг них и как это сочетается с остальными параметрами) и понимая что некоторые модели учить очень дорого.
Как челик, который делает всё вышеперечисленное в качестве основной рабочей деятельности, скажу начинай с CNN сетей, а дальше дообмазывай их чем-то ещё. У CNN есть проблема, что ей не важно где на картинке элемент изображения. Так что изобретай что-то что это учитывает. Вариантов много.
Исправление peregrine, :
Короче, чтобы обмазаться нейронками и не случайно, а понимая что и зачем ты делаешь, ты скорее всего должен быть кандидатом наук или около того в плане соображалки. Я не говорю что большинство ML разрабов такие, но то большинство и не занимается проектированием и разработкой моделек, они всякую обезьянью работу выполняют как то разметка данных (самые слабенькие, должны уметь пользоваться компом и, возможно, писать простые скрипты), очистка данных (те которые чуть посильнее и что-то знают про регулярки и сложные SQL запросы), анализ данных (эти уже математическую статистику знать должны ко всем предыдущим пунктам), ну а дальше идут те самые челики которые модельку выбирают и то как данные для неё закодировать надо, они всё должны знать + кучу матана, понимать что в кишках у машинного обучения происходит, уметь программировать (пусть и не так хорошо и правильно, как промышленные программисты), а потом ещё челики есть, которые параметры модели подтюнят, те тоже особо соображать не должны, им достаточно скрипты сделать которые с разными параметрами модельки покрутят и подберут лучшую комбинацию. Правда крутить надо не всё подряд, а немного думая (например варьируя параметр не от 1 до 1000 а скажем 1, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 а дальше уже выбирать наиболее перспективные цифры и смотреть что там вокруг них и как это сочетается с остальными параметрами) и понимая что некоторые модели учить очень дорого.
Как челик, который делает всё вышеперечисленное в качестве основной рабочей деятельности, скажу начинай с CNN сетей, а дальше дообмазывай их чем-то ещё.
Исправление peregrine, :
Короче, чтобы обмазаться нейронками и не случайно, а понимая что и зачем ты делаешь, ты скорее всего должен быть кандидатом наук или около того в плане соображалки. Я не говорю что большинство ML разрабов такие, но то большинство и не занимается проектированием и разработкой моделек, они всякую обезьянью работу выполняют как то разметка данных (самые слабенькие, должны уметь пользоваться компом и, возможно, писать простые скрипты), очистка данных (те которые чуть посильнее и что-то знают про регулярки и сложные SQL запросы), анализ данных (эти уже математическую статистику знать должны ко всем предыдущим пунктам), ну а дальше идут те самые челики которые модельку выбирают и то как данные для неё закодировать надо, они всё должны знать + кучу матана, понимать что в кишках у машинного обучения происходит, уметь программировать (пусть и не так хорошо и правильно, как промышленные программисты), а потом ещё челики есть, которые параметры модели подтюнят, те тоже особо соображать не должны, им достаточно скрипты сделать которые с разными параметрами модельки покрутят и подберут лучшую комбинацию. Правда крутить надо не всё подряд, а немного думая (например варьируя параметр не от 1 до 1000 а скажем 1, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 а дальше уже выбирать наиболее перспективные цифры и смотреть что там вокруг них и как это сочетается с остальными параметрами) и понимая что некоторые модели учить очень дорого.
Как челик который делает всё вышеперечисленное, скажу начинай с CNN сетей, а дальше дообмазывай их чем-то ещё.
Исправление peregrine, :
Короче, чтобы обмазаться нейронками и не случайно, а понимая что и зачем ты делаешь, ты скорее всего должен быть кандидатом наук или около того в плане соображалки. Я не говорю что большинство ML разрабов такие, но то большинство и не занимается проектированием и разработкой моделек, они всякую обезьянью работу выполняют как то разметка данных (самые слабенькие, должны уметь пользоваться компом и, возможно, писать простые скрипты), очистка данных (те которые чуть посильнее и что-то знают про регулярки и сложные SQL запросы), анализ данных (эти уже математическую статистику знать должны ко всем предыдущим пунктам), ну а дальше идут те самые челики которые модельку выбирают и то как данные для неё закодировать надо, они всё должны знать + кучу матана, понимать что в кишках у машинного обучения происходит, уметь программировать (пусть и не так хорошо и правильно, как промышленные программисты), а потом ещё челики есть, которые параметры модели подтюнят, те тоже особо соображать не должны, им достаточно скрипты сделать которые с разными параметрами модельки покрутят и подберут лучшую комбинацию. Правда крутить надо не всё подряд, а немного думая (например варьируя параметр не от 1 до 1000 а скажем 1, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 а дальше уже выбирать наиболее перспективные цифры и смотреть что там вокруг них и как это сочетается с остальными параметрами) и понимая что некоторые модели учить очень дорого.
Как челик который делает всё, скажу начинай с CNN сетей, а дальше дообмазывай их чем-то ещё.
Исходная версия peregrine, :
Короче, чтобы обмазаться нейронками и не случайно, а понимая что и зачем ты делаешь, ты скорее всего должен быть кандидатом наук или около того в плане соображалки. Я не говорю что большинство ML разрабов такие, но то большинство и не занимается проектированием и разработкой моделек, они всякую обезьянью работу выполняют как то разметка данных (самые слабенькие, должны уметь пользоваться компом и, возможно, писать простые скрипты), очистка данных (те которые чуть посильнее и что-то знают про регулярки и сложные SQL запросы), анализ данных (эти уже математическую статистику знать должны ко всем предыдущим пунктам), ну а дальше идут те самые челики которые модельку выбирают и то как данные для неё закодировать надо, они всё должны знать + кучу матана, понимать что в кишках у машинного обучения происходит, уметь программировать (пусть и не так хорошо и правильно, как промышленные программисты), а потом ещё челики есть, которые параметры модели подтюнят, те тоже особо соображать не должны, им достаточно скрипты сделать которые с разными параметрами модельки покрутят и подберут лучшую комбинацию. Правда крутить надо не всё подряд, а немного думая (например варьируя параметр не от 1 до 1000 а скажем 1, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 а дальше уже выбирать наиболее перспективные цифры и смотреть что там вокруг них и как это сочетается с остальными параметрами) и понимая что некоторые модели учить очень дорого.