LINUX.ORG.RU
ФорумJob

разработка программы по удалению фона с изображения

 


0

1

Есть графический редактор. К нему хотим прикрутить удаление фона для фотографий и иллюстраций.

В вебе есть уже готовые библиотеки типа https://github.com/xuebinqin/U-2-Net на питоне. Есть такая https://github.com/cyrildiagne/ar-cutpaste

Мы тестили https://www.experte.com/background-remover который вроде использует одну из библиотек выше , но качество получается не очень.

Хотим ориентироваться на remove.bg сервис по качеству. У них всё в порядке.

Нужен человек для подбора архитектуры программы с вариантом обучения модели. Рассмотрю разработку на базе готовой библиотеки или с нуля.



Последнее исправление: ivancre (всего исправлений: 2)

Ни что за редактор (десктоп? мобильный? браузерный?), ни бюджета. Ни разработки - «нужен человек для подбора архитектуры». Wtf?..

ei-grad ★★★★★
()
Ответ на: комментарий от ei-grad

Ни что за редактор (десктоп? мобильный? браузерный?)

Там питон в тегах. Так что в принципе пофиг: я так понимаю, требуется саму либу обеспечить.

wandrien ★★
()
21 сентября 2021 г.
Ответ на: комментарий от ei-grad

Редактор браузерный Бюджет по часовой ставке, её определяет разработчик Подбор архитектуры предполагал написание модели. Сейчас у нас есть некая модель. Её нужно обучить на сете.

ivancre
() автор топика
Ответ на: комментарий от ivancre

Блин, теперь всё написанное выше выглядит логично, но как-то реально сложно было понять что вам был нужен ML Engineer с опытом решения конкретной задачи чтоб сказал «ML-ную часть этой задачи нужно делать вот так» :).

ei-grad ★★★★★
()
Ответ на: комментарий от ymn

Предыдущий разработчик передал некую модель с сетом и написал следующее «Есть модель, архитектура одна из новейших. Модель имеет хороший потенциал, но необходимо её правильно обучить, а это достигается только долгим подбором параметров обучения. Основная сложность заключается в выборе и написании хорошей функции ошибки. Модель выдаёт три изображения: trimap, острые углы trimap, alpha image, так что необходимо поподбирать различные функции ошибок и должно работать. Из технологий обучения нужен semi-supervised learning.»

Почему он не захотел дальше обучать, тут я затрудняюсь ответить:

  • возможно задача оказалась сложнее чем он предполагал
  • нет времени возможно и то и другое.
ivancre
() автор топика
Ответ на: комментарий от ivancre

Возможно потому что эта часть работы, которую он уже «сделал», сама по себе ничего не стоит. Работа собственно и заключается в поиске/подготовке датасета, а архитектура/модели под него потом перебираются десятками (либо берется первая попавшаяся u-net и она уже неплохо работает).

ei-grad ★★★★★
()
Ответ на: комментарий от ivancre

Про выбор функции ошибки тоже дичь какая-то написана. Обычно просто кросс-энтропию оптимизируют. Вопрос над чем, да, но кажется что для background removal вариантов не так много (один?).

ei-grad ★★★★★
()
Ответ на: комментарий от ei-grad

возможно, могу скинуть модель и датасет если интересно

ivancre
() автор топика
Ответ на: комментарий от ei-grad

Насколько я понял он выбрал самую лучшую u-net , и пытался её переписать для дообучения. И вроде что-то переписал, но не прокатило. Например из такой картинки http://prntscr.com/1t41xuo

получается http://prntscr.com/1t41zzi

такую проблему решить не удалось.

Не говоря о том эта изначальная u-net тоже не идеально обрабатывала объекты и людей.

ivancre
() автор топика
Ответ на: комментарий от ivancre

А возможно ничего и не переписывалось, просто была выбрана библиотека типа rembg https://github.com/danielgatis/rembg он её протестил и собрал какой-то датасет.

ivancre
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.