LINUX.ORG.RU
ФорумTalks

А как вы думаете

 


1

1

Возможна ли такая нейросеть, которой можно будет «скормить» некое количество записей голоса человека, и она сможет произнести любой текст голосом этого человека? Или уже такая есть?


man WaveNet. Только вот ей вроде надо немеренное количество данных для обучения. Насчёт возможности дообучить предобученную сеть - хрен её знает, кастуйте неподдиванных спецов.

з.ы. ну то есть как - возможность-то есть, а вот много ли профита для сетей такой структуры - хрен знает.

alex4321
()
Последнее исправление: alex4321 (всего исправлений: 1)

Есть определённые наработки, но лично я в этом пока не преуспел. У меня успешно получалось восстанавливать ВЧ по известной модели голоса, даже как-то оно переносило особенности певческого голоса одного исполнителя на другого, но всё это пока недостаточно высокого качества для продакшена. Сами нейросетки могут работать во временной и частотной областях. Если во временной, проще всего взять рекуррентную сеть, ту же LSTM, и загнать ей сырой файлик. Некоторые так генерили случайные речеподобные звуки. Архитектуру можете подглядеть в WaveNet. Учится оно долго, но здесь ещё есть простор для творчества.

Если работаем в частотной области, преобразуем наш звук тем же STFT, кормим сетку либо блоками с перекрытием, либо тоже рекуррентно, но здесь уже можно юзать свёрточные сети, так что блоками лично мне интереснее. Главное после обработки не забыть восстановить фазу с минимумом артефактов, иначе вся работа сети окажется бесполезной.

Ну, и следует рассчитывать свои силы: высокие частоты генерировать значительно затратнее, нежели низкие, так что по возможности следует снижать частоту дискретизации до минимально допустимой.

Пока забросил это дело, занимаюсь графикой.

Sadler ★★★
()
Последнее исправление: Sadler (всего исправлений: 1)
Ответ на: комментарий от svr4

И как минимум 1 инстанс (как раз обученный уже) в мозгу Жириновского? :-)

alex4321
()

А как вы думаете

При помощи межушного нервного узла.

te111011010
()

есть уже. Причем офигенно достоверно звучит. Ссылки не помню, месяца три назад презентовали.

dikiy ★★☆☆☆
()

Тут есть видяшки как это получается.

https://www.youtube.com/watch?v=FsVSZpoUdSU

https://www.youtube.com/watch?v=NG-LATBZNBs

А вообще, нейросеть - это самый ленивый способ писать программы. Это не что-то новое, суперинструмент, решающий все возможные задачи. А просто необычный способ писать программы, когда ты не пишешь код вручную, а программа делает это за тебя.

И для ответа на свой вопрос спроси себя, возможно ли написать такую программу стандартными средствами. Если да, то значит и нейросеть сможет.

WaveNet уже упоминали.

SL_RU ★★★★
()
Последнее исправление: SL_RU (всего исправлений: 1)
Ответ на: комментарий от SL_RU

И для ответа на свой вопрос спроси себя, возможно ли написать такую программу стандартными средствами

Только для некоторых задач удобнее скормить ИНС с годной архитектурой over9000 единиц информации, и пусть оно там аппрокисимрует нашу функцию само :-) .

alex4321
()
Ответ на: комментарий от alex4321

Не спорю)

Просто очень часто вижу и слышу, как даже неплохие программисты думают о нейросетях, как о чуде, решающем все задачи.

SL_RU ★★★★
()
Ответ на: комментарий от SL_RU

Не, ну правильно - дайте мне точку опоры размеченных входных данных и железо, и я переверну весь мир :-)

Правда вопрос - откуда я возьму столько инфы (а то я пока даже в классификацию на 2 класса кой-каких доменоспецифичных текстов ibm-м nlc хреново смог. Лучше чем нихрена и даже вроде чуть лучше просто ключевых слов, но хреново).

alex4321
()
Ответ на: комментарий от alex4321

откуда я возьму столько инфы

Можно использовать силу толпы скучающего офисного планктона с выходом в интернет. Как для входных данных, так и для железа. При грамотном подходе даже гугл обзавидуется мощности железа и кол-ву структурированных данных. Какого рода данные тебе нужны?

foror ★★★★★
()
Последнее исправление: foror (всего исправлений: 3)
Ответ на: комментарий от foror

Какого рода данные тебе нужны?

Да не, я о «даже неплохие программисты думают о нейросетях, как о чуде, решающем все задачи», а не конкретной задаче.

з.ы. я думал, из фразы про точку опоры будет понятен уровень серьёзности.

alex4321
()
Ответ на: комментарий от SL_RU

А чем нейронная сеть отличается от обычной программы? В смысле что в ней такого прям принципиально нового?

Я вот сегодня попробовал waifu2x, увеличивает изображения без шакализма, но вот процессор грузит конечно сильно...

ozzee
() автор топика
Ответ на: комментарий от ozzee

А чем нейронная сеть отличается от обычной программы?

Ну, примерно так - что ИНС, что обычную программу мы можем представить как функцию от входных данных. С той разницей :

  • для «обычной программы» - мы заранее знаем, что за функцию мы реализуем (что может быть затруднительно для некоторых задач). Нет, меняющееся аки демон Тзинча ТЗ - это другой вопрос :-)
  • в случае ИНС - у нас неизвестна «целевая» функция, но есть вагон и телега данных, по которым мы можем приблизиться к её нахождению.

Я вот сегодня попробовал waifu2x, увеличивает изображения без шакализма, но вот процессор грузит конечно сильно...

Дай повангую - внутри свёрточная сеть, а их рациональнее считать на GPU :-)

alex4321
()
Последнее исправление: alex4321 (всего исправлений: 2)
Ответ на: комментарий от alex4321

Ещё одним плюсом нейросетей является штатная возможность адаптации: иногда в продакшене нужно иметь систему, которая будет потихоньку подстраиваться под ситуацию без ручного перекраивания каждый день, месяц или год.

Sadler ★★★
()
Ответ на: комментарий от alex4321

а их рациональнее считать на GPU

OpenCL у меня есть, и вроде как должен работать, но он не работает :)

ozzee
() автор топика
Ответ на: комментарий от alex4321

Я поставил пакет waifu2x-converter-cpp, потому что не разобрался, как запускать waifu2x. Там можно указать флаг --force-OpenCL, но тогда программа крашится.

ozzee
() автор топика
Последнее исправление: ozzee (всего исправлений: 1)
Ответ на: комментарий от alex4321

У меня карточка древняя (5470). В марте или апреле куплю новую карту, там уже OpenCL и нормальные драйвера.

ozzee
() автор топика
Ответ на: комментарий от Sadler

Вообще стала интересна тема нейросетей, сейчас гуглю, читаю как они реализовываются и что вообще из себя представляют.

ozzee
() автор топика

Про Хатсуне Мику уже написали?

Myau ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.