LINUX.ORG.RU
ФорумTalks

Видеохостинги: как экономить место с помощью ИИ.

 , , , ,


1

1

Подумалось мне часом… Нынче ИИ научились генерировать видео по текстовому описанию. И наоборот: генерировать текстовое описание по видео. А что если… что если малозначительные видео типа «медведь ловит рыбу» закодировать в виде текстового описания, оставив звуковую дорожку? Ну, типа, «бурый медведь на Камчатке ловит нерестящегося лосося в реке днём». Сколько места можно высвободить! И ведь всем будет по фигу, что медведь не совсем тот, река несуществующая и лосось не лососеватый. Или, возьмём видео от нашего @Croco. Через 50 лет только близких родственников будет волновать, что ИИ сгенерировала мужика похожего на Croco, а не точно его самого.

★★★★★
  1. Видеохостинг хостит видео. За такие финты надо разжаловать из видеохостингов.

  2. А если задача — сэкономить за каким-то чертом место, то можно просто не давать загружать бессмыссленные видео с говорящими головами, пусть твитят себе в жж текст.

t184256 ★★★★★
()
Ответ на: комментарий от t184256

Видеохостинг хостит видео. За такие финты надо разжаловать из видеохостингов.

Гугол давным-давно сливает очень похожие фото в одно фото - и ничего, никто не разжаловал гугол из фотохостингов.

можно просто не давать загружать бессмыссленные видео с говорящими головами, пусть твитят себе в жж текст.

Э, запрещать - не наш подход, так можно и клиента потерять.

tiinn ★★★★★
() автор топика
Ответ на: комментарий от tiinn

Гугол давным-давно сливает очень похожие фото в одно фото - и ничего, никто не разжаловал гугол из фотохостингов.

Принеси пруфы, я охотно разжалую.

Э, запрещать - не наш подход, так можно и клиента потерять.

Ну, все в рамках твоей цели.

t184256 ★★★★★
()

Интересно, что за видео современные ИИ выдадут на запрос «tinn троллит на ЛОРе».

apt_install_lrzsz ★★★
()

Нынче ИИ научились генерировать видео по текстовому описанию.

очеь смешно, то что оно там генерирует больше напоминают сны наркомана с температурой 42

Kolins ★★★★
()
Ответ на: комментарий от Kolins

очеь смешно, то что оно там генерирует больше напоминают сны наркомана с температурой 42

Так это сейчас. Раньше обладатели зеркалок - тоже, говорили, «не смешите мои тапки, смартфон никогда не сможет приблизиться к качеству фотоаппарата», а оно вона чо вышло

tiinn ★★★★★
() автор топика
Ответ на: комментарий от tiinn

Так что вышло-то? Фотографы повыкидывали фотоаппараты с большой матрицей и сменной оптикой и снимают всё на смартфон?

hateWin ★☆
()
Ответ на: комментарий от hateWin

Фотографы повыкидывали фотоаппараты с большой матрицей и сменной оптикой и снимают всё на смартфон?

Обыватели повыкидывали фотоаппараты с большой матрицей и сменной оптикой и снимают всё на смартфон

tiinn ★★★★★
() автор топика
Ответ на: комментарий от tiinn

Обыватели повыкидывали фотоаппараты с большой матрицей и сменной оптикой и снимают всё на смартфон

Обыватели их и не выкидывали. Потому что они ими никогда не обладали. Хотя ИИ в области обработки сигналов действительно позволяет получать удивительные результаты, да

hateWin ★☆
()
Ответ на: комментарий от hateWin

В нулевых зеркалки были популярны. А теперь сравните диагональ матрицы любой потребительской зеркалки из нулевых и диагональ матрицы смартфона.

tiinn ★★★★★
() автор топика

Да да, будет как в Глубине заблуждения.

ya-betmen ★★★★★
()
Ответ на: комментарий от t184256

Конкретно про эту фичу не нашёл, но есть вот тут и тут - про ограничение в 16 Мегапикселей, про принудительное пережатие фото «с сохранением качества», про удаление ваших фото через 2 года неиспользования…

tiinn ★★★★★
() автор топика
Ответ на: комментарий от Kolins

Теплое и мягкое.

Вы не верите, что ИИ рано или поздно сможет генерировать реалистичное видео?

tiinn ★★★★★
() автор топика

Это будет уже не видеохостинг.

Если использовать очень хорошую смазку для натягивания этой совы на глобус, то можно это назвать lossy-кодированием с ОЧЕНЬ большими потерями.

Но у нас место на HDD становится всё дешевле гораздо быстрее, чем вычислительные возможности. А чем круче ИИ, тем больше оных ему надо. Причём даже незначительное с точки зрения юзера улучшение требует значительного увеличения используемых ресурсов. Так что очень мало в этом толку, если в итоге описания всё равно достаточно подробные хранить.

А вот видеокодек с потерями, но с использованием нейросетки вместо обычных алгоритмов, как сейчас — это вполне возможно. Можно сохранять, грубо говоря, видео в 320×200, с дополнительным текстовым (а можно и не текстовым, а хитровыдуманным) описанием деталей, и нейросетка уже по этой инфе достраивает что-то очень похожее (не отличимое, если не присматриваться — как и нынешние x265 и иже с ним) в нужном разрешении.

CrX ★★★★★
()
Ответ на: комментарий от CrX

А вот видеокодек с потерями, но с использованием нейросетки вместо обычных алгоритмов, как сейчас — это вполне возможно. Можно сохранять, грубо говоря, видео в 320×200, с дополнительным текстовым (а можно и не текстовым, а хитровыдуманным) описанием деталей, и нейросетка уже по этой инфе достраивает что-то очень похожее (не отличимое, если не присматриваться — как и нынешние x265 и иже с ним) в нужном разрешении.

Да, это вполне соответствует моим мыслям.

tiinn ★★★★★
() автор топика
Ответ на: комментарий от Kolins

Каких-нибудь 5–10 лет назад они и картинки генерировали, больше напоминающие сны наркомана с температурой 42, а теперь уже дадут фору многим профессиональным* художникам. Нет никаких оснований полагать, что с видео будет не то же самое.

* Профессиональным — значит берущим деньги за свою работу, которая пользуется спросом, а не «гении» и «истинное искусство» и вот это всё

CrX ★★★★★
()
Ответ на: комментарий от Kolins

Не только. Они генерят в любом стиле. Я уверен, что если перемешать 15 «фото» людей, сгенерированных совменными нейросетями по правильному промпту, и 15 настоящих фото откуда-нибудь из условного вконтакта или фейсбука, ты не сможешь назвать, какие из них где с вероятностью выше случайного угадывания.

CrX ★★★★★
()
Ответ на: комментарий от CrX

Если есть такая угадайка - дай ссылку, попробую пройти

пока только комиксы/мангу видел которые отличить от «человеческих» не всегда возможно а все что связано с реальными фотками палится

Kolins ★★★★
()
Ответ на: комментарий от TPPPbIHDELj

они и сейчас популярны. Просто в нулевых не было нормальных ЖК экранов.

Угу. Оно и видно

После 2008-2012 годов наблюдается существенное падение продаж фотоаппаратов и объективов. Смартфоны победили.

tiinn ★★★★★
() автор топика
Ответ на: комментарий от Kolins

Если есть такая угадайка - дай ссылку, попробую пройти

Под рукой нет, к сожалению. Я в каком-то видео видел, там лектор предлагал залу определять, и получалось именно на уровне случайного угадывания. Как и у меня самого. Но сейчас я уже и само видео вряд ли найду.

CrX ★★★★★
()
Ответ на: комментарий от hateWin

Искусственный интеллект там, кстати, активно используется для улучшения эффективности автофокуса.

hateWin ★☆
()

Нынче ИИ научились генерировать видео по текстовому описанию.

Разве оно одно и то же у всех?

dataman ★★★★★
()
Ответ на: комментарий от Kolins

Не очень хорошо получится, но я нашёл способ подогнать реальные фотки под формат (чтоб это не сильно выдавало), и кой-чего нагенерил, так что давай вот так попробуем:

1 2 3 4 5 6 7 8 9 10

Под какими номерами сгенерированные фото, а под какими фото реальных людей?

CrX ★★★★★
()
Ответ на: комментарий от CrX

1 - нейро (левое ухо)
2 - нейро (одежда, правая щека)
3 - нейро (плечи)
4 - нейро (очки)
5 - нейро (глаза, ухо, губа)
6 - нейро (правое ухо)
7 - нейро (одежда, уши)
8 - нейро (одежда, правое ухо, тень на лбу)
9 - нейро (правый глаз)
10 - нейро (пуговица на одежде)

Kolins ★★★★
()
Ответ на: комментарий от Kolins

Вот хохоту-то будет, когда CrX докажет, что показал тебе одни реальные фотографии XD

token_polyak ★★★★★
()

И ведь всем будет по фигу

Нетъ, галлюцинации ИИ © обесценивают «доказательную базу» человеков. Юристы всех стран применят запрещательные законы, приравнивающие ИИ к «средневековому колдунству», с публичным сжиганием серверов на кострах инквизиции :)

quickquest ★★★★★
()
Ответ на: комментарий от tiinn

от фото зависит:
первое на левом ухе сверху глитчи есть
на пятом неправильная форма и глитчи
на шестом левое ухо выглядит как объект в виде уха на заднем фоне под неправильным угломб на правом глитчи
на седьмом мочка правого уха торчит из-за щеки, хотя пригляделся там еще глитчи на носу есть
восьмое - глитчи на ушах

Kolins ★★★★
()

А зачем в таком случае вообще компьютер? Бахаешь почтовую [удалено роскомнадзором] и сидишь, бубнишь себе под нос «медведь ловит рыбу».

buddhist ★★★★★
()
Ответ на: комментарий от CrX

блин, я думал что на 10 чел, там артифактов нет, но вот горизонтальная петелька под пуговицу и то что остальные нейро мня навело на мысль что ты троллишь)

Kolins ★★★★
()
Ответ на: комментарий от CrX

На пальцах все прикольно, только забыл что файлы моделей уже занимают гигабайты/десятки гигабайт. Мы уже создали головняк с вычислительной мощностью, а вопрос об экономии места все ещё открыт.

Gary ★★★★★
()

идея правильная и очевидная

Bad_ptr ★★★★★
()
Ответ на: комментарий от Gary

только забыл что файлы моделей уже занимают гигабайты/десятки гигабайт

Почему же забыл? Просто не думаю, что их размер возрастёт на много порядков для этой цели. Ну будут сотни гигабайт — всё равно капля в море.

CrX ★★★★★
()
Ответ на: комментарий от CrX

Просто не думаю, что их размер возрастёт на много порядков для этой цели

Почему нет? Есть прямая связь между размером модели, размером тренировочного сета и качеством результата. Нет никакой магии, позволяющей сохранить бесконечное количество информации в файле фиксированного объема.

Это все поиск гвоздя с очередным микроскопом в руках.

Gary ★★★★★
()
Ответ на: комментарий от Gary

Нет никакой магии, позволяющей сохранить бесконечное количество информации в файле фиксированного объема

Так суть как раз в том что тут информацию можно потерять без потери «смысла».. Точно так же как для стриминга видео можно использовать UDP и терять пакеты, а вот текст только по TCP.

Bad_ptr ★★★★★
()
Ответ на: комментарий от Gary

Потому что не потребуется рост больше, чем в разы.

Более того, я уверен, что даже с использованием моделей в единицы гигабайт можно неплохо решить эту задачу. Да, «жать» будет не так сильно, как более крутые модели, но у обычных x265, av1 и иже с ними явно может выиграть в даже в разы. По размеру. То что при этом требования к вычислительной мощности возрастут на порядки — это в данном случае следует воспринимать как само собой разумеющееся.

CrX ★★★★★
()

Ещё такая фантазия.. что у каждого короче на компе ещё своя модель будет, которая будет «доводить» видео до «понятного лично тебе»..

Ну как вот ты человеку рассказываешь какую-то историю, а он её себе воспринимает и воображает исходя из своего опыта. Зачастую неправильно и ваще не понимая что ты хотел ему сказать.
А может это ты сам понимал ситуацию неправильно и не правильно её пытался рассказать.

Bad_ptr ★★★★★
()
Ответ на: комментарий от CrX

Потому что не потребуется рост больше, чем в разы.

Более того, я уверен, что даже с использованием моделей в единицы гигабайт можно неплохо решить эту задачу. Да, «жать» будет не так сильно, как более крутые модели, но у обычных x265, av1 и иже с ними явно может выиграть в даже в разы.

Есть уже тесты или это все домыслы?

Gary ★★★★★
()
Ответ на: комментарий от Bad_ptr

Так можно даже не генерировать ничего. Оставить описание, «медведь ловит рыбу», а там уже каждый сам что нафантазирует у себя в голове, то и будет.

Gary ★★★★★
()
Ответ на: комментарий от Gary

Домыслы. Я не осилю реализацию такого. Если бы осилил, уже вовсю юзал бы для холодного хранения, и наверное не я один.

Причём не осилю не по отсутствию скиллов, а по отсутствию вычислительных мощностей и бигдаты, необходимой для тренировки такой модели.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от Gary

Оставить описание, «медведь ловит рыбу», а там уже каждый сам что нафантазирует у себя в голове, то и будет.

Это ещё 1 средство выразительности короче. В каких-то моментах ты можешь оставить только общее описание, в каких-то добавить конкретных деталей..
И, возможно, когда будешь смотреть фильм во второй раз, там уже совсем другая картинка будет и герои..

Bad_ptr ★★★★★
()
Последнее исправление: Bad_ptr (всего исправлений: 2)

А что если… что если малозначительные видео типа «медведь ловит рыбу» закодировать в виде текстового описания, оставив звуковую дорожку? Ну, типа, «бурый медведь на Камчатке ловит нерестящегося лосося в реке днём». Сколько места можно высвободить!

«Сначала много всякой фигни, потом Наполеона таки победили, а Пьер Безухов затусил с Наташей Ростовой»

vaddd ★☆
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)