LINUX.ORG.RU

Выпущена языковая модель MiniGPT-4

 ,


0

1

Исследователи из Научно-технологического университета имени короля Абдаллы опубликовали на github MiniGPT-4 — языковую модель, предназначенную для улучшения понимания языка посредством зрения.

MiniGPT-4 использует предварительно обученный компонент зрения BLIP-2, к которому добавлен один проекционный слой для согласования закодированных визуальных функций с языковой моделью Vicuna путем замораживания всех других компонентов зрения и языка. Тренировочный процесс состоит из двух этапов. На первом этапе модель предварительно обучается с использованием примерно 5 миллионов выровненных пар изображение-текст за 10 часов с использованием 4 графических процессоров A100. После этого этапа Vicuna может понимать изображения, но ее способность генерировать сильно снижается.

Чтобы решить эту проблему и повысить удобство использования, исследователи нашли новый способ создания высококачественных пар изображение-текст, используя вместе саму модель и ChatGPT. Затем они создали небольшой, но качественный набор данных, содержащий 3500 пар. На втором этапе модель обучается на этом наборе данных, что значительно повышает качество генерации и общее удобство использования. Этот этап эффективен в вычислительном отношении и занимает всего около 7 минут с одним графическим процессором A100.

Исследователи предоставили онлайн-демонстрацию и инструкции по установке, локальному запуску демоверсии и обучению модели.

Распространяется по лицензии BSD 3-Clause License.

Демо

>>> Подробности

★★☆

Проверено: hobbit ()
Последнее исправление: hobbit (всего исправлений: 1)

И что даёт открытость данной модели? Ведь без анально огороженного ChatGPT она все равно не работает. Если что, это не троллинг

Werenter ★★★
()

Сколько ещё рекламных проектов чатГПТ вывалят на нас ещё? Как можно сделать открытый проект на закрытом чатгпт? Замануха? То на хабре расписывают автогпт, то это, блин, задолбало. Или пиите про действительно открытые проекты, или нафиг не надо. Есть хабр туда и пишите.

R_He_Po6oT ★★★★
()
Ответ на: комментарий от R_He_Po6oT

Просто астрологи объявили именно 2023 год, годом искусных говорилок, я надеюсь ЛОР добавит блэк-лист тэгов, чтобы игнорить этот ололо чатжпт.

gtk222
()
Ответ на: комментарий от gtk222

На лоре есть блеклист тегов.

Алсо, астрологи объявят 2024, в котором выйдет GPT-5, годом начала конца. Тут надо добавить шутку про яйца, но я ее не придумал, а чатгпт с таким не хочет помогать(

goingUp ★★★★★
()

goingUp и Werenter спасибо, нашёл!

gtk222
()
Ответ на: комментарий от R_He_Po6oT

Как можно сделать открытый проект на закрытом чатгпт?

Тебя самого это не смутило, нет? Где вообще хоть слово сказано о том, что оно сделано на ЗАКРЫТОМ ChatGPT? Вот как вообще эта мысль могла прийти в голову? В основе проекта лежит LLaMA Vicuna.

ChatGPT использовался для создания обучающих данных, всё.

evgeny_aa ★★☆
() автор топика
Последнее исправление: evgeny_aa (всего исправлений: 1)
Ответ на: комментарий от evgeny_aa

Всё равно, мне лично непонятно: в мире Linux происходит масса событий. Но вместо этих новостей зачем-то новость, которая никаким боком к нему не относится.

Разве эта модель напишет открытый драйвер для Nvidia?

Давайте ещё новости про криптовалюты и криптобиржи писать…

emorozov
()
Ответ на: комментарий от emorozov

У новости стоит соответствующий раздел - Open Source. В чём проблема? Новость интересная, тема актуальная, как бы не ныли некоторые луддиты.

evgeny_aa ★★☆
() автор топика
Ответ на: комментарий от friedrich

За 20 лет индусы ATI, а затем AMD, не смогли написать нормальный драйвер для своих видеокарт, и ты думаешь что рандомные индусы смогут написать драйвера для nvidia, ISA которых до сих пор не опубликованы?

Aber ★★★★★
()

Многие эти модели имхо имеют сомнительную лицензию, ведь их тренируют на несвободном контенте, так что не совсем понятно причём тут опен сорс. То что сама по себе обвязка свободная - ну толку от неё не очень много.

Gary ★★★★★
()
Ответ на: комментарий от friedrich

Тогда можно писать новости про индуизм. Ведь индусы исповедуют индуизм, и они же могут (теоретически) написать драйверы для Linux.

Ну или новости про то, что в Индии, где живут индусы, например, открылось новое шоссе. Ведь по нему поедут индусы, которые потенциально могут написать драйвер.

emorozov
()
Ответ на: комментарий от emorozov

Разве эта модель напишет открытый драйвер для Nvidia?

Боюсь лет через 10 только так и будет софт писаться.

peregrine ★★★★★
()
Ответ на: комментарий от anonymous_sapiens

Ты видишь суслика? Нет? А он есть.

Утки за камышом где-том.

DyadyushkaAU
()
Ответ на: комментарий от R_He_Po6oT

Да, чувствуется фальш как у открытого Linux на закрытом intel. Но быть может, аналогично RISC-V для таких появится открытый OpenGPT

I-Love-Microsoft ★★★★★
()
Ответ на: комментарий от evgeny_aa

Единственная цель у всех этих проектиков пропиарить ЗАКРЫТЫЙ и ПЛАТНЫЙ проект который захватил Микрософт. И единственное что они должны делать - создавать шум в котором будет слышно лишь о GPT-4 чтобы подавить зарождение и распространение по настоящему открытых моделей. И вот эффект - хотел привести одну такую модель, и забыл название. Где они, открытые модели? Была новость о модели натренированой с нуля, без GPT-3/4, как она называлась?

R_He_Po6oT ★★★★
()
Ответ на: комментарий от I-Love-Microsoft

Линус платил Интелу за даташиты? Каждый кто пойдёт путём разрботки на Интеле должен будет платить Интелу? Разницы не видишь?

R_He_Po6oT ★★★★
()
Ответ на: комментарий от Aber

За 20 лет индусы ATI, а затем AMD, не смогли написать нормальный драйвер для своих видеокарт

4.2

Werenter ★★★
()
Ответ на: комментарий от R_He_Po6oT

Действительно: есть же годные опенсорсные альтернативы, тот же BLOOM например - причём его можно запустить даже у себя локально + в режиме чата, достаточно лишь 400 гигов HDD и 16 гигов RAM... Но нет - как всегда, люди упорно будут жрать распиаренный проприетарный кактус

SakuraKun ★★★★★
()
Последнее исправление: SakuraKun (всего исправлений: 3)
Ответ на: комментарий от SakuraKun

Найдёшь что-то проприетарное в том проекте, о котором идёт речь в статье? Или блаблабла не вникая?

evgeny_aa ★★☆
() автор топика
Ответ на: комментарий от SakuraKun

Не знаю, шутка это с твоей стороны, или нет, но реально же, опенсорсный. И работают над сокращением объёмов. Но я читал про какую-то другую, поменьше, поскромнее. А может это была прошлая их версия? Не основанная ни на альпаке ни на гпт.

R_He_Po6oT ★★★★
()
Ответ на: комментарий от peregrine

Боюсь лет через 10 только так и будет софт писаться.

Где-то видел что под ардуину уже что-то может...

hbars ★★★★★
()

Приму в дар выгрузку комментов саныча из БД ЛОРа. Обещаю натренировать модель Sun-chGPT и отжигать ею в толксах.

cocucka ★★★★☆
()

pond with ducks

Клара наше всё!

etwrq ★★★★★
()
Ответ на: комментарий от R_He_Po6oT

Open Assistant мб? Но они вроде датасеты только обещают зарелизить.

SeTSeR
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.