Яндекс выложил в открытый доступ языковую модель YandexGPT-5-Lite

0

3

Архитектура новой языковой модели похожа на Llama или Qwen, но она обучалась полностью с нуля. Похожесть позволяет использовать тот же инструментарий. Pretrain-версия большой языковой модели YandexGPT 5 Lite на 8B параметров с длиной контекста 32k токенов. При обучении модели особое внимание уделялось русскому языку, материалы на русском составили более 70% датасета.

Старшая модель YandexGPT 5 доступна в Алисе и на сайте Яндекса, но она в открытый доступ выложена не будет.

В своей категории модель достигает паритета с мировыми SOTA по ряду ключевых бенчмарков для pretrain-моделей, а по многим другим — превосходит их. Например, по результатам внутреннего слепого попарного сравнения (side-by-side) для широкого потока запросов YandexGPT 5 Pro превосходит YandexGPT 4 Pro в 67% случаев и не уступает GPT-4o.

>>> Подробности на Хабре

>>> Скачать

Ссылка

←	Gifsicle 1.96

EA открыла исходный код Command & Conquer Red Alert

→

в открытый доступ выложена не будет.

Фу такими быть.

One ★★★★★
(27.02.25 18:53:25 MSK)

Ответ на: комментарий от One 27.02.25 18:53:25 MSK

А толку? У простых смертных ресурсов не хватит её запустить.

mord0d ★★★★★
(27.02.25 18:55:47 MSK)

Ответ на: комментарий от mord0d 27.02.25 18:55:47 MSK

А сколько надо-то? Что-то я не вижу требований.

Smacker ★★★★★
(27.02.25 18:57:14 MSK)

А для чего это нужно?

Goat ★★★
(27.02.25 19:00:16 MSK)

Ответ на: комментарий от mord0d 27.02.25 18:55:47 MSK

Они прошку сравнивают с Qwen 2.5 32b, значит и вес похожий, а это 24гб подойдёт

One ★★★★★
(27.02.25 19:01:13 MSK)
Последнее исправление: One 27.02.25 19:02:24 MSK (всего исправлений: 1)

Ответ на: комментарий от Smacker 27.02.25 18:57:14 MSK

А сколько надо-то? Что-то я не вижу требований.

Для выложенной 8B — ≥12G VRAM.

То что осталось закрыто — наверняка не меньше 400B.

LLaMA 3.1 на 405B требует ≈512(!) GB(!!) VRAM(!!!). Можно с выгрузкой в RAM, но в этом случае понадобится 512GB RAM, и разумеется это будет сильно медленнее.

При подсчётах не забудь учесть счета за электричество. (=

mord0d ★★★★★
(27.02.25 19:08:55 MSK)

Ответ на: комментарий от One 27.02.25 19:01:13 MSK

прошку сравнивают с Qwen 2.5 32b

А, ну тогда они просто не хотят позориться. xD

mord0d ★★★★★
(27.02.25 19:09:48 MSK)

Ссылка

Ответ на: комментарий от Goat 27.02.25 19:00:16 MSK

Про ChatGPT слышал?
Вот это для бедных и жадных (в том числе жадных до своих личных данных).

mord0d ★★★★★
(27.02.25 19:10:53 MSK)

Ответ на: комментарий от mord0d 27.02.25 19:10:53 MSK

А что такое ChatGPT?

Goat ★★★
(27.02.25 19:12:30 MSK)

Ответ на: комментарий от Goat 27.02.25 19:12:30 MSK

Спроси у гугла. (=

mord0d ★★★★★
(27.02.25 19:13:57 MSK)

Ответ на: комментарий от mord0d 27.02.25 19:13:57 MSK

Тогда мне придется доказать гуглу что я робот, но есть проблема: я - не робот.

Goat ★★★
(27.02.25 19:15:03 MSK)

Ответ на: комментарий от Goat 27.02.25 19:15:03 MSK

Это такая штука, которая заменяет человеку отсутствующий естественный интеллект. Не очень хорошо, но лучше чем ничего. (% Подробности у гугла.

Тогда мне придется доказать гуглу что я робот, но есть проблема: я - не робот.

Это тоже придётся доказать.

mord0d ★★★★★
(27.02.25 19:15:47 MSK)

Ссылка

Кто нибудь в курсе как это соотносится с чатиком, который яндекс встроил в свой поисковик? Где то есть другой VIP GPT, который работает, или они все такие тупые и с узким кругозором?

kirill_rrr ★★★★★
(27.02.25 19:52:37 MSK)

Черепа измерять уже научили?

buddhist ★★★★★
(27.02.25 20:05:20 MSK)

Ссылка

А неплохо так DeepSeek индустрию взбодрил :)

zabbal ★★★★★
(27.02.25 20:06:34 MSK)

Ссылка

достигает паритета с мировыми ... а по многим другим — превосходит их

Например,... YandexGPT 5 Pro превосходит YandexGPT 4 Pro

Это никаким боком не пример к предыдущему заявлению. Просто эта версия яндексгпт оказалась лучше прошлой версии яндексгпт.

firkax ★★★★★
(27.02.25 20:15:23 MSK)

Ссылка

Ответ на: комментарий от mord0d 27.02.25 19:08:55 MSK

LLaMA 3.1 на 405B требует ≈512(!) GB(!!) VRAM(!!!).

Я не очень в теме всех этих гпт, но вот чего не понимаю: почему гпт, опубликованные только в виде апи к их серверу, вообще сравниваются с гпт для личного пользования в плане системных требований? Очевидно же, что у огромной фирмы есть средства хоть многие терабайты (десятки, сотни?) VRAM организовать, и что в частном порядке никто, кроме олигархов, себе такую систему не соберёт (а они этим заниматься всё равно лично не станут).

firkax ★★★★★
(27.02.25 20:19:16 MSK)
Последнее исправление: firkax 27.02.25 20:19:49 MSK (всего исправлений: 1)

Ответ на: комментарий от firkax 27.02.25 20:19:16 MSK

почему гпт, опубликованные только в виде апи к их серверу, вообще сравниваются с гпт для личного пользования в плане системных требований?

Сравнение сабжа это лишь спекуляции на косвенных данных.

Но есть БОЛЬШИЕ модели в открытом доступе: LLaMA 405B, DeepSeek v3/R1 671B. Да, простые смертные не смогут ими пользоваться (по крайней мере комфортно), многие даже запустить не смогут, но никто не обещал что будет легко.

в частном порядке никто […] себе такую систему не соберёт

Мало её собрать, её ещё нужно питать. Подобный сетап будет жрать (навскидку) сотни киловатт в час.

mord0d ★★★★★
(27.02.25 20:38:44 MSK)

Ответ на: комментарий от kirill_rrr 27.02.25 19:52:37 MSK

Кто нибудь в курсе как это соотносится с чатиком, который яндекс встроил в свой поисковик? Где то есть другой VIP GPT, который работает, или они все такие тупые и с узким кругозором?

У меня есть подписка на Алису Про и она говорит, что теперь базируется на модели YandexGPT 5 Pro.

mshewzov ★★★
(27.02.25 20:55:53 MSK)

Ачё Алиса такая тупая?

lenin386 ★★★★
(27.02.25 21:13:03 MSK)

Ссылка

Что-то я не ощутил поумнения. Как теряла контекст, так и теряет. И галлюцинации на каждом шагу просто.

Clayman ★★
(27.02.25 21:25:59 MSK)

Ссылка

Мелкая модель - полная фигня. Кроме того, что её учили на русском языке - отчаянный трындеж, нормально оно пытается отвечать только на английском языке, постоянно в него скатываясь, если пытаться говорить по-русски.

pekmop1024 ★★★★★
(27.02.25 21:33:44 MSK)

Ссылка

Ответ на: комментарий от mord0d 27.02.25 19:08:55 MSK

VRAM это же Video RAM? Есть агрегаты с 512 Гб оной???

Smacker ★★★★★
(27.02.25 21:47:53 MSK)

Ответ на: комментарий от Goat 27.02.25 19:15:03 MSK

но есть проблема: я - не робот.

Действительно, не очень хорошо получается. Но главное не унывать и работать над собой! СР/УВЧ!

Smacker ★★★★★
(27.02.25 21:49:20 MSK)

Ссылка

Ответ на: комментарий от mord0d 27.02.25 20:38:44 MSK

(навскидку) сотни киловатт в час

Куда-куда киловатт навскидку?

yvv1
(27.02.25 21:49:29 MSK)

Ответ на: комментарий от mord0d 27.02.25 19:08:55 MSK

Ну сейчас нет, но какой-нибудь условный m4 ultra запустит это без проблем на 300 ваттах.

Те же GPT они у себя стараются гонять на таких же специфичных железках с универсальной памятью.

alexmaru ★
(27.02.25 21:52:23 MSK)

А как это связано с тематикой форума?

Kolins ★★★★★
(27.02.25 22:00:41 MSK)

Ссылка

Ответ на: комментарий от Smacker 27.02.25 21:47:53 MSK

VRAM это же Video RAM?

Да.

Есть агрегаты с 512 Гб оной???

Я о таких не слышал.
Но во-первых можно собрать кластер (не очень надёжно), а во-вторых инференция поддерживает распределённые вычисления.

mord0d ★★★★★
(27.02.25 22:03:52 MSK)

Ссылка

Ответ на: комментарий от yvv1 27.02.25 21:49:29 MSK

Один ускоритель с достаточной скоростью ядер и количеством видеопамяти жрёт чуть меньше киловатта. Таких ускорителей нужно не меньше десятка. 1×10=100! (%

mord0d ★★★★★
(27.02.25 22:07:46 MSK)

Ответ на: комментарий от alexmaru 27.02.25 21:52:23 MSK

Ну сейчас нет, но какой-нибудь условный m4 ultra запустит это без проблем на 300 ваттах.

Для одного юзера — вполне. Причём даже M2 справляется с этим с неплохой скоростью. А если тебе нужно поделиться мощностями с семьёй/друзьями, то ой.

mord0d ★★★★★
(27.02.25 22:11:30 MSK)

Ссылка

Ответ на: комментарий от Smacker 27.02.25 21:47:53 MSK

Шесть штук NVIDIA H100 80GB и уже на Q4 вертишь DeepSeek V3 671B. Скромно вертят даже и Q3.

А так бомж сборки с двумя RTX 3090 и моделями в 67-70b вполне используются. 120 тыс рэ и ты LLM-барин с 48GB vram

One ★★★★★
(27.02.25 22:13:00 MSK)

интересно, алиса поумнеет от этого новшества? а то сейчас она тупенькая.

ergo ★★★
(27.02.25 22:15:44 MSK)

Ссылка

Ответ на: комментарий от Smacker 27.02.25 21:47:53 MSK

VRAM это же Video RAM? Есть агрегаты с 512 Гб оной???

просто собираешь машину с 4ю видеокартами по 128ГБ

ДипСику надо 700ГБ, соответственно там 6-7 видеокарт, народ описывал требуемое железо, там вроде за 30Кбаксов

sena ★★
(27.02.25 22:19:05 MSK)
Последнее исправление: sena 27.02.25 22:20:42 MSK (всего исправлений: 3)

Ссылка

Раз пошла такая пьянка, то зачем-то оформил Алиса Про. Ещё не знаю зачем, но пусть будет.

Irben ★★★
(27.02.25 22:27:57 MSK)

Ссылка

Ответ на: комментарий от One 27.02.25 18:53:25 MSK

Гопатыча как будто выкладывают

shalom_ ★★
(27.02.25 22:38:34 MSK)

Ссылка

Ответ на: комментарий от mord0d 27.02.25 22:07:46 MSK

Таких ускорителей нужно не меньше десятка.

В час?

yvv1
(27.02.25 22:45:19 MSK)

Ссылка

Ответ на: комментарий от One 27.02.25 22:13:00 MSK

ITT: как прикуривать от ассигнаций в домашних условиях с помощью видеокарт и нейронок.

Smacker ★★★★★
(27.02.25 23:03:23 MSK)

Ссылка

Бинарные блобы в свободном доступе какое отношение к опенсорсу имеют? iso-образы винды тоже в полном свободном доступе с msdn скачиваются. Давайте их сюда как новости постить?

anonymoos ★★★★★
(27.02.25 23:13:23 MSK)

Ответ на: комментарий от mshewzov 27.02.25 20:55:53 MSK

Но насколько она лучше ищет инфу чем бесплатный чат?

kirill_rrr ★★★★★
(27.02.25 23:31:53 MSK)

Ответ на: комментарий от kirill_rrr 27.02.25 23:31:53 MSK

Но насколько она лучше ищет инфу чем бесплатный чат?

Хз, я почти сразу оформил подписку, когда ещё Yandex GOT 4 было. Там полгода бесплатно давалось, потом 100 рублей в месяц. Я на самом деле не для поиска использую, а для работы - пишу рекламные тексты, дорабатываю статьи, иногда ищу интересные идеи для своих документов.

Сам по себе нейро поиск от Яндекса интересен тем, что он неплохо суммаризирует ответ. Но стало ли лучше именно в поиске - я не знаю. По мне и было неплохо.

mshewzov ★★★
(27.02.25 23:35:46 MSK)

Ответ на: комментарий от alexmaru 27.02.25 21:52:23 MSK

М4у не поддерживает столлько памяти даже если она общая. И старший АПУ амд не поддерживает. Пока что только те самые старые зионы над которыми все смеялись.

kirill_rrr ★★★★★
(27.02.25 23:37:13 MSK)

Ссылка

Ответ на: комментарий от mshewzov 27.02.25 23:35:46 MSK

Сам по себе нейро поиск от Яндекса интересен тем, что он неплохо суммаризирует ответ.

На самом деле плохо. 30% ответов которые можно считать за ответ, даже если он бесполезен или там **здёж. Но по крайней мере есть какое то виденье как это можно использовать и вообще зачем он нужен. Даже в таком виде это экономит некоторое количество времени.

kirill_rrr ★★★★★
(27.02.25 23:41:01 MSK)

8B - ну это не серьезно

voltmod ★★★
(27.02.25 23:41:16 MSK)

Ссылка

Ответ на: комментарий от anonymoos 27.02.25 23:13:23 MSK

Вот если бы Яндекс выложил исходники, другое дело!

Aceler ★★★★★
(28.02.25 00:02:38 MSK) автор топика

Ссылка

Ответ на: комментарий от kirill_rrr 27.02.25 23:41:01 MSK

На самом деле плохо. 30% ответов которые можно считать за ответ, даже если он бесполезен или там **здёж. Но по крайней мере есть какое то виденье как это можно использовать и вообще зачем он нужен. Даже в таком виде это экономит некоторое количество времени.

Может и плохо. Но я всё равно перепроверяю все ответы, поэтому некоторый процент недостоверности ответов для меня не новость. На самом деле и ChatGPT тоже любитель фантазировать. У меня подключён Doczilla AI, который как раз на базе ChatGPT, так вот он частенько просто придумывает статьи и законы.

mshewzov ★★★
(28.02.25 00:04:05 MSK)

Сколько раз мы подобные заявления слышали. Почти такой же хороший как западный аналог, а по некоторым параметрам даже превосходит =))) Не ну на само деле хорошо, больше разных нейросетей, больших и разных

Dieter ★★★
(28.02.25 00:58:13 MSK)