DeepSeek выложил в открытый доступ свои модели

5

5

Китайская компания DeepSeek выложила в открытый доступ свои модели искусственного интеллекта, включая DeepSeek-R1 и DeepSeek-R1-Zero, что уже вызвало падение акций OpenAI на американском фондовом рынке.

DeepSeek (深度求索) — это китайский стартап, основанный тремя сотрудниками Чжэцзянского университета из Ханчжоу. Проект был создан в 2023 году и за короткий период смог стать достойной альтернативой ChatGPT. У проекта есть веб-версия, официально доступная в том числе из России, в отличие от западных аналогов.

Проект привлек внимание на Западе после новости о том, что китайская компания открыла доступ к своим языковым моделям, которые демонстрируют если не превосходство, то паритет с американскими аналогами.

DeepSeek-R1-Zero и DeepSeek-R1 обучены на основе модели DeepSeek-V3-Base. Они содержат 671 миллиард параметров.

Также для скачивания доступны облегченные модели, которые представляют собой другие опенсорсные проекты, дополнительно дообученные с использованием данных, сгенерированных DeepSeek-R1. В частности, использовались модели Qwen и Llama. Они легко справляются с задачами в области программирования и решением математических задач, при этом не являясь требовательными к ресурсам GPU.

>>> Официальный репозиторий

Ссылка

←	ISD — новый способ управления systemd

Meson 1.7.0

→

← 1 2 3 →

Интересно, почему на их логотипе изображена худая рыба, откусывающая свой хвост?

apt_install_lrzsz ★★★
(27.01.25 13:33:44 MSK)

Есть ссылка на репу, но я бы всё же в тексте новости уточнил, хотя я тут собственно и напишу - исходники открыты. Уже несколько статей на эту тему читал, что это реально важный шаг для мировых технологий, то есть открытая качественная нейросетевая штука

Некоторые пишут что это попытка априори выбить монополию сами знаете кого на очень важную технологию

I-Love-Microsoft ★★★★★
(27.01.25 13:38:24 MSK)

Как оно воспринимает русский?

stickler
(27.01.25 13:43:52 MSK)

Ответ на: комментарий от stickler 27.01.25 13:43:52 MSK

Язык: Я понимаю и отвечаю на русском, но могу ошибаться в сложных нюансах.

Aurum ★
(27.01.25 13:45:18 MSK)

Ответ на: комментарий от I-Love-Microsoft 27.01.25 13:38:24 MSK

Где-то плакают сёма альтман и илона маскова, потому как не увидят 500 лярдов от частных инвесторов, ибо три препода-ноунейма из китайского вуза сделали практически за так то, на что были потрачены миллиарды денег, доверчивых инвесторов, которые повелись на магическое «AI»

rtxtxtrx ★★★
(27.01.25 13:47:10 MSK) автор топика

что уже вызвало падение акций OpenAI на американском фондовом рынке.

Хе, ох уж эти китайсы😏

UriZzz ★
(27.01.25 13:51:45 MSK)

Ответ на: комментарий от stickler 27.01.25 13:43:52 MSK

Нормально. Можешь сам проверить, оно пока что бесплатное https://chat.deepseek.com/

Только не забудь слева под полем ввода нажать кнопку DeepThink(R1), а то старая версия модели будет работать.

ox55ff ★★★★★
(27.01.25 13:52:21 MSK)

Ответ на: комментарий от ox55ff 27.01.25 13:52:21 MSK

Спасибо!

stickler
(27.01.25 13:55:01 MSK)

Ссылка

На Ollama DeepSeek R1 уже давненько лежит, репа 5 дней назад была обновлена. Надо попробовать 14b/q4 локально на видяшке

~~XOXO~~ ★
(27.01.25 14:07:23 MSK)

Ссылка

Ответ на: комментарий от apt_install_lrzsz 27.01.25 13:33:44 MSK

Это кит вроде как

PlaQ ★★
(27.01.25 14:10:59 MSK)

Ссылка

при этом не являясь требовательными к ресурсам GPU

https://github.com/sgl-project/sglang/tree/main/benchmark/deepseek_v3

Hardware Recommendation
8 x NVIDIA H200 GPUs

dataman ★★★★★
(27.01.25 14:13:53 MSK)

Ответ на: комментарий от apt_install_lrzsz 27.01.25 13:33:44 MSK

Намёк конкурентам;)

u5er ★★
(27.01.25 14:18:15 MSK)

Ссылка

а и б сидели на трубе, а упало, б пропало, что осталось на трубе?

Хорошо, давайте разберемся с этой загадкой. На первый взгляд, она кажется игрой слов, типичной для детских загадок. Итак, у нас есть два персонажа: "а" и "б", которые сидят на трубе. Затем происходит что-то: "а упало, б пропало". Вопрос: что осталось на трубе?

Первое, что приходит в голову, это то, что буквы "а" и "б" здесь используются не как самостоятельные объекты, а как части слова или слова, которые могут изменяться при удалении определенных букв. Возможно, тут игра с буквами русского алфавита.

Давайте подумаем: если у нас есть буква "а" и буква "б", и они "сидят на трубе", то есть составляют какое-то слово вместе с "трубой". Но "труба" здесь может быть ключевым словом. Может быть, нужно рассмотреть слово "труба" и посмотреть, что произойдет, если из него убрать буквы "а" и "б". Но в слове "труба" есть буква "а", а "б" нет. Тогда если "а упало", то из слова "труба" убираем "а", остается "труб". Затем "б пропало" — убираем "б" из "труб", получаем "тру". Но "тру" — это не совсем осмысленное слово, возможно, нужно искать другой подход.

Альтернативный вариант: возможно, буквы "а" и "б" обозначают части слова, которое связано с трубой. Например, "арбуз" — но тут нет связи с трубой. Или "аб..." что-то. Может, "абзац"? Нет, не подходит.

Еще одна мысль: в русском алфавите буквы идут в порядке а, б, в, г... Если "а" упало и "б" пропало, то следующая буква — "в". Возможно, ответ — буква "в", которая осталась на трубе. То есть после удаления "а" и "б" остается "в".

Но тогда почему именно "в"? Потому что это следующая буква после "а" и "б"? Или потому, что если убрать "а" и "б" из слова "труба", то остается "тр", но это не вяжется с буквой "в".

Возможно, нужно рассматривать не буквы алфавита, а сами слова. "а" и "б" сидели на трубе. Если "а" упало, то осталось "б". Затем "б" пропало, значит, ничего не осталось. Но тогда ответ — ничего. Однако в детских загадках обычно есть каламбур или игра слов, а не буквальный ответ.

Еще вариант: возможно, "а" и "б" — это сокращения от "Аня" и "Боря", но тогда это не связано с буквами. Или, может быть, это части слова, например, "арбуз": "а" и "б" как первые буквы, но тогда неясно.

Другой подход: в некоторых загадках используется то, что при удалении букв из слова остаются другие буквы. Например, если есть слово "слава", и убрать "а", получится "слв". Но это не помогает.

Попробуем еще раз: "а" и "б" на трубе. Если убрать "а" и "б", что останется? Если труба — это слово, то без "а" и "б" остается "тр", но это не имеет смысла. Может, это не буквы, а звуки? Например, "а" и "б" как звуки, но тогда непонятно.

А может, это математические символы? Например, "а" и "b" как переменные, но тогда опять не ясно.

Еще одна идея: в русском языке есть выражение "на трубе", может быть, имеется в виду труба как часть музыкального инструмента или как дымоход. Но как это связано с буквами?

Возможно, ответ заключается в том, что после удаления "а" и "б" остается буква "в", как следующая в алфавите. То есть: а, б, в, г... Если а и б убрали, то следующая буква — "в". Поэтому ответ: буква "в" осталась на трубе.

Но тогда почему именно "в"? Потому что если убрать первые две буквы алфавита, то следующая — третья, то есть "в". Возможно, это и есть ответ.

Проверяем: если "а" упало, "б" пропало, то осталась "в". Значит, на трубе осталась буква "в". Это логично в контексте алфавитной последовательности.

Но также можно подумать, что "труба" — это слово, и если из него убрать "а" и "б", то останется "тр". Но "тр" не является осмысленным словом. Поэтому более вероятно, что ответ связан с буквами алфавита.

Итак, наиболее вероятный ответ: на трубе осталась буква "в".

Ответ: На трубе осталась буква "В".

Это классическая детская загадка, построенная на последовательности букв русского алфавита. Если "а" (первая буква) упала, а "б" (вторая буква) пропала, то следующая буква — "В" (третья в алфавите). Таким образом, игра слов заключается в переходе от букв "а" и "б" к следующей букве "в", которая и остаётся на трубе.

leprecon73
(27.01.25 14:19:10 MSK)

Круто! Молодцы китайцы!

abondarev ★★★
(27.01.25 14:19:31 MSK)

Ссылка

Ответ на: комментарий от dataman 27.01.25 14:13:53 MSK

8 x NVIDIA H200 GPUs

не являясь требовательными к ресурсам GPU

4 069 406 ₽ за шт.

прежде чем умножать примите меры предосторожности

olelookoe ★★★
(27.01.25 14:19:48 MSK)

Конечно интересно роль отыгрывает, попросил представить себя сенатором Лотт Дод из Торговой Федерации, который на сессии сената обсуждает возможность мирных переговоров с сепаратистами, и где я в качестве одного из сенаторов с ним общаюсь. Очень вжился в роль, все повадки в диалоге даже перенял, которые я помню из The Clone Wars.

Посмотрим, запускал локально 7b гуфа, вроде ничё. Меня оно интересует только как база для RP моделей, чтобы использовтаь в SillyTavern (базовая модель наверное слишком этична может быть). А для остального LLM не использую даже. Но пожить в интерактивной книге - это отличная замена RPG.

skywarp
(27.01.25 14:22:25 MSK)
Последнее исправление: skywarp 27.01.25 14:26:04 MSK (всего исправлений: 3)

Ответ на: комментарий от apt_install_lrzsz 27.01.25 13:33:44 MSK

Это такой прикол, типа некоторые думают что Омега-3 положительно влияет на мозги.

mx__ ★★★★★
(27.01.25 14:25:30 MSK)

Ссылка

Ответ на: комментарий от olelookoe 27.01.25 14:19:48 MSK

Прежде чем умножать примите меры предосторожности

Это всего ~32.6кк ₽, ну т.е любая мелкая мухосранская IT-компания вполне может себе позволть, типа «Битрикса», они как раз сейчас агрессивно толкают ИИ в своих говнопродуктах.

~~XOXO~~ ★
(27.01.25 14:26:03 MSK)

Ссылка

Ответ на: комментарий от I-Love-Microsoft 27.01.25 13:38:24 MSK

сами знаете кого

Фигасе ты зашифровался и ведешь борьбу.

thesis ★★★★★
(27.01.25 14:29:07 MSK)

Ссылка

Ответ на: комментарий от olelookoe 27.01.25 14:19:48 MSK

прежде чем умножать примите меры предосторожности

У моего калькулятора столько разрядов нет.

BydymTydym ★★
(27.01.25 14:33:08 MSK)

Ссылка

Ответ на: комментарий от olelookoe 27.01.25 14:19:48 MSK

это утверждение относилось к облегченным моделям с парой-другой лярдов параметров

rtxtxtrx ★★★
(27.01.25 14:34:01 MSK) автор топика

Ссылка

671b модель, практически каждый способен запустить на LLM машине )

Дообученные модели совершенно не нравятся (пробовал DeepSeek R1 Distill (Llama 8B) и DeepSeek R1 Distill (Qwen 14B)), на фоне веб-версии шняга полная.

One ★★★★★
(27.01.25 14:40:02 MSK)

Ссылка

Ответ на: комментарий от dataman 27.01.25 14:13:53 MSK

Скромно хватит и трёх H200, для Q4_K_M (404Gb)

One ★★★★★
(27.01.25 14:41:44 MSK)

Ссылка

Ну хоть не deepthroat

Psilocybe ★★★★★
(27.01.25 14:43:07 MSK)

Ссылка

акций OpenAI на американском фондовом рынке

А каким образом, если OpenAI это ЧАО ещё и закрытое, никто не знает сколько стоят акции. А оценка около 86 миллиардов долларов, что именно обрушили китайцы, а главное где?

sbu_shpigun ★
(27.01.25 14:43:28 MSK)

Ссылка

Ответ на: комментарий от leprecon73 27.01.25 14:19:10 MSK

На трубе осталось «и».

Это загадка-шутка, основанная на игре слов. Фраза «а и б» читается как «а и бэ» (названия букв), но также содержит союз «и» (и). Когда «а» и «б» «упали» и «пропали» (в контексте букв, как будто их убрали из фразы), на трубе (в фразе) остается только буква «и».

Это классическая детская загадка, построенная на звуковом сходстве и игре с буквами.

Gemini 2.0 Flash Thinking 01-21

One ★★★★★
(27.01.25 14:45:11 MSK)

Ссылка

Ответ на: комментарий от skywarp 27.01.25 14:22:25 MSK

попросил представить себя сенатором Лотт Дод из Торговой Федерации

Страшно представить сколько гигаватт тратится на подобные запросы. Ты ещё в крестики-нолики с ней сыграй.

ox55ff ★★★★★
(27.01.25 14:52:55 MSK)

Ссылка

Сейчас пиарят по всему интеренту её, по ходу им почтовик положили, код не приходит на почту для регистрации.

th3m3 ★★★★★
(27.01.25 14:54:44 MSK)

Ответ на: комментарий от th3m3 27.01.25 14:54:44 MSK

по ходу им почтовик положили, код не приходит на почту для регистрации.

Там есть авторизация Google как вариант же. Конечно в каких-то интимно-анонимных случаях нужен и почтовик.

skywarp
(27.01.25 14:56:09 MSK)
Последнее исправление: skywarp 27.01.25 14:56:29 MSK (всего исправлений: 1)

Ответ на: комментарий от skywarp 27.01.25 14:56:09 MSK

авторизация Google

Очень плохая идея, если потерять доступ к аккаунту(google) или ещё какие санкции - доступ к аккаунту на сайте будет невозможен.

th3m3 ★★★★★
(27.01.25 14:59:29 MSK)

Ответ на: комментарий от rtxtxtrx 27.01.25 13:47:10 MSK

три препода-ноунейма из китайского вуза сделали практически за так то, на что были потрачены миллиарды денег

Повторили все исследования с 2015 года, сделанные OpenAI, благодаря которым сегодня препод любого вуза может воссоздать их конечный продукт? Creation != distribution.

kaldeon ★
(27.01.25 14:59:50 MSK)
Последнее исправление: kaldeon 27.01.25 15:01:14 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от th3m3 27.01.25 14:59:29 MSK

доступ к аккаунту на сайте будет невозможен.

Подумаешь, так всегда можно создать новый :D

skywarp
(27.01.25 15:00:18 MSK)

Ссылка

Ответ на: комментарий от leprecon73 27.01.25 14:19:10 MSK

а и б сидели на трубе, а упало, б пропало, что осталось на трубе?

Аж зачитался. Реально похоже на рассуждение человека. Но тупого и повторяющего одно и тоже.

Пошел пробовать в ChatGPT4o

“и” осталась на трубе!

Это загадка-игра слов. Когда говорится “А упало, Б пропало”, остаётся только “и” — союз, который соединяет “А” и “Б”. То есть, “и” — единственное, что остаётся на трубе.

skyman ★★★★
(27.01.25 15:08:41 MSK)

Ответ на: комментарий от leprecon73 27.01.25 14:19:10 MSK

Это классическая детская загадка, построенная на последовательности букв русского алфавита

Надо обучить модель что А И Б это три буквы а не просто and, Скайнет не близок к обретению сознания

I-Love-Microsoft ★★★★★
(27.01.25 15:13:18 MSK)

Покрутил локально 8b и 32b модели. Спросил как на калькуляторе citizen srp-280n переключить режим в радианы. 8b на запросы по-русски отвечает с вкраплениями английского и неправильно. 32b с вкраплениями китайского и тоже не правильно, но логика чуть лучше. Версия с веб-сайта отвечает правильно, видимо там максимальная модель. Пока что хороших локальных моделей для запуска на обычном ПК нет.

ox55ff ★★★★★
(27.01.25 15:29:20 MSK)

Ответ на: комментарий от ox55ff 27.01.25 15:29:20 MSK

Пока что хороших локальных моделей для запуска на обычном ПК нет.

Так оно и не предвидится. Разве что только когда обычные ПК дотянутся до того же уровня на которых нынче веб-версии запускают.

Стоит ли говорить что тогда веб-версии будут уже далеки от нынешних?

unDEFER ★★★★★
(27.01.25 15:40:18 MSK)

Только что прочитал на совсем не айтишном ресурсе, что акции Nvidia обрушились на фоне того, что китайцы выложили модели нейросеток в открытый доступ. Захожу на ЛОР, а тут уже обсуждают.

slepoy_pew ★
(27.01.25 15:44:10 MSK)

Ссылка

Ответ на: комментарий от dataman 27.01.25 14:13:53 MSK

8 x NVIDIA H200 GPUs

Ну! Один сервачок же всего! Даже не стойка! )

GAMer ★★★★★
(27.01.25 15:44:54 MSK)

Ссылка

Ответ на: комментарий от ox55ff 27.01.25 15:29:20 MSK

А там есть режим перехода в радианы?

Так на русском языке модели gemma-2 (пользуюсь 27b, но сволочь, медленная у меня с 4t/sec) очень хороши как локальные

One ★★★★★
(27.01.25 15:52:46 MSK)

Ответ на: комментарий от One 27.01.25 15:52:46 MSK

А там есть режим перехода в радианы?

В калькуляторе? Да, отдельная кнопка DRG, открывается меню и можно выбрать.

gemma-2

Не слышал.

но сволочь, медленная у меня с 4t/sec

У меня deepseek-r1:32b на RTX 4090 выдаёт 36 токенов в секунду.

ox55ff ★★★★★
(27.01.25 15:57:55 MSK)

Ответ на: комментарий от unDEFER 27.01.25 15:40:18 MSK

тогда веб-версии будут уже далеки от нынешних?

Каким образом? Они уже упёрлись в предел. Больше нет данных для обучения. Сама эта штука думать не может. Так что, скоро ждём, как все эти «пузыри-ИИ» лопнут.

th3m3 ★★★★★
(27.01.25 16:03:46 MSK)

Ответ на: комментарий от ox55ff 27.01.25 15:57:55 MSK

Я на встроенке, поэтому такие скудные показатели.

Mistral-Small-Instruct-2409 еще ничего так для русского языка.

Обычно проверяю: прошу рассказать об Оломоуце и о Москве, если модель хоть как-то косячит, значит для русского языка LLM-ка совсем не подходит.

One ★★★★★
(27.01.25 16:10:50 MSK)

Ссылка

вызвало падение акций

чудесненько-чудесненько, прям душу греет! :о)

sunjob ★★★★★
(27.01.25 16:14:47 MSK)

Ссылка

Ответ на: комментарий от I-Love-Microsoft 27.01.25 15:13:18 MSK

Скайнет не близок к обретению сознания

Тем временем ChatGPT:

Я:
а и б сидели на трубе, а упало, б пропало, что осталось на трубе?
ChatGPT:
На трубе осталось «и»! 😊

Jurik_Phys ★★★★★
(27.01.25 16:14:54 MSK)

Ссылка

Ответ на: комментарий от ox55ff 27.01.25 13:52:21 MSK

Письмо с кодом при регистрации не пришло на gmail.com, а теперь и вовсе пишет ошибку «Sorry! We're having trouble sending you an email right now. Please try again later.»

Печаль, тест-драйв откладывается

Jurik_Phys ★★★★★
(27.01.25 16:17:28 MSK)

Ответ на: комментарий от leprecon73 27.01.25 14:19:10 MSK

а он редкостный, бл...ин, балабол... я бы сказал, даже, трепло! :о)

sunjob ★★★★★
(27.01.25 16:18:01 MSK)

Ссылка

Ответ на: комментарий от th3m3 27.01.25 16:03:46 MSK

Ну если упёрлись, то как минимум серверные мощности всё равно будут ещё круче.

unDEFER ★★★★★
(27.01.25 16:18:06 MSK)

Ссылка

Ответ на: комментарий от th3m3 27.01.25 16:03:46 MSK

Больше нет данных для обучения.

Ты буквально пишешь в теме про модель, которая обучалась в том числе на неразмеченных данных.

DeepSeek-R1-Zero, a model trained via large-scale reinforcement learning (RL) without supervised fine-tuning (SFT) as a preliminary step, demonstrated remarkable performance on reasoning.

without supervised fine-tuning (SFT)

Удивительно, что до сих пор встречаются ИИ-скептики.

ox55ff ★★★★★
(27.01.25 16:19:12 MSK)

Ответ на: комментарий от Jurik_Phys 27.01.25 16:17:28 MSK

Я авторизовался через гугл-аккаунт.

ox55ff ★★★★★
(27.01.25 16:19:42 MSK)

Ссылка

Ответ на: комментарий от leprecon73 27.01.25 14:19:10 MSK

Поспрашивал разных Искусственных Идиотов:

«А и Б сидели на трубе. А упала, Б пропала, что осталось на трубе?»

Llama 3.1 70B Ответ: буква «А» упала, а буква «Б» пропала, поэтому на трубе осталось слово «на трубе».

Mixtral 8x7B This is a riddle. The answer is «dew» or «frost,» depending on the context. The reasoning behind this is that after the «A» character falls (perhaps as a letter or in a physical sense), and the «B» character disappears (possibly as an abbreviation for «fog» or «mist»), only the dew or frost remains on the pipe.

Claude 3 Haiku Согласно условию, А и Б сидели на трубе. А упала, Б пропала, что осталось на трубе? Исходя из этого, на трубе осталась только труба.

GPT-4o mini На трубе осталась «и». Это известная детская загадка!

Grapow ★★
(27.01.25 16:24:59 MSK)

Для того чтобы оставить комментарий войдите или зарегистрируйтесь.

← 1 2 3 →

←	ISD — новый способ управления systemd

Open Source

Meson 1.7.0

→

Похожие темы