LINUX.ORG.RU

DeepSeek выложил в открытый доступ свои модели

 , , ,

DeepSeek выложил в открытый доступ свои модели

4

5

Китайская компания DeepSeek выложила в открытый доступ свои модели искусственного интеллекта, включая DeepSeek-R1 и DeepSeek-R1-Zero, что уже вызвало падение акций OpenAI на американском фондовом рынке.

DeepSeek (深度求索) — это китайский стартап, основанный тремя сотрудниками Чжэцзянского университета из Ханчжоу. Проект был создан в 2023 году и за короткий период смог стать достойной альтернативой ChatGPT. У проекта есть веб-версия, официально доступная в том числе из России, в отличие от западных аналогов.

Проект привлек внимание на Западе после новости о том, что китайская компания открыла доступ к своим языковым моделям, которые демонстрируют если не превосходство, то паритет с американскими аналогами.

DeepSeek-R1-Zero и DeepSeek-R1 обучены на основе модели DeepSeek-V3-Base. Они содержат 671 миллиард параметров.

Также для скачивания доступны облегченные модели, которые представляют собой другие опенсорсные проекты, дополнительно дообученные с использованием данных, сгенерированных DeepSeek-R1. В частности, использовались модели Qwen и Llama. Они легко справляются с задачами в области программирования и решением математических задач, при этом не являясь требовательными к ресурсам GPU.

>>> Официальный репозиторий

★★

Проверено: hobbit ()
Последнее исправление: hobbit (всего исправлений: 4)

Есть ссылка на репу, но я бы всё же в тексте новости уточнил, хотя я тут собственно и напишу - исходники открыты. Уже несколько статей на эту тему читал, что это реально важный шаг для мировых технологий, то есть открытая качественная нейросетевая штука

Некоторые пишут что это попытка априори выбить монополию сами знаете кого на очень важную технологию

I-Love-Microsoft ★★★★★
()
Ответ на: комментарий от I-Love-Microsoft

Где-то плакают сёма альтман и илона маскова, потому как не увидят 500 лярдов от частных инвесторов, ибо три препода-ноунейма из китайского вуза сделали практически за так то, на что были потрачены миллиарды денег, доверчивых инвесторов, которые повелись на магическое «AI»

rtxtxtrx ★★
() автор топика

что уже вызвало падение акций OpenAI на американском фондовом рынке.

Хе, ох уж эти китайсы😏

UriZzz
()
Ответ на: комментарий от stickler

Нормально. Можешь сам проверить, оно пока что бесплатное https://chat.deepseek.com/

Только не забудь слева под полем ввода нажать кнопку DeepThink(R1), а то старая версия модели будет работать.

ox55ff ★★★★★
()

На Ollama DeepSeek R1 уже давненько лежит, репа 5 дней назад была обновлена. Надо попробовать 14b/q4 локально на видяшке

XOXO
()

а и б сидели на трубе, а упало, б пропало, что осталось на трубе?

Хорошо, давайте разберемся с этой загадкой. На первый взгляд, она кажется игрой слов, типичной для детских загадок. Итак, у нас есть два персонажа: "а" и "б", которые сидят на трубе. Затем происходит что-то: "а упало, б пропало". Вопрос: что осталось на трубе?

Первое, что приходит в голову, это то, что буквы "а" и "б" здесь используются не как самостоятельные объекты, а как части слова или слова, которые могут изменяться при удалении определенных букв. Возможно, тут игра с буквами русского алфавита.

Давайте подумаем: если у нас есть буква "а" и буква "б", и они "сидят на трубе", то есть составляют какое-то слово вместе с "трубой". Но "труба" здесь может быть ключевым словом. Может быть, нужно рассмотреть слово "труба" и посмотреть, что произойдет, если из него убрать буквы "а" и "б". Но в слове "труба" есть буква "а", а "б" нет. Тогда если "а упало", то из слова "труба" убираем "а", остается "труб". Затем "б пропало" — убираем "б" из "труб", получаем "тру". Но "тру" — это не совсем осмысленное слово, возможно, нужно искать другой подход.

Альтернативный вариант: возможно, буквы "а" и "б" обозначают части слова, которое связано с трубой. Например, "арбуз" — но тут нет связи с трубой. Или "аб..." что-то. Может, "абзац"? Нет, не подходит.

Еще одна мысль: в русском алфавите буквы идут в порядке а, б, в, г... Если "а" упало и "б" пропало, то следующая буква — "в". Возможно, ответ — буква "в", которая осталась на трубе. То есть после удаления "а" и "б" остается "в".

Но тогда почему именно "в"? Потому что это следующая буква после "а" и "б"? Или потому, что если убрать "а" и "б" из слова "труба", то остается "тр", но это не вяжется с буквой "в".

Возможно, нужно рассматривать не буквы алфавита, а сами слова. "а" и "б" сидели на трубе. Если "а" упало, то осталось "б". Затем "б" пропало, значит, ничего не осталось. Но тогда ответ — ничего. Однако в детских загадках обычно есть каламбур или игра слов, а не буквальный ответ.

Еще вариант: возможно, "а" и "б" — это сокращения от "Аня" и "Боря", но тогда это не связано с буквами. Или, может быть, это части слова, например, "арбуз": "а" и "б" как первые буквы, но тогда неясно.

Другой подход: в некоторых загадках используется то, что при удалении букв из слова остаются другие буквы. Например, если есть слово "слава", и убрать "а", получится "слв". Но это не помогает.

Попробуем еще раз: "а" и "б" на трубе. Если убрать "а" и "б", что останется? Если труба — это слово, то без "а" и "б" остается "тр", но это не имеет смысла. Может, это не буквы, а звуки? Например, "а" и "б" как звуки, но тогда непонятно.

А может, это математические символы? Например, "а" и "b" как переменные, но тогда опять не ясно.

Еще одна идея: в русском языке есть выражение "на трубе", может быть, имеется в виду труба как часть музыкального инструмента или как дымоход. Но как это связано с буквами?

Возможно, ответ заключается в том, что после удаления "а" и "б" остается буква "в", как следующая в алфавите. То есть: а, б, в, г... Если а и б убрали, то следующая буква — "в". Поэтому ответ: буква "в" осталась на трубе.

Но тогда почему именно "в"? Потому что если убрать первые две буквы алфавита, то следующая — третья, то есть "в". Возможно, это и есть ответ.

Проверяем: если "а" упало, "б" пропало, то осталась "в". Значит, на трубе осталась буква "в". Это логично в контексте алфавитной последовательности.

Но также можно подумать, что "труба" — это слово, и если из него убрать "а" и "б", то останется "тр". Но "тр" не является осмысленным словом. Поэтому более вероятно, что ответ связан с буквами алфавита.

Итак, наиболее вероятный ответ: на трубе осталась буква "в".

Ответ: На трубе осталась буква "В".

Это классическая детская загадка, построенная на последовательности букв русского алфавита. Если "а" (первая буква) упала, а "б" (вторая буква) пропала, то следующая буква — "В" (третья в алфавите). Таким образом, игра слов заключается в переходе от букв "а" и "б" к следующей букве "в", которая и остаётся на трубе.

leprecon73
()
Ответ на: комментарий от dataman

8 x NVIDIA H200 GPUs

не являясь требовательными к ресурсам GPU

4 069 406 ₽ за шт.

прежде чем умножать примите меры предосторожности

olelookoe ★★★
()

Конечно интересно роль отыгрывает, попросил представить себя сенатором Лотт Дод из Торговой Федерации, который на сессии сената обсуждает возможность мирных переговоров с сепаратистами, и где я в качестве одного из сенаторов с ним общаюсь. Очень вжился в роль, все повадки в диалоге даже перенял, которые я помню из The Clone Wars.

Посмотрим, запускал локально 7b гуфа, вроде ничё. Меня оно интересует только как база для RP моделей, чтобы использовтаь в SillyTavern (базовая модель наверное слишком этична может быть). А для остального LLM не использую даже. Но пожить в интерактивной книге - это отличная замена RPG.

skywarp
()
Последнее исправление: skywarp (всего исправлений: 3)
Ответ на: комментарий от apt_install_lrzsz

Это такой прикол, типа некоторые думают что Омега-3 положительно влияет на мозги.

mx__ ★★★★★
()
Ответ на: комментарий от olelookoe

Прежде чем умножать примите меры предосторожности

Это всего ~32.6кк ₽, ну т.е любая мелкая мухосранская IT-компания вполне может себе позволть, типа «Битрикса», они как раз сейчас агрессивно толкают ИИ в своих говнопродуктах.

XOXO
()
Ответ на: комментарий от I-Love-Microsoft

сами знаете кого

Фигасе ты зашифровался и ведешь борьбу.

thesis ★★★★★
()
Ответ на: комментарий от olelookoe

прежде чем умножать примите меры предосторожности

У моего калькулятора столько разрядов нет.

BydymTydym ★★
()
Ответ на: комментарий от olelookoe

это утверждение относилось к облегченным моделям с парой-другой лярдов параметров

rtxtxtrx ★★
() автор топика

671b модель, практически каждый способен запустить на LLM машине )

Дообученные модели совершенно не нравятся (пробовал DeepSeek R1 Distill (Llama 8B) и DeepSeek R1 Distill (Qwen 14B)), на фоне веб-версии шняга полная.

One ★★★★★
()
Ответ на: комментарий от dataman

Скромно хватит и трёх H200, для Q4_K_M (404Gb)

One ★★★★★
()

акций OpenAI на американском фондовом рынке

А каким образом, если OpenAI это ЧАО ещё и закрытое, никто не знает сколько стоят акции. А оценка около 86 миллиардов долларов, что именно обрушили китайцы, а главное где?

sbu_shpigun
()
Ответ на: комментарий от leprecon73

На трубе осталось «и».

Это загадка-шутка, основанная на игре слов. Фраза «а и б» читается как «а и бэ» (названия букв), но также содержит союз «и» (и). Когда «а» и «б» «упали» и «пропали» (в контексте букв, как будто их убрали из фразы), на трубе (в фразе) остается только буква «и».

Это классическая детская загадка, построенная на звуковом сходстве и игре с буквами.

Gemini 2.0 Flash Thinking 01-21

One ★★★★★
()
Ответ на: комментарий от skywarp

попросил представить себя сенатором Лотт Дод из Торговой Федерации

Страшно представить сколько гигаватт тратится на подобные запросы. Ты ещё в крестики-нолики с ней сыграй.

ox55ff ★★★★★
()

Сейчас пиарят по всему интеренту её, по ходу им почтовик положили, код не приходит на почту для регистрации.

th3m3 ★★★★★
()
Ответ на: комментарий от th3m3

по ходу им почтовик положили, код не приходит на почту для регистрации.

Там есть авторизация Google как вариант же. Конечно в каких-то интимно-анонимных случаях нужен и почтовик.

skywarp
()
Последнее исправление: skywarp (всего исправлений: 1)
Ответ на: комментарий от skywarp

авторизация Google

Очень плохая идея, если потерять доступ к аккаунту(google) или ещё какие санкции - доступ к аккаунту на сайте будет невозможен.

th3m3 ★★★★★
()
Ответ на: комментарий от rtxtxtrx

три препода-ноунейма из китайского вуза сделали практически за так то, на что были потрачены миллиарды денег

Повторили все исследования с 2015 года, сделанные OpenAI, благодаря которым сегодня препод любого вуза может воссоздать их конечный продукт? Creation != distribution.

kaldeon
()
Последнее исправление: kaldeon (всего исправлений: 2)
Ответ на: комментарий от th3m3

доступ к аккаунту на сайте будет невозможен.

Подумаешь, так всегда можно создать новый :D

skywarp
()
Ответ на: комментарий от leprecon73

а и б сидели на трубе, а упало, б пропало, что осталось на трубе?

Аж зачитался. Реально похоже на рассуждение человека. Но тупого и повторяющего одно и тоже.

Пошел пробовать в ChatGPT4o

“и” осталась на трубе!

Это загадка-игра слов. Когда говорится “А упало, Б пропало”, остаётся только “и” — союз, который соединяет “А” и “Б”. То есть, “и” — единственное, что остаётся на трубе.

skyman ★★★★
()
Ответ на: комментарий от leprecon73

Это классическая детская загадка, построенная на последовательности букв русского алфавита

Надо обучить модель что А И Б это три буквы а не просто and, Скайнет не близок к обретению сознания

I-Love-Microsoft ★★★★★
()

Покрутил локально 8b и 32b модели. Спросил как на калькуляторе citizen srp-280n переключить режим в радианы. 8b на запросы по-русски отвечает с вкраплениями английского и неправильно. 32b с вкраплениями китайского и тоже не правильно, но логика чуть лучше. Версия с веб-сайта отвечает правильно, видимо там максимальная модель. Пока что хороших локальных моделей для запуска на обычном ПК нет.

ox55ff ★★★★★
()
Ответ на: комментарий от ox55ff

Пока что хороших локальных моделей для запуска на обычном ПК нет.

Так оно и не предвидится. Разве что только когда обычные ПК дотянутся до того же уровня на которых нынче веб-версии запускают.

Стоит ли говорить что тогда веб-версии будут уже далеки от нынешних?

unDEFER ★★★★★
()

Только что прочитал на совсем не айтишном ресурсе, что акции Nvidia обрушились на фоне того, что китайцы выложили модели нейросеток в открытый доступ. Захожу на ЛОР, а тут уже обсуждают.

slepoy_pew
()
Ответ на: комментарий от dataman

8 x NVIDIA H200 GPUs

Ну! Один сервачок же всего! Даже не стойка! )

GAMer ★★★★★
()
Ответ на: комментарий от ox55ff

А там есть режим перехода в радианы?

Так на русском языке модели gemma-2 (пользуюсь 27b, но сволочь, медленная у меня с 4t/sec) очень хороши как локальные

One ★★★★★
()
Ответ на: комментарий от One

А там есть режим перехода в радианы?

В калькуляторе? Да, отдельная кнопка DRG, открывается меню и можно выбрать.

gemma-2

Не слышал.

но сволочь, медленная у меня с 4t/sec

У меня deepseek-r1:32b на RTX 4090 выдаёт 36 токенов в секунду.

ox55ff ★★★★★
()
Ответ на: комментарий от unDEFER

тогда веб-версии будут уже далеки от нынешних?

Каким образом? Они уже упёрлись в предел. Больше нет данных для обучения. Сама эта штука думать не может. Так что, скоро ждём, как все эти «пузыри-ИИ» лопнут.

th3m3 ★★★★★
()
Ответ на: комментарий от ox55ff

Я на встроенке, поэтому такие скудные показатели.

Mistral-Small-Instruct-2409 еще ничего так для русского языка.

Обычно проверяю: прошу рассказать об Оломоуце и о Москве, если модель хоть как-то косячит, значит для русского языка LLM-ка совсем не подходит.

One ★★★★★
()

вызвало падение акций

чудесненько-чудесненько, прям душу греет! :о)

sunjob ★★★★★
()
Ответ на: комментарий от I-Love-Microsoft

Скайнет не близок к обретению сознания

Тем временем ChatGPT:

Я:
а и б сидели на трубе, а упало, б пропало, что осталось на трубе?
ChatGPT:
На трубе осталось «и»! 😊

Jurik_Phys ★★★★★
()
Ответ на: комментарий от ox55ff

Письмо с кодом при регистрации не пришло на gmail.com, а теперь и вовсе пишет ошибку «Sorry! We're having trouble sending you an email right now. Please try again later.»

Печаль, тест-драйв откладывается

Jurik_Phys ★★★★★
()
Ответ на: комментарий от leprecon73

а он редкостный, бл...ин, балабол... я бы сказал, даже, трепло! :о)

sunjob ★★★★★
()
Ответ на: комментарий от th3m3

Ну если упёрлись, то как минимум серверные мощности всё равно будут ещё круче.

unDEFER ★★★★★
()
Ответ на: комментарий от th3m3

Больше нет данных для обучения.

Ты буквально пишешь в теме про модель, которая обучалась в том числе на неразмеченных данных.

DeepSeek-R1-Zero, a model trained via large-scale reinforcement learning (RL) without supervised fine-tuning (SFT) as a preliminary step, demonstrated remarkable performance on reasoning.

without supervised fine-tuning (SFT)

Удивительно, что до сих пор встречаются ИИ-скептики.

ox55ff ★★★★★
()
Ответ на: комментарий от Jurik_Phys

Я авторизовался через гугл-аккаунт.

ox55ff ★★★★★
()
Ответ на: комментарий от leprecon73

Поспрашивал разных Искусственных Идиотов:

«А и Б сидели на трубе. А упала, Б пропала, что осталось на трубе?»

Llama 3.1 70B Ответ: буква «А» упала, а буква «Б» пропала, поэтому на трубе осталось слово «на трубе».

Mixtral 8x7B This is a riddle. The answer is «dew» or «frost,» depending on the context. The reasoning behind this is that after the «A» character falls (perhaps as a letter or in a physical sense), and the «B» character disappears (possibly as an abbreviation for «fog» or «mist»), only the dew or frost remains on the pipe.

Claude 3 Haiku Согласно условию, А и Б сидели на трубе. А упала, Б пропала, что осталось на трубе? Исходя из этого, на трубе осталась только труба.

GPT-4o mini На трубе осталась «и». Это известная детская загадка!

Grapow ★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.