LINUX.ORG.RU

Французский стартап Mistral выложил в общий доступ ИИ-модель, предположительно превосходящую GPT-3.5

 ,


0

5

В то время как большинство ИИ-компаний тщательно анонсируют свои новейшие алгоритмы в прессе и блогах, другим, похоже, вполне комфортно выбрасывать свои новинки в цифровой эфир, как пиратскому кораблю, избавляющемуся от балласта. Одна из компаний, подпадающая под последнюю категорию — это Mistral, французский ИИ-стартап, который выложил свою последнюю крупную языковую модель в неприметной ссылке на торрент.

В понедельник компания наконец дополнила свой первоначальный релиз блог-постом с подробностями о программе, которая просто называется Mixtral-8x7B. Согласно приведенным в посте бенчмаркам, алгоритм Mistral превосходит некоторых американских конкурентов, включая семейство Llama 2 от Meta и GPT-3.5 от OpenAI. Похоже, люди в интернете согласны с тем, что новый алгоритм Mistral довольно хорош.

Бонус к этому — Mixtral-8x7B имеет открытый исходный код, в отличие от иронически названной OpenAI, которая держит свои последние LLM закрытыми, что вызвало определенное недовольство среди сообщества.

Mistral сосредоточена на открытии исходного кода всего своего ИИ-программного обеспечения, что твердо ставит ее на одну сторону в разгорающейся войне культур ИИ-индустрии. Сооснователь и гендиректор Mistral AI Артур Менш недавно прокомментировал это решение, отметив, что его компания привержена «открытому, ответственному и децентрализованному подходу к технологиям».

>>> https://twitter.com/MistralAI/

★★★

Проверено: hobbit ()
Последнее исправление: hobbit (всего исправлений: 1)

вполне комфортно выбрасывать свои новинки в цифровой эфир, как пиратскому кораблю, избавляющемуся от балласта

Ты, случайно, журналистом на региональном ТВ не работал?

buddhist ★★★★★
()
Ответ на: комментарий от windows10

И по кухне что-то забавное помню

Главное, не спрашивай у ИИ про съедобность грибов.

Tigger ★★★★★
()
Ответ на: комментарий от noc101

Особо никто и не называет нейронку ИИ-шкой. Это больше журналисткое

Ии это не искуственный интел., а искуственный интелегент

s-warus ★★★
()
Ответ на: комментарий от Barracuda72

MoE – Mixture of Experts – это не просто «склеить восемь сеток», это модель с точностью и качеством как у полносвязной модели аналогичного веса (40 млрд весов), при вычислительных затратах в режиме генерации как у модели на 7 миллиардов весов.

Еще это и в процессе обучения работает, но несколько меньший прирост даёт.

Обучается сеть как одно целое, а не раздельные части, не надо путать с мультимодальными моделями где есть основная модель и куча адаптеров которые переводят разные типы данных в понятны основно модели формат.

timdorohin ★★★★
()
Ответ на: комментарий от i-rinat

Больший кластер с более жирными девайсами вполне вероятно что может эффективнее использовать ресурсы железа. Ну и ты платишь не за машину, а за её использование в виде количества запросов, так что вполне вероятно выйдет сильно дешевле для конечного пользователя (исключая случаи абуза бесплатного Colab’а)

timdorohin ★★★★
()
Ответ на: комментарий от timdorohin

Это может «защитить» от отдельных пользователей, им действительно может оказаться выгоднее платить за каждый запрос. Но всё равно ставит в невыгодное положение перед другими провайдерами услуги. Им же не нужно вкладываться в тренировку своей модели, они могут её просто взять и использовать. Крупные бизнесы, опять-таки, уже не будут покупать доступ к API. В больших масштабах им удобнее и дешевле будет развернуть сеть на своих мощностях.

i-rinat ★★★★★
()
Ответ на: комментарий от xor2003

Оперативной памяти? А сколько «весит» вся полная база у разных сервисов? Это 40, 100, 500 гигабайт? У меня нет идей

I-Love-Microsoft ★★★★★
()
Ответ на: комментарий от Ghostwolf

Вон, глупых ботов в играх, которые ходят по заданному маршруту, тоже называют AI - ещё с девяностых.

Кто называет? Игроки? Так не в их компетенции знать и правильно употреблять термины. А разработчики ботов называют AA (autonomous agents), по крайней мере в солидных книжках,

skidphysic
()
Ответ на: комментарий от alex1101

Сиськиписьки покупаешь отдельно от колонки с Алисой, в общем, как с женщинами, одна для поговорить, другая для...

skidphysic
()
Ответ на: комментарий от noc101

То, что вы хотите, нынче принято называть AGI.

Сильного АИ не существует. По факту сейчас есть модели неких процессов и не более. Особо никто и не называет нейронку ИИ-шкой. Это больше журналисткое название.

Сейчас нейросети называют «ИИ» даже разработчики нейросетей, когда желают получить финансирование.

question4 ★★★★★
()
Ответ на: комментарий от i-rinat

Это круто и всё такое. Но в чём бизнес модель заключается? Они потратили ресурсы на тренировку модели, и раздали её бесплатно всем желающим. Как они планируют зарабатывать деньги, если каждый скачавший теперь может использовать модель на своих мощностях?

Отдали устаревшую разработку, так как готовят что-то получше, но им нужны инвесторы и реклама?

question4 ★★★★★
()
Ответ на: комментарий от windows10

Ой сколько я уже этих ИИ перевидал.

Как поиск - да.

forumkinopoisk.ru и fantlab.ru переполнены вопросами от людей, которым ИИ по их запросу назвал несуществующий фильм или литературное произведение. Часто с подробным пересказом сюжета. Для поиска русскоязычных фильмов и книг ИИ предпочитают вместо ответа выдумывать что-нибудь своё. Скоро банить и стирать начнут.

question4 ★★★★★
()
Ответ на: комментарий от question4

Называют так только для маркетинга. По факту, тут ИИ и не пахнет. Это как спермотозоида назвать человеком.

noc101
()
Ответ на: комментарий от Pinux001

Пишет вход только по приглашению

А как еще должно быть? Свобода - это кого надо свобода. Если все будут злоупотреблять правами, то черте что получится, поэтому проект открыт для всех, для кого он не закрыт.

BydymTydym
()
Ответ на: комментарий от question4

Для поиска русскоязычных фильмов и книг ИИ предпочитают вместо ответа выдумывать что-нибудь своё.

О, я так после выхода GPT4 повелся. Искал повесть, прочитанную еще в юности, сюжет которой помнил довольно поверхностно. Этот электронный ублюдок мне пару очень правдоподобных вариантов выдал. Я потом долго изучал библиографии указанных авторов и силился понять почему названного произведения нет, зато есть с таким же названием у другого автора и почему оно вовсе не про то. А потом просто у народа спросил на форуме и 5 минут спустя мне назвали нужное произведение с первой попытки.

BydymTydym
()
Ответ на: комментарий от SpaceRanger

Лет через 10 будешь с Яндекс Алисой бухать и говорить, что лучшего собутыла свет ещё не видывал

Я уже бухаю с гпт-3.5, мне норм.

papin-aziat ★★★★★
()
Ответ на: комментарий от i-rinat

imho имховое:

они и не планируют - ибо «опоздали»

выброс в открытый доступ заведомо лучшей иишки - понуждает всякие отрытоИИ бежать ещё быстрее что бы хотя бы остатся в своём топе

qulinxao3
()
Ответ на: комментарий от windows10

ээээ,.?! пока не появились вот эти вот генераторы текста:

было очевидно что у всех людей сильный естественный интеллект

благо даря : прогрессу в области текстогенераторов выяснилось, что 95% людей носители слабого естественного интеллекта - которые не отличимы от слабого АИ

как это не успех технологии?

qulinxao3
()
Ответ на: комментарий от beck

интеллект - ставить и достигать СВОИХ целей

даром за амбаром

qulinxao3
()
Ответ на: комментарий от noc101

сильный аи существует

ему и название уже как несколько (десятков)сотен лет:

ГОСУДАРСТВО(их штук пять, остальное аватары этих пяти)

qulinxao3
()
Ответ на: комментарий от beck

В том, что интеллект отличает чушь от нечуши

чушь - понятие субъективное к сожалению, ммм и Кашпировский подтвердят что и образование и интеллект бессильны против глупости, которая является частью интеллекта в широком более объективном и неидеализированном смысле

peregrine ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.