OpenAI выпустила o1

chatgpt, llm, openai, искусственный интеллект

0

2

https://openai.com/index/introducing-openai-o1-preview/

12 сентября 2024 года OpenAI представила o1 — свою первую ИИ-модель с возможностями «рассуждения». Проект OpenAI o1 в разы производительнее GPT-4o. Новая модель показывает себя в 5 раз лучше в математических задачах и в 6 раз лучше в написании кода, чем GPT-4o.

По данным OpenAI, проект o1 отвечает на запросы и сложные задачи на уровне знаний доктора наук точных дисциплин. Также o1 заточена под соревновательное программирование, олимпиады по математике, точные науки и даже философию.

Разработчики пояснили, что o1 не просто собирает ответ из слов в датасете, а по-настоящему думает, как человек.

Ссылка

←	Чем вендоузятнеги пользовались до git?

android перестали работать приложения

→

← 1 2 →

Думать может и камень, если мы наделим его такой способностью.

// извините

forest22 ★
(12.09.24 22:17:54 MSK)
Последнее исправление: forest22 12.09.24 22:18:33 MSK (всего исправлений: 1)

Ссылка

Разработчики пояснили, что o1 не просто собирает ответ из слов в датасете, а по-настоящему думает, как человек.

Как думает человек до сих пор нет четкого определения. Два разных человека знающие ответ на вопрос, могут дать два разных ответа в зависимости от...

anc ★★★★★
(12.09.24 22:31:03 MSK)

на уровне знаний доктора наук точных дисциплин

По ссылке: performs similarly to PhD students

o1 не просто собирает ответ из слов в датасете, а по-настоящему думает, как человек

По ссылке просто написано, что дольше думает над ответом)

В playground пока нету.

goingUp ★★★★★
(12.09.24 22:34:49 MSK)

Ответ на: комментарий от goingUp 12.09.24 22:34:49 MSK

По ссылке просто написано, что дольше думает над ответом)

По сути да, только лично я пока не понимаю, как оно работает под капотом. Если я все правильно понял, то они просто в каком-то усиленном режиме включили CoT в процесс тренировки. При этом не понятно, как они могли включить его на этапе pretraining, учитывая что тогда параллелизовать в рамках одной последовательности его можно примерно никак. Они упоминают некий large-scale reinforcement learning, возможно что они просто сделали fine tuning с этой самой CoT в большем объеме и с rl

rk-d ★
(12.09.24 22:49:11 MSK) автор топика
Последнее исправление: rk-d 12.09.24 22:52:15 MSK (всего исправлений: 2)

По данным OpenAI, проект o1 отвечает на запросы и сложные задачи на уровне знаний доктора наук точных дисциплин.

Простой тест: подсовываем обыкновенный нелинейный дифур второго порядка, который средний выпускник вуза/втуза не интегрирует за полчаса. Если нейросеть интегрирует, то подсовываем систему дифуров с неизвестным в литературе общим решением. Если нет, то ну вы понели (с)

x22 ★☆
(12.09.24 23:00:55 MSK)

o1 … по-настоящему думает, как человек.

«Женскую логику» могёт? :)

quickquest ★★★★★
(13.09.24 00:02:53 MSK)

Ссылка

Ответ на: комментарий от x22 12.09.24 23:00:55 MSK

Подсовывай сразу великую теорему Ферма. Не справился - не мужик.

Я вот уже вижу, что он олимпиадные задачи решает лучше меня. И это меня немножко печалит.

vbr ★★★★
(13.09.24 00:28:47 MSK)

Также o1 заточена под соревновательное программирование, олимпиады по математике, точные науки и даже философию.

проект o1 отвечает на запросы и сложные задачи на уровне знаний доктора наук точных дисциплин.

Чего на халяву нашли на то и надрочили. А именно, энциклопедии, тонны книжек по философии и сотни тысяч результатов олимпиад со всеми их решениями, задачами, кодом и возможно эссе на тему как кто и что решал, ну типа с пояснениями.

Разработчики пояснили, что o1 не просто собирает ответ из слов в датасете, а по-настоящему думает, как человек.

Я извиняюсь за сленг, а за базар они пояснили, в смысле как думает человек это всё ещё спорный вопрос ващета, или тут слово пояснили в скобочки надо обернуть? А не хотят ли они сравнить тёплое с мягким? А именно, вариативную сложность системы представить не как вариативную сложность, а как некий процесс мыслительный, ну в смысле, во первых один хрен никто не проверит, даже если дать и исходники и модель на растерзание на потоха, банальная сложность в виде огромного количества возможных состояний просто не даст дать ответа на то что и как там происходит, хотя проследить можно всё от и до каждую мелоч, но в этом смысла нет, физически человек не может удержать в голове состояние нейросетки, метрики тоже не помогут, и почему вопрос, они сами то, откуда знают, как человек оно работает, или нет. Если да, что они конкретно имеют в виду?

К сожалению, сама простота технического вопроса, выраженная в неимоверной сложности конечного результата, даёт возможным маркетологические манипуляции на ровном месте такие что мама не горюй, а ещё хуже, что при этом смешивается, правда, лож, маркетинг и реклама, причём так, что даже за руку не поймаешь ибо хрен ты проверишь практически любое из заявлений.

Мимикрия может быть неотличима от оригинала, но мимикрией оно от этого не перестаёт быть.

Чисто технически молодцы, это здорово что что-то получается. Но это не ИИ, не имеет к нему никакого отношения, ничего там не мыслит и мыслить на данный момент не может по определению, чисто технически. А PseudoOpenNotAI вбросил очередную матетинговую какашку. Действительно, новый чатбот может показывать клёвые результаты и быть полезным, но это точно не то чем они его называют, и точно работает не так как они это описывают.

LINUX-ORG-RU ★★★★★
(13.09.24 01:22:08 MSK)

Ответ на: комментарий от LINUX-ORG-RU 13.09.24 01:22:08 MSK

По ссылке приведены примеры его рассуждений. По-мне примерно так же, как человек рассуждает. Конечно это не сильный ИИ, но это большой прогресс в сравнение с предыдущей моделью.

vbr ★★★★
(13.09.24 01:27:45 MSK)

Ответ на: комментарий от x22 12.09.24 23:00:55 MSK

Простой тест: подсовываем обыкновенный нелинейный дифур

Слишком сложно. Его все еще задачками по арифметике (elementary number theory, в смысле) легко завалить.

Например,

Whether (1000^{100!} - 1) divides (2002^{100!} - 1) ?

– и все, пиздец котенку.

i586 ★★★★★
(13.09.24 01:28:40 MSK)
Последнее исправление: i586 13.09.24 01:39:45 MSK (всего исправлений: 1)

Ответ на: комментарий от vbr 13.09.24 00:28:47 MSK

Если бы ты был савант, с абсолютной памятью, то мог бы зазубрить все решения всех олимпиад которые когда либо были, а раз зазубрил то можешь их комбинировать так что вариаций станет на порядки больше чем зазубрил и оно бы тебя не победило бы и лучше не сделало. Это из разряда, трактор копает лучше чем я, ну ок. Так и там, чисто механически оно может манипулировать данными в большем объёме и быстрее, ну ок. Нет смысле пытаться прыгнуть выше самолёта, и копать быстрее трактора, как и нет смысла знать больше чем ЭВМ и считать быстрее.

Никого же не ущемляет что БД у википедии может дать ответ на то что не сможет дать ни один человек, быстрее, точнее и подробнее. Никто не печалится от этого. Вот и ты не печалься.

LINUX-ORG-RU ★★★★★
(13.09.24 01:32:31 MSK)

4o только вышла, а уже новая. Впрочем хорошо. Время от времени пригождается по работе.

ox55ff ★★★★★
(13.09.24 01:34:20 MSK)

Ссылка

Ответ на: комментарий от vbr 13.09.24 01:27:45 MSK

По ссылке приведены примеры его рассуждений. По-мне примерно так же, как человек рассуждает.

Это так не работает. (Хотя и не важно, так или не так, главное чтобы тебя устраивала работа программы, если здорово, то почему бы и нет)

Конечно это не сильный ИИ, но это большой прогресс в сравнение с предыдущей моделью.

Прогресс, да. И это здорово. Но ты написал так что ИИ это тоже будет модель, просто пока ещё текущие модели не стали ИИ, это абсолютно неправильная логика. ИИ не может быть моделью, вот просто, нет. Это так не работает. Как не может колесо быть автомобителем, или руль, или педаль, это просто части. Даже хуже, это как надувать матрас, дуешь его , дуешь, ну вот надул, плавает, это конечно не многотонный сохогруз, но это большой прогресс по сравнению с предыдущими надуваниями, вот если я постараюсь его ещё надуть у матраса появится металлический киль, а если ещё дунуть то винт и мотор, а если ещё как посильнее, да качком велосипедным и каюты обустроенные. Вот это вот так звучит, когда говорят о развитии текущих искусственных нейросетей, склоняя к тому что что они это и есть будущий ИИ, а это не так. От слова совсем. Хотя казалось бы.

Не всё так просто. А так да, молодцы, прикольно и чем лучше тем лучше.

LINUX-ORG-RU ★★★★★
(13.09.24 01:42:52 MSK)
Последнее исправление: LINUX-ORG-RU 13.09.24 01:51:43 MSK (всего исправлений: 1)

Ссылка

o1 отвечает на запросы и сложные задачи на уровне знаний доктора наук точных дисциплин

они наконец нашли мою диссертацию, лол, если на таких ее и обучали, то мы все утонем

Lordwind ★★★★★
(13.09.24 07:48:29 MSK)

Ссылка

Ответ на: комментарий от goingUp 12.09.24 22:34:49 MSK

По ссылке: performs similarly to PhD students

т.е. по факту - Аспирант. Это кто так весело аспиранта в доктора наук преобразовал? Причем это не только на ЛОРе такая трактовка, это где-то в другом месте надмозговой перевод произошел.

Loki13 ★★★★★
(13.09.24 09:15:33 MSK)
Последнее исправление: Loki13 13.09.24 09:15:47 MSK (всего исправлений: 1)

Ссылка

Ждём о7.

Bfgeshka ★★★★★
(13.09.24 09:18:26 MSK)

Ответ на: комментарий от Bfgeshka 13.09.24 09:18:26 MSK

А что у них вообще с нумерацией версий? Почему o1 круче чем 4o? К чему эти перестановки цифры и буквы?

unDEFER ★★★★★
(13.09.24 10:05:18 MSK)

Ответ на: комментарий от unDEFER 13.09.24 10:05:18 MSK

Главное, чтобы для разных версий обозначения не совпадали.

forest22 ★
(13.09.24 10:11:53 MSK)

Ссылка

Ответ на: комментарий от vbr 13.09.24 01:27:45 MSK

Прогресс там разве что в виде наращивания мощности и доработки того, что и так было очевидно уже в первых гпт.

Сильный ИИ это несколько про другое вообще, но его делать никто не собирается, а если и будут делать то не для публикации.

firkax ★★★★★
(13.09.24 10:31:45 MSK)

Ссылка

Ответ на: комментарий от anc 12.09.24 22:31:03 MSK

Разработчики пояснили, что o1 не просто собирает ответ из слов в датасете, а по-настоящему думает, как человек.
Как думает человек до сих пор нет четкого определения. Два разных человека знающие ответ на вопрос, могут дать два разных ответа в зависимости от...

Пришел в голову пример. Вопрос: «Может ли человек летать?». Один ответит Нет, второй Да. И оба будут правы.

anc ★★★★★
(13.09.24 10:57:22 MSK)

Ответ на: комментарий от unDEFER 13.09.24 10:05:18 MSK

А что у них вообще с нумерацией версий? Почему o1 круче чем 4o?

Это как до нашей эры и после. :)

anc ★★★★★
(13.09.24 11:00:15 MSK)

Ссылка

в 5 раз лучше

о5 25.

dataman ★★★★★
(13.09.24 12:19:36 MSK)

Ссылка

Ответ на: комментарий от anc 13.09.24 10:57:22 MSK

Может, но только вертикально https://www.youtube.com/watch?v=gyQw6Tt35Lc

ratvier ★★
(13.09.24 13:02:43 MSK)

Ответ на: комментарий от ratvier 13.09.24 13:02:43 MSK

По параболе тоже может https://youtu.be/fAG9gGKJgDM?t=99. И по горизонтали тоже, что каждый день делают тысячи людей. Или другой вариант: Всё человечество летает с момента появления человеков.

anc ★★★★★
(13.09.24 13:17:17 MSK)

Ответ на: комментарий от Bfgeshka 13.09.24 09:18:26 MSK

Ждём о7.

Ждем C2H5OH

anc ★★★★★
(13.09.24 13:19:02 MSK)

Ответ на: комментарий от anc 13.09.24 13:17:17 MSK

/me достаёт из кармана пистолет, заряжает его первым попавшимся человеком, производит выстрел, и наблюдает: человек летит, но не летает.

ratvier ★★
(13.09.24 13:58:38 MSK)

Ответ на: комментарий от ratvier 13.09.24 13:58:38 MSK

Я написал же: И по горизонтали тоже, что каждый день делают тысячи людей.

anc ★★★★★
(13.09.24 14:06:23 MSK)

Ответ на: комментарий от ratvier 13.09.24 13:58:38 MSK

Очень похоже на тот тред про летающих коров.

Irma ★★
(13.09.24 14:22:34 MSK)

Ответ на: комментарий от anc 13.09.24 13:19:02 MSK

А спирт на дейтерии бывает? :D

LINUX-ORG-RU ★★★★★
(13.09.24 14:33:40 MSK)

Ссылка

Ответ на: комментарий от anc 13.09.24 14:06:23 MSK

Давай в картинках: пух летает, вода льётся.

ratvier ★★
(13.09.24 18:34:15 MSK)

Ответ на: комментарий от ratvier 13.09.24 18:34:15 MSK

ЯННП, можно не так глубоко?

anc ★★★★★
(13.09.24 19:02:02 MSK)

Ответ на: комментарий от Irma 13.09.24 14:22:34 MSK

До чего дошёл прогресс, аэродинамика коровы:
https://www.techinsider.ru/science/374172-pochemu-korovy-letayut-aerodinamika...

ratvier ★★
(13.09.24 19:14:23 MSK)

Ссылка

Ответ на: комментарий от anc 13.09.24 19:02:02 MSK

Ну перекликай обратно на русский, примерно то же самое, только без картинок.

ratvier ★★
(13.09.24 19:17:57 MSK)

Ссылка

Ответ на: комментарий от i586 13.09.24 01:28:40 MSK

Whether (1000^{100!} - 1) divides (2002^{100!} - 1) ?

Приближенный ответ 0. В чём чатгпт не прав?

foror ★★★★★
(13.09.24 19:44:19 MSK)

Ответ на: комментарий от foror 13.09.24 19:44:19 MSK

whether (1000^{100!} - 1) divides (2002^{100!} - 1)
Приближенный ответ 0.

ЯННП.

i586 ★★★★★
(13.09.24 19:47:29 MSK)

Ответ на: комментарий от i586 13.09.24 19:47:29 MSK

Так и я. А ты к боту ещё прикапываешься.

foror ★★★★★
(13.09.24 19:48:29 MSK)

Ответ на: комментарий от foror 13.09.24 19:48:29 MSK

You
gcd((1000^{100!} - 1), (2002^{100!} - 1)) != 1

ChatGPT
...
which confirms the statement in the question.

Чё-т лень думать, а какой там ответ?

ratvier ★★
(13.09.24 20:24:36 MSK)

Ответ на: комментарий от ratvier 13.09.24 20:24:36 MSK

Рассмотрим выражение:

\[
\frac{1000^{100!} - 1}{2002^{100!} - 1}
\]

Здесь заметим, что числа 1000 и 2002 значительно отличаются друг от друга. Чтобы упростить задачу, обратим внимание на возможные приближения и свойства больших чисел.

Для больших степеней \(a^{100!}\) и \(b^{100!}\), где \(a\) и \(b\) — достаточно большие числа, разница в их величинах становится чрезвычайно велика. Попробуем проанализировать дробь.

Обозначим \(x = 100!\) для краткости. Тогда выражение перепишется так:

\[
\frac{1000^x - 1}{2002^x - 1}
\]

Для малых \(x\) разницу между этими числами можно было бы как-то оценить, но для таких огромных значений как \(100!\), разница между \(1000^x\) и \(2002^x\) будет астрономической.

При приближении дроби для таких больших степеней можно сделать вывод, что:

\[
\frac{1000^x - 1}{2002^x - 1} \approx 0
\]

Итак, с учётом величин чисел, результат задачи можно приближённо считать равным:

\[
\boxed{0}
\]

foror ★★★★★
(13.09.24 20:37:38 MSK)

Ссылка

Ответ на: комментарий от ratvier 13.09.24 20:24:36 MSK

К o1 у меня нет доступа, это на gpt4o ответ. Но тут обычный человек не поймёт, что этому ботанику надо, а он хочет ещё от бота ответ получить.

foror ★★★★★
(13.09.24 20:54:46 MSK)
Последнее исправление: foror 13.09.24 20:55:44 MSK (всего исправлений: 1)

Ответ на: комментарий от foror 13.09.24 20:54:46 MSK

Но тут обычный человек не поймёт, что этому ботанику надо, а он хочет ещё от бота ответ получить.

В целых положительных числах, .ля. .ебилы, .ля. (с)

x22 ★☆
(13.09.24 21:18:55 MSK)

LLM не умеет думать, и никогда не научится

lovesan ★★
(13.09.24 21:29:11 MSK)

Разработчики пояснили, что o1 не просто собирает ответ из слов в датасете, а по-настоящему думает, как человек.

Про «как человек» это маркетинговый буллшит. Но на простейшую проверку которую заваливали сети до нее:«А и Б сидело на трубе, А - упало, Б - пропало. Что осталось на трубе?» отвечает верно «И».

Инференс развернут вот тут, можно поиграться. Добавьте ссылку в новость если посчитаете нужным.

Obezyan ☆
(13.09.24 22:24:11 MSK)

Ссылка

Ответ на: комментарий от rk-d 12.09.24 22:49:11 MSK

возможно что они просто сделали fine tuning с этой самой CoT в большем объеме и с rl

Именно так и сделали, только не просто абстрактные CoT, а конкретно STEM.

Obezyan ☆
(13.09.24 22:32:14 MSK)

Ссылка

Ответ на: комментарий от unDEFER 13.09.24 10:05:18 MSK

Почему o1 круче чем 4o?

Потому что не ничего круче константной сложности O(1) алгоритма.

Obezyan ☆
(13.09.24 22:35:37 MSK)

Ссылка

а по-настоящему думает, как человек.

Что, уже и посылать спрашивающих может?

Tigger ★★★★★
(13.09.24 22:44:35 MSK)

Ссылка

Ответ на: комментарий от x22 13.09.24 21:18:55 MSK

В целых положительных числах, .ля. .ебилы, .ля. (с)

Я всё ещё не до конца понял, что хочет от gpt4o этот мешок с мясом, но если и понял, то gpt4o и подавно:

Таким образом, можно сделать вывод, что: не делится

foror ★★★★★
(14.09.24 02:00:15 MSK)

Ответ на: комментарий от foror 14.09.24 02:00:15 MSK

Вот что выдаёт, но я не математик, а пограммист, так что пусть тут математики проверяют:

Для того чтобы определить, делится ли (1000^100! - 1) на (2002^100! - 1), рассмотрим задачу с точки зрения теории чисел, а именно — теорем о делимости разности степеней.

### Общий подход

Мы знаем, что:

(2002^100! - 1) / (1000^100! - 1)

делится, если существуют такие взаимосвязи между числами 1000 и 2002, что 1000^n - 1 делит 2002^n - 1 для n = 100!.

### Теорема о делимости разности степеней

Известная теорема о делимости разности степеней гласит:

a^n - 1 делит b^n - 1 тогда и только тогда, когда a делит b.

Таким образом, чтобы проверить, делится ли (1000^100! - 1) на (2002^100! - 1), нам нужно проверить, делится ли 1000 на 2002.

Однако:

2002 = 1000 * 2 + 2

То есть, 1000 **не делит** 2002 (поскольку остаток 2 отличен от нуля).

### Вывод

Поскольку 1000 не делит 2002, выражение (1000^100! - 1) **не делит** (2002^100! - 1).

Ответ:

Нет, не делится.

foror ★★★★★
(14.09.24 02:12:26 MSK)

Ссылка

Ответ на: комментарий от lovesan 13.09.24 21:29:11 MSK

Так и самолёт не умеет грационзно махать крыльями как птицы.

foror ★★★★★
(14.09.24 02:27:04 MSK)

по-настоящему думает, как человек

Чтобы по настоящему думать, нужен элемент случайности. Вот когда к ИИ приделают квантовый сопроцессор…

greenman ★★★★★
(14.09.24 04:42:17 MSK)

Ответ на: комментарий от LINUX-ORG-RU 13.09.24 01:32:31 MSK

Никого же не ущемляет что БД у википедии может дать ответ на то что не сможет дать ни один человек

БД у вики наполняли люди, так что с «не сможет дать ни один человек» приминительно к единичным запросам вы погорячились.

anc ★★★★★
(14.09.24 07:30:37 MSK)

Ссылка

Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)

← 1 2 →

←	Чем вендоузятнеги пользовались до git?

Talks

android перестали работать приложения

→

Похожие темы