LINUX.ORG.RU

История изменений

Исправление red75prim, (текущая версия) :

Однако, если ИИ начнет генерировать сам себе контент для обучения, результат может быть не таким революционным

Модель o1 от OpenAI делает именно это (самообучение эффективному применению chain of thought). На некоторых тестах (в основном математических) количество ошибок уменьшилось в 4-7 раз по сравнению с GPT4.

Если и не революционно, то многообещающе. Заметить, что решение скорее всего правильное, намного проще чем найти его. Так что модель, перебирающая кучу самосгенерированных вариантов решения, отбирающая правильные решения (по её собственному мнению) и обучающаяся на них повышает свои возможности. Как это продемонстрировано моделью o1.

Конечно, это работает только с проблемами, которые имеют логическое решение (вроде математических и части физических). Решение проблем, которые требуют знания фактов реального мира, от этого не улучшится. Для улучшения решения таких проблем нужен внешний валидатор: доступ к библиотеке, например.

Исходная версия red75prim, :

Однако, если ИИ начнет генерировать сам себе контент для обучения, результат может быть не таким революционным

Модель o1 от OpenAI делает именно это (самообучение эффективному применению chain of thought). На некоторых тестах (в основном математических) количество ошибок уменьшилось в 4-7 раз по сравнению с GPT4.

Если и не революционно, то многообещающе. Заметить, что решение скорее всего правильное, намного проще чем найти его. Так что модель, перебирающая кучу самосгенерированных вариантов решения, отбирающая правильные решения (по её собственному мнению) и обучающаяся на них повышает свои возможности. Как это продемонстрировано моделью o1.