Нейросеть AlphaDev от Deepmind изобрела новый алгоритм сортировки, и он уже в LLVM!

llvm, neural network, алгоритмы, нейронные сети, сортировка

1

2

Научпоп, с цветными картинками: https://www.deepmind.com/blog/alphadev-discovers-faster-sorting-algorithms

В нашей статье, опубликованной 7 июня в журнале Nature, мы представляем AlphaDev, систему искусственного интеллекта (ИИ), которая использует обучение с подкреплением для открытия усовершенствованных алгоритмов информатики, превосходящих те, которые ученые и инженеры оттачивали десятилетиями.

Благодаря открытому исходному коду наших новых алгоритмов сортировки в основной библиотеке C++ миллионы разработчиков и компаний по всему миру теперь используют его в приложениях ИИ в различных отраслях, от облачных вычислений и онлайн-покупок до управления цепочками поставок. Это первое изменение в этой части библиотеки сортировки более чем за десятилетие, и впервые в эту библиотеку был добавлен алгоритм, разработанный с помощью обучения с подкреплением. Мы рассматриваем это как важный шаг к использованию ИИ для оптимизации мирового кода, по одному алгоритму за раз.

AlphaDev основан на AlphaZero , нашей модели обучения с подкреплением, которая побеждала чемпионов мира в таких играх, как го, шахматы и сёги. С помощью AlphaDev мы показываем, как эта модель может быть преобразована из игр в научные задачи и из симуляций в приложения реального мира.

Чтобы обучить AlphaDev открывать новые алгоритмы, мы превратили сортировку в «игру по сборке» для одного игрока. На каждом шагу AlphaDev наблюдает за сгенерированным алгоритмом и информацией, содержащейся в центральном процессоре (ЦП). Затем он выполняет ход, выбирая инструкцию для добавления к алгоритму. Игра на ассемблере невероятно сложна, потому что AlphaDev приходится эффективно перебирать огромное количество возможных комбинаций инструкций, чтобы найти алгоритм, способный сортировать и работающий быстрее, чем текущий лучший из них. Количество возможных комбинаций инструкций аналогично количеству частиц во вселенной или количеству возможных комбинаций ходов в играх в шахматы (10 120 игр) и го (10 700 игр). И одно неверное движение может свести на нет весь алгоритм.

AlphaDev обнаружила новые алгоритмы сортировки, которые привели к улучшениям в библиотеке сортировки LLVM libc++, которая стала на 70 % быстрее для более коротких последовательностей и примерно на 1,7 % быстрее для последовательностей, превышающих 250 000 элементов. Мы сосредоточились на улучшении алгоритмов сортировки более коротких последовательностей из трех-пяти элементов. Эти алгоритмы являются одними из наиболее широко используемых, потому что они часто вызываются много раз как часть более крупных функций сортировки. Улучшение этих алгоритмов может привести к общему ускорению сортировки любого количества элементов.

Суровый не научпоп: https://www.nature.com/articles/s41586-023-06004-9

Коммит: https://reviews.llvm.org/D118029

Ссылка

←	Чем почитать?

Почему они у нас не летают?

→

Алгоритм то хоть верифицировали? А то получится второй тимсорт.

ya-betmen ★★★★★
(08.06.23 03:24:27 MSK)

Ссылка

TLDR Набрутфорсили алгоритм (я не выдумываю, это в статье «научной»), дополняющей (не путать с генерирующей) сетью по начальному шаблону, молодцы.

Где компуктер сиенсе разбор алгоритма? Описание алгоритма. И всё вот это вот. В тут, в статье, в науч~~попе~~ 90% всех букф водяная вода и нулевая конкретика и тонны маркетингового высера (извините что я ругаюсь).

которая стала на 70 %

4.2 В тестах нет этой цифры только 69.88 и только с данными на 4 элемента. Разница сортировки 4х элементов было 5.20ns стало 1.56ns. Если элементов больше чем 4 разница уже плавает в виде 1%~0,5% а не 69.

https://docs.google.com/document/d/1ULNoweKnNLI1Gf1Mj5FA1HtIFsQUPdgNpTzYk9XdUOM/edit#

Суть, оптимизировали частные случаи сортировки 4х элементов через if/else. Ор на весь двор.
Тестирование проводилось только на AMD Zen2 Intel Skylake ARMv8. Всё.

Внезависимости от того что я бубню в лужу, ускорили код, молодцы (без сарказма).

LINUX-ORG-RU ★★★★★
(08.06.23 03:53:42 MSK)
Последнее исправление: LINUX-ORG-RU 08.06.23 03:57:04 MSK (всего исправлений: 2)

Быстрее, чем Быстрая стабильная сортировка от Игоря? :)
Или:
https://github.com/Morwenn/cpp-sort
https://github.com/zeux/nanosort

dataman ★★★★★
(08.06.23 05:30:26 MSK)
Последнее исправление: dataman 08.06.23 06:00:15 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от LINUX-ORG-RU 08.06.23 03:53:42 MSK

Сортировка гиперзвуковым турбопузырьком.

Irma ★★
(08.06.23 05:54:03 MSK)

Ответ на: комментарий от Irma 08.06.23 05:54:03 MSK

Табличным гиперзвуковым суперпузырьком. Это как таблица с синусом.

Suigintou ★★★★★
(08.06.23 06:47:26 MSK)

Ответ на: комментарий от Suigintou 08.06.23 06:47:26 MSK

Будущее за квантовым нанопузырьком!

rupert ★★★★★
(08.06.23 07:50:54 MSK)

Ссылка

Мы рассматриваем это как важный шаг к использованию ИИ для оптимизации мирового кода, по одному алгоритму за раз.

Согласен

xwicked ★★☆
(08.06.23 08:58:18 MSK)

Ссылка

Почему код, обмазанный тернарным оператором, они называют branchless?

ratvier ★★
(08.06.23 09:34:52 MSK)

Ответ на: комментарий от ratvier 08.06.23 09:34:52 MSK

Он компилируется в cmov

rupert ★★★★★
(08.06.23 09:46:41 MSK)

Ответ на: комментарий от LINUX-ORG-RU 08.06.23 03:53:42 MSK

Суть, оптимизировали частные случаи сортировки 4х элементов через if/else. Ор на весь двор.

Это получается, что на пяти элементах мы должны получить ухудшение производительности за счет добавления новой проверки длины массива? Правильно?

FishHook
(08.06.23 10:28:03 MSK)

Ответ на: комментарий от FishHook 08.06.23 10:28:03 MSK

Проверка длинны массива и отдельная обработка случаев от 0 до 5 там уже была.

ratvier ★★
(08.06.23 11:21:47 MSK)

Ссылка

Ответ на: комментарий от LINUX-ORG-RU 08.06.23 03:53:42 MSK

Мы сосредоточились на улучшении алгоритмов сортировки более коротких последовательностей из трех-пяти элементов.

Предлагаю Нобелевскую премию дать.

Forum0888
(08.06.23 11:28:57 MSK)

Ссылка

Ответ на: комментарий от rupert 08.06.23 09:46:41 MSK

То есть на других архитектурах там всё-таки будет ветвление?

static_lab ★★★★★
(08.06.23 13:49:15 MSK)

Ответ на: комментарий от static_lab 08.06.23 13:49:15 MSK

А какая разница? Разве не в этом смысл разных архитектур, чтобы использовали их сильные стороны?

Но вообще, применимо и к ARM: The libc++ benchmarks were run on isolated machines for Skylake, ARM and AMD architectures and achieve statistically significant improvement in sorting random integers on test cases from sort1 to sort262144 for uint32 and uint64.

alexmaru ★
(08.06.23 15:11:30 MSK)
Последнее исправление: alexmaru 08.06.23 15:13:17 MSK (всего исправлений: 1)

Ссылка

То есть, сначала были запилены чудовищно переусложнённые процессоры, а теперь выясняется, что чтобы под них эффективный код компилировать, нужен ИИ, перебирающий все варианты ассемблера брутфорсом. Приехали, чо.

hateyoufeel ★★★★★
(08.06.23 18:33:59 MSK)

Ссылка

Нам п*здец)

BceM_IIpuBeT ★★☆☆☆
(08.06.23 18:48:29 MSK)

Ссылка

Кстати, посмотрите как AlphaStar «побеждал» в СтарКрафте 2.

BceM_IIpuBeT ★★☆☆☆
(08.06.23 18:49:29 MSK)

Комментарий с у-комбинатора, сойдёт за TLDR:

Несколько очень крутых улучшений в уже сильно оптимизированных алгоритмах. Они обнаружили, что в сортировочной сети, обрабатывающей 3 входа, ИИ нашел способ сохранить инструкцию, сократив операцию «min(A, B, C)» до просто «min(A, B)», воспользовавшись этим фактом. что предыдущие операции гарантировали, что B <= C. Они также обнаружили, что в сортировочной сети, обрабатывающей 4 входа, когда она является частью сети «сортировки 8», существуют аналогичные гарантии (D >= min(A, C) в этом case), что также можно использовать для удаления инструкции. Компилятор может быть не в состоянии конкурировать с написанным от руки ассемблером, но кажется, что ИИ может написать код на ассемблере от руки, который в некоторых случаях даже лучше.

Еще одно улучшение тоже очень крутое. Они обсуждают VarSort4, который берет список длиной 2, 3 или 4 элемента и сортирует его. Существующий алгоритм

    if (len = 4) { 
        sort4
    }
    elif (len = 3) {
        sort3
    }
    elif (len = 2) {
        sort2
    }

ИИ нашел алгоритм, который выглядит совершенно иначе:

    if (len = 2) {
        sort2
    }
    else {
        sort3
        if (len = 4) {
            sortspecial
        }
    }

Это довольно дико! Он немедленно запускает Sort3 для чего-то, что может состоять из 3 или 4 элементов, и только после этого проверяет, насколько это действительно длинно. Если это 3 элемента, мы закончили; в противном случае запустите Sort4, но поскольку (уже запустив Sort3) вы знаете, что первые три элемента отсортированы, вы можете использовать специальный и гораздо более простой алгоритм, чтобы просто поместить 4-й элемент в нужное место. Очень круто. Улучшение основных алгоритмов сортировки LLVM, которые уже были сильно оптимизированы вручную лучшими в мире, определенно вызывает чувство «это 1997 год, и Deep Blue побеждает чемпиона мира по шахматам».

Интересно, что для этого понадобился ИИ. Я думаю, что мутагенное тестирование обнаружило бы первое (благодаря проверке того, какой код не нужен глобально ), но, вероятно, не второе (которому нужна новая ветвь, если только эта ветвь уже не существовала?).

mydibyje ★★★
(08.06.23 20:58:28 MSK) автор топика

Ответ на: комментарий от BceM_IIpuBeT 08.06.23 18:49:29 MSK

На хабре отмечают, что победил тупо из-за нечеловеческого APM и прочих читов, а не стратегически, в отличие от побед в Го например или шахматах.

mydibyje ★★★
(08.06.23 21:10:06 MSK) автор топика
Последнее исправление: mydibyje 08.06.23 21:11:00 MSK (всего исправлений: 1)

Ответ на: комментарий от mydibyje 08.06.23 21:10:06 MSK

https://youtu.be/mpAUufSzaUo

BceM_IIpuBeT ★★☆☆☆
(08.06.23 21:32:58 MSK)

Ссылка

Ответ на: комментарий от mydibyje 08.06.23 20:58:28 MSK

Улучшение основных алгоритмов сортировки LLVM, которые уже были сильно оптимизированы вручную лучшими в мире, определенно вызывает чувство «это 1997 год, и Deep Blue побеждает чемпиона мира по шахматам».

Где-то заплакал Дональд-наш-Кнут :)

quickquest ★★★★★
(08.06.23 22:15:21 MSK)