[хочется странного][JIT?] компиляция поискового предиката

0

1

Дано: больщой массив записей (умещается в 8 GB оперативки) и некий поисковый запрос, формируемый пользователем. Хочется этот запрос скомпилировать в нативный код и дальше уже выполнять максимально быстро.

В терминах интерпретируемого языка это был бы eval, а мне такой изврат очень хочется для компилируемого. Можно, конечно, создать генератор сишного кода, вызывать gcc, создавать shared library, загружать его и затем уже вызывать, но это как-то не Ъ.

P. S. вариаций поискового запроса может быть огромное количество, предварительно сгенерировать код для каждого не представляется возможным. О методе «выявить самые популярные и предварительно заоптимизировать только их» я подумал. Так неинтересно.

Ссылка

←	[Toolchain][Blackfin] Как собрать?

Тесты для компилятора

→

> В терминах интерпретируемого языка это был бы eval,

а мне такой изврат очень хочется для компилируемого.

Дык, CL же компилируемый и eval реально компилирует в машинный код.

archimag ★★★
(07.11.10 00:00:56 MSK)

libtcc

anonymous
(07.11.10 00:02:54 MSK)

Ссылка

Надо было использоваать CL, а не строить из себя крутого кулхацкера и не дрочить байтики.

~~Love5an~~
(07.11.10 00:48:00 MSK)

Ссылка

В чём вопрос? парсишь запрос, строишь дерево, оптимизируешь при необходимости, транслируешь в машинный код. Для последнего можно использовать liblightning.

~~Legioner~~ ★★★★★
(07.11.10 00:57:29 MSK)

gnu lightning

yoghurt ★★★★★
(07.11.10 03:32:34 MSK)

Ссылка

.net expression trees?

anonymous
(07.11.10 09:52:38 MSK)

Ссылка

> Дано: больщой массив записей (умещается в 8 GB оперативки) и некий поисковый запрос, формируемый пользователем. Хочется этот запрос скомпилировать в нативный код и дальше уже выполнять максимально быстро.

* Почему у тебя магомет идет к горе, а не наоборот? Может, эффективнее в машинный код компилировать, а создать над этими данными какие-нибудь индексы, чтобы не нужно было каждый раз все перелопачивать?

* Если поиск полным перебором - единственное решение, почему ты выбрал направление «оптимизировать один поток», а не распараллеливать поиск? Распараллеливаться оно должно хорошо, а сейчас уже даже нетбуки многоядерные...

* Если тебе приспичило генерить машинный код - почему бы не использовать java, там вроде был JIT? :-)

gods-little-toy ★★★
(07.11.10 10:37:04 MSK)

Ответ на: комментарий от gods-little-toy 07.11.10 10:37:04 MSK

>создать над этими данными какие-нибудь индексы

ОП не говорил, что у него нет индексов, что поиск идет полным перебором и в один поток.

Компиляция запросов пользователя в какое-нибудь исполнимое представление - обычно дело для СУБД (только скорее не в машинный код, а байт-код виртуальной машины). Как минимум такое преобразование обычно правильно с точки зрения архитектуры и разделения зон ответственности (парсер - отдельно, генератор плана выполнения/программы запроса - отдельно, исполнение запроса - отдельно).

Только мне кажется, что не стоит на каждый чих компилировать запрос в машинный код - вполне может оказаться, что накладные расходы на компиляцию превышают расходы на интерпретацию байт-кода или интерпретацию непосредственно запроса. Например, если запросы очень простые и выполняются на малом объеме данных.

Ну и о преимуществах Common Lisp для кодогенерации в рантайме уже сказали.

dmitry_vk ★★★
(07.11.10 12:00:22 MSK)

А на каком языке, вы таки пишете? И какой язык запросов?

no-such-file ★★★★★
(07.11.10 12:30:13 MSK)

Ответ на: комментарий от archimag 07.11.10 00:00:56 MSK

>Дык, CL же компилируемый и eval реально компилирует в машинный код.

Если бы мне нужны были скобочные тормоза, тормозный скобочный gc и его неуемное потребление памяти, я бы так и сделал.

~~linuxfan~~ ★
(07.11.10 21:21:00 MSK) автор топика

Ссылка

Ответ на: комментарий от Legioner 07.11.10 00:57:29 MSK

>Для последнего можно использовать liblightning.

Посмотрел. Неэффективный код генерирует, однако.

~~linuxfan~~ ★
(07.11.10 21:21:56 MSK) автор топика

Ссылка

Ответ на: комментарий от gods-little-toy 07.11.10 10:37:04 MSK

>Почему у тебя магомет идет к горе, а не наоборот? Может, эффективнее в машинный код компилировать, а создать над этими данными какие-нибудь индексы, чтобы не нужно было каждый раз все перелопачивать?

Эффективнее, но из-за достаточно большого количества элементов в этом массиве (порядка 10 млн) размеры индексов будут некислые. Самая главная проблема в разнообразии запросов. Все требуемые индексы в памяти не поместятся, поэтому и понадобился быстрый «select»,

Если поиск полным перебором - единственное решение, почему ты выбрал направление «оптимизировать один поток», а не распараллеливать поиск?

Потому что я хочу избавиться от выборок «select FOO from TABLE where PREDICATE order by BAR offset X limit Y». Причем Y очень маленькое по сравнению с общим числом записей.

Если тебе приспичило генерить машинный код - почему бы не использовать java, там вроде был JIT? :-)

Мне не приспичило. Мне надо, чтобы реактивно прошаривало сотни мегабайт данных. Java отпадает, потому что невзирая на ее посредственную прлизводительность, задача сведется к борьбе в вызовом gc в самое неподходящее время. Я хочу облегчить себе жизнь, а не усложнить.

~~linuxfan~~ ★
(07.11.10 21:28:44 MSK) автор топика

Ответ на: комментарий от dmitry_vk 07.11.10 12:00:22 MSK

>Только мне кажется, что не стоит на каждый чих компилировать запрос в машинный код - вполне может оказаться, что накладные расходы на компиляцию превышают расходы на интерпретацию байт-кода или интерпретацию непосредственно запроса.

Согласен, но к сожалению

Например, если запросы очень простые и выполняются на малом объеме данных.

Не мой случай (объем данных достаточно велик и ключей поиска порядка 10).

~~linuxfan~~ ★
(07.11.10 21:30:26 MSK) автор топика

Ссылка

Ответ на: комментарий от no-such-file 07.11.10 12:30:13 MSK

>А на каком языке, вы таки пишете?

На C++.

И какой язык запросов?

Для начала никакого — просто некая структура данных, описывающая поисковый предикат, который по задумке компилируется и применяется к имеющемуся набору данных.

~~linuxfan~~ ★
(07.11.10 21:33:48 MSK) автор топика

Ссылка

LLVM!

Пока искал информацию о lightning наткнулся в вики на example JIT'инья встроенного языка с помощью LLVM. Судя по всему, LLVM самое то.

~~linuxfan~~ ★
(07.11.10 21:35:37 MSK) автор топика

Ссылка

Ответ на: комментарий от linuxfan 07.11.10 21:28:44 MSK

> Эффективнее, но из-за достаточно большого количества элементов в этом массиве (порядка 10 млн) размеры индексов будут некислые.

Дадим им 1G памяти (стоимость - 1 тыр. Если ты не user:Hokum, это меньше, чем ты за день зарабатываешь) 1G / 10М = 100 байт/элемент. Для большинства типов индексов уже хватит. Если нужно очень много индексов или особо толстые индексы - тоже не проблема, пусть вместо конкретных записей можно указывать на пачки записей (например по 1 тыс штук). Тогда индекс уменьшится в #записей_в_пачке раз сразу.

Самая главная проблема в разнообразии запросов. Все требуемые индексы в памяти не поместятся, поэтому и понадобился быстрый «select»

Ну может что-то и выжмешь с компиляцией. Хотя мой прогноз - ускорение будет максимум в 3 раза. И это будет абсолютно жесткий предел. В отличие от параллелизации, и индексов, которые откроют значительно большие перспективы.

gods-little-toy ★★★
(08.11.10 12:17:57 MSK)

Ответ на: комментарий от linuxfan 07.11.10 21:28:44 MSK

> Самая главная проблема в разнообразии запросов.

man SQL-ные СУБД и использование индексов оными :-)

gods-little-toy ★★★
(08.11.10 12:19:05 MSK)

Ответ на: комментарий от gods-little-toy 08.11.10 12:17:57 MSK

>Дадим им 1G памяти

Во-первых, обращение к памяти тоже не мгновенно. Чем меньше размер индекса, тем лучше.

Во-вторых, изменение ключевого поля должно отразиться на всех индексах (а изменений там относительно много). Соответственно, чем меньше индексов, тем лучше.

Хотя мой прогноз - ускорение будет максимум в 3 раза

Вдумайся в фразу «3 раза». Если бы линукс вместо 30 секунд грузился за 10, это сделало бы меня счастливым. Вот и здесь: три раза — это очень круто. На деле будет гораздо больше, потому как количество условных переходов по сравнению с «интрепретацией байт-кода» уменьшается очень сильно.

Если нужно очень много индексов или особо толстые индексы - тоже не проблема, пусть вместо конкретных записей можно указывать на пачки записей (например по 1 тыс штук). Тогда индекс уменьшится в #записей_в_пачке раз сразу.

Мне интересно, как ты собираешься одним указателем (+ константа для указания количества) адресовать тысячу записей. В общем, поверь на слово, в моем случае каждый индекс будет занимать минимум 28 мегабайт (более реалистичная оценка — 52 мб). Таких много не налепишь.

В отличие от параллелизации, и индексов, которые откроют значительно большие перспективы.

Почему параллелизация мне не нужна, я уже объяснял. Кроме того, при 800 запросах в секунду, чего параллелить-то? Достаточно сделать CPU_CORES+1 рабочих потоков и забыть о параллельности.

А индексы из-за описанных ограничений будут строится динамически с использованием откомпилированных предикатов.

~~linuxfan~~ ★
(08.11.10 18:55:26 MSK) автор топика