Я такое из генты делал на 64битном атоме. Ядро x86-64, всё окружение x86-32. Не путать x86-32 c x32 ABI, это немного другое. Готовый дистрибутив такой вряд ли есть сейчас.
у меня на мини 4 гб было недостаточно. Имхо 8гб это необходимый минимум. А с мини я как тс тоже тратил время на поиски всяких оптимизаций которые мало, что дают. Я добился более-менее приемлемой работы и все равно всегда поглядывал на индикатор
Какой «такой»? Если про х32 то я не знаю кто его вообще поддерживает. Если про 64 битное ядро на 32 юзерспейсе то в дебиане это делается тупо установкой 64-битного ядра (apt-get install linux-image-amd64) и если используется dkms то 64-битные штуки для него, и больше ничего делать не надо.
Ну и всё, это прекрасно, это и есть ответ на вопрос ТС. Я просто дебиан плохо знаю и не задумывался что там так можно. Вообще получается ничего сложного в этом нет.
Возможно он сам не знает как правильно называется то что он хочет. В x32 ABI как раз 64бит адресация, что позволяет 32бит коду выходить за границы 4gb, а он хочет 32бит адресацию, судя по стартовому посту. А это x86-32, а не x32. Да и умерло x32 ABI, его уже в самом ядре похоронили. Гента вроде пыталась в x32 ABI, был даже профиль экспериментальный. Я же просто x86-64 ядро с x86-32 юзерспейсом использовал, x32 ABI не пробовал.
Я ненастоящий сварщик, потери производительности по сравнению с 32бит ядром я на этом атоме не ощущал (он вообще сам по себе был не про производительность). А вот расход мозгов был слегка поменьше, железка больше четырёх гигов не могла, вот я и экспериментировал.
Впрочем какой либо выгоды от 64бит ядра я тоже не ощутил, сделал просто потому что мог и интересно было. Но всё это быстро потеряло актуальность в целом, вместе с железкой и протуханием 32битных гентушных профилей. Надоело мучиться, надоело баги выгребать, так что я железку эту оставил на работе, вместе с работой.
Даже на атоме с 2гб ОЗУ (мой текущий случай) 64 бита даёт прирост производительности. Но хотелось бы уменьшить жор программ. То что ты описываешь не этот случай. У тебя 32 битный тормозной софт. Зачем то 64 битное ядро. Что это даёт?
Вот давай конкретный пример. Aes ядерный через syscall 32 битный софт дёргает быстрый код из ядра. Либо банально memcpy ядерный на 64 битах быстрее и программы его тоже дёргают из ядра.
Помнится мне что pae тормозит и глючит. Впрочем если памяти меньше 4гигов pae не нужно. Я кажется именно из за этого и ставил x64 ядро, потому что x32 ядро без pae видело 3.5 гигов, x32 с pae видело 4гига, но глючило, x64 же работало нормально. Ну и чисто теоретически я предполагал что оно «быстрее» будет. На практике разницы не заметил впрочем.