LINUX.ORG.RU

Nvidia CUDA на дебиан

 , , ,


0

1

Дебиан, после установки сразу устроил Sid, ставлю дрова cuda. apt install nvidia-driver nvidia-cuda-toolkit. Вроде как все хорошо, но после перезагрузки не стартуют модули ядра, и nvidia persistenced:

systemd-modules-load.service - Load Kernel Modules
     Loaded: loaded (/lib/systemd/system/systemd-modules-load.service; static)
     Active: failed (Result: exit-code) since Mon 2022-07-11 20:53:57 MSK; 7min ago
       Docs: man:systemd-modules-load.service(8)
             man:modules-load.d(5)
   Main PID: 780 (code=exited, status=1/FAILURE)
        CPU: 35ms

июл 11 20:53:57 Commander systemd-modules-load[784]: modprobe: ERROR: could not insert 'nvidia': Invalid argument
июл 11 20:53:57 Commander systemd-modules-load[787]: modprobe: ERROR: could not insert 'nvidia_current_modeset': Operation not permitted
июл 11 20:53:57 Commander systemd-modules-load[782]: modprobe: ERROR: ../libkmod/libkmod-module.c:1047 command_do() Error running install command 'modprobe nvidia ; modprobe -i nvidia-current-modeset ' for module nvidia_modeset: retcode 1
июл 11 20:53:57 Commander systemd-modules-load[782]: modprobe: ERROR: could not insert 'nvidia_modeset': Invalid argument
июл 11 20:53:57 Commander systemd-modules-load[793]: modprobe: ERROR: could not insert 'nvidia_current_drm': Operation not permitted
июл 11 20:53:57 Commander systemd-modules-load[780]: Error running install command 'modprobe nvidia-modeset ; modprobe -i nvidia-current-drm ' for module nvidia_drm: retcode 1
июл 11 20:53:57 Commander systemd-modules-load[780]: Failed to insert module 'nvidia_drm': Invalid argument
июл 11 20:53:57 Commander systemd[1]: systemd-modules-load.service: Main process exited, code=exited, status=1/FAILURE
июл 11 20:53:57 Commander systemd[1]: systemd-modules-load.service: Failed with result 'exit-code'.
июл 11 20:53:57 Commander systemd[1]: Failed to start Load Kernel Modules.

systemctl status nvidia-persistenced говорит, что:

июл 11 20:53:57 Commander systemd[1]: Starting NVIDIA Persistence Daemon...
июл 11 20:53:57 Commander nvidia-persistenced[809]: Started (809)
июл 11 20:53:57 Commander nvidia-persistenced[809]: Failed to query NVIDIA devices. Please ensure that the NVIDIA device files (/dev/nvidia*) exist, and that user 118 has read and write permissions for those files.
июл 11 20:53:57 Commander nvidia-persistenced[809]: Shutdown (809)
июл 11 20:53:57 Commander nvidia-persistenced[805]: nvidia-persistenced failed to initialize. Check syslog for more details.
июл 11 20:53:57 Commander systemd[1]: nvidia-persistenced.service: Control process exited, code=exited, status=1/FAILURE
июл 11 20:53:57 Commander systemd[1]: nvidia-persistenced.service: Failed with result 'exit-code'.
июл 11 20:53:57 Commander systemd[1]: Failed to start NVIDIA Persistence Daemon.

Что тут произошло и как это фиксить? Папки /dev/nvidia действительно нету.



Последнее исправление: Yarosvet (всего исправлений: 1)

Ответ на: комментарий от smilessss

Много чего, в том числе и persistenced, который я только что удалил. Слишком много логов, поэтому залил на пастебин: https://pastebin.com/t71hku9j

Yarosvet
() автор топика
Последнее исправление: Yarosvet (всего исправлений: 1)

Ну так посмотри, собрались ли модули вообще, системдэшник. Ищи make.log в недрах /var/lib/dkms/nvidia-current. У нвидиевских драйверов бывает, отваливается сборка под новыми версиями ядра — тогда или патчить, или пробовать более новый драйвер с сайта нвидии.

alegz ★★★★
()

nvidia-cuda-toolkit это то же лишнее, nvidia-driver вполне будет достаточно - остальное подтянется в зависимостях, я даже что бы лишнее не тянуть через --no-install-recommends ставлю… какая у тебя видеокарта? если 700-я серия и выше nvidia-driver должен с ними работать, если 400-я или 600-я 390-ый драйвер нужен, если 200-я 340-ой драйвер.

amd_amd ★★★★★
()
Ответ на: комментарий от Yarosvet

супер пупер навороченое новье за бешеный оверпрайс - тогда страдай, у меня ничего новее 1030-ой нет… можно еще попоробовать сделать nvidia-xconfig, были у меня видеокарты которые не хотели без этого работать, но это был лютый антиквариат.

amd_amd ★★★★★
()
Ответ на: комментарий от amd_amd

Удалил cuda, картина с модулями та же. Кстати, виртуалбокс тоже жалуется, что он не может подгрузиться: Loading VirtualBox kernel modules...modprobe vboxdrv failed. Please use 'dmesg' to find out why ... failed! А в dmesg нет ничего по этому поводу. На testing с этим проблем не было, мне рекомендовали сделать sid, так тут постоянно что-то подобное вылезает. Но на тестинг не работает сам виртуалбокс, причем никак совсем.

Yarosvet
() автор топика
Ответ на: комментарий от Yarosvet

мне рекомендовали сделать sid

я и рекомендовал, но не сделать, а установить его изначально, у тебя же насколько я помню вначале была стабле, потом ты к ней прикрутил тестовую репу, а за тем уже сид - в общем каша получилась… у меня чистый сид - проблем с виртуалбоксом нет, а вот с видеодрайвером недавно была проблема, 340-ой не хотел собираться с ядром 5.18, но сейчас уже все починили… если надумаешь чистую переустановку сида - ставь в режиме «эксперт», причем установи только базовую часть системы - остальное через apt затянешь, так будет понятней что и откуда - вместо того что бы мучаться с кривыми готовыми решениями.

amd_amd ★★★★★
()
Ответ на: комментарий от Yarosvet

А потом сразу

так не пойдет - нужен сразу сид, что бы ты на этапе установки уже самое последнее ядро поставил без всяких обновлений… вот отсюда качаешь самый свежий срез https://d-i.debian.org/daily-images/ выбери архитектуру, определись с датой, тебе нужен netboot инсталятор с условным именем mini.iso это имя никогда не меняется и версий у него нет, вот сегодняшний срез для x86-64 от 2022.07.12 https://d-i.debian.org/daily-images/amd64/20220712-00:13/netboot/mini.iso установи только базовую часть системы не используй решений в виде готовых DE, затем накати через apt xorg linux-headers nvidia-driver перезагрузись и сразу будет понятно - поперли дрова или нет, не смотря на то что система будет еще практически голой для работы видеодрайверов этого вполне достаточно…

amd_amd ★★★★★
()
Ответ на: комментарий от amd_amd

Возобновляю тему. Теперь у меня чистый дебиан сид, правда установленный несколько иным образом, сделанный из тестинга (Вроде так можно, причем без последствий,т.к. тестинг это сид фактически, в который попали пакеты прошедшие автоматические тесты). Мне по логике нужен 470-й драйвер, но nvidia-detect говорит просто поставить nvidia-driver. Что nvidia-driver, что tesla-470-й драйвер приводят к тому, что в результате дрова не подгружаются с модулями ядра. Попытка установить драйвер 470 с сайта нвидии привела к поломке системы. теперь при загрузке просто экран начинает мерцать, ну и до рабочего стола дело не доходит. Может быть, все-таки глянуть мои логи, мб там есть что-то интересное? Оно определенно есть, просто я сам этого не вижу и не понимаю что делать. Из-под nouveau я не смогу в полной мере пользоваться видюхой, и не смогу например, производить сложные вычисления на ней.

Yarosvet
() автор топика
Ответ на: комментарий от Yarosvet

Тебе же ещё в одной из твоих прошлых тем сказали, что в ядре 5.18 сломали nVidia. А ты упорно пытаешься её там завести.

Зачем вообще тебе новое ядро? Ставь Debian Stable и не парься.

Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от Yarosvet

Видюха неплохая

кто сказал что она плохая? она слишком новая и ей нужен драйвер поновей, ведь ты сам говоришь что 470-ый драйвер у тебя не работает, значит нужен следующий, а следующий сейчас 515-ый, у меня на нем антиквариат 700-ой серии нормально летает, думаю и твоя карта заведется, так что ставь арч и не парься - потом нам расскажешь чем дело закончилось… у меня на всех машинах по два винта - на одном живет сид, на другом арч.

amd_amd ★★★★★
()
Ответ на: комментарий от Yarosvet

стабильный дебиан

все работает

что же ты мозги ибешь? я то думал у тебя видеодрайвер вообще не работает из под дебиан…

как бы мне этого не хотелось

нахера тебе новое ядро?

amd_amd ★★★★★
()
Ответ на: комментарий от alex1101

да ты чо - железобетонная стабильность, я на сиде годами еду со времен jessie, именно по этому большая часть поделий в мире сляпана из дебиан, дебиан это монстр в мире линукса, если ты не смог осилить дебиан это диагноз.

amd_amd ★★★★★
()