LINUX.ORG.RU

Проблема nvidia GT1030+Centos8, платф.AMD, Мать - AMD Asus Prime X570-P

 , ,


1

2

Привет. Всё было хорошо, всё работало. Понятно что периодически конфигурацию сервера менял… В этот раз я не могу связать случившееся с какими-либо своими действиями.

Симптомы: Консоль загружается только в режиме VGA, с отключенным драйвером

nouveau.modeset=0 rd.driver.blacklist=nouveau modprobe.blacklist=nouveau

если драйвер включить, то в dmesg ругается

Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: vgaarb: deactivate vga console
Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: NVIDIA GP108 (138000a1)
Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: bios: version 86.08.17.00.8f
Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: acr: firmware unavailable
Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: pmu: firmware unavailable
Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: gr: firmware unavailable
Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: sec2 ctor failed: -38
Nov 28 18:58:32 localhost kernel: nouveau: probe of 0000:08:00.0 failed with error -38

соответственно на консоли полная пустота после этого

Ну оно как бы и ладно, пусть VGA… Но иксы не запускаются

Nov 29 09:45:36 localhost dbus-daemon[3071]: [session uid=0 pid=3071] Activating via systemd: service name='org.a11y.Bus' unit='at-spi-dbus-bus.service' requested by ':1.10' (uid=0 pid=3690 comm="/usr/libexec/gnome-session-check-accelerated ")
Nov 29 09:45:36 localhost systemd[2227]: Starting Accessibility services bus...
Nov 29 09:45:36 localhost dbus-daemon[3071]: [session uid=0 pid=3071] Successfully activated service 'org.a11y.Bus'
Nov 29 09:45:36 localhost systemd[2227]: Started Accessibility services bus.
Nov 29 09:45:36 localhost at-spi-bus-launcher[3691]: dbus-daemon[3696]: Activating service name='org.a11y.atspi.Registry' requested by ':1.0' (uid=0 pid=3690 comm="/usr/libexec/gnome-session-check-accelerated ")
Nov 29 09:45:36 localhost at-spi-bus-launcher[3691]: dbus-daemon[3696]: Successfully activated service 'org.a11y.atspi.Registry'
Nov 29 09:45:36 localhost at-spi-bus-launcher[3691]: SpiRegistry daemon is running with well-known name - org.a11y.atspi.Registry
Nov 29 09:45:36 localhost gnome-session[3543]: gnome-session-binary[3543]: WARNING: software acceleration check failed: Дочерний процесс завершился с кодом 1
Nov 29 09:45:36 localhost gnome-session-binary[3543]: WARNING: software acceleration check failed: Дочерний процесс завершился с кодом 1
Nov 29 09:45:36 localhost gnome-session[3543]: Unable to init server: Could not connect: Connection refused
Nov 29 09:45:36 localhost journal[3707]: Cannot open display:.
No

В общем сломал уже голову всю. Весь интернет перекопал, linux-firmware переустановил, ядро 5 поставил - не помогло. Всё перепробовал. Ну никак. И уже грешу на карточку, но попробовал загрузиться с live usb linux mint - графика есть :-(

Где еще можно посмотреть?


Обновлялся? Если да, ставь предыдущие версии mesa, возможно, успели сломать последнюю версию для "центоси" (что неудивительно, учитывая то, что 8-ку "убили").

Korchevatel ★★★★★
()
Ответ на: комментарий от Korchevatel

я переустанавливал mesa после всего, но дело ИМХО не в этом. mesa нужна для xorg а мне бы хоть консоль запустить не в vga…

galiy
() автор топика
Ответ на: комментарий от ZenitharChampion

удалял и вычищал всё после него. Возможно что-то недочистил, но это не должно касаться Xorg т.к. с загруженным драйвером не работает вообще консоль. Возможно какие-то настройки ядра?

galiy
() автор топика
Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: acr: firmware unavailable
Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: pmu: firmware unavailable
Nov 28 18:58:32 localhost kernel: nouveau 0000:08:00.0: gr: firmware unavailable

Не может подгрузить фирмвари, надо понять, почему. Есть ли каталог /lib/firmware/nvidia/gp108/?

zemidius
()
Последнее исправление: zemidius (всего исправлений: 1)

Откуда ставил Nvidia драйвер?

sudo yum repolist покажи нам.

По идее, правильно ставить из elrepo репозитория. Но подключён ли он у тебя? Мы не знаем. И ещё что подключено.

PS: У меня тоже CentOS Stream 8 только, подключены EPEL и RPMFusion. Ибо видео встроенное в AMD.

А если бы была Nvidia, как у тебя, то я бы подключил elrepo и устанавливал проприетарный драйвер для CentOS 8 оттуда. С ними никогда таких проблем не было.

Естественно драйвер ставится под свою видеокарту оттуда, предварительно nvidia-detect вроде, команду надо выдать и она скажет какой именно.

Ну а nouveau да, блэклистится.

anonymous
()
Ответ на: комментарий от anonymous

Пробовал и из репозитория, пробовал и с сайта nvidia

 dnf repolist
идентификатор репозитория                                                                                                                              имя репозитория
PowerTools                                                                                                                                             CentOS Linux 8 - PowerTools
Webmin                                                                                                                                                 Webmin Distribution Neutral
appstream                                                                                                                                              CentOS Linux 8 - AppStream
baseos                                                                                                                                                 CentOS Linux 8 - BaseOS
copr:copr.fedorainfracloud.org:castor:remmina                                                                                                          Copr repo for remmina owned by castor
elrepo                                                                                                                                                 ELRepo.org Community Enterprise Linux Repository - el8
elrepo-extras                                                                                                                                          ELRepo.org Community Enterprise Linux Extras Repository - el8
epel                                                                                                                                                   Extra Packages for Enterprise Linux 8 - x86_64
epel-modular                                                                                                                                           Extra Packages for Enterprise Linux Modular 8 - x86_64
extras                                                                                                                                                 CentOS Linux 8 - Extras
grafana                                                                                                                                                grafana
nux-dextop                                                                                                                                             Nux.Ro RPMs for general desktop use
opera                                                                                                                                                  Opera packages
plus                                                                                                                                                   CentOS Linux 8 - Plus
remi                                                                                                                                                   Remi's RPM repository for Enterprise Linux 8 - x86_64
remi-modular                                                                                                                                           Remi's Modular repository for Enterprise Linux 8 - x86_64
remi-safe                                                                                                                                              Safe Remi's RPM repository for Enterprise Linux 8 - x86_64
rpmfusion-free-updates                                                                                                                                 RPM Fusion for EL 8 - Free - Updates
rpmfusion-nonfree-updates                                                                                                                              RPM Fusion for EL 8 - Nonfree - Updates
virtualbox                                                                                                                                             Oracle Linux / RHEL / CentOS-8 / x86_64 - VirtualBox
galiy
() автор топика
Ответ на: комментарий от anonymous

При чём тут это всё? Вопрос в чём Драйвер nouveau с диска линукс минт (читай убунту) - работает Драйвер nouveau в моём центосе - не работает. Явно что-то в конфигурации…

galiy
() автор топика
Ответ на: комментарий от galiy

Нда. Зоопарк…

А nux-dextop разве есть для 8?

Интуиция подсказывает мне, что у тебя лишнего подключено репозиториев.

Я бы оставил все CentOS 8 комплектные, + EPEL + Elrepo + RPMfusion + Remi(если в последнем уж есть такая крайняя необходимость), не думаю что остальные нужны вообще.

Хотя, по их количеству, я чую там зоопарк софта стоит не кислый такой. Он весь необходим?

anonymous
()
Ответ на: комментарий от anonymous

Зоопарк действительнно не кислый, но это всё работает нормально, жалоб нет. Консоль блин не работает :-( Всё что мне нужно для работы консоли находится (и ставится из) baseos. nouveau вообще вшит в ядре, и он НЕ работает. Хотя раньше работал. Нужно куда-то посмотреть и что-то увидеть, но я не понимаю куда еще смотреть и что видеть…

galiy
() автор топика
Ответ на: комментарий от galiy

Не в конфигурации, а в твоём зоопарке, не знаю что ты там наставил. Ну и в некоторой кривости драйвера nouveau в CentOS 8 в сущности. Не ты первый жалуешься. Лечится только проприетарным драйвером, конкретно подходящим под твою видеокарту и из elrepo для RHEL 8 именно репа.

Зачем тебе все остальные репозитории, типа nux-dextop, я вообще ума не приложу.

Зачем самому то себе проблем насоздавал? Подключать нужно только необходимые для работы, всё.

А как теперь разрулить - я не могу сказать. Я твой компьютер не могу удалённо администрировать.

anonymous
()
Ответ на: комментарий от Korchevatel

Ты его реполист глянь. Я офигел %-) Я вот даже не знаю с какой стороны теперь подойти и что он наустанавливал. Ну репозиториев надо минимум подключать и только проверенные и нужные.

Жуть…

anonymous
()
Ответ на: комментарий от anonymous

Зря вы так. Я посмотрел по установленным пакетам. Пару репозиториев вообще отключил т.к. из них в настоящее время ничего установлено не было. Всё системное установлено из

baseos
appstream
anaconda
epel

Из левых репозиториев установлена всякая периферия типа VirtualBox и mpeg кодеков

galiy
() автор топика
Ответ на: комментарий от galiy

Так зачем столько левых то тогда? Для кодеков и VirtualBox хватит RPMFusion и Elrepo, впрочем в последнем и проприетарные драйвера для твоей видеокарты.

Остальное зачем? Nux-Dextop однозначно лишний, remi на твоё усмотрение, остальные тоже вроде как не нужны.

Погрохай их. Потом сделай distro-sinc и должно всё более менее стать. А уж потом разбирайся с драйверами Nvidia.

anonymous
()
Ответ на: комментарий от anonymous

Уже погрохал. Но Вы меня натолкнули на мысль. Увидел локальный репо с amdgpu от старой видюхи - убил и репо и пакеты, установленные из него. Перезагрузил сервак. Сейчас у меня X запустился через xrdp-session но при этом консоль так и есть дохлая как была

dmesg | grep nouve
[    1.978932] fb: switching to nouveaufb from EFI VGA
[    1.979053] nouveau 0000:08:00.0: vgaarb: deactivate vga console
[    1.979122] nouveau 0000:08:00.0: NVIDIA GP108 (138000a1)
[    2.097330] nouveau 0000:08:00.0: bios: version 86.08.17.00.8f
[    2.097513] nouveau 0000:08:00.0: acr: firmware unavailable
[    2.097517] nouveau 0000:08:00.0: pmu: firmware unavailable
[    2.097582] nouveau 0000:08:00.0: gr: firmware unavailable
[    2.097588] nouveau 0000:08:00.0: sec2 ctor failed: -38
[    2.097600] nouveau: probe of 0000:08:00.0 failed with error -38
galiy
() автор топика
Ответ на: комментарий от anonymous
Linux gsrv.local 4.18.0-348.2.1.el8_5.x86_64 #1 SMP Tue Nov 16 14:42:35 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux
PowerTools (отсюда только блютус)
Webmin (вебмин)
appstream
baseos
copr:copr.fedorainfracloud.org:castor:remmina (клиент реммина)
epel
epel-modular
extras
grafana (графана)
opera (опера и только)
remi (php)
remi-modular (php)
remi-safe (php)
rpmfusion-free-updates (кусочки от виртуалбокса + кодеки)
rpmfusion-nonfree-updates (кусочки от виртуалбокса + кодеки)
virtualbox (виртуалбокс и есть)
galiy
() автор топика
Ответ на: комментарий от anonymous

А зачем ему лишний раз? Если всё нормально работало, с его слов.

anonymous
()
Ответ на: комментарий от galiy

Понятно. Ну вроде тогда всё нормально, раз тебе всё это нужно. Вот странно с консолью тогда.

А иксы работают нормально да?

Только в голой консоли такое разрешение? И dmesg так ругается?

anonymous
()
Ответ на: комментарий от anonymous

Обновил. Не так давно. Вот кстати тоже момент подозрительный. Но на этом биосе УЖЕ работало.

Вообще физически сбой выглядел так:

  1. Всё работает, экран с графикой всё супер
  2. Shutdown
  3. Подключено другое питание
  4. Power up
  5. Графики нет, консоли, на екране артефакты даже

Понимаю первую реакцию.

Но не забывайте про Linux Mint который с USB-флэшки заводит графику на этой же системе. Блин jопа какая-то, поеду наверное другую видеозатычку куплю просто чтобы попробовать…

galiy
() автор топика
Ответ на: комментарий от anonymous

Иксы нормально теперь работают только через xrdp, не локально. Когда nouveau загрузил

Консоль дохлая вообще, вверху пара строчек в режиме vga самые первые при загрузке ядра и всё тишина. Ни на что не реагирует.

galiy
() автор топика
Ответ на: комментарий от galiy

Если на лайве си-ди от любого дистрибутива, с видео всё в порядке, то не спеши за затычкой.

А лучше подумай над двумя вариантами сперва:

  1. Мигрировать с CentOS 8 на CentOS Stream 8, там будут немного посвежее некоторые пакеты, я на ней сейчас. Поддержка до 2024 года. Но у меня видео в AMD встройка.

  2. Мигрировать на Alma Linux 8.5 с помощью скрипта, который на их сайте лежит и инструкции там есть как сделать. Поддержка до 2029 года.

В обоих случаях гарантий особо никаких, но взвесь и подумай. В первом случае с репозиториями подключёнными не должно быть проблем. Во втором я даже не знаю, я на их техподдержке спрашивал, ответа не последовало.

Подумай.

anonymous
()
Ответ на: комментарий от galiy

Драйвер nouveau с диска линукс минт (читай убунту) - работает Драйвер nouveau в моём центосе - не работает. Явно что-то в конфигурации…

Или просто версии ядра разные. С нвидевским драйвером чем хорошо - если стоит какая-то версия драйвера, она на любом ядре будет одинаково работать

annulen ★★★★★
()
Ответ на: комментарий от galiy

PS В любом случае в +

  1. Навёл порядок с репозиториями
  2. Изучил в деталях всё, что связано с поддержкой видео в ядре
  3. Таки перешел на Centos Stream, только особо не заметил разницы - обновилось незначительное кол-во пакетов, ничего ядерного. Т.к у меня репозитории стримовые уже были подключены. :-)
galiy
() автор топика
Ответ на: комментарий от zemidius

Распаковал, проверил. в initramfs в firmware только /updates/amdgpu хм… в основной корневой ФС /lib/firmware всего гораздо больше Я пересобирал initramfs командой

dracut -f /boot/initramfs-$(uname -r).img $(uname -r) 

, как в мануалах - ошибок не было

galiy
() автор топика
Ответ на: комментарий от galiy

Initramfs надо пересобрать после удаления из блэклиста nouveau.

Включи verbose mode у dracut (-v), будет понятно, добавит ли он фирмварь при пересборке

zemidius
()
Последнее исправление: zemidius (всего исправлений: 2)
Ответ на: комментарий от zemidius

initramfs пересобрал (nouveau в блэклисте нет), фирмвари в полученном имидже нет При -v ничего про firmvare в out только строка

dracut:     microcode_ctl: final fw_dir: "/usr/share/microcode_ctl/ucode_with_caveats/intel-06-8e-9e-0x-dell /usr/share/microcode_ctl/ucode_with_caveats/intel-06-8c-01 /usr/share/microcode_ctl/ucode_with_caveats/intel-06-5e-03 /usr/share/microcode_ctl/ucode_with_caveats/intel-06-55-04 /usr/share/microcode_ctl/ucode_with_caveats/intel-06-2d-07 /usr/share/microcode_ctl/ucode_with_caveats/intel  /lib/firmware/updates "

полный вывод не влазит

Но и того видеоадаптера в сервере сейчас нет. Стоит другой, с ним всё ОК даже без firmware

[    4.038934] fb: switching to nouveaufb from EFI VGA
[    4.039032] nouveau 0000:08:00.0: vgaarb: deactivate vga console
[    4.039072] nouveau 0000:08:00.0: NVIDIA GK208B (b06080b1)
[    4.148925] nouveau 0000:08:00.0: bios: version 80.28.79.00.10
[    4.149490] nouveau 0000:08:00.0: fb: 2048 MiB DDR3
[    4.839676] nouveau 0000:08:00.0: DRM: VRAM: 2048 MiB
[    4.839677] nouveau 0000:08:00.0: DRM: GART: 1048576 MiB
[    4.839680] nouveau 0000:08:00.0: DRM: TMDS table version 2.0
[    4.839680] nouveau 0000:08:00.0: DRM: DCB version 4.0
[    4.839682] nouveau 0000:08:00.0: DRM: DCB outp 00: 01000f02 00020030
[    4.839683] nouveau 0000:08:00.0: DRM: DCB outp 01: 02011f62 00020010
[    4.839683] nouveau 0000:08:00.0: DRM: DCB outp 02: 02022f10 00000000
[    4.839684] nouveau 0000:08:00.0: DRM: DCB conn 00: 00001031
[    4.839685] nouveau 0000:08:00.0: DRM: DCB conn 01: 00002161
[    4.839686] nouveau 0000:08:00.0: DRM: DCB conn 02: 00000200
[    4.840008] nouveau 0000:08:00.0: DRM: MM: using COPY for buffer copies
[    4.840919] snd_hda_intel 0000:08:00.1: bound 0000:08:00.0 (ops nv50_audio_component_bind_ops [nouveau])
[    5.011765] nouveau 0000:08:00.0: DRM: allocated 1920x1080 fb: 0x80000, bo 000000004bcdf120
[    5.011811] fbcon: nouveaudrmfb (fb0) is primary device
[    5.055058] nouveau 0000:08:00.0: [drm] fb0: nouveaudrmfb frame buffer device
[    5.066180] [drm] Initialized nouveau 1.3.1 20120801 for 0000:08:00.0 on minor 0
[22858.409276] nouveau 0000:08:00.0: gr: TRAP ch 2 [007fb1a000 systemd-logind[1838]]
[22858.409283] nouveau 0000:08:00.0: gr: GPC0/TPC0/TEX: 80000049
[22858.409293] nouveau 0000:08:00.0: fifo: fault 00 [READ] at 00000000055eb000 engine 00 [GR] client 01 [GPC0/T1_0] reason 02 [PTE] on channel 2 [007fb1a000 systemd-logind[1838]]
[22858.409297] nouveau 0000:08:00.0: fifo: channel 2: killed
[22858.409299] nouveau 0000:08:00.0: fifo: runlist 0: scheduled for recovery
[22858.409302] nouveau 0000:08:00.0: fifo: engine 0: scheduled for recovery
[22858.409306] nouveau 0000:08:00.0: systemd-logind[1838]: channel 2 killed!
[23102.641203] Workqueue: events_unbound nv50_disp_atomic_commit_work [nouveau]
[23102.641235]  ? nvif_notify_get+0x94/0xa0 [nouveau]
[23102.641264]  ? nouveau_fence_no_signaling+0x26/0xa0 [nouveau]
[23102.641293]  ? nouveau_fence_enable_signaling+0x2a/0x70 [nouveau]
[23102.641333]  nv50_disp_atomic_commit_tail+0x8b/0xaa0 [nouveau]

galiy
() автор топика
Ответ на: комментарий от zemidius

Ну если других мыслей нет то да, неактуально.

Я просто кучу времени на эту хрень убил, и теперь просто интересно. Если firmware должна быть в initramfs то как текущая карточка без неё там работает. Вполне вероятно, nouveau запускается уже после монтирования / , и фирмварь берется уже с рутовой ФС… Остаётся один вариант - видюха всё же битая. Но почему она тогда сцуко с live usb нормально грузится…

galiy
() автор топика
Ответ на: комментарий от galiy

Если firmware должна быть в initramfs то как текущая карточка без неё там работает.

Текущая карточка может не хотеть фирмвари.

zemidius
()
Ответ на: комментарий от zemidius

@zemidius Карту протестировали, всё ОК. Хочу вернуть в сервер. пытаюсь собрать initramfs с фирмварью gp108 что-то не получается Добавил в папку /etc/dracut.conf.d файл nvidia_gp108.conf

add_drivers+=" nouveau "
fw_dir+=" /lib/firmware/nvidia "

пересобираю initramfs

#dracut -f /boot/initramfs-$(uname -r).img $(uname -r)
...
dracut:     microcode_ctl: final fw_dir: "/usr/share/microcode_ctl/ucode_with_caveats/intel-06-8e-9e-0x-dell /usr/share/microcode_ctl/ucode_with_caveats/intel-06-8c-01 /usr/share/microcode_ctl/ucode_with_caveats/intel-06-5e-03 /usr/share/microcode_ctl/ucode_with_caveats/intel-06-55-04 /usr/share/microcode_ctl/ucode_with_caveats/intel-06-2d-07 /usr/share/microcode_ctl/ucode_with_caveats/intel  /lib/firmware/updates  /lib/firmware/nvidia "
...

но этого недостаточно, в получившемся архиве папка /lib/nvidia/gp108 не появляется :-( Куда-то не туда копаю походу…

Драйвер nouveau вшит в ядро, его я не пересобирал

galiy
() автор топика
Ответ на: комментарий от galiy

Ну вот и всё, вроде разобрался с причинами.

В папке /etc/dracut.conf.d файл amdgpu.conf со следующим содержимым

add_drivers+=" amdgpu "
fw_dir+=" /lib/firmware/updates "

Из-за него в initramfs не добавлялись фирмвари для nvidia. Сложно сказать, откуда сий файл появился. До того в сервере стояла видюха AMD, и проприетарные дрова. Возможно этот конфиг создал инсталлятор проприетарных дров… Не очень понимаю, как именно это влияние возможно, в обеих командах стоит += то есть добавляет драйвер и папку в строки, но как есть. После того как я закомментировал эти строки и пересобрал initramfs, нужные фирмвари в нём появились и сервак нормально загрузился с графикой.

Блин ну времени убил конечно на какую-то фигню… Ну как обычно :-)

galiy
() автор топика
Ответ на: комментарий от galiy

Не очень понимаю, как именно это влияние возможно, в обеих командах стоит += то есть добавляет драйвер и папку в строки, но как есть.

Сложно сказать, надо вникать в логику dracut, может быть, @alpha сможет помочь, направив нужной ссылкой? Лично я был бы благодарен, это осталось последнее темное пятно в этой истории.

Блин ну времени убил конечно на какую-то фигню… Ну как обычно

Так это ж отлично, только не говори, что удовлетворение не получил от того, что докопался до сути проблемы и не решил её )

zemidius
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.