LINUX.ORG.RU

Baytrail full X11 freeze

 , , , ,


6

8

Проблему уже не раз поднимал на форуме оффтопиком и в IRC-конфе.

Суть проблемы:

  • Во время работы получаю полный фриз системы (сначала замирает мышка и изображение, через небольшую паузу выключается звук). И подобное замершее состояние может быть минутами, до хард ресета.
  • Предположительно проблема проявляется при включенном Google Chrome, много реже - при использовании Firefox. Грешил на flashplugin, но проблема проявляется и без оного. Думаю на кривые vaapi в драйверах.
  • В системе монитор весит на верхней панельке - не происходит Out Of Memory, память на момент падения свободна примерно наполовину, остальное - кэшировано, своп свободен. Сильной загрузки HDD нет, сильной загрузки процессора нет.
  • Под оффтопиком проблема не проявляется, совсем.
  • Оффтопиком пользоваться не могу, неудобно.

Имеется железо:

Asus X200MA (он же Asus X200M)
Intel(R) Pentium(R) CPU  N3540  @ 2.16GHz
Intel Corporation Atom Processor Z36xxx/Z37xxx Series Graphics & Display (rev 0e)

Софт:

Fedora 22, netinstall.
Mate Desktop.
Mate Applications.
LibreOffice.
Различные Development Tools.
Google Chrome.
Skype (проблема проявляется и при отсутствии оного, и на дебиане).
Telegram (аналогично Skype).
Yandex-disk (аналогично, проблема проявляется и без оного).
Mpv.
Драйвера с 01.org (проблема проявляется и на тех же драйверах из репозиториев дебиана/репозиториев Fedora + RPMfusion):
intel-gpu-tools.x86_64 2.99.917-22.intel20152
libva.x86_64 1.6.0-22.intel20152
libva-intel-driver.x86_64 1.6.0-22.intel20152
libva-utils.x86_64 1.6.0-22.intel20152
xorg-x11-drv-intel.x86_64 2.99.917-22.intel20152

Всё это на brtfs. На ext4 проблема так же проявляется.

Что изменено относительно дефолтной федоры:

GRUB_CMDLINE_LINUX="rhgb quiet intel_pstate=disable acpi_osi= video.use_native_backlight=1"

cat /etc/X11/xorg.conf.d/20-intel.conf 
Section "Device"
    Identifier "card0"
    Driver "intel"
    Option "Backlight" "intel_backlight"
    BusID "PCI:0:2:0"
EndSection

Section "InputClass"
        Identifier "touchpad catchall"
        Driver "synaptics"
        MatchIsTouchpad "on"
        MatchDevicePath "/dev/input/event*"
	Option "TapButton1" "1"
	Option "TapButton2" "3"
	Option "TapButton3" "2"
EndSection

Что делал:

  • Из вики Archlinux'а: If you are using kernel 4.0.X or above on Baytrail architecture and frequently encounter complete system freezes (especially when watching video or using GFX intensivelly), you should try adding the following kernel option as a workaround, until this bug will be fixed permanently. intel_pstate=disable
  • Как видно в изменениях, правил опции ядра для работы fn-клавиш. Соответствующая тема. С ядра 4.2.x перестала работать строка video.use_native_backlight=1, пришлось создать файл 20-intel.conf в xorg.conf.d. В дебиане эта строка не работала никогда.
  • Изменены шрифты (мало ли): установлен freetype-freeworld, конфигурационный файл стащен из вики дебиана fonts.

Какие логи нужны? (прикреплю при первом же падении, оно падает практически рандомно). Хотел, называется EeePC и поменьше геморроя. Получил кучу потерянных отчётов в универе.

За исключением утреннего фриза (сегодня, 13 ноябра 2015) остальные падения соответствовали описанию на арчевики: просмотр youtube, проигрывание музыки вк, и смена таба/трека/закрытие таба браузера/вообщеничегонеделание. Сегодня утром упал тогда, когда хром был в диалогах вконтакте, музыки не было, работал с LibreOffice и QtCreator'ом.

Upd: journalctl before and after freeze: https://gist.github.com/merhalak/a8e1801657b1fe9e5bbf
По отдельности:
До:https://gist.github.com/merhalak/d6ca878442c4ca191378
После:https://gist.github.com/merhalak/de4d2f816c8ba86140f5

Solution: запрещаем ускорение хз чего в /etc/X11/xorg.conf.d/..-intel.conf. Если такого файла нет, тащим его из /usr/...

Option "NoAccel" "True"
Upd: Нет, решение не сработало и на 5% батарейки комп завис.
Придётся искать другое решение.

Upd: Пробую форсить tsc.
Upd: К чертям tsc, не в нем дело. Два зависания за минуту получил.

Deleted

Последнее исправление: merhalak (всего исправлений: 14)
Ответ на: комментарий от anonymous
cat /sys/bus/clocksource/devices/clocksource0/available_clocksource 
tsc acpi_pm
cat /sys/bus/clocksource/devices/clocksource0/current_clocksource
tsc
Deleted
()
Ответ на: комментарий от Jefail

Странно то, что в dmesg этого нет. Точнее, я не могу получить логов dmesg за предыдущую загрузку.

Deleted
()
Ответ на: комментарий от Jefail

journalctl в топе топика. Последняя ошибка идёт после очередного (не первого) обновления базы dnf. Но если бы был виноват dnf - Debian не фризился бы, а он тоже.

Deleted
()
Ответ на: комментарий от Jefail

Последние 10 минут после падением. Похоже, он ничего в лог записать не успевает/умирает раньше.

ноя 13 08:01:01 white CROND[2797]: (root) CMD (run-parts /etc/cron.hourly)
ноя 13 08:01:02 white run-parts[2800]: (/etc/cron.hourly) starting 0anacron
ноя 13 08:01:02 white run-parts[2807]: (/etc/cron.hourly) finished 0anacron
ноя 13 08:01:02 white run-parts[2809]: (/etc/cron.hourly) starting mcelog.cron
ноя 13 08:01:02 white run-parts[2813]: (/etc/cron.hourly) finished mcelog.cron
ноя 13 08:12:25 white systemd[1]: Cannot add dependency job for unit dmraid-activation.service, ignoring: Unit dmraid-activation.service failed to load: No such file or directory.
ноя 13 08:12:25 white systemd[1]: Starting dnf makecache...
ноя 13 08:12:25 white dnf[2923]: cachedir: /var/cache/dnf
ноя 13 08:12:25 white dnf[2923]: Loaded plugins: builddep, config-manager, copr, playground, debuginfo-install, download, generate_completion_cache, needs-restarting, noroot, protected_packages, Query, reposync, migrate, langpacks
ноя 13 08:12:25 white dnf[2923]: langpacks: No languages are enabled
ноя 13 08:12:25 white dnf[2923]: Error reading file : /var/lib/dnf/plugins/langpacks/installed_langpacks as it does not exist
ноя 13 08:12:25 white dnf[2923]: initialized Langpacks plugin
ноя 13 08:12:25 white dnf[2923]: DNF version: 1.1.3
ноя 13 08:12:25 white dnf[2923]: Создание кэша для всех метаданных файлов.
ноя 13 08:12:25 white dnf[2923]: Metadata timer caching disabled when running on a battery.
ноя 13 08:12:25 white systemd[1]: Started dnf makecache.
ноя 13 08:12:25 white audit[1]: <audit-1130> pid=1 uid=0 auid=4294967295 ses=4294967295 subj=system_u:system_r:init_t:s0 msg='unit=dnf-makecache comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? addr=? terminal=? res=success'
ноя 13 08:12:25 white audit[1]: <audit-1131> pid=1 uid=0 auid=4294967295 ses=4294967295 subj=system_u:system_r:init_t:s0 msg='unit=dnf-makecache comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? addr=? terminal=? res=success'
ноя 13 08:12:37 white kernel: perf interrupt took too long (3954 > 2500), lowering kernel.perf_event_max_sample_rate to 50000
Кстати, странная запись в 25 секунд: «Metadata timer caching disabled when running on a battery.» - я работал то от сети.

Deleted
()
Последнее исправление: merhalak (всего исправлений: 1)
Ответ на: комментарий от Deleted

Оттуда же (у меня такой же вывод):

glxinfo | grep -i "vendor\|rendering"
direct rendering: Yes
server glx vendor string: SGI
client glx vendor string: Mesa Project and SGI
OpenGL vendor string: Intel Open Source Technology Center

Deleted
()
Ответ на: комментарий от Deleted
cat /var/log/Xorg.0.log | grep -ie uxa -ie sna
[     5.979] (II) intel(0): SNA initialized with Baytrail (gen7) backend

You might consider disabling sna acceleration in favor of uxa (uxa is slower, but more stable)... See: https://bugzilla.redhat.com/show_bug.cgi?id=1188772

You'd need to edit your /etc/X11/xorg.conf.d/20-intel.conf in line with comment #3 of that page...

You can always change it back if it's not it... Worth a shot...

Now that I know where to search information, I'm pretty sure the problem started when I enabled compiz.

But I'm trying with AccelMethod «glamor», and it looks pretty well. I hasn't crashed (yet), and it goes smoothly (not like «uxa»).

If it crashes, I'll go back again and continue from this point.

Thank you JaseP for your help

Deleted
()
Последнее исправление: merhalak (всего исправлений: 2)

Временно спи^W стащил с арчевики:

[root@white default]# cat /etc/default/grub 
GRUB_TIMEOUT=5
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=saved
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="rhgb quiet acpi_osi= video.use_native_backlight=1 i915.semaphores=1"
GRUB_DISABLE_RECOVERY="true"
[root@white default]# cat /etc/X11/xorg.conf.d/20-intel.conf 
Section "Device"
    Identifier "card0"
    Driver "intel"
    Option "Backlight" "intel_backlight"
    Option "NoAccel" "True"
    BusID "PCI:0:2:0"
EndSection

Deleted
()

Исходя из последних двух сообщений, похоже я отключил 2D ускорение X-ов. А достаточно было сменить.

Deleted
()
Последнее исправление: merhalak (всего исправлений: 1)
Ответ на: комментарий от greenman

Как проверить? Кстати есть странное поведение intel_gpu_top:

[root@white ploskov]# intel_gpu_top
(intel_gpu_top:3489) intel-mmio-CRITICAL: Test assertion failure function intel_mmio_use_pci_bar, file intel_mmio.c:144:
Failed assertion: !(error != 0)
Last errno: 1, Operation not permitted
Couldn't map MMIO region
Stack trace:
  #0 [_init+0x7eb9]
  #1 [_init+0x5d96]
  #2 [_init+0x1291]
  #3 [__libc_start_main+0xf0]
  #4 [_init+0x2d11]
  #5 [<unknown>+0x2d11]
Test (null) failed.
**** DEBUG ****
(intel_gpu_top:3489) intel-mmio-CRITICAL: Test assertion failure function intel_mmio_use_pci_bar, file intel_mmio.c:144:
Failed assertion: !(error != 0)
Last errno: 1, Operation not permitted
Couldn't map MMIO region
****  END  ****
FAIL (3366.246s)
Этот микрокод?
[root@white ploskov]# dmesg | grep microcode
[    0.734495] microcode: CPU0 sig=0x30678, pf=0x8, revision=0x815
[    0.734520] microcode: CPU1 sig=0x30678, pf=0x8, revision=0x815
[    0.734556] microcode: CPU2 sig=0x30678, pf=0x8, revision=0x815
[    0.734575] microcode: CPU3 sig=0x30678, pf=0x8, revision=0x815
[    0.734706] microcode: Microcode Update Driver: v2.00 <tigran@aivazian.fsnet.co.uk>, Peter Oruba

Deleted
()
Последнее исправление: merhalak (всего исправлений: 2)
Ответ на: комментарий от greenman

У меня Fedora, и микрокод подгружется (вроде) из microcode_ctl.x86_64

Установленные пакеты
Имя         : microcode_ctl
Архитектура : x86_64
Эпоха       : 2
Версия      : 2.1
Релиз       : 8.1.fc22
Размер      : 659 k
Репозиторий : @System
Из репозито : fedora
Краткое опи : Tool to transform and deploy CPU microcode update for x86.
URL         : http://fedorahosted.org/microcode_ctl
Лицензия    : GPLv2+ and Redistributable, no modification permitted
Описание    : The microcode_ctl utility is a companion to the microcode driver
            : written by Tigran Aivazian <tigran@aivazian.fsnet.co.uk>.
            : 
            : The microcode update is volatile and needs to be uploaded on each
            : system boot i.e. it doesn't reflash your cpu permanently, reboot
            : and it reverts back to the old microcode.

Deleted
()
Ответ на: комментарий от greenman

Какое ускорение регулируется настройками AccelMethod и NoAccel в xorg.conf.d? 2D ускорение композитора?

Deleted
()
Ответ на: комментарий от greenman

У меня фризы были и на 3.16.
Но сегодня весь день фризов не было с установки
https://bbs.archlinux.org/viewtopic.php?pid=1577275#p1577275

Option "NoAccel" "True"
Вопрос, какое ускорение у меня теперь отключено? vaapi? Не похоже, mpv-плеер тяжелое видео жрёт и не нагружает процессор выше 12% (без hwdec=vaapi нагружает минимум на 40%).

Deleted
()
Последнее исправление: merhalak (всего исправлений: 1)
Ответ на: комментарий от BeerSeller

Короче, не помогло ничего. Ни accelmethod, ни noaccel, ни tsc, ни acpi_pm, ни-че-го. В логах ничего поймать не могу. Придется мигрировать обратно на оффтопик и ждать пару лет до тех пор, пока линукс научится в бэйтреил.

Deleted
()
Ответ на: комментарий от greenman

Брр... Что ж, попытка не пытка. Хотя не хочу убунту. Попробую gnome 3 версию оной.

Deleted
()
Ответ на: комментарий от greenman

Загрузился я... Попробовал разместить окно файрфокса в правой части экрана, Ubuntu потужилась-потужилась и зафризилась. Я ебал. Уж простите.

Deleted
()
Последнее исправление: merhalak (всего исправлений: 1)

Неделю назад у меня было подобное на рабочем стационарном компьютере под нагрузкой. Методом перебора выяснилось, что если вынуть видеокарту (именно вынуть, а не просто переключить монитор на внутреннюю) фризы стопроцентно прекращаются. В общем: поддох похоже блок питания. Если нагрузка не сильная, то держит, а в противном случае всё дохнет. Иными словами — проверь железо!

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Evgueni

Не похоже на железную проблему это. Тем более ТС сказал, что под офтопиком такой пролемы нет. Алсо дырявая ОЗУ / HDD скорее будут крашить софт и отправлять ядро в панику, нежели вот так вот подвешивать систему, проблема точно в видеоподсистеме, ядро / иксы.

Jefail ★★★★
()
Ответ на: комментарий от arson

Ох, вроде даже «толсто» ответить хочется. Но вот незадача: не могу. Я очень надеюсь на успех. И очень не хочу возвращаться к винде.

Deleted
()
Ответ на: комментарий от Jefail

Обидно, что логов нет. Точнее в journalctl пусто, а как посмотреть dmesg за прошлую загрузку - я не знаю.

Deleted
()

i915.i915_enable_rc6=0 надо попробовать

Deleted
()
Ответ на: комментарий от arson

Понять бы, из-за чего он падает. Тогда интелю багрепорт можно было б кинуть.

Deleted
()
Ответ на: комментарий от superuser

В общем, уже починили в Fedora 23 (ядро 4.2.5). Правда, при этом поломали подсветку экрана (либо регулируется она, либо работают функциональные клавиши, настройки в xorg.conf.d/20-intel.conf и video.use_native_backlight не работают).

На линуксы я забью до сдачи сессии, она всё ближе, а я ещё к ней не готов. Потом буду заниматься этим всем. Наверно, даже на Gentoo перееду. Может, как раз ядро туда добавят (у меня опыта Gentoo нет, но хочется иметь).

Deleted
()
Ответ на: комментарий от superuser

Написал предыдущий пост и был наказан... Очередным фризом.

Deleted
()

Абсолютно аналогичная проблема. Не уверен что помогло:

1. Накатил LTS-ядро 4.1.13-1-lts

2. Выключил pstate _И_ поставил cpupower, где в качестве драйвера выставил acpi-cpufreq. Одно только выключение pstate ничего не дает, т.к. cpupower все равно использовал его в качестве драйвера.

vasiliy_sychev
()
Ответ на: комментарий от vasiliy_sychev

Отпишись через пару дней. У меня были забавные случаи, когда вроде все работает, отчитываюсь сюда о починке, делаю Ctrl+Tab и все заного.

Deleted
()
Ответ на: комментарий от vasiliy_sychev

У меня уже три недели полёт стабильный под оффтопиком. Раньше сессии перелезть обратно не получится - у нас универ завязан на M$, заставлять работать всё это говно под линем времени нет.

Поделить /etc/default/grub'ом? А ещё версиями kernel'я и intel-driver'ов + vaapi.

Deleted
()
Последнее исправление: merhalak (всего исправлений: 1)
Ответ на: комментарий от Deleted
cat /boot/loader/entries/arch.conf 
title	Arch Linux
linux	/vmlinuz-linux-lts
initrd	/initramfs-linux-lts.img
options	root=/dev/sda2 rw intel_pstate=disable
uname -r
4.1.13-1-lts
pacman -Qs intel
local/intel-tbb 4.4_20150728-1
    High level abstract threading library
local/mesa 11.0.6-1
    an open-source implementation of the OpenGL specification
local/xf86-video-intel 1:2.99.917+478+gdf72bc5-3 (xorg-drivers xorg)
    X.org Intel i810/i830/i915/945G/G965+ video drivers

Вот самое главное, после чего все заработало:

cpupower frequency-info
analyzing CPU 0:
  driver: acpi-cpufreq

vasiliy_sychev
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.