LINUX.ORG.RU

Фриз системы после переноса SSD на другое железо

 , , , ,


0

1

Всем привет. Subj.

Изначально система была поставлена на ноут с Nvidia, туда же запилен bumblebee.
Затем по объективным причинам SSD переехал на другое железо с встроенным видео (Intel).

Время от времени система рандомно фризится. Это может быть операция копирования, какая-нибудь системная утилита (gparted) либо запуск google-chrome/браузинг в нём же.

Система может так же рандомно как саморазморозиться через 1-2 минуты, так и не разморозиться никогда. Всё бы ничего, но делать 5-6 рестартов подряд меня как-то приподзаколебало...

Логи Xorg смотрел - вроде бы ничего подозрительного. Вот что есть в dmesg:

[12768.601726] WARNING: CPU: 1 PID: 3215 at /build/linux-RGM_Ed/linux-3.16.7-ckt9/drivers/gpu/drm/i915/intel_uncore.c:132 gen6_gt_check_fifodbg.isra.10+0x36/0x50 [i915]()
[12768.601727] GT wake FIFO error 0x3
[12768.601728] Modules linked in: xfs libcrc32c jfs ctr ccm pci_stub vboxpci(O) vboxnetadp(O) vboxnetflt(O) vboxdrv(O) bnep bluetooth 6lowpan_iphc cpufreq_powersave cpufreq_userspace cpufreq_stats cpufreq_conservative binfmt_misc nls_utf8 nls_cp437 vfat fat fuse ecryptfs parport_pc ppdev lp parport dm_crypt uinput arc4 rt2800usb rt2x00usb rt2800lib rt2x00lib mac80211 cfg80211 crc_ccitt rfkill joydev hid_generic hid_logitech_dj usbhid hid ses enclosure x86_pkg_temp_thermal intel_powerclamp intel_rapl coretemp kvm_intel snd_hda_codec_hdmi kvm crc32_pclmul ghash_clmulni_intel snd_hda_codec_realtek iTCO_wdt iTCO_vendor_support snd_hda_codec_generic efi_pstore aesni_intel aes_x86_64 lrw gf128mul glue_helper ablk_helper cryptd psmouse serio_raw efivars snd_hda_intel pcspkr snd_hda_controller snd_hda_codec
[12768.601748]  snd_hwdep snd_pcm lpc_ich snd_timer mfd_core snd i2c_i801 soundcore shpchp mei_me mei nuvoton_cir tpm_tis processor rc_core tpm evdev ext4 crc16 mbcache jbd2 dm_mirror dm_region_hash dm_log dm_mod sg sr_mod cdrom sd_mod crc_t10dif crct10dif_generic usb_storage crct10dif_pclmul crct10dif_common i915 ehci_pci r8169 mii crc32c_intel ahci ehci_hcd xhci_hcd libahci video i2c_algo_bit libata drm_kms_helper scsi_mod usbcore drm i2c_core usb_common thermal_sys button
[12768.601764] CPU: 1 PID: 3215 Comm: Xorg Tainted: G        W  O  3.16.0-4-amd64 #1 Debian 3.16.7-ckt9-3~deb8u1
[12768.601765] Hardware name: To Be Filled By O.E.M. To Be Filled By O.E.M./Z68 Pro3, BIOS P1.40 06/21/2011
[12768.601766]  0000000000000009 ffffffff8150ac96 ffff88023542bb60 ffffffff81067747
[12768.601767]  0000000000000003 ffff88023542bbb0 ffff8800361c0080 0000000000000000
[12768.601769]  0000000000000000 ffffffff810677ac ffffffffa028923c ffffffff00000020
[12768.601770] Call Trace:
[12768.601774]  [<ffffffff8150ac96>] ? dump_stack+0x41/0x51
[12768.601777]  [<ffffffff81067747>] ? warn_slowpath_common+0x77/0x90
[12768.601778]  [<ffffffff810677ac>] ? warn_slowpath_fmt+0x4c/0x50
[12768.601785]  [<ffffffffa021a016>] ? gen6_gt_check_fifodbg.isra.10+0x36/0x50 [i915]
[12768.601791]  [<ffffffffa021b667>] ? gen6_read32+0x117/0x120 [i915]
[12768.601797]  [<ffffffffa0215637>] ? gen6_ring_get_seqno+0x27/0x40 [i915]
[12768.601803]  [<ffffffffa01fc823>] ? __wait_seqno+0x1e3/0x4f0 [i915]
[12768.601806]  [<ffffffff810a7930>] ? prepare_to_wait_event+0xf0/0xf0
[12768.601812]  [<ffffffffa01f7303>] ? i915_gem_do_execbuffer.isra.24+0x6b3/0x13f0 [i915]
[12768.601814]  [<ffffffff8101b4c5>] ? read_tsc+0x5/0x20
[12768.601816]  [<ffffffff810c758e>] ? ktime_get+0x3e/0xc0
[12768.601822]  [<ffffffffa01fdb47>] ? i915_gem_object_wait_rendering+0x37/0x50 [i915]
[12768.601828]  [<ffffffffa0203b47>] ? i915_gem_pwrite_ioctl+0x2f7/0x8a0 [i915]
[12768.601830]  [<ffffffff81075a17>] ? recalc_sigpending+0x17/0x50
[12768.601832]  [<ffffffff81005ae1>] ? __xen_pgd_walk+0x301/0x310
[12768.601834]  [<ffffffff811badad>] ? set_fd_set+0x1d/0x30
[12768.601839]  [<ffffffffa00798b7>] ? drm_ioctl+0x1c7/0x5b0 [drm]
[12768.601842]  [<ffffffff810125c9>] ? do_signal+0x199/0xa10
[12768.601844]  [<ffffffff8101e5d2>] ? __restore_xstate_sig+0x82/0x580
[12768.601845]  [<ffffffff811ba2ff>] ? do_vfs_ioctl+0x2cf/0x4b0
[12768.601847]  [<ffffffff81079535>] ? restore_altstack+0x15/0x30
[12768.601848]  [<ffffffff81013066>] ? sys_rt_sigreturn+0xa6/0xb0
[12768.601850]  [<ffffffff811ba561>] ? SyS_ioctl+0x81/0xa0
[12768.601852]  [<ffffffff815114a9>] ? stub_rt_sigreturn+0x69/0xa0
[12768.601854]  [<ffffffff81510e4d>] ? system_call_fast_compare_end+0x10/0x15
[12768.601855] ---[ end trace 8397ced6ce746904 ]---
[12768.616113] [drm:__gen6_gt_force_wake_get] *ERROR* Timed out waiting for forcewake to ack request.
[12768.629130] [drm:__gen6_gt_wait_for_thread_c0] *ERROR* GT thread status wait timed out
[12768.629133] ------------[ cut here ]------------

Есть идеи? Спасибо!


Баг в ядре. Собери другое ядро. Дистрибутив-то какой? Вижу, Debian, ну чтоже ищи откуда поставить другое ядро.

kostik87 ★★★★★
()
Последнее исправление: kostik87 (всего исправлений: 1)
Ответ на: комментарий от darkenshvein

Идиот что ли? Это ж стоковое ведро с секурити-апдейтом. И внезапно не получилось с SSD. ТС придется ставить ядро из другой ветки.

Deleted
()
Ответ на: комментарий от Deleted

И внезапно не получилось с SSD

так может всё-таки не в SSD дело? :) проблема вроде в иксах...

dbzix
() автор топика
Ответ на: комментарий от kostik87

Баг в ядре.

какой? с чего вы взяли?
ведро можно поставить с кернел.орг, но пока я не увидел довода, что проблема в ведре :)

dbzix
() автор топика
Ответ на: комментарий от dbzix

какой? с чего вы взяли?

В той части вывода dmesg, что вы выложили, ясно видно, что в модуле i915 происходит сбой:

drivers/gpu/drm/i915/intel_uncore.c:132 
и далее модуль «падает», ниже приведены модули которые с ним слинкованы. Вот и получается, что баг в ядре, точнее в модуле i915. Собирайте или ставьте другое ядро. Заодно можете отписаться в багзиллу.

kostik87 ★★★★★
()
Последнее исправление: kostik87 (всего исправлений: 1)

А без VBox'a пробовал? Выгрузи vbox* модули и попробуй.

Кроме того если xfs, jfs реально не используются, тоже выгрузи.

Если i915 продолжит падать, приходи, обсудим.

anonymous
()
Ответ на: комментарий от anonymous

А без VBox'a пробовал? Выгрузи vbox* модули и попробуй.

спасибо, попробую полетать без них, потом приду отпишусь :)

dbzix
() автор топика
Ответ на: комментарий от anonymous

А без VBox'a пробовал? Выгрузи vbox* модули и попробуй.

Интересно девки пляшут... Выгрузил, погонял машинку. Система всё так же имеет свойство притормаживать, но очень быстро растормаживается назад.

Что бы это значило? Куда дальше копать?

А вообще dmesg мне радостно отрапортовал:

[  115.811442] [drm] stuck on render ring
[  115.812768] [drm] GPU HANG: ecode 0:0x87e8effd, reason: Ring hung, action: reset
[  115.812770] [drm] GPU hangs can indicate a bug anywhere in the entire gfx stack, including userspace.
[  115.812771] [drm] Please file a _new_ bug report on bugs.freedesktop.org against DRI -> DRM/Intel
[  115.812773] [drm] drm/i915 developers can then reassign to the right component if it's not a kernel issue.
[  115.812774] [drm] The gpu crash dump is required to analyze gpu hangs, so please always attach it.
[  115.812775] [drm] GPU crash dump saved to /sys/class/drm/card0/error
[  117.712868] [drm] Enabling RC6 states: RC6 on, RC6p off, RC6pp off

dbzix
() автор топика
Ответ на: комментарий от armbox

снёс, зачем-то даже разблэклистил nouveau, и на всякий пожарный допилил relatime

сижу жду прихода...

dbzix
() автор топика
Ответ на: комментарий от dbzix

Баг в ядре. Неактуально. Помечено как решённое.

dbzix
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.