LINUX.ORG.RU

Иксы опять потекли, на этот раз в GPU mem

 , , ,


1

2

После обновления обнаружил течку у иксов. На этот раз непосредственно в видеопамять. Памяти 2 гб у видеокарты обычно «хватает» на пол дня, после чего оно начинает гадить в оперативку и своп, вплоть до полного зависания. Причем течет оно не в виде процесса, т.е. адресуется на каком-то более низком уровне (короче также, как обычно происходит при нехватке памяти видеокарты).

Система: Linux desktop 4.7.2-1-ARCH #1 SMP PREEMPT Sat Aug 20 23:02:56 CEST 2016 x86_64 GNU/Linux
KDE
nvidia

nvidia-smi выдает примерно такое

Wed Sep  7 04:28:34 2016       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 370.23                 Driver Version: 370.23                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 750 Ti  Off  | 0000:01:00.0      On |                  N/A |
| 40%   30C    P8     1W /  38W |   1937MiB /  1998MiB |      3%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0      1649    G   /usr/lib/xorg-server/Xorg                     1784MiB |
|    0      2758    G   kwin_x11                                        32MiB |
|    0      2766    G   /usr/bin/krunner                                 1MiB |
|    0      2782    G   /usr/bin/plasmashell                            56MiB |
|    0      3112    G   nvidia-settings                                  0MiB |
|    0      3227    G   ...dius/.local/share/Steam/ubuntu12_32/steam    20MiB |
|    0      4981    G   /usr/lib/firefox/plugin-container                1MiB |
|    0     11822    C   /usr/lib/libreoffice/program/soffice.bin        26MiB |
|    0     13594    G   /usr/bin/knotes                                  1MiB |
|    0     13649    G   /usr/bin/akonadi_archivemail_agent               1MiB |
|    0     13679    G   /usr/bin/akonadi_mailfilter_agent                1MiB |
|    0     13687    G   /usr/bin/akonadi_newmailnotifier_agent           1MiB |
|    0     13690    G   /usr/bin/akonadi_notes_agent                     1MiB |
|    0     13693    G   /usr/bin/akonadi_sendlater_agent                 1MiB |
+-----------------------------------------------------------------------------+

xrestop до кучи

xrestop - Display: localhost:0
          Monitoring 66 clients. XErrors: 0
          Pixmaps:   79656K total, Other:     141K total, All:   79797K total

res-base Wins  GCs Fnts Pxms Misc   Pxm mem  Other   Total   PID Identifier    
1e00000    37    2    7   39  491    44000K     19K  44020K   ?   KWin
5a00000    18  131    1  280   48    19541K      5K  19546K 11822  ~Q                1 - LibreOffice Calc
5000000    23   75    1    6   50     8491K      4K   8496K  5983 xpra_launcher
2a00000     8  103    1   16   46     3809K      4K   3813K 13385 /home/radius/ ~T     ~C       ~B ~K/videobios/SAPPHIRE_7850.ROM - Bless
0000000     2    0    2    0  195     3112K      6K   3118K   ?   <unknown>
3a00000    42   24    1    4  101      520K      4K    524K  3114  ~T           ~B ~L  ~A       ~I         - Mozilla Firefox
8000000     1  127    0   43   12       86K      3K     89K   ?   <unknown>
2000000    21    7    1   64  135       33K      4K     38K  2782          ~G      ~A ~B           ~C       ~G       ~N  ~@~T Plasma
3400000     4    3    1    2   28       22K      1K     24K  3112 NVIDIA X Server Settings
2e00000    10   64    1    4   55       16K      4K     20K  2963 StarDict

Вопрос собственно такой: это можно как-то диагностировать, кроме как методом тыка? Когда иксы текут по-обычному, т.е. в оперативку, тогда найти виновника помогает xrestop. Но nvidia-smi увы ничего полезного не говорит. В системном логе и логе иксовой сессии тоже ничего особо вопиюще-спамного нет, все примерно как обычно.

★★★★

Дык, unstable же. На 361.28 подобных проблем не наблюдаю.

Хотя у меня иксы жрут 224MiB с аптаймом в 16 часов.

RazrFalcon ★★★★★
()

Попробуйте откатиться на 367.44

А у меня почему-то nvidia-smi не поддерживает таблицу процессов.

Deleted
()

Нвидия славится своими кривыми дровами и годами неисправляемыми даже в стабильной ветке багами.

У тя старые забагованные 4кеды? У меня всё ок, и судя по представленной картинке течёт именно квин.

anonymous
()
Ответ на: комментарий от Deleted

Откатился на 367.35 вместе с ядром, все равно течет.. значит буду тыкать само окружение и софт, где-то там засела бездонная пожиралка памяти.

Radius ★★★★
() автор топика
Ответ на: комментарий от anonymous

похоже не в нвидии дело, она тут только при том, что с помощью ее утилиты я пытался выяснить источник проблемы.

Смотри внимательнее, xrestop - это данные по оперативке. Квин занимает в процессе xorg 44 мб из 79 мб суммарных. А проблема здесь не в оперативке, а видеопамяти, в которой xorg занимает аж 1.8 гб.

Radius ★★★★
() автор топика
Последнее исправление: Radius (всего исправлений: 1)
Ответ на: комментарий от anonymous

ага очень старая аж 2014 года

Radius ★★★★
() автор топика
Ответ на: комментарий от Radius

Ну так квин и течет, он всегда течёт на видимопамять в иксах.

Вот тебе моя картинка, кде5:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 370.23                 Driver Version: 370.23                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 750 Ti  Off  | 0000:01:00.0      On |                  N/A |
| 29%   39C    P0     2W /  38W |    409MiB /  1998MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0      3156    G   /usr/bin/X                                     203MiB |
|    0      3512    G   kwin_x11                                        66MiB |
|    0      3515    G   /usr/bin/krunner                                 1MiB |
|    0      3520    G   /usr/bin/plasmashell                            57MiB |
|    0      7444    G   ...s-passed-by-fd --v8-snapshot-passed-by-fd    79MiB |
+-----------------------------------------------------------------------------+

Квин занимает в процессе xorg 44 мб из 79 мб суммарных

ой не факт

anonymous
()
Ответ на: комментарий от Radius

посмотри консистентность libGL и прочих либ, меза любит подменять нормальные проприетарные либы своими, и ничего что ядерный модуль не собран даже.

anonymous
()
Ответ на: комментарий от Radius

Откатился на 367.35

Под Gentoo новее 352.79 на 740m проблемы с выгрузкой модуля ядра, можно попробовать ещё откатить.

backbone ★★★★★
()
Ответ на: комментарий от anonymous

Нашел виновника - течет плазмащель. Буду ее ковырять.

странно что в логах ничего нету, ну кроме вот этого:

plasmashell[21603]: QXcbConnection: XCB error: 2 (BadValue), sequence: 6819, resource id: 54525959, major code: 142 (Unknown), minor code: 3
но это вроде и раньше было

Radius ★★★★
() автор топика

Так вот для чего продают затычки c немощным чипом, но с несколькими гигами памяти.

anonymous
()
23 декабря 2016 г.

Аналогичная проблема, кстати. За три дня натек почти гиг.

root@akamanah-PC:/home/akamanah# nvidia-smi
Fri Dec 23 13:08:23 2016       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 370.28                 Driver Version: 370.28                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1070    Off  | 0000:01:00.0      On |                  N/A |
| 25%   44C    P0    37W / 166W |   1335MiB /  8110MiB |      1%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0      1227    G   /usr/lib/xorg/Xorg                             925MiB |
|    0      1515    G   kwin_x11                                        56MiB |
|    0      1518    G   /usr/bin/krunner                                12MiB |
|    0      1529    G   /usr/bin/plasmashell                           208MiB |
|    0     27542    G   /home/akamanah/.steam/ubuntu12_32/steam        130MiB |
+-----------------------------------------------------------------------------+
Akamanah ★★★★★
()
Ответ на: комментарий от Akamanah

Был какой-то баг в плазме или qt, вылечилось очередным обновлением кед. Честно говоря не засек конкретные версии, но вероятно в твоем дистрибутиве сейчас как раз они.

Radius ★★★★
() автор топика
Ответ на: комментарий от Akamanah

у меня сейчас плазма 5.8.4, frameworks 5.29.0 и qt 5.7.1. Вот кажется как раз с переходом на 5.8.x проблема и исчезла, но 100% не уверен.

Radius ★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.