LINUX.ORG.RU

Долгая загрузка системы

 , ,


0

2

Приветствую.

Последняя версия Manjaro GNU/Linux, systemd 238. Система загружается чрезвычайно долго — около 2 минут, при этом на протяжении загрузки наблюдается высокая нагрузка на HDD. Что характерно, перезагрузка после этого проходит нормально — в течение 20-30 секунд — до следующего раза.

systemd-analyze blame:

         23.728s dev-sdb2.device
         22.058s systemd-journal-flush.service
         20.006s systemd-udevd.service
         18.153s udisks2.service
          1.952s systemd-sysusers.service
          1.332s ufw.service
          1.138s user@1000.service
          1.113s NetworkManager.service
          1.061s ldconfig.service
          1.009s systemd-modules-load.service
          1.009s polkit.service
          1.002s systemd-fsck@dev-sdb1.service
           806ms macspoof@multi-user.service
           753ms systemd-logind.service
           744ms alsa-restore.service
           740ms avahi-daemon.service
           558ms systemd-sysctl.service
           537ms systemd-tmpfiles-setup-dev.service
           427ms systemd-journal-catalog-update.service
           361ms systemd-binfmt.service
           312ms systemd-update-utmp.service
           272ms dev-mqueue.mount
           269ms systemd-tmpfiles-setup.service
           250ms systemd-tmpfiles-clean.service
           213ms systemd-udev-trigger.service
           202ms sys-kernel-debug.mount
           200ms dev-hugepages.mount
           199ms kmod-static-nodes.service
           198ms systemd-remount-fs.service
           194ms tmp.mount
           172ms systemd-journald.service
           139ms boot-efi.mount
            97ms systemd-random-seed.service
            91ms rtkit-daemon.service
            34ms dev-sdb3.swap
            29ms systemd-user-sessions.service
             8ms systemd-update-done.service
             7ms proc-sys-fs-binfmt_misc.mount
             6ms sys-fs-fuse-connections.mount
             3ms sys-kernel-config.mount
То же самое, но после перезагрузки:
          4.207s dev-sdb2.device
          1.962s systemd-journal-flush.service
          1.758s systemd-udevd.service
          1.455s ufw.service
           921ms NetworkManager.service
           876ms polkit.service
           681ms systemd-tmpfiles-setup-dev.service
           547ms macspoof@multi-user.service
           544ms udisks2.service
           540ms systemd-modules-load.service
           503ms systemd-logind.service
           481ms avahi-daemon.service
           478ms alsa-restore.service
           461ms systemd-journald.service
           386ms systemd-tmpfiles-setup.service
           353ms sys-kernel-debug.mount
           352ms systemd-remount-fs.service
           352ms dev-hugepages.mount
           338ms user@1000.service
           272ms systemd-udev-trigger.service
           260ms systemd-fsck@dev-sdb1.service
           229ms systemd-binfmt.service
           176ms dev-sdb3.swap
           161ms boot-efi.mount
           117ms systemd-sysctl.service
           116ms rtkit-daemon.service
           115ms dev-mqueue.mount
           109ms kmod-static-nodes.service
            52ms systemd-random-seed.service
            41ms systemd-user-sessions.service
            40ms systemd-update-utmp.service
            32ms proc-sys-fs-binfmt_misc.mount
            12ms tmp.mount
             6ms sys-fs-fuse-connections.mount
             3ms sys-kernel-config.mount
В логах загрузки видны сообщения об ошибках с amdkfd и sp5100-tco, но отключение этих модулей проблему не решает. Также, для проверки, я отключал fsck на старте, но, опять же, результата нет.

Как решить эту проблему?

★★

Последнее исправление: pelmeshechka (всего исправлений: 3)
Ответ на: комментарий от Vsevolod-linuxoid

Судя по отсутствию соответствующих сообщений на старте, он отключился, но, как я уже говорил, проблема не в нём.

pelmeshechka ★★
() автор топика
Ответ на: комментарий от pelmeshechka

dmesg смотри что там 20 секунд делается

anonymous
()
Ответ на: комментарий от ugoday

Да, кстати, там была версия манжары с опенрц, сейчас они в стадии откола в полноценный форк.

mandala ★★★★★
()
Ответ на: комментарий от ugoday

Ну да вместо того чтобы глянуть логи и разобраться в проблеме будем менять систему инициализации, перебирать дистры ну а потом еще и железо до кучи заменим

anonymous
()
Ответ на: комментарий от anonymous

Нормальные дистры (которые позиционируют себя как универсальные) предлагают хотя бы пару инитов, т.к. мощная, но запутанная система управления (это не только же инит) под названием сустемд может быть избыточна.

mandala ★★★★★
()
Последнее исправление: mandala (всего исправлений: 1)
Ответ на: комментарий от anonymous

Если виноват диск, то даже винда не решит проблему. Если проблема в другом, и это не единственная сложность — то почему бы и нет?

mandala ★★★★★
()
Ответ на: комментарий от Samsky

journalctl --disk-usage

Archived and active journals take up 176.0M in the file system
Насколько я понимаю, это относительно немного, поэтому проблема лежит в другом.

pelmeshechka ★★
() автор топика
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.16.2-1-MANJARO] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Blue
Device Model:     WDC WD10EZEX-60WN4A0
Serial Number:    WD-WCC6Y0SUK5PL
LU WWN Device Id: 5 0014ee 264d0bfd4
Firmware Version: 01.01A01
User Capacity:    1 000 204 886 016 bytes [1,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Apr 17 17:51:20 2018 +05
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(11040) seconds.
Offline data collection
capabilities: 			 (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 114) minutes.
SCT capabilities: 	       (0x303d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   179   173   021    Pre-fail  Always       -       2008
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       70
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002f   200   200   051    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       557
 10 Spin_Retry_Count        0x0033   100   253   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       68
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   097    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   098   000    Old_age   Always       -       3
190 Airflow_Temperature_Cel 0x0022   065   064   040    Old_age   Always       -       35 (Min/Max 35/35)
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       4
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       74
194 Temperature_Celsius     0x0022   108   107   000    Old_age   Always       -       35
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%       557         -
# 2  Short offline       Completed without error       00%        15         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Я не очень хорошо разбираюсь в S.M.A.R.T., но судя по этим результатам (и по тому, что диску лишь чуть больше месяца), проблема заключается не в HDD.

pelmeshechka ★★
() автор топика
Ответ на: комментарий от anonymous
апр 17 15:41:16 sorrymak-pc kernel: sd 3:0:0:0: [sdb] 1953525168 512-byte logical blocks: (1.00 TB/932 GiB)
апр 17 15:41:16 sorrymak-pc kernel: sd 3:0:0:0: [sdb] 4096-byte physical blocks
апр 17 15:41:16 sorrymak-pc kernel: sd 3:0:0:0: [sdb] Write Protect is off
апр 17 15:41:16 sorrymak-pc kernel: sd 3:0:0:0: [sdb] Mode Sense: 00 3a 00 00
апр 17 15:41:16 sorrymak-pc kernel: sd 3:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
апр 17 15:41:16 sorrymak-pc kernel:  sdb: sdb1 sdb2 sdb3
апр 17 15:41:16 sorrymak-pc kernel: sd 3:0:0:0: [sdb] Attached SCSI disk
апр 17 15:41:16 sorrymak-pc kernel: EXT4-fs (sdb2): mounted filesystem with ordered data mode. Opts: (null)
апр 17 15:41:16 sorrymak-pc kernel: EXT4-fs (sdb2): re-mounted. Opts: (null)
апр 17 15:41:39 sorrymak-pc kernel: Adding 6537180k swap on /dev/sdb3.  Priority:-2 extents:1 across:6537180k FS
pelmeshechka ★★
() автор топика
Ответ на: комментарий от anonymous

Релевантная часть лога:

апр 17 15:41:16 sorrymak-pc systemd[1]: Reached target Slices.
апр 17 15:41:16 sorrymak-pc systemd[1]: Created slice system-getty.slice.
апр 17 15:41:16 sorrymak-pc systemd[1]: Started Dispatch Password Requests to Console Directory Watch.
апр 17 15:41:16 sorrymak-pc kernel: EXT4-fs (sdb2): re-mounted. Opts: (null)
апр 17 15:41:38 sorrymak-pc kernel: vhba: loading out-of-tree module taints kernel.
апр 17 15:41:38 sorrymak-pc kernel: scsi host7: vhba
апр 17 15:41:38 sorrymak-pc kernel: piix4_smbus 0000:00:14.0: SMBus Host Controller at 0xb00, revision 0
апр 17 15:41:38 sorrymak-pc kernel: piix4_smbus 0000:00:14.0: Using register 0x2e for SMBus port selection
апр 17 15:41:38 sorrymak-pc kernel: piix4_smbus 0000:00:14.0: Auxiliary SMBus Host Controller at 0xb20

pelmeshechka ★★
() автор топика
Ответ на: комментарий от pelmeshechka

Там проблемы с гибернацией, у вас после суспенда долго загружается или чистая загрузка?

anonymous
()
Ответ на: комментарий от anonymous

Мат. плата MSI A68HM-P33 v2, процессор AMD A4-7300 APU (с Radeon HD 8470D), 64-битная система... Как можно видеть по предыдущим моим тредам, проблем с ним масса — в частности, отключить ACPI пришлось именно из-за проблем с загрузкой.

pelmeshechka ★★
() автор топика
Ответ на: комментарий от pelmeshechka

меня это вот смущает:

scsi host7: vhba

такое ощущение, что там i/o через какую-то задницу работает

anonymous
()
Ответ на: комментарий от anonymous

Сомневаюсь. journalctl -k -b -2 | grep scsi

апр 17 21:36:24 sorrymak-pc kernel: scsi host0: ahci
апр 17 21:36:24 sorrymak-pc kernel: scsi host1: ahci
апр 17 21:36:24 sorrymak-pc kernel: scsi host2: ahci
апр 17 21:36:24 sorrymak-pc kernel: scsi host3: ahci
апр 17 21:36:24 sorrymak-pc kernel: scsi host4: ahci
апр 17 21:36:24 sorrymak-pc kernel: scsi host5: ahci
апр 17 21:36:24 sorrymak-pc kernel: scsi host6: usb-storage 1-1:1.0
апр 17 21:36:24 sorrymak-pc kernel: scsi 0:0:0:0: Direct-Access     ATA      ST250DM000-1BD14 KC45 PQ: 0 ANSI: 5
апр 17 21:36:24 sorrymak-pc kernel: scsi 3:0:0:0: Direct-Access     ATA      WDC WD10EZEX-60W 1A01 PQ: 0 ANSI: 5
апр 17 21:36:24 sorrymak-pc kernel: scsi 6:0:0:0: Direct-Access     Generic  STORAGE DEVICE   9602 PQ: 0 ANSI: 0
апр 17 21:36:24 sorrymak-pc kernel: scsi 6:0:0:1: Direct-Access     Generic  STORAGE DEVICE   9602 PQ: 0 ANSI: 0
апр 17 21:36:24 sorrymak-pc kernel: scsi 6:0:0:2: Direct-Access     Generic  STORAGE DEVICE   9602 PQ: 0 ANSI: 0
апр 17 21:36:24 sorrymak-pc kernel: scsi 6:0:0:3: Direct-Access     Generic  STORAGE DEVICE   9602 PQ: 0 ANSI: 0
апр 17 21:36:24 sorrymak-pc kernel: scsi host7: vhba
vhba требуется исключительно для CDEmu, проблема явно не в нём.

pelmeshechka ★★
() автор топика

Удалось запустить htop сразу после загрузки, и, как выяснилось, /sbin/init нагружает ЦП на 100%, по крайней мере на последней стадии загрузки, но скорее всего и до этого тоже.

Не уверен, нормально ли это.

pelmeshechka ★★
() автор топика
Ответ на: комментарий от pelmeshechka

И все таки попробуйте поставить лимит

в

/etc/systemd/journald.conf

SystemMaxUse=50M

и

sudo systemctl restart systemd-journald

10% от терабайтника для журнала чересчур

vs220
()
Ответ на: комментарий от vs220

Думаю, вы правы — я только что попробовал в качестве одноразового эксперимента полностью отключить systemd-journal-flush.service, и проблема исчезла...

Последую вашему совету, спасибо.

pelmeshechka ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.