
MySQL сервер падает в одно и тоже время

 , ,



Есть mysql сервер с одной единственной базой для сайта на drupal 7. Суть проблемы в том, что начиная с 20 чисел этого месяца, около 9 часов утра InnoDB пытается завершить транзакции:

InnoDB: 379 transaction(s) which must be rolled back or cleaned up
, а потом падает весь mysql сервер после строк в логе:
InnoDB: Progress in percents: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 1002018-03-25  8:50:40 139705236580096 [Note] InnoDB: Rollback of trx with id 5052001327 completed
2018-03-25  8:50:40 139705236580096 [Note] InnoDB: Rollback of non-prepared transactions completed
2018-03-25  8:51:13 139705236580096 [Note] InnoDB: Dumping buffer pool(s) not yet started
2018-03-25  8:51:13 139811765056064 [Note] Plugin 'FEEDBACK' is disabled.
2018-03-25  8:51:13 139811765056064 [Note] Recovering after a crash using tc.log
2018-03-25  8:51:13 139811765056064 [Note] Starting crash recovery...
2018-03-25  8:51:13 139811765056064 [Note] Crash recovery finished.
2018-03-25  8:51:13 139811765056064 [Note] Server socket created on IP: ''.
2018-03-25  8:51:13 139811764549376 [Note] /usr/sbin/mysqld: Normal shutdown
И этим строчкам предшедствуют такие (их реально много):

2018-03-25 08:49:16 7f0fa8ffe700  InnoDB: Rolling back trx with id 5054068002, 1 rows to undo
2018-03-25  8:49:16 139705236580096 [Note] InnoDB: Rollback of trx with id 5054068002 completed
2018-03-25 08:49:16 7f0fa8ffe700  InnoDB: Rolling back trx with id 5054065546, 1 rows to undo
2018-03-25  8:49:16 139705236580096 [Note] InnoDB: Rollback of trx with id 5054065546 completed
2018-03-25 08:49:16 7f0fa8ffe700  InnoDB: Rolling back trx with id 5054063879, 1 rows to undo
2018-03-25  8:49:16 139705236580096 [Note] InnoDB: Rollback of trx with id 5054063879 completed
2018-03-25 08:49:16 7f0fa8ffe700  InnoDB: Rolling back trx with id 5054061051, 1 rows to undo
2018-03-25  8:49:16 139705236580096 [Note] InnoDB: Rollback of trx with id 5054061051 completed

Нашёл в гугле что это может быть повреждена база, но прогнал все таблицы базы с помощью mysqlcheck и он на каждой таблице выдал «OK».

Сам конфиг сервера mysql:

# These groups are read by MariaDB server.
# Use it for options that only the server (but not clients) should see
# See the examples of server my.cnf files in /usr/share/mysql/

# this is read by the standalone daemon and embedded servers

# this is only for the mysqld standalone daemon

# * Basic Settings
user		= mysql
pid-file	= /var/run/mysqld/
socket		= /var/run/mysqld/mysqld.sock
port		= 3306
basedir		= /usr
datadir		= /var/lib/mysql
tmpdir		= /tmp
lc-messages-dir	= /usr/share/mysql
# Instead of skip-networking the default is now to listen only on
# localhost which is more compatible and is not less secure.
bind-address		=

# * Fine Tuning
key_buffer_size		= 4G
max_allowed_packet	= 128M
thread_stack		= 256K
thread_cache_size       = 108
# This replaces the startup script and checks MyISAM tables if needed
# the first time they are touched
myisam_recover_options  = BACKUP
max_connections         = 10000
innodb_thread_concurrency = 0
table_open_cache        = 8192
innodb_buffer_pool_size = 80G
innodb_buffer_pool_instances = 64
# * Query Cache Configuration
query_cache_limit	= 64M
query_cache_size        = 8G

# * Logging and Replication
# Both location gets rotated by the cronjob.
# Be aware that this log type is a performance killer.
# As of 5.1 you can enable the log at runtime!
#general_log_file        = /var/log/mysql/mysql.log
#general_log             = 1
# Error log - should be very few entries.
log_error = /var/log/mysql/error.log
# Enable the slow query log to see queries with especially long duration
#slow_query_log_file	= /var/log/mysql/mariadb-slow.log
#long_query_time = 10
#log_slow_rate_limit	= 1000
#log_slow_verbosity	= query_plan
# The following can be used as easy to replay backup logs or for replication.
# note: if you are setting up a replication slave, see README.Debian about
#       other settings you may need to change.
#server-id		= 1
#log_bin			= /var/log/mysql/mysql-bin.log
expire_logs_days	= 10
max_binlog_size   = 100M
#binlog_do_db		= include_database_name
#binlog_ignore_db	= exclude_database_name

# * InnoDB
# InnoDB is enabled by default with a 10MB datafile in /var/lib/mysql/.
# Read the manual for more InnoDB related options. There are many!

# * Security Features
# Read the manual, too, if you want chroot!
# chroot = /var/lib/mysql/
# For generating SSL certificates you can use for example the GUI tool "tinyca".
# ssl-ca=/etc/mysql/cacert.pem
# ssl-cert=/etc/mysql/server-cert.pem
# ssl-key=/etc/mysql/server-key.pem
# Accept only connections using the latest and most secure TLS protocol version.
# ..when MariaDB is compiled with OpenSSL:
# ssl-cipher=TLSv1.2
# ..when MariaDB is compiled with YaSSL (default in Debian):
# ssl=on

# * Character sets
# MySQL/MariaDB default is Latin1, but in Debian we rather default to the full
# utf8 4-byte character set. See also client.cnf
character-set-server  = utf8mb4
collation-server      = utf8mb4_general_ci

# * Unix socket authentication plugin is built-in since 10.0.22-6
# Needed so the root database user can authenticate without a password but
# only when running as the unix root user.
# Also available for other users if required.
# See

# this is only for embedded server

# This group is only read by MariaDB servers, not by MySQL.
# If you use the same .cnf file for MySQL and MariaDB,
# you can put MariaDB-only options here

# This group is only read by MariaDB-10.1 servers.
# If you use the same .cnf file for MariaDB of different versions,
# use this group for options that older servers don't understand

То, что ты показал - это восстановление после падения (а не сама причина падения базы). Поэтому ищи причину дальше. Dmesg, journalctl и т.д

Ответ на: комментарий от anonymous

В dmesg последняя запись по mysqld: Out of memory: Kill process 53199 (mysqld) score 239 or sacrifice child

Но как mysqld может сыпаться от out of memory если памяти в избытке?

() автор топика
Ответ на: комментарий от FluffyPillow

Это её физически в избытке. А что там у тебя наконфижено и когда к мускулю киллер приходит — неизвестно.

deep-purple ★★★★★
Ответ на: комментарий от FluffyPillow

ну вот и причина - oom killer. В избытке это сколько? innodb_buffer_pool_size = 80G Т.е 80G это должно быть примерно 70% от общей памяти. Для нормальной работы. Но есть ньансы. Возможно именно в этом время прилетает огромное кол-во соединений с запросами, который сами по себе еще выжирают памяти. Метрики-то собираешь? Графики использования памяти рисуешь? Тогда было б все примерно ясно. Еще демон atop не помешает запустить.

Ответ на: комментарий от anonymous

На сервере 128ГБ памяти. Сейчас убавил innodb_buffer_pool_size до 56ГБ и урезал максимально возможное количество соединений до 5000.

atop установил, демон запустился, но как его использовать? Никогда раньше не работал с ним.

() автор топика
Ответ на: комментарий от FluffyPillow

урезал максимально возможное количество соединений до 5000.

5000 одновременных соединений к мусклю - это очень много.

Посмотри mysqltuner и tuning primer, немного подскажут.

Ответ на: комментарий от FluffyPillow

еще можешь сказать oomkiller'у чтобы поискал чего другого убить, чтобы память освободить: echo '-20' > /proc/$(pidof mysqld)/oom_score_adj

Ответ на: комментарий от FluffyPillow

Если память фрагментирована сильно, то OOM придёт когда свободный блок подходящего размера не найдёт.

Dark_SavanT ★★★★★
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.