Задавайте вопросы, мы ответим
Вы не зашли.
Страниц: 1
Доброго дня, коллеги!
Поделитесь размышлениями плиз.
На достаточно мощном высоконагруженном серваке (36 процессоров, 72 ядра) отданном
под нужды mysql раз в несколько недель возникает следующая беда:
В error.log'е mysql
2019_11_29_08_21_57 Could not find the MySQL error log
ERROR 2013 (HY000): Lost connection to MySQL server at
'reading initial communication packet', system error: 95
ERROR 2013 (HY000) at line 1: Lost connection to MySQL server during query
при этом гасятся все соединения с mysql, на все попытки новых подключений
идёт реакция
ERROR 2002 (HY000): Can't connect to local
MySQL server through socket '/var/run/mysqld/mysqld.sock' (111)
Демон mysqld при этом в памяти присутствует.
Перезагрузка сервера спасала. Но - не "навсегда".
OS error code 95: Operation not supported
Отличное описание! Написали бы еще, какая именно операция.
Фоном запущен pt-stalk, по его сводке (ближайшей по времени к падению mysql)
на диске место есть
lock waits'ов нету
В файле 2019_12_25_12_22_26-mutex-status1 в конце
InnoDB rwlock: hash0hash.cc:353 waits=20
InnoDB rwlock: hash0hash.cc:353 waits=40
InnoDB rwlock: hash0hash.cc:353 waits=22
InnoDB sum rwlock: buf0buf.cc:1456 waits=16560962
У файла 2019_12_25_12_22_26-opentables1 в конце
2019_12_25_12_22_26 Too many open tables: 23502
у файла 2019_12_25_12_22_26-mutex-status2 в конце
InnoDB rwlock: hash0hash.cc:353 waits=41
InnoDB rwlock: hash0hash.cc:353 waits=19
InnoDB rwlock: hash0hash.cc:353 waits=20
InnoDB rwlock: hash0hash.cc:353 waits=40
InnoDB rwlock: hash0hash.cc:353 waits=22
InnoDB sum rwlock: buf0buf.cc:1456 waits=16561196
у файла 2019_12_25_12_22_26-output в конце
/usr/bin/pt-stalk: line 963: ts: unbound variable
/usr/bin/pt-stalk: line 971: ts: unbound variable
2019_12_25_12_22_36 Loop end: TS 1577265756.007285866 2019-12-25 12:22:36
ERROR 1286 (42000) at line 1: Unknown storage engine 'TOKUDB'
/usr/bin/pt-stalk: line 1023: mysqladmin_pid: unbound variable
В остальных файлах подозрительного не увидел, могу прислать.
Вот... Собственно, извечные вопросы - кто виноват и что делать?
Какие параметры стоит попытаться помониторить?
Может быть количество открытых файлов?
В общем, любые идеи фстудию плиз!
Неактивен
Возникла мысль посмотреть:
Неактивен
fs.file-max = 26314096
fs.file-nr = 2304 0 26314096
select @@open_files_limit
на этой же машинке
1024000
Неактивен
Страниц: 1