История изменений
Исправление valentin630, (текущая версия) :
Специально запустил 10 задач, чтобы в случае «пропажи» попытаться отловить ее код завершения. Через полутора суток перестала считаться одна задача - тор ее перестал видеть (или она где-то внизу). Через ps отыскал - она оказалась спящей, ждущей ресурсов.
xxx@vxx01:~$ ps -aux|grep rndAc|grep bin
xxx 32263 60.5 4.6 958304 367248 pts/0 R июл26 1416:50 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,1)
xxx 32517 60.6 5.1 954508 403452 pts/0 R июл26 1416:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,2)
xxx 32602 60.5 6.4 965204 507352 pts/0 R июл26 1413:35 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,3)
xxx 33988 60.3 6.5 966164 516100 ? R июл26 1402:28 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,5)
xxx 33989 60.3 6.6 964484 518316 ? R июл26 1402:15 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,4)
xxx 33990 54.5 6.2 938000 490528 ? S июл26 1268:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,9)
xxx 33991 60.3 6.6 959192 519576 ? R июл26 1401:58 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,7)
xxx 33992 60.3 6.6 967248 523072 ? R июл26 1402:04 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,6)
xxx 33993 60.3 6.5 968316 514232 ? R июл26 1402:11 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,10)
xxx 33994 60.2 6.4 954768 510264 ? R июл26 1400:31 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,8)
Может кто прокомментировать ситуацию?
Я предполагаю, что не закончился какой-то обмен с диском, и задача будет ждать его окончания (прихода соответствующего прерывания) вечно? Есть ли возможность «подтолкнуть» ее?
Чисто ли это ошибка железа, почему система не выдает таймаут и сообщение об ошибке обмена?
Можно ли выудить дополнительную информацию?
Исправление valentin630, :
Специально запустил 10 задач, чтобы в случае «пропажи» попытаться отловить ее код завершения. Через полутора суток перестала считаться одна задача - тор ее перестал видеть (или она где-то внизу). Через ps отыскал - она оказалась спящей, ждущей ресурсов.
xxx@vxx01:~$ ps -aux|grep rndAc|grep bin
xxx 32263 60.5 4.6 958304 367248 pts/0 R июл26 1416:50 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,1)
xxx 32517 60.6 5.1 954508 403452 pts/0 R июл26 1416:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,2)
xxx 32602 60.5 6.4 965204 507352 pts/0 R июл26 1413:35 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,3)
xxx 33988 60.3 6.5 966164 516100 ? R июл26 1402:28 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,5)
xxx 33989 60.3 6.6 964484 518316 ? R июл26 1402:15 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,4)
xxx 33990 54.5 6.2 938000 490528 ? S июл26 1268:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,9)
xxx 33991 60.3 6.6 959192 519576 ? R июл26 1401:58 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,7)
xxx 33992 60.3 6.6 967248 523072 ? R июл26 1402:04 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,6)
xxx 33993 60.3 6.5 968316 514232 ? R июл26 1402:11 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,10)
xxx 33994 60.2 6.4 954768 510264 ? R июл26 1400:31 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,8)
Может кто прокомментировать ситуацию?
Я предполагаю, что не закончился какой-то обмен с диском, и задача будет ждать его окончания (прихода соответствующего прерывания) вечно? Есть ли возможность «подтолкнуть» ее?
Чисто ли это ошибка железа, почему система не выдает таймаут и сообщение об ошибке обмена?
Можно ли выудить дополнbтельную информацию?
Исходная версия valentin630, :
Специально запустил 10 задач, чтобы в случае «пропажи» попытаться отловить ее код завершения. Через полутора суток перестала считаться одна задача - тор ее перестал видеть (или она где-то внизу). Через ps отыскал - она оказалась спящей, ждущей ресурсов.
xxx@vxx01:~$ ps -aux|grep rndAc|grep bin
xxx 32263 60.5 4.6 958304 367248 pts/0 R июл26 1416:50 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,1)
xxx 32517 60.6 5.1 954508 403452 pts/0 R июл26 1416:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,2)
xxx 32602 60.5 6.4 965204 507352 pts/0 R июл26 1413:35 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,3)
xxx 33988 60.3 6.5 966164 516100 ? R июл26 1402:28 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,5)
xxx 33989 60.3 6.6 964484 518316 ? R июл26 1402:15 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,4)
xxx 33990 54.5 6.2 938000 490528 ? S июл26 1268:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,9)
xxx 33991 60.3 6.6 959192 519576 ? R июл26 1401:58 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,7)
xxx 33992 60.3 6.6 967248 523072 ? R июл26 1402:04 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,6)
xxx 33993 60.3 6.5 968316 514232 ? R июл26 1402:11 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,10)
xxx 33994 60.2 6.4 954768 510264 ? R июл26 1400:31 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,8)
Может кто прокомментировать ситуацию?
Я предполагаю, что не закончился какой-то обмен с диском, и задача будет ждать его окончания (прихода соответствующего прерывания) вечно? Есть ли возможность «подтолкнуть» ее?
Чисто ли это ошибка железа, почему система не выдает таймаут и сообщение об ошибке обмена?
Можно ли выудить дополнтельную информацию?