LINUX.ORG.RU

История изменений

Исправление valentin630, (текущая версия) :

Специально запустил 10 задач, чтобы в случае «пропажи» попытаться отловить ее код завершения. Через полутора суток перестала считаться одна задача - тор ее перестал видеть (или она где-то внизу). Через ps отыскал - она оказалась спящей, ждущей ресурсов.

xxx@vxx01:~$ ps -aux|grep rndAc|grep bin
xxx        32263 60.5  4.6 958304 367248 pts/0   R    июл26 1416:50 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,1)
xxx        32517 60.6  5.1 954508 403452 pts/0   R    июл26 1416:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,2)
xxx        32602 60.5  6.4 965204 507352 pts/0   R    июл26 1413:35 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,3)
xxx        33988 60.3  6.5 966164 516100 ?       R    июл26 1402:28 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,5)
xxx        33989 60.3  6.6 964484 518316 ?       R    июл26 1402:15 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,4)
xxx        33990 54.5  6.2 938000 490528 ?       S    июл26 1268:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,9)
xxx        33991 60.3  6.6 959192 519576 ?       R    июл26 1401:58 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,7)
xxx        33992 60.3  6.6 967248 523072 ?       R    июл26 1402:04 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,6)
xxx        33993 60.3  6.5 968316 514232 ?       R    июл26 1402:11 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,10)
xxx        33994 60.2  6.4 954768 510264 ?       R    июл26 1400:31 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,8)

Может кто прокомментировать ситуацию?

Я предполагаю, что не закончился какой-то обмен с диском, и задача будет ждать его окончания (прихода соответствующего прерывания) вечно? Есть ли возможность «подтолкнуть» ее?

Чисто ли это ошибка железа, почему система не выдает таймаут и сообщение об ошибке обмена?

Можно ли выудить дополнительную информацию?

Исправление valentin630, :

Специально запустил 10 задач, чтобы в случае «пропажи» попытаться отловить ее код завершения. Через полутора суток перестала считаться одна задача - тор ее перестал видеть (или она где-то внизу). Через ps отыскал - она оказалась спящей, ждущей ресурсов.

xxx@vxx01:~$ ps -aux|grep rndAc|grep bin
xxx        32263 60.5  4.6 958304 367248 pts/0   R    июл26 1416:50 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,1)
xxx        32517 60.6  5.1 954508 403452 pts/0   R    июл26 1416:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,2)
xxx        32602 60.5  6.4 965204 507352 pts/0   R    июл26 1413:35 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,3)
xxx        33988 60.3  6.5 966164 516100 ?       R    июл26 1402:28 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,5)
xxx        33989 60.3  6.6 964484 518316 ?       R    июл26 1402:15 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,4)
xxx        33990 54.5  6.2 938000 490528 ?       S    июл26 1268:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,9)
xxx        33991 60.3  6.6 959192 519576 ?       R    июл26 1401:58 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,7)
xxx        33992 60.3  6.6 967248 523072 ?       R    июл26 1402:04 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,6)
xxx        33993 60.3  6.5 968316 514232 ?       R    июл26 1402:11 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,10)
xxx        33994 60.2  6.4 954768 510264 ?       R    июл26 1400:31 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,8)

Может кто прокомментировать ситуацию?

Я предполагаю, что не закончился какой-то обмен с диском, и задача будет ждать его окончания (прихода соответствующего прерывания) вечно? Есть ли возможность «подтолкнуть» ее?

Чисто ли это ошибка железа, почему система не выдает таймаут и сообщение об ошибке обмена?

Можно ли выудить дополнbтельную информацию?

Исходная версия valentin630, :

Специально запустил 10 задач, чтобы в случае «пропажи» попытаться отловить ее код завершения. Через полутора суток перестала считаться одна задача - тор ее перестал видеть (или она где-то внизу). Через ps отыскал - она оказалась спящей, ждущей ресурсов.

xxx@vxx01:~$ ps -aux|grep rndAc|grep bin
xxx        32263 60.5  4.6 958304 367248 pts/0   R    июл26 1416:50 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,1)
xxx        32517 60.6  5.1 954508 403452 pts/0   R    июл26 1416:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,2)
xxx        32602 60.5  6.4 965204 507352 pts/0   R    июл26 1413:35 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,3)
xxx        33988 60.3  6.5 966164 516100 ?       R    июл26 1402:28 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,5)
xxx        33989 60.3  6.6 964484 518316 ?       R    июл26 1402:15 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,4)
xxx        33990 54.5  6.2 938000 490528 ?       S    июл26 1268:02 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,9)
xxx        33991 60.3  6.6 959192 519576 ?       R    июл26 1401:58 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,7)
xxx        33992 60.3  6.6 967248 523072 ?       R    июл26 1402:04 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,6)
xxx        33993 60.3  6.5 968316 514232 ?       R    июл26 1402:11 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,10)
xxx        33994 60.2  6.4 954768 510264 ?       R    июл26 1400:31 /run/host/var/cvmfs/nica.jinr.ru/sw/slc7_x86-64/ROOT/v6.26.10-1/bin/root.exe -splash -b -l -q rndAc.c(50,8)

Может кто прокомментировать ситуацию?

Я предполагаю, что не закончился какой-то обмен с диском, и задача будет ждать его окончания (прихода соответствующего прерывания) вечно? Есть ли возможность «подтолкнуть» ее?

Чисто ли это ошибка железа, почему система не выдает таймаут и сообщение об ошибке обмена?

Можно ли выудить дополнтельную информацию?