Есть распределенная среда (множество машин) на которых надо выполнять некоторый список задач с опредленной периодичностью (у каждой задачи она может быть своя). При условии что одно задание должно одновременно выполняться только один раз.
Пока основная идея - хранить конфиг в sql базе (собственно этого не избежать по другим причинам), и выставлять прямо в таблице флаг running пока задание где-то исполняется.
А если нода отвалится? Можно было бы как-то заходить на узел и проверять. НО этого хотелось бы избежать. Сколько задача будет исполняться по времени сказать сложно, так что некий тайм аут тоже не желателен.
Можно использовать не флаг running, а некий счетчик, увеличвать его каждые n секунд, а на других (или отдельной взятой) ноде следить за этим.
Что-нибудь посоветуете? Может есть готовые решения?