Всем привет.
Предстоит собеседование по datacenter troubleshooting. А у меня практически отсутствует опыт в отладке проблем с трафиком на таком уровне. Поэтому вопрос к гуру связи, точнее два: какие проблемы бывают и что по ним почитать. Я вижу вот такие проблемы:
0. Диагностика проблем в целом
Общие проблемы диагностируемые пингом
Проблемы с tcp (плохая скорость, внезапные обрывы) или с отдельными портами из-за кривых фаерволов
1. Внутри датацентра
Потеря связности (аля split brain)
Перегрузка отдельных линков
Зацикливание трафика (такое ещё бывает? Считаем spanning tree включён)
2. Снаружи
Перегрузка по отдельным направлениям
Потеря связи по отдельным направляениям (кстати, как такое мониторить?)
DDOS
traffic engineering
балансировка и переключение трафика между датацентрами (в случае глобальной аварии)
использование looking glass
3. (опционально) Безопасность сети внутри датацентра
Как выделяем клиентам сети, вланы итп
Прошу гуру дополнить список и накидать док для нубов по использованию looking glass и по проблемам ospf, bgp (что-то ещё массово используется?). Исходите из того что протоколы маршрутизации я практически не знаю.