LINUX.ORG.RU
ФорумAdmin

У кого-нибудь были проблемы с использованием bonding вместе со стеком 3750?

 , , ,


0

1

Доброго времени суток

Сабж.

Есть bonding, mode=802.3ad miimon=100 ad_select=bandwidth lacp_rate=fast. Обычное отключение кабеля работает на ура. Но оказалось что циски 3750 не равноправны, одна из них является мастером стека. Так вот, отказ по питанию именно мастера стека приводит к странному залипанию bonding'а:

В cat /proc/net/bonging/bond0 Partner Mac Address меняется на 00:00:00:00:00:00 ( как будто циска не поддерживает 802.3ad ) и залипает в таком состоянии.

Выбора agregator'а больше не происходит при ifdown/ifup для slave'ов. В таком подвешенном состоянии интерфейс будет висеть ровно до загрузки бывшего мастера стека или до ifdown/ifup самого bond0

Совершенно непонятно что именно залипает. Да, меняется mac адрес партнера, но должен произойти выбор нового агрегатора, а этого не происходит.

И опять же непонятно почему из этого состояния бондинг выходит при загрузке циски, которая до падения была мастером стека

★★★★★

Да, странно.

1. Какая версия иоса? Это 3750 или 3750-Х? 2. Что-нибудь есть ценное в логах второй (живой) цыски в момент падения?

blind_oracle ★★★★★
()
Ответ на: комментарий от blind_oracle

1. Какая версия иоса?

Без понятия, у нас цисками занимаются сетевики.

Это 3750 или 3750-Х?

3750. Был бы -X, он бы питался от соседа через кабель.

2. Что-нибудь есть ценное в логах второй (живой) цыски в момент падения?

со слов сетевиков, отрабатывает штатно.

  1. Опа, теперь я мастер стека!
  2. Гасим порты!
  3. Применяем конфиг мастера!
001504: Apr 12 11:11:26 UTC: %STACKMGR-5-MASTER_READY: Master Switch 2 is READY
001505: Apr 12 11:11:27 UTC: %LINEPROTO-5-UPDOWN: Line protocol on Interface Port-channel1, changed state to down
001506: Apr 12 11:11:28 UTC: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet2/0/20, changed state to down
[...]
001595: Apr 12 11:11:35 UTC: %LINK-3-UPDOWN: Interface GigabitEthernet2/0/24, changed state to up
001596: Apr 12 11:11:35 UTC: %LINK-3-UPDOWN: Interface GigabitEthernet2/0/9, changed state to up
[...]
001634: Apr 12 11:11:40 UTC: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet2/0/7, changed state to up
001635: Apr 12 11:11:40 UTC: %LINEPROTO-5-UPDOWN: Line protocol on Interface Port-channel10, changed state to up
001636: Apr 12 11:11:40 UTC: %LINEPROTO-5-UPDOWN: Line protocol on Interface Port-channel8, changed state to up

На самом деле workaround уже есть ( весьма хардкорный, но тем не менее )

stack-mac persistent timer 4

И поддержка циско тоже рекомендовала его же. Но юмор в том что ESX'ы инцидент пережили спокойно, а вот bonding на linux лежал до подачи питания на циску. Т.е. вина возможно моя. Теперь думаю что с этим делать

router ★★★★★
() автор топика
Последнее исправление: router (всего исправлений: 1)
Ответ на: комментарий от router

У ESXов и у тебя принципиально разные режимы бондинга - ESXы не умеют активный бондинг LACP/802.3ad (по крайней мере без distributed switch), только пассивный (channgel-group XX mode on). Попробуй у себя заменить 802.3ad на balance-xor, скорее всего поведёт себя иначе. Особого смысла в 802.3ad нет.

blind_oracle ★★★★★
()
Последнее исправление: blind_oracle (всего исправлений: 1)
Ответ на: комментарий от router

Со стороны цыски только не забудь поменять channel-mode с active на on, а то port-channel не поднимется без LACP пакетов.

Я бы у себя проверил на 3750-X это дело, но оно сейчас боевое по самое некуда, как буду проводить масштабную профилактику, то обязательно проверю - самому интересно. Всё-таки отказоустойчивость.. или нет её :)

У меня к этому стеку сейчас подключены как минимум два сервера линуксовых в режиме 802.3ad, плюс еще NAS на линуксе глубоко внутри, тоже в lacp.

blind_oracle ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.