LINUX.ORG.RU

сервер SUN Fire 4800, вопросы, и нужна прошивка

 ,


2

2

Достался старый сервер SUN Fire 4800 еще 2001 года выпуска. Потихоньку с ним разбираюсь. Последний раз он обновлялся в 2008 году.Версия прошивки стоит 5.20.9. в сети обнаружил что есть более свежая прошивка, но Oracle ее не дает скачать. Думал что на раритеты все находится в свободном доступе, как у сана раньше.
Последняя прошивка версии 5.21.1 вот ссылка на нее https://updates.oracle.com/download/9607074.html?release=400012610000

Еще есть прошивка 5.21.0 ссылка на нее https://updates.oracle.com/download/9607073.html?release=400012610000

И вот такая 5.20.17 И ссылка https://updates.oracle.com/download/12717602.html?release=400012610000

Может кто то поможет найти прошивку? Заранее большое спасибо

Так как сервер мне достался частично некомплектный я стал искать к нему процессорные платы. Нашел одну с 4 процессорами, но она оказалась вообще не рабочей. Тогда я решил с нее снять процессоры и кэш, и установить на рабочую процессорную плату. Изначально на ней стояло 2 процессора по 900МГц, Вместо них и хотел поставить 4 процессора по 1050МГц, пусть немного, но все же апгрейд.

И тут оказалось что нельзя просто так взять и поменять процессора. Сервер их видит но как 600МГц. получается процессора как бы рабочие. Но при этом выдает в консоль такое:

Oct 03 14:02:56 sc1. Platform.SC: /partition1/domain0/SB4/bbcGroup0/cpuAB/cpusafariagent0: CPU Serial number mismatch: please update cpu speed property via: sepromupdate //SB4 -cpu_speed A <cpu_speed> Oct 03 14:02:56 sc1. Domain-C.POST: {/N0/SB4/P0} ERROR: Missing/Improper Seeprom CPU Speed information Oct 03 14:02:56 sc1. Domain-C.POST: WARNING: Setting CPU clock ratio to 4, CPU speed to 600 и тд, для всех 4 процессоров

Можно глянуть компоненты что установлены в системе, первые 4 на рабочей плате SB0, еще 4 что решил проапгрейдить.

/N0/SB0/P0 enabled - pass UltraSPARC-III+, 900MHz, 8M ECache
/N0/SB0/P1 enabled - pass UltraSPARC-III+, 900MHz, 8M ECache
/N0/SB0/P2 enabled - pass UltraSPARC-III+, 900MHz, 8M ECache
/N0/SB0/P3 enabled - pass UltraSPARC-III+, 900MHz, 8M ECache

/N0/SB4/P0 enabled - fail UltraSPARC-III+, 600MHz, 8M ECache
/N0/SB4/P1 enabled - fail UltraSPARC-III+, 600MHz, 8M ECache
/N0/SB4/P2 enabled - fail UltraSPARC-III+, 600MHz, 8M ECache
/N0/SB4/P3 enabled - fail UltraSPARC-III+, 600MHz, 8M ECache

Я так понял несовпадение серийных номеров процессоров и из за этого и неправильная частота процессоров.

Гугулеж не помог, в доках тоже не нашел как исправить эту нестыковку. Может кто то сталкивался с серверами серии Fire 3800, 4800, 6800, и их старшие модификации 3900, 4900, 6900

Понимаю что сервер старый, и ни на что не пригодный, Но очень хочется в нем покопаться и довести его до полностью рабочего состояния. Процессорные платы к нему найти целая проблема, из за их размеров и веса. Одна попалась да и та дохлая. Память на ней тоже оказалась мертвой. Там проблемы по питанию были



Последнее исправление: sl-project (всего исправлений: 2)

Он тебе там командочку пишет, которую надо запустить - sepromupdate.
Не пробовал ее запускать? Для нее скорее всего нужен инженерный пароль. Но это не проблема - это ж серенгети, там SCApp на Java - можно загрузить ее в декомпилятор Java, отпилить ненужное, и генератор сервисных и инженерных паролей у тебя в руках.

bigbit ★★★★★
()

Новая версия прошивки наверняка была доступна и в виде патча (123456-78.zip, 123456-78.jar или 123456-78.tar.Z). Первым делом я бы узнал номер патча.

Далее, я бы воспользовался поиском по FTP-сайтам, winworldpc, vetusware, archive.is и т. д. Коллекции патчей SunSolve до сих пор лежат в открытом доступе на сайтах научных институтов.

Bass ★★★★★
()

Посмотрел более внимательно – у меня в наличии есть только:

  • 114527-01 - Sun Fire system controller and flashprom update 5.20.0
  • 114527-02 - Sun Fire system controller and flashprom update 5.20.1
  • 114527-03 - Sun Fire system controller and flashprom update 5.20.2

– все патчи скачаны отсюда.

Попробуй спросить на Полигоне призраков.

Bass ★★★★★
()

Последняя прошивка версии 5.21.1 вот ссылка на нее https://updates.oracle.com/download/9607074.html?release=400012610000

Еще есть прошивка 5.21.0 ссылка на нее https://updates.oracle.com/download/9607073.html?release=400012610000

И вот такая 5.20.17 И ссылка https://updates.oracle.com/download/12717602.html?release=400012610000

https://dropmefiles.com/EnWZX 🐔

anonymous
()
Ответ на: комментарий от anonymous

2 anonymous

Спасибо большое за прошивки. Даже не ожидал.Теперь надо будет установить.

2 Bass

У моем SF4800 прошивка 5.20.9, Так что смысла нет откатываться, Но спасибо за ссылку, От туда все утяну.

На полигоне призраков врят ли помогут с этим сервером,Все же вещь крайне специфическая и не частая. Хотя лет 5 часто видел их в продаже за копейки. Сейчас разве что придется на ебай скупать память к нему пачками.

2 bigbit

Командочку то он пишет, но увы она не работает, не знает такой команды, скорее всего да, надо как то попадать сервисный режим системного контроллера.

SCApp на Java - можно загрузить ее в декомпилятор Java

Тут я пас. Если бы я умел то попытался бы. Но увы. Даже не знаю с какой стороны подходить. Глянул прошивку искомое находится в файле sgsc.flash, то что ява есть внутри это факт. Быть может у вас есть возможность сгенерировать пароль? Вообще существует ли в открытом доступе документация по service mode для этой платформы? Хотя даже если у кого то и была дока то за древностью уже выброшена и удалена

2 all

Этот сервер та и должен очень хорошо греться? немного это смущает. после получаса работы некоторые компоненты греются за 80 градусов. По идее не должно. Скорость вращения вентиляторов на минимуме, Ошибок по FT0, FT1, FT2 нет, да и дуют вентиляторы очень хорошо даже на минимуме. После срабатывания алармов что уже нагрелись до 100 градусов переходят на максимум.

Вот данные по температурам сервера, перед этим прогнал встроенные тесты. Если это норма то в квартире ему будет жарковато. Радиаторы все на месте. Изначально перегрев был по БП, так как в них были неисправны вентиляторы, эту проблему устранил.

SC> showenvironment -w -p temps

Slot    Device     Sensor       LoWarn Value  HiWarn Units     Age     Status
------- ---------- ------------ ------ ------ ------ --------- ------- ------
SSC0    SBBC 0     Temp. 0           0 65        100 Degrees C   7 sec OK
SSC0    CBH 0      Temp. 0           0 65        100 Degrees C   7 sec OK
SSC0    SSC 0      Temp. 0           0 45         85 Degrees C   7 sec OK
SSC0    SSC 0      Temp. 1           0 40         85 Degrees C   7 sec OK
SSC0    SSC 0      Temp. 2           0 50         85 Degrees C   7 sec OK
PS0     48 VDC 0   Temp. 0          -1 43         65 Degrees C   6 sec OK
PS1     48 VDC 0   Temp. 0          -1 53         65 Degrees C   4 sec OK
/N0/SB0 SDC 0      Temp. 0           0 90        100 Degrees C   2 sec OK
/N0/SB0 AR 0       Temp. 0           0 77        100 Degrees C   2 sec OK
/N0/SB0 DX 0       Temp. 0           0 84        100 Degrees C   2 sec OK
/N0/SB0 DX 1       Temp. 0           0 85        100 Degrees C   2 sec OK
/N0/SB0 DX 2       Temp. 0           0 81        100 Degrees C   2 sec OK
/N0/SB0 DX 3       Temp. 0           0 79        100 Degrees C   2 sec OK
/N0/SB0 SBBC 0     Temp. 0           0 74        100 Degrees C   2 sec OK
/N0/SB0 Board 1    Temp. 0           0 38         85 Degrees C   2 sec OK
/N0/SB0 Board 1    Temp. 1           0 37         85 Degrees C   2 sec OK
/N0/SB0 CPU 0      Temp. 0           0 62         88 Degrees C   2 sec OK
/N0/SB0 CPU 1      Temp. 0           0 59         88 Degrees C   2 sec OK
/N0/SB0 SBBC 1     Temp. 0           0 62        100 Degrees C   2 sec OK
/N0/SB0 Board 1    Temp. 2           0 37         85 Degrees C   3 sec OK
/N0/SB0 Board 1    Temp. 3           0 38         85 Degrees C   3 sec OK
/N0/SB0 CPU 2      Temp. 0           0 60         88 Degrees C   3 sec OK
/N0/SB0 CPU 3      Temp. 0           0 60         88 Degrees C   3 sec OK
/N0/SB4 SDC 0      Temp. 0           0 73        100 Degrees C   2 sec OK
/N0/SB4 AR 0       Temp. 0           0 54        100 Degrees C   2 sec OK
/N0/SB4 DX 0       Temp. 0           0 77        100 Degrees C   2 sec OK
/N0/SB4 DX 1       Temp. 0           0 81        100 Degrees C   2 sec OK
/N0/SB4 DX 2       Temp. 0           0 80        100 Degrees C   2 sec OK
/N0/SB4 DX 3       Temp. 0           0 75        100 Degrees C   2 sec OK
/N0/SB4 SBBC 0     Temp. 0           0 71        100 Degrees C   2 sec OK
/N0/SB4 Board 1    Temp. 0           0 35         85 Degrees C   2 sec OK
/N0/SB4 Board 1    Temp. 1           0 37         85 Degrees C   2 sec OK
/N0/SB4 CPU 0      Temp. 0           0 42         88 Degrees C   2 sec OK
/N0/SB4 CPU 1      Temp. 0           0 43         88 Degrees C   3 sec OK
/N0/SB4 SBBC 1     Temp. 0           0 54        100 Degrees C   3 sec OK
/N0/SB4 Board 1    Temp. 2           0 33         85 Degrees C   3 sec OK
/N0/SB4 Board 1    Temp. 3           0 34         85 Degrees C   3 sec OK
/N0/SB4 CPU 2      Temp. 0           0 42         88 Degrees C   3 sec OK
/N0/SB4 CPU 3      Temp. 0           0 42         88 Degrees C   3 sec OK
/N0/IB6 Board 0    Temp. 0           0 42         85 Degrees C   4 sec OK
/N0/IB6 Board 0    Temp. 1           0 42         85 Degrees C   4 sec OK
/N0/IB6 SDC 0      Temp. 0           0 80        100 Degrees C   4 sec OK
/N0/IB6 AR 0       Temp. 0           0 59        100 Degrees C   4 sec OK
/N0/IB6 DX 0       Temp. 0           0 71        100 Degrees C   4 sec OK
/N0/IB6 DX 1       Temp. 0           0 70        100 Degrees C   4 sec OK
/N0/IB6 SBBC 0     Temp. 0           0 63        100 Degrees C   4 sec OK
/N0/IB6 IOASIC 0   Temp. 0           0 68        100 Degrees C   5 sec OK
/N0/IB6 IOASIC 1   Temp. 1           0 58        100 Degrees C   5 sec OK
/N0/IB8 Board 0    Temp. 0           0 41         85 Degrees C   4 sec OK
/N0/IB8 Board 0    Temp. 1           0 43         85 Degrees C   4 sec OK
/N0/IB8 SDC 0      Temp. 0           0 75        100 Degrees C   4 sec OK
/N0/IB8 AR 0       Temp. 0           0 63        100 Degrees C   4 sec OK
/N0/IB8 DX 0       Temp. 0           0 69        100 Degrees C   4 sec OK
/N0/IB8 DX 1       Temp. 0           0 67        100 Degrees C   4 sec OK
/N0/IB8 SBBC 0     Temp. 0           0 67        100 Degrees C   4 sec OK
/N0/IB8 IOASIC 0   Temp. 0           0 64        100 Degrees C   4 sec OK
/N0/IB8 IOASIC 1   Temp. 1           0 65        100 Degrees C   4 sec OK
RP0     Board 0    Temp. 0           0 39         85 Degrees C   7 sec OK
RP0     Board 0    Temp. 1           0 39         85 Degrees C   7 sec OK
RP0     SDC 0      Temp. 0           0 76        100 Degrees C   7 sec OK
RP0     AR 0       Temp. 0           0 72        100 Degrees C   8 sec OK
RP0     DX 0       Temp. 0           0 66        100 Degrees C   8 sec OK
RP0     DX 1       Temp. 0           0 62        100 Degrees C   8 sec OK
RP2     Board 0    Temp. 0           0 40         85 Degrees C   7 sec OK
RP2     Board 0    Temp. 1           0 42         85 Degrees C   7 sec OK
RP2     SDC 0      Temp. 0           0 82        100 Degrees C   7 sec OK
RP2     AR 0       Temp. 0           0 77        100 Degrees C   7 sec OK
RP2     DX 0       Temp. 0           0 70        100 Degrees C   7 sec OK
RP2     DX 1       Temp. 0           0 67        100 Degrees C   7 sec OK
sl-project
() автор топика
Ответ на: комментарий от sl-project

Все так - в сервисном и инженерном режимах больше команд. Вход в эти режимы осуществляется командами service и engineering. Они выведут на экран данные для генерации пароля - скидывай их сюда. Только сначала установи дату правильно - пароль привязан к дате. Действует, вроде, 1 месяц.

Греться он должен очень хорошо - у нас это были самые горячие сервера в серверной =)

bigbit ★★★★★
()
Ответ на: комментарий от bigbit

добрый день, ответ не эти команды один и тот же

SC> service

The use of service commands can be destructive and destabilize the system.
Use of service mode is authorized only by personnel trained in its use.

Enter Password:
Invalid password.


HostID: 8307aee6
ScApp version: 5.20.9
RTOS version: 47

SC> engineering

The use of engineering commands can be destructive and destabilize the system.
Use of engineering mode is authorized only by personnel trained in its use.

Enter Password:
Invalid password.


HostID: 8307aee6
ScApp version: 5.20.9
RTOS version: 47

Да ничего не скажешь что горячий, представляю как он греется под нагрузкой. А с 4-ми ультраспарками то вообще. Там и БП надо мощнее, хотя в документации говорится что надо заменять и вентиляторные полки на другие. Видно у этих недостаточная производительность

sl-project
() автор топика
Ответ на: комментарий от sl-project

Генератор паролей был добыт из прошивки от LW8, но там есть логика и для серенгети, так что для 4800 должен подойти.

HostID: 8307aee6
ScApp version: 5.20.9
RTOS version: 47

======= Service passwords =======
seCnOpKf3n
fXXsY7kgrq
HReaFV5xl7
8sje4vjB+R
5YrZdrU4cD
3+6XuKqj6E
an52Rfi/12
3FOR0bxaWi
===== Engineering passwords =====
XyezFrx+Xt
gD/CPwAZ/f
HB5e+/m8nL
ySiObYv/z2
mExAF6eAKB
PcgcSfUK2c
tE/UkNy+iR
BrI4KiE5KV

И еще на всякий случай пароли именно для LW8 (вот эти скорее всего не подойдут):

======= Service passwords =======
cfNZtJZUCt
vAAJFm3fIy
G/EnYvYi9x
uUF7Oow3ru
Ltzhql5iGb
v/LOswnVwD
zkI1hMbFhA
ZYLwCA+S+9
===== Engineering passwords =====
lHqEhfnKPK
vL+EI70zki
o7bYoN2SFq
UbpRz2hkLq
GvUT4AvYcv
boMz+L19rL
ScL41Gk2F/
8r3WlHT6X5
bigbit ★★★★★
()
Ответ на: комментарий от bigbit

Большое спасибо за коды, Подошли.

Существует ли руководство по этим режимам, с описанием команд? Хотя скорее всего мало кто знает что там да и как. Oracle наверное давно пришиб все эти файлы.

sl-project
() автор топика
Ответ на: комментарий от sl-project

Я не встречал. Наверняка дока есть, только не публичная (это ведь для сановских инженеров режимы). Зато там есть встроенный хелп :)

bigbit ★★★★★
()
Ответ на: комментарий от bigbit

Встроенный хелп там какой то куцый. Меня это и удивило. По большинству команд вообще ничего не пишет,

Кстати может невнимательно смотрел, но новых команд в сервисном режиме не заметил, в инженерном целая куча.

sl-project
() автор топика
Ответ на: комментарий от sl-project

Интересно почему такие жуткие сроки наработки?

вот например:

SSC0: SSC: 501-5407-09-50 serial# 007412 "System Controller"
    Made on Sat May 19 22:52:24 MSD 2001 by 012c at Toronto, Ontario
    Powered on for [b]28212 days[/b] 17 hours 29 minutes 36 seconds
sl-project
() автор топика
Ответ на: комментарий от bigbit

Но ведь по идее счетчик наработки не должен никак искажаться. Иначе ведь можно было лишиться гарантии, и не докажешь что это не сам. Не во всех железках таких дутые числа, в большинстве все реалистичнее

sl-project
() автор топика
Ответ на: комментарий от sl-project

Баги... Может этот:

Sun Fire[TM] Midrange Server: Time Jumps When SC Accumulates Extended Uptime (Doc ID 1009954.1)

В SNMP вон вообще аптайм каждые 497 дней в ноль сбрасывается, потому что счетчик 32-битный. Считается не багом, а фичей.

bigbit ★★★★★
()
Ответ на: комментарий от bigbit

На данный момент частота процессоров показывается правильно. теперь ищу память. так как с той что есть непонятки. Часть однозначно битая, а часть почему то показывается в половину объема

sl-project
() автор топика
Ответ на: комментарий от sl-project

FYI
на некоторых старых десктопных материнках более новая 8-чиповая память показывалась в полобъёма, а более старая 16-ти чиповая - полностью.
возможно, дело в контроллере памяти, а может и в чём-то другом

anonymous
()
Ответ на: комментарий от anonymous

Сейчас стоит вся родная сановская память, и у всей один и тот же pn. Так что все палки по 512 Мб. так что дело не в количестве чипов, и pn памяти совместим с этим сервером Завтра конечно для успокоения души с полностью рабочей платы переставлю память на эту, чтоб убедиться что плата рабочая, а проблема в памяти.

sl-project
() автор топика
Ответ на: комментарий от sl-project

Решил дальше продолжить апгрейд процессоров, так как нашел дома две шутки по 1,2ГГц. и знаю где можно добыть еще три. Эти два вытащены из модулей для Blade 2000. В теории они должны подойти

sl-project
() автор топика
Ответ на: комментарий от sl-project

CHS статус компонентов

Если я так понял то CHS статус выставляется во время прохождения POST тестов. И записывается в seeprom каждого компонента.

Для установки вручную CHS есть команда setchs.

Сейчас в системе есть банк ОЗУ и он может быть дохлый, допустим что дохлый.

SC[engineering]> showchs
Component           Status
---------------     --------
/N0/SB4/P2/B0/D0/L0 Faulty
/N0/SB4/P2/B0/D0/L1 Faulty

я вручную выставлю его в ОК. Что будет при прохождении POST допустим по команде setkeyswitсh on, или вообще проще - testboard sb4? Статус снова установится в Faulty? Или из за такого издевательства что то глюканет безвозвратно и придется что то менять еще кроме памяти?

Просто хочу понять что и как в этой машине, что можно делать а что нет.

Процы поменял, сейчас на плате два по 1200 МГц и два по 1050. Может где то можно достать платы для этой машине? Вдруг кто то встречал и знает где.

sl-project
() автор топика
Ответ на: CHS статус компонентов от sl-project

По-моему, это безвредная команда.
Нам сановский инженер рекомендовал ее выполнить над сдохшими платами перед тем, как пытаться их менять.
Вот один из кейсов - тогда заменили сразу 2 платы, насколько я помню:

lom>showchs -b
Component           Status
---------------     --------
/N0/RP2             Faulty
/N0/SB4             Suspect
lom>

B2. WHAT ACTIONS DOES THE ENGINEER NEED TO TAKE:
1. Request service password
2. Change the CHS status to OK for RP2 and SB4.
lom[service]> setchs -s OK -r "test 36275632" -c RP2
Same for SB4.
3. If problem persist, replace Level 2 Repeater Board Assembly RP2 according to Sun Fire E2900 System Service Manual 817-4054-15 
 
bigbit ★★★★★
()
Последнее исправление: bigbit (всего исправлений: 1)
Ответ на: комментарий от bigbit

тогда попробую сбросить эти статусы, Пытаюсь вспомнить откуда эта память, Вроде бы как дернута с сервера 280R пытался ее сунуть в blade 2000 а там ругань была на spd насколько помню, Хотя это давно было. С него же был разобран процессорный модуль, и сам процессор сейчас стоит в SF4800, тесты проходит прекрасно. Если память оживет то хорошо, Сейчас рылся на сайте Оракла, и обнаружил вот такую доку https://docs.oracle.com/cd/E19957-01/816-4158-11/816-4158-11.pdf

Sun Expert3D Graphics Card Installation for Sun Fire 6800S ystems

Каков в этом смысл? Когда нет клавиатуры и мышки. У меня была мысль сунуть в него видео, но из за отсутствия клавы, решил что глупости все это.

sl-project
() автор топика
Ответ на: комментарий от sl-project

пришел с работы, и решил еще два процессора поменять, чтоб плата была с четырьмя US3+ 1200 МГц. Включил машину, а пароли то уже не подходят, перебрал все. Выходит что они на очень короткий срок.

Можно еще нагенерить паролей для SF4800

HostID: 8307aee6
ScApp version: 5.20.9
RTOS version: 47

В пути еще три процессора для второй платы, и договариваюсь о покупке половинчатых плат. Их них буду собирать целую. Я с этой железякой точно зависну на долго. Думал вот все сделаю что возможно с этим сервером, а тут на самом интересном месте...

Вообще можно попросить генератор паролей для этой машинки? Распространять его не буду. Вот почта. sl-project(собака)mail.ru

sl-project
() автор топика
Ответ на: комментарий от sl-project

Этот сервер та и должен очень хорошо греться? немного это смущает. после получаса работы некоторые компоненты греются за 80 градусов.

Вы еще энергопотребление посмотрите. 3кВт/час - лучше экспериментировать на чужой площадке :)

Andy_ua
()
Ответ на: комментарий от Andy_ua

Энергопотребление я знаю, чувством зелени не страдаю. Просто удивил нагрев в простое. Немного не привычно

Достал 4 палки память по 1Гб для пробы, вставил, и увидел вот такие варнинги

/N0/SB0/P0/B0:  WARNING: memory timing parameter mismatch:  D0=Dram Record at 0x
ffff tag = 0xf800230000000000 class F 2.768
    sizeSPDmemorydevice=0d Rows=0d Cols=0a Banks=02 dataWidth=90 RefreshRate=82
BanksDev=04 Density=80 CycleTime=4e tRCtime=4e dimmType=00 D3=Dram Record at 0xf
fff tag = 0xf800230000000000 class F 2.768
    sizeSPDmemorydevice=0d Rows=0d Cols=09 Banks=02 dataWidth=90 RefreshRate=82
BanksDev=04 Density=40 CycleTime=4e tRCtime=4e dimmType=00
 Platform.SC: /N0/SB0/P0/B0:  WARNING: memory timing p
arameter mismatch:  D0=Dram Record at 0xffff tag = 0xf800230000000000 class F 2.
768
    sizeSPDmemorydevice=0d Rows=0d Cols=0a Banks=02 dataWidth=90 RefreshRate=82
BanksDev=04 Density=80 CycleTime=4e tRCtime=4e dimmType=00 D3=Dram Record at 0xf
fff tag = 0xf800230000000000 class F 2.768
    sizeSPDmemorydevice=0d Rows=0d Cols=09 Banks=02 dataWidth=90 RefreshRate=82
BanksDev=04 Density=40 CycleTime=4e tRCtime=4e dimmType=00
 Platform.SC: /N0/SB0/P3/B0:  WARNING: memory timing p
arameter mismatch:  D0=Dram Record at 0xffff tag = 0xf800230000000000 class F 2.
768
    sizeSPDmemorydevice=0d Rows=0d Cols=09 Banks=02 dataWidth=90 RefreshRate=82
BanksDev=04 Density=40 CycleTime=4e tRCtime=4e dimmType=00 D3=Dram Record at 0xf
fff tag = 0xf800230000000000 class F 2.768
    sizeSPDmemorydevice=0d Rows=0d Cols=0a Banks=02 dataWidth=90 RefreshRate=82
BanksDev=04 Density=80 CycleTime=4e tRCtime=4e dimmType=00
/N0/SB0/P3/B0:  WARNING: memory timing parameter mismatch:  D0=Dram Record at 0x
ffff tag = 0xf800230000000000 class F 2.768
    sizeSPDmemorydevice=0d Rows=0d Cols=09 Banks=02 dataWidth=90 RefreshRate=82
BanksDev=04 Density=40 CycleTime=4e tRCtime=4e dimmType=00 D3=Dram Record at 0xf
fff tag = 0xf800230000000000 class F 2.768
    sizeSPDmemorydevice=0d Rows=0d Cols=0a Banks=02 dataWidth=90 RefreshRate=82
BanksDev=04 Density=80 CycleTime=4e tRCtime=4e dimmType=00

Память по документации поддерживается, Так в чем причина может быть этих варнингов? Может кто то сталкивался с таким? А то я обрадовался что смогу сунуть 32ГБ ОЗУ

sl-project
() автор топика
Ответ на: комментарий от sl-project

Проблемы с памятью решены, мой косяк. Называется нефиг лезть после хорошей попойки в сервер и что то делать.

sl-project
() автор топика
Ответ на: комментарий от anonymous

вот уже несколько дней рою оракловский сайт на наличие Sun Management Center 3.5 Version 6 for Sun Fire Midrange Systems можно и предыдущую версию.

Несколько лет точно помню что где то были у них выложены все разновидности SMC а сейчас если и находится то только 4-я версия, которая мне не нужна.И даже ее не скачать. Получается Оракл насквозь стал платным. Вот уж точно надо было выкачивать все подряд.

Вдруг у кого то что то сохранилось скачаным или даже сидюк имеется? Со всеми патчами и версиями для соляриса и винды (SMC 3.5 ver6 for mid sys)

sl-project
() автор топика
Ответ на: комментарий от sl-project

Все ждал когда сдохнет батарейка в ИС TOD M48T59Y И искал чем же считать ее содержимое на всякий случай. Стерх-007 не поддерживает такую ИС. И вот сегодня при старте сервера вижу такие строки.

        ERROR   : TOD BATTERY LOW FLAG SET
        Add: 0x37001ff0
        Exp: 0x00000000
        Obs: 0x00000010

WARNING: TOD battery is low; replace TOD chip

В доках есть упоминание что вызовите сервисного инженера и он вам все сделает.

Более древние сервера из серии х000 и х500 в доках содержали более полное описание что делать, Меняем на всех платах ИС TOD Грузимся, сбрасываем все настройки, устанавливаем host ID clock board, потом командой синхронизируем во всех остальных ИС TOD. Ну а время поставим или при установке соляры или после загрузки. Ничего сложного, я это сам делал не раз.

Как быть в этом случае не знаю. Так как нет данных что хранится в ИС TOD. Только время или еще host ID? Каким образом проводится синхронизация содержимого ис TOD?

Сначала меняем на первом SC. ИС синхронизируются, потом на втором.

Перед этим надо отключать failover?

Может кто то знает всю процедуру? Хотя ничего не отключишь так как SC находится в бесконечном soft resete из за этой ошибки

        TOD(M48T59)              Test
        TOD Init                        Test
        ERROR   : TOD BATTERY LOW FLAG SET
        Add: 0x37001ff0
        Exp: 0x00000000
        Obs: 0x00000010

        FRU: SYSTEM CONTROLLER
        SYSTEM CONTROLLER #0
        ERROR:
        TEST=TOD(M48T59)
        SUBTEST=TOD Init
        ID=22.1
        COMPONENT UNDER TEST: TOD                   U2106


Software Reset...

Вот захотел установить соляру сегодня. Подключил полку D240, и установил....

sl-project
() автор топика
Ответ на: комментарий от sl-project

В виду вышестоящей проблемы снес все настройки.

Решил настроить все заново, Но вот установить sntp сервер не получается. Уже перебрал наверное несколько десятков sntp серверов что нашел. Но на всех получается вот эта вещь

SNTP
----
SNTP server []: тут адрес сервера
The SNTP server : unknown host

Так какой сервер ему нужен? Сервера времени проверял, рабочие

sl-project
() автор топика
Ответ на: комментарий от sl-project

ошибки модулей IO

Cтолкнулся с ворохом каких то ошибок по модулям IO. Попробовал искать что это может быть, но неудачно.

кто то может сталкивался с этим и знает в чем причина? напряжения и температуры в норме. Сначала запустил сервер, старт прошел успешно, а так как автозагрузка отключена, дал команду на загрузку, Но она не прошла, рестартовал сервер, были кучи ошибок по модулям IO, Это второй блок ошибок после холодной перезагрузки.

Nov 03 06:38:40 sf4800 Platform.SC: Data Parity error polling failed. Board will no longer be polled: JtagController.tapIssueCmd:  ConsoleBus ERROR:  errorCode=00008100 (CM_PRER) ack=00
	
	I/O request: RP2.sdc.b0 (138000b0) offset=038000b0 window=83000004 P=0 DD=3 space=4
	Error address: SSC0.cbh.330 (13e00330)
Hardware error occurred during Interconnect testing: sun.serengeti.HpuFailedException: /N0/IB6: L1ICT.pass1CheckInterConnectTest: sun.serengeti.FailedHwException: DoubleErrorHandler.checkForErrors: : PCI I/O Board at /N0/IB6
Nov 03 06:38:40 sf4800 Platform.SC: Data Parity error polling failed. Board will no longer be polled: JtagController.tapIssueCmd:  ConsoleBus ERROR:  errorCode=00008800 (CM_EACK) ack=ee
	
	I/O request: RP0.sdc.b0 (134000b0) offset=034000b0 window=83000004 P=0 DD=3 space=4
	Error address: IB6.ar.50 (12c80050)
Hardware error occurred during Interconnect testing: sun.serengeti.HpuFailedException:  setSlaveSync: DoubleErrorHandler.checkForErrors: : PCI I/O Board at /N0/IB6
Nov 03 06:38:40 sf4800 Domain-A.SC: Excluded unusable, unlicensed, failed or disabled board: /N0/IB6
Testing IO Boards ...
Nov 03 06:38:57 sf4800 Platform.SC: Device voltage problem: /N0/IB6 abnormal state for device: Board 0 1.5 VDC 0 Value: 0.03 Volts DC
Nov 03 06:38:57 sf4800 Platform.SC: Device voltage problem: /N0/IB6 abnormal state for device: Board 0 3.3 VDC 0 Value: 0.49 Volts DC
Nov 03 06:38:57 sf4800 Platform.SC: Device voltage problem: /N0/IB6 abnormal state for device: Board 0 5 VDC 0 Value: 0.29 Volts DC
Nov 03 06:38:57 sf4800 Platform.SC: Device voltage problem: /N0/IB6 abnormal state for device: Board 0 12 VDC 0 Value: 0.08 Volts DC
Nov 03 06:38:57 sf4800 Platform.SC: PCI I/O Board at /N0/IB6 Device poll caused: sun.serengeti.FailedHwException: (SdcAsic)Asic.getTemp: Path broken between CBH and SDC: IB6.sdc.10 (12c00010)
Nov 03 06:38:57 sf4800 Platform.SC: Device will not be polled
Nov 03 06:38:58 sf4800 Platform.SC: PCI I/O Board at /N0/IB6 Device poll caused: sun.serengeti.FailedHwException: (ArAsic)Asic.getTemp: Path broken between CBH and SDC: IB6.ar.10 (12c80010)
Nov 03 06:38:58 sf4800 Platform.SC: Device will not be polled
Nov 03 06:38:58 sf4800 Platform.SC: PCI I/O Board at /N0/IB6 Device poll caused: sun.serengeti.FailedHwException: /partition0/domain0/IB6/dx0: DxAsic.getTemp: sun.serengeti.jtag.JtagException: JtagController.tapWait:  Path broken between CBH and SDC: IB6.sdc.b0 (12c000b0)
Nov 03 06:38:58 sf4800 Platform.SC: Device will not be polled
Nov 03 06:38:58 sf4800 Platform.SC: PCI I/O Board at /N0/IB6 Device poll caused: sun.serengeti.FailedHwException: /partition0/domain0/IB6/dx1: DxAsic.getTemp: sun.serengeti.jtag.JtagException: JtagController.tapWait:  Path broken between CBH and SDC: IB6.sdc.b0 (12c000b0)
Nov 03 06:38:58 sf4800 Platform.SC: Device will not be polled
Nov 03 06:38:58 sf4800 Platform.SC: PCI I/O Board at /N0/IB6 Device poll caused: sun.serengeti.FailedHwException: (RepeaterSbbcAsic)Asic.getTemp: Path broken between CBH and SDC: IB6.sbbc0.regs.10 (11800010)
Nov 03 06:38:58 sf4800 Platform.SC: Device will not be polled
Nov 03 06:38:58 sf4800 Platform.SC: PCI I/O Board at /N0/IB6 Device poll caused: sun.serengeti.FailedHwException: I2cComm.readCmd:  Path broken between CBH and SDC: IB6.sbbc0.regs.c0 (118000c0)
Nov 03 06:38:58 sf4800 Platform.SC: Device will not be polled
Nov 03 06:38:58 sf4800 Platform.SC: PCI I/O Board at /N0/IB6 Device poll caused: sun.serengeti.FailedHwException: I2cComm.readCmd:  Path broken between CBH and SDC: IB6.sbbc0.regs.c0 (118000c0)
Nov 03 06:38:58 sf4800 Platform.SC: Device will not be polled
Nov 03 06:38:58 sf4800 Platform.SC: /N0/IB6, sensor status, outside acceptable limits (7,1,0x501060d00050000)
Nov 03 06:38:58 sf4800 Platform.SC: /N0/IB6, sensor status, outside acceptable limits (7,1,0x501060d00070000)
Nov 03 06:38:58 sf4800 Platform.SC: /N0/IB6, sensor status, outside acceptable limits (7,1,0x501060d00080000)
Nov 03 06:38:58 sf4800 Platform.SC: /N0/IB6, sensor status, outside acceptable limits (7,1,0x501060d00090000)
Loading the test table from board IB8 PROM 0 ...
Copying IO PROM to CPU DRAM
.Nov 03 06:39:05 sf4800 Platform.SC: ErrorMonitor: Domain A has a SYSTEM ERROR
Nov 03 06:39:05 sf4800 Domain-A.SC: ErrorMonitor: Domain A has a SYSTEM ERROR
Nov 03 06:39:05 sf4800 Domain-A.SC: /N0/IB8 encountered the first error
Nov 03 06:39:05 sf4800 Domain-A.SC: ArAsic reported first error on /N0/IB8
Nov 03 06:39:05 sf4800 Domain-A.SC: 
/partition0/domain0/IB8/ar0: 
>>> L2CheckError[0x6150] : 0x00009e1e
	     CMDVSyncErr [12:09] : 0xf Ports [9:6] command valid mismatched against internal expected command valid
	     PreqSyncErr [04:01] : 0xf Ports [9:6] prereq mismatched against internal expected prereq
	              FE [15:15] : 0x1 

Nov 03 06:39:05 sf4800 Platform.SC: [AD] Event: SF4800
     CSN: 203M20F6 DomainID: A ADInfo: 1.SCAPP.20.9
     Time: Sun Nov 03 06:39:05 PST 2019
     FRU-List-Count: 0; FRU-PN:  ; FRU-SN:  ; FRU-LOC: UNRESOLVED
     Recommended-ActioNov 03 06:39:05 sf4800 Domain-A.SC: [AD] Event: SF4n: Service action re800
     CSN: 203M2quired
0F6 DomainID
: A ADInfo: 1.SCAPP.20.9
     Time: Sun Nov 03 06:39:05 PST 2019
     FRU-List-Count: 0; FRU-PN:  ; FRU-SN:  ; FRU-LOC: UNRESOLVNov 03 06:39:05 sf4800 Platform.SC: A fatal condition is detected on Domain A.ED
     Recommended-Action: Service action required
sl-project
() автор топика
Последнее исправление: sl-project (всего исправлений: 1)
29 декабря 2019 г.
Ответ на: ошибки модулей IO от sl-project

прошивка

прошил на версию 5.21.1 все компоненты сервера. В целом я доволен.

Component   Segment Compatible In Date       Time  Build Version                
---------   ------- ---------- -- ----       ----  ----- -------                
SSC0/FP0    -       -          -  -          -     -     RTOS version: 48       
SSC0/FP1    ScApp   Reference  12 11/20/2008 04:32 1.0   5.21.1                 
SSC0/FP1    Ver     -          -  11/20/2008 04:32 1.0   5.21.1 Build_02        
/N0/IB6/FP0 iPOST   Yes        12 11/20/2008 04:24 1.0   5.21.1                 
/N0/IB6/FP0 Ver     -          -  11/20/2008 04:27 1.0   5.21.1 Build_02        
/N0/IB8/FP0 iPOST   Yes        12 11/20/2008 04:24 1.0   5.21.1                 
/N0/IB8/FP0 Ver     -          -  11/20/2008 04:27 1.0   5.21.1 Build_02        
/N0/SB0/FP0 POST    Yes        12 11/20/2008 04:12 1.0   5.21.1                 
/N0/SB0/FP0 OBP     Yes        12 11/20/2008 04:06 1.0   5.21.1                 
/N0/SB0/FP0 Ver     -          -  11/20/2008 04:19 1.0   5.21.1 Build_02        
/N0/SB0/FP1 POST    Yes        12 11/20/2008 04:12 1.0   5.21.1                 
/N0/SB0/FP1 OBP     Yes        12 11/20/2008 04:06 1.0   5.21.1                 
/N0/SB0/FP1 Ver     -          -  11/20/2008 04:19 1.0   5.21.1 Build_02        
/N0/SB4/FP0 POST    Yes        12 11/20/2008 04:12 1.0   5.21.1                 
/N0/SB4/FP0 OBP     Yes        12 11/20/2008 04:06 1.0   5.21.1                 
/N0/SB4/FP0 Ver     -          -  11/20/2008 04:19 1.0   5.21.1 Build_02        
/N0/SB4/FP1 POST    Yes        12 11/20/2008 04:12 1.0   5.21.1                 
/N0/SB4/FP1 OBP     Yes        12 11/20/2008 04:06 1.0   5.21.1                 
/N0/SB4/FP1 Ver     -          -  11/20/2008 04:19 1.0   5.21.1 Build_02        

Нет ли у кого Sun Management Center 3.5 Version 6 for Sun Fire Midrange Systems. Для винды и Соляриса. Или любой другой версии подходящей для SF4800

Заранее благодарю

sl-project
() автор топика
Последнее исправление: sl-project (всего исправлений: 1)
5 марта 2020 г.
Ответ на: прошивка от sl-project

Добавил немного памяти.

При запуске домена командой setkeyswitch on при тестировании железа вылазит вот такая ошибка

/N0/SB0 : Failed AR interconnect test. Status = 10000400
/N0/SB4 : Failed AR interconnect test. Status = 7c0003bf

Раньше ее не было, Как ее можно устранить?

Причем машина грузится. Все индикаторы зеленые. Ошибок по команде showchs нет

sf4800:SC> showchs
Component           Status
---------------     --------
RP0                 Suspect
RP2                 Suspect
/N0/SB0             Suspect
/N0/SB4             Suspect
/N0/IB6             Suspect

Память тесты проходит

sf4800:SC> showcomponent

Component           Status   Pending  POST   Description
---------           ------   -------  ----   -----------
/N0/SB0/P0          enabled  -        pass   UltraSPARC-III+, 1200MHz, 8M ECache

/N0/SB0/P1          enabled  -        pass   UltraSPARC-III+, 1200MHz, 8M ECache
/N0/SB0/P2          enabled  -        pass   UltraSPARC-III+, 1200MHz, 8M ECache
/N0/SB0/P3          enabled  -        pass   UltraSPARC-III+, 1200MHz, 8M ECache
/N0/SB0/P0/B0/L0    enabled  -        pass   2048M DRAM
/N0/SB0/P0/B0/L2    enabled  -        pass   2048M DRAM
/N0/SB0/P0/B1/L1    enabled  -        pass   2048M DRAM
/N0/SB0/P0/B1/L3    enabled  -        pass   2048M DRAM
/N0/SB0/P1/B0/L0    enabled  -        pass   2048M DRAM
/N0/SB0/P1/B0/L2    enabled  -        pass   2048M DRAM
/N0/SB0/P1/B1/L1    enabled  -        pass   2048M DRAM
/N0/SB0/P1/B1/L3    enabled  -        pass   2048M DRAM
/N0/SB0/P2/B0/L0    enabled  -        pass   1024M DRAM
/N0/SB0/P2/B0/L2    enabled  -        pass   1024M DRAM
/N0/SB0/P2/B1/L1    enabled  -        pass   1024M DRAM
/N0/SB0/P2/B1/L3    enabled  -        pass   1024M DRAM
/N0/SB0/P3/B0/L0    enabled  -        pass   1024M DRAM
/N0/SB0/P3/B0/L2    enabled  -        pass   1024M DRAM
/N0/SB0/P3/B1/L1    enabled  -        pass   1024M DRAM
/N0/SB0/P3/B1/L3    enabled  -        pass   1024M DRAM
/N0/SB4/P0          enabled  -        pass   UltraSPARC-III+, 1200MHz, 8M ECache
/N0/SB4/P1          enabled  -        pass   UltraSPARC-III+, 1200MHz, 8M ECache
/N0/SB4/P2          enabled  -        pass   UltraSPARC-III+, 1200MHz, 8M ECache
/N0/SB4/P3          enabled  -        pass   UltraSPARC-III+, 1200MHz, 8M ECache
/N0/SB4/P0/B0/L0    enabled  -        pass   1024M DRAM
/N0/SB4/P0/B0/L2    enabled  -        pass   1024M DRAM
/N0/SB4/P0/B1/L1    enabled  -        pass   1024M DRAM
/N0/SB4/P0/B1/L3    enabled  -        pass   1024M DRAM
/N0/SB4/P1/B0/L0    enabled  -        pass   1024M DRAM
/N0/SB4/P1/B0/L2    enabled  -        pass   1024M DRAM
/N0/SB4/P1/B1/L1    enabled  -        untest empty
/N0/SB4/P1/B1/L3    enabled  -        untest empty
/N0/SB4/P2/B0/L0    enabled  -        pass   512M DRAM
/N0/SB4/P2/B0/L2    enabled  -        pass   512M DRAM
/N0/SB4/P2/B1/L1    enabled  -        pass   512M DRAM
/N0/SB4/P2/B1/L3    enabled  -        pass   512M DRAM
/N0/SB4/P3/B0/L0    enabled  -        pass   1024M DRAM
/N0/SB4/P3/B0/L2    enabled  -        pass   1024M DRAM
/N0/SB4/P3/B1/L1    enabled  -        untest empty
/N0/SB4/P3/B1/L3    enabled  -        untest empty
.....

Уже не знаю куда копать и что делать? Поискал в сети похожие проблемы, но там что то похожее в варианте процессорная плата вообще не стартует. Может кто то подскажет в чем причина такого поведения машины?

sl-project
() автор топика
Последнее исправление: sl-project (всего исправлений: 1)
Ответ на: комментарий от bigbit

Спасибо за ссылку, раньше была в сети более свежая версия, вроде бы как на imhans.net или как то так. Но она уже давненько протухла. Эту проблему я решил в тот же день, вытащив процессорные платы, осмотрев их, осмотрев ножки на центроплане, тоже проделал с платами комутаторов, Но их поменял местами, Эта ошибка ушла, Долго воевал с IB6 были ошибки по питанию +5, +3,3 и тд, уже смотрел на ножки и осматривал сам модуль, но ничего криминального не видел. В итоге вставил модуль и прижал его вверх и так закрутил винты, Ошибка пропала. Я привык что сановское железо надежное а тут такие непонятки.

Вот придется искать новую IB. Чтоб понять проблемы в ней, или проблемы в центроплане. Жаль что сейчас проблема найти к этому серверу комплектуху.

Никто не поделится тестовыми пакетами на спарки. Хочется погонять его, и посмотреть что меняется при добавлении процессоров, памяти и изменении частот процессоров.

Чтоб можно было его прогрузить как следует.

Вполне возможно что получится найти третью процессорную плату, но пока это под вопросом.

sl-project
() автор топика
Последнее исправление: sl-project (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.