LINUX.ORG.RU
ФорумTalks

AMD, Intel, всё барахло

 , ,


1

2

Товарищи из Гугла [1] (а до этого из Пейсбука [2]) говорят, что все процессоры говно.

Для Ъ: процессоры молча считают неправильно (aka SDC). Один умудрился так зашифровать, что никто больше расшифровать не может. Ничего не говорят о масштабах трагедии или распределении Intel против AMD.

Кто-нибудь из операторов ДЦ сталкивался с подобным?

[1] https://sigops.org/s/conferences/hotos/2021/papers/hotos21-s01-hochschild.pdf

[2] https://engineering.fb.com/2021/02/23/data-infrastructure/silent-data-corrupt...

★★★★

Белки-истерички на службе корпораций.

CYB3R ★★★★★
()

Прочитал заголовок темы, прочитал ник, перепутал с «phoronix», подумал: «логично, те тоже обзоры железа пишут…».

dimgel ★★★★★
()

Товарищи из Гугла [1] (а до этого из Пейсбука [2]) говорят, что все процессоры говно.
Для Ъ: процессоры молча считают неправильно (aka SDC). Один умудрился так зашифровать, что никто больше расшифровать не может. Ничего не говорят о масштабах трагедии или распределении Intel против AMD

Я давно говорю, что процессоры говно и выхода без смены парадигмы нет. Другое дело, что нужно быть челом из фейсбука или гугла для того, чтобы тебя кто-то послушал.

Смысл нынешней парадигмы построения компьютеров ранее заключался в том, что есть достаточно простая и тщательно оттестированная железяка, которая выполняет гибкие, сложные, и содержащие ошибки программы. На текущий же момент мы имеем гибкие, сложные, и содержащие ошибки процессоры, на тщательное тестирование которых уже нужны тысячи или даже миллионы лет — потому их толком никто не тестирует.

У меня давным-давно был комп с процессором AMD, которые при компиляции генты спустя несколько часов выдавал битые бинари. Хз, сколько подходов я сделал, но потом по итогу поставил убунту и забыл про проблему.

byko3y ★★★★
()

процессоры молча считают неправильно

Тащемта, это уже давно известно. х86 как минимум со времён первых "пней" правильно считать не умеют, и производитель компенсирует это всякими дополнительными "угадайками".

Korchevatel ★★★★★
()
Ответ на: комментарий от Korchevatel

вообще да, всякие f00f и прочие fdiv (https://en.wikipedia.org/wiki/Pentium_FDIV_bug) были известны давно. Отличие в том, что эти проблемы в процессорах с рождения (ошибки дизайна). А ребята тут говорят об ошибках, вызваных износом устройств.

phoenix ★★★★
() автор топика
Ответ на: комментарий от phoenix

Отличие в том, что эти проблемы в процессорах с рождения (ошибки дизайна). А ребята тут говорят об ошибках, вызваных износом устройств.

Если так, то в принципе ожидаемо. Любое устройство такой сложности со временем изнашивается и начинает работать неправильно, это неизбежно.

Вопрос в том, как скоро это начнётся. Не хотелось бы, чтобы свежекупленная "ряженка" стала глючить сразу после покупки.

Korchevatel ★★★★★
()
Ответ на: комментарий от phoenix

Тащемта, это уже давно известно. х86 как минимум со времён первых «пней» правильно считать не умеют, и производитель компенсирует это всякими дополнительными «угадайками».

вообще да, всякие f00f и прочие fdiv (https://en.wikipedia.org/wiki/Pentium_FDIV_bug) были известны давно.

Ну ок, а на RISCV что?

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 3)
Ответ на: комментарий от byko3y

Каким образом менять парадигму-то? Понятно, что x86_64 содержит кучу легаси говна, ненужной совместимости и т.д. А разве ARM лучше? Тот же Specter и на ARM и на Power работает если верить википедии

phoenix ★★★★
() автор топика
Ответ на: комментарий от byko3y

Нормальные люди при проблемах с пк: проверяют на перегрев, тестируют память, контакты, может вообще проц/vrm деграднул.

Лоровцы: «по итогу поставил убунту и забыл про проблему»+«процессоры говно и выхода без смены парадигмы нет».

Zyy
()
Последнее исправление: Zyy (всего исправлений: 2)
Ответ на: комментарий от Korchevatel

Ряженка, как я помню, и так сразу после покупки глючила так что даже Линух накатить нельзя было :-D Починили микрокодом.

Это, кстати, к вопросу о сложности устройств. Хз сколько там теперь железа и сколько софта. А мы-то знаем, как люди софт пишут и тестируют.

phoenix ★★★★
() автор топика
Ответ на: комментарий от Zyy

и выхода без смены парадигмы нет».

А RISCV нга что придуман?
Проприетарщики то могут халтурить как хотят, но нас то, сообщество, ни кто же не заставляет халтурить при создании наших разработок?

Вообще давно следовало бы поделить процессоры на две линейки, сопроцессор главная задача которого надёжность и скорость, и основной процессор задача которого надёжность и безопасность,
а проприетарщики всё стараются запихнуть три в одно, причём глупые ЛОРовцы их ещё за это и нахваливают.

torvn77 ★★★★★
()
Ответ на: комментарий от torvn77

riscv это isa, большинство реализаций как я просмотрю все равно закрытие

phoenix ★★★★
() автор топика
Последнее исправление: phoenix (всего исправлений: 1)
Ответ на: комментарий от phoenix

Каким образом менять парадигму-то? Понятно, что x86_64 содержит кучу легаси говна, ненужной совместимости и т.д. А разве ARM лучше? Тот же Specter и на ARM и на Power работает если верить википедии

Так ARM не меняет парадигму, а копирует все недостатки с x86. Они даже ужасные SIMD операции слизали подчистую. За всю историю разрабы ARM не создали ни одной новой технологии, а только подражали чужим разработкам или прямо покупали их, как это случилось с Thumb, который на самом деле называется Hitachi SuperH.

byko3y ★★★★
()
Ответ на: комментарий от Zyy

Нормальные люди при проблемах с пк: проверяют на перегрев, тестируют память, контакты, может вообще проц/vrm деграднул

«Нормальные люди» выкидывают сбойное железо, не пытаясь тратить кучу времени в угадайках «заработает или нет, потеряю я в этот раз данные или нет». Что я по итогу и сделал.

byko3y ★★★★
()
Ответ на: комментарий от phoenix

Ряженка, как я помню, и так сразу после покупки глючила так что даже Линух накатить нельзя было :-D

Глючили только первые степпинги первого же "зена". Остальные же работают хорошо.

Korchevatel ★★★★★
()
Ответ на: комментарий от byko3y

«Нормальные люди» выкидывают сбойное железо, не пытаясь тратить кучу времени в угадайках «заработает или нет, потеряю я в этот раз данные или нет».

Ну это "нормальные люди". Разумные люди же исследуют рынок и смотрят обзоры прежде, чем решать, расстаться с кровными или нет.

Korchevatel ★★★★★
()
Ответ на: комментарий от byko3y

выхода без смены парадигмы нет.

я правильно понял базовое утверждение: есть труднообнаруживаемые деффекты CPU-cores? авторы статьи предлагают дополнительные чеки в железе. говорят, что в IBM Z990 есть дублированный pipelines (что бы это не значило в их контексте). я к тому, что это не для потребительского железа, т.к. падает производительность.

crypt ★★★★★
()
Ответ на: комментарий от crypt

можно ещё QA лучше делать на стороне производителей, но вряд ли это смена парадигмы. Непонятно, как вообще эти дефекты искать коль скоро они все такие mercurial.

phoenix ★★★★
() автор топика
Ответ на: комментарий от crypt

я правильно понял базовое утверждение: есть труднообнаруживаемые деффекты CPU-cores?... дублированный pipelines.. это не для потребительского железа, т.к. падает производительность

Да, ты правильно понял, массовая публика будет продолжать жрать говно и переустанавливать виндоус.

byko3y ★★★★
()
Последнее исправление: byko3y (всего исправлений: 1)
Ответ на: комментарий от byko3y

ну да, я тоже думаю, что эту парадигму не изменить. все хотят подешевле и побыстрее. от порчи шейдера в игре геймер не страдает и деньги отдаст с готовностью.

crypt ★★★★★
()

Плохой процессор можно протестировать хорошей программой. Которая на хороших процессорах выдаёт ожидаемые результаты.

Harald ★★★★★
()

Хз. У меня такое было в детстве, когда я покупал самую дешевую бушную комплектуху. Там и винты с битыми секторами были и подбитая память была, и мамки которые включались через раз. Когда я купил первый нормальный набор комплектухи – загадочные баги пропали сами собой :)

mrdeath ★★★★★
()
Ответ на: комментарий от Korchevatel

Это если разумным людям заняться больше нечем. В отличие от автомобиля, компютер стоит не так дорого, чтобы смотреть обзоры. А ещё обзорщики зачастую получают деньги за обзоры, посему трудно говорить о не предвзятости.

Вот я сейчас посматриваю на новые ноутбуки и единственные 2 параметра, что интересуют: размер экрана выше full HD и 32 гига оперативки. Я с железом лет 15 не работал, ни черта не понимаю в нём. Разобраться во всём займёт несколько дней, а то и больше, да ещё голову забьёт временными знаниями. Через год на рынке опять всё поменяется.

Irben ★★★
()
Ответ на: комментарий от byko3y

Что я по итогу и сделал.

Пишешь с утюга, как я понимаю?

CaveRat ★★
()
Ответ на: комментарий от Irben

Это если разумным людям заняться больше нечем. В отличие от автомобиля, компютер стоит не так дорого, чтобы смотреть обзоры. А ещё обзорщики зачастую получают деньги за обзоры, посему трудно говорить о не предвзятости.

Какой компьютер и какая машина?)) Забитая блейд-корзина может стоить недешево. Да даже не корзина, просто заряженный сервер под виртуализацию будет стоить ОЧЕНЬ недешево

CaveRat ★★
()
Ответ на: комментарий от CaveRat

Уйдя в облако забыл о том, что сервера надо покупать. Но да, когда собирал сервера, помню, какие космические были цены на любую деталь, в том числе лицензии, чтобы эти железяки работали.

Irben ★★★
()
Ответ на: комментарий от phoenix

так что даже Линух накатить нельзя было

4.2

Починили микрокодом.

А можно было в биосе microop cache отключить.

devl547 ★★★★★
()
Ответ на: комментарий от Irben

Уйдя в облако забыл о том, что сервера надо покупать. Но да, когда собирал сервера, помню, какие космические были цены на любую деталь, в том числе лицензии, чтобы эти железяки работали

Ты бы хоть привел какой-то конкретный пример, потому что я не вижу никаких космических цен, и лицензии на постгрес с мускулем что-то не особо дорого стоят.

byko3y ★★★★
()
Ответ на: комментарий от byko3y

Я про лицензии на тот же хардварный RAID в серверах. Мало купить железку, надо лицензию купить. Или железка шла в комплекте, а лицензия для включения отдельно. Не помню детали, лет 15 назад это было. Как будто в другой жизни, где я с железом работал.

Irben ★★★
()
Ответ на: комментарий от Irben

Мне кажется, что твой опыт устарел, и нынче уже хардовый рейд не такой дорогой, а ПО к нему производитель прилагает бесплатно.

byko3y ★★★★
()
Ответ на: комментарий от torvn77

Вообще давно следовало бы поделить процессоры на две линейки, сопроцессор главная задача которого надёжность и скорость, и основной процессор задача которого надёжность и безопасность, а проприетарщики всё стараются запихнуть три в одно, причём глупые ЛОРовцы их ещё за это и нахваливают.

Ну вот ты ж вроде умный.

Угадай слово, которое заставляет проприетарщиков запихать три в одно, а не делать разносы. Слово на «lat» начинается, на «ency» заканчивается.

windows10 ★★★★★
()
Ответ на: комментарий от windows10

Слово на «lat» начинается, на «ency» заканчивается.

Нет, делают это не из-за времени реакции, а потому что знают, что всякие поверхностные люди на скоростной процессор закричат "у дыраааа", а на секюрный процессор "тормознутое дерьмооооо", ни сколечки не думая над комплекснотью решения и целесообразности их хотелок задачам которые этот процессор должен решать.


И да, я в курсе что на биржах надо все три сразу, и быстро, и надёжно, и секюрно, но только вот там сложных вычислений быть не должно, только простая арифметика и сравнения величин, а значит процессор можно упростить.
Незачем там использовать общие процессоры, там надо использовать специальные процессоры для бирж.

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 4)

Это обычное дело https://gmplib.org/list-archives/gmp-discuss/2017-August/006138.html

The GMP Ryzen dev system is now powered off, and we plan no more development work for Ryzen.

Ryzen systems keep crashing due to serious silicon bugs:

1. When running an OS on the raw hardware, processes get spurious segfaults under load.

2. When virtualising the system with Xen, the entire machine dies under load.

AMD apparently has decided to pretend their early Ryzen works fine except for GNU/Linux. They replace CPUs on a case-by-case basis only. But the only reasonable action would be to publicly confess that their early chips did not work properly, and make a full recall.

SZT ★★★★★
()

Еще вот забавно. Драйвер якобы для PCI от AMD разблокирует какие-то багованные фичи процессора https://hothardware.com/news/questionable-amd-pci-driver-may-improve-game-sta... если в списке процессов видит название каких-то игрушек.

The initial findings from this reverse engineering, of which he reported on Twitter, explained that the «AMD PCI Driver» registers a process creation notify routine that, in short, «checks all process names against a list of 19 hashed names.» If a match is found against that list, which turns out to be a list of game executables, the driver sets a bit to disable certain hardware optimizations. Disabling these optimizations, like the instruction cache, which could cause instability under load, could improve game stability. As Ionescu then explained to us, «it doesn't disable them merely for the running game — it disables them for the entire machine.»

SZT ★★★★★
()
Последнее исправление: SZT (всего исправлений: 1)
Ответ на: комментарий от torvn77

Нет, делают это не из-за времени реакции, а потому что знают

Делают именно из-за времени реакции, и только из-за нее. И кстати уже очень давно. Эксперименты проводились еще в 90хх, а встраивать высокоскоростную логику в процессоры стали где-то с 2004 года.

Более того, при встраивании логики в процессор как ни странно, идет снижение его цены, за счет отсутствия доп. обвязки необходимой, как для компенсации электрических потерь, так и для трансляции одного протокола шины в другой.

Это очень хорошо прослеживается на примере северного моста, который хоть и не совсем процессор, однако имеет те же слабые места. И как только его стали встраивать в ЦПУ - размер плат уменьшился, скорость выросла.

Незачем там использовать общие процессоры, там надо использовать специальные процессоры для бирж.

С точки зрения экономики это не оправдано. Производство твоего специального процессора для бирж, будет стоить на доллар дешевле производства процессора общего назначения (как ты знаешь, два литра супа не сложнее сделать чем один литр супа), но покупать его будет только узкая целевая аудитория. Проще сделать процессор общего назначения и продавать его биржевикам, геймерам, офисникам, программерам, ученым.

windows10 ★★★★★
()
Ответ на: комментарий от windows10

С точки зрения экономики это не оправдано.

Не знаю, но ведь даже для одной биржи, как например Санкт-Петребуржская делается небольшей ЦОД, а это тираж в несколько тысяч чипов, а значит если основная масса бирж договорится использовать этот ЦПУ, то стоимость в расчёте на чип может оказаться достаточно маленькой.
И это без учёта того, что не одни биржи могут проявить интерес к такому процессору, например такой процессор вполне может оказаться идеальным для роутеров и NAS(по идее процессор для биржи должен в себя включать всё для этого необходимое).

Но тут хорошо бы узнать мнение профессионала.

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 2)
Ответ на: комментарий от windows10

по идее

Ну если хочешь жить в мире из "никогда не было и вот опять" то живи в нём, а предусмотрительно учту что в SOC включат не всё, что в неё включить необходимо.

могут

А что, ты можешь им запретить чтобы они НЕ МОГЛИ?
В общем это ты теоретик, а я понимаю что для продвижения в биржах этого ЦПУ надо работать: находить контакты, отправлять предложения и вести переговоры.

Если

Абсолютная уверенность отнюдь не признак профессионализма.

В общем ты мне должен денег за ответ на твой дурацкий пост.
Предлагаю сделать платные посты.

torvn77 ★★★★★
()
Последнее исправление: torvn77 (всего исправлений: 1)
Ответ на: комментарий от CaveRat

нет, я даже в ОП написал об этом. Но раз это парит Гугл и ко можно представить что при их масштабах это проблема. Для сравнения в статей упомянуты случайные битфлипы памяти альфа-частицами, видимо вероятности сравнимые

phoenix ★★★★
() автор топика
Ответ на: комментарий от t184256

Участвует в обсуждении, люди ему даже иногда отвечают, уже неплохо ))

zemidius
()
Ответ на: комментарий от Irben

Посмотри на розничные цены на интеловые камни и вспомни, сколько это стоит

PS да, я в курсе, какие скидки можно получить у вендоров на больших закупках

CaveRat ★★
()
Ответ на: комментарий от phoenix

Гугл оно может парить и чисто по приколу, у них достаточно большое исследовательское подразделение, которое в том числе и более-менее фундаментальные исследования.

CaveRat ★★
()

Помню была движуха с кривой архитектурой корок. Геологи там понаходили столько косяков, что мама не горюй.

И ничо, живем как-то.

utanho ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.