LINUX.ORG.RU

Нифига себе названьице у этой новости ! Ошибка все же в ядре Linux _при_работе_с_чипом_AMD_, а не в самом процессоре.

anonymous
()
Ответ на: комментарий от anonymous

> Нифига себе названьице у этой новости ! Ошибка все же в ядре Linux _при_работе_с_чипом_AMD_, а не в самом процессоре.

Ошибка именно в процессоре. Поищи оригинал новости например на http://slashdot.org, если не доверяешь http://www.cnews.ru

maxcom ★★★★★
()

Виноват :) Беру слова обратно. По содержанию постинга похоже на ошибку в ядре.

anonymous
()

Нет никакой ошибки. В смысле в АМД процах она есть, но Linux ее вызвать не может, потому что invlpg никогда на 4Mb страницы не вызывается.

green ★★★★★
()

А кого они должны информировать? Линуса Торвальдса что-ли :) ??

anonymous
()

Оригинально новость называлась Major Linux/Athlon CPU bug discovered. Другой смысл.

SDAll

anonymous
()

Просветите, что такое invlpg? Инструкция? Почему Linux ее не вызывает?

Объективно: у меня 2 машины (работа и дом), у обоих Matrox G4xx карты и Athlon/Duron процессоры, ядра 2.4.x серий, за год и полгода соответственно проблем не было.

Может это надумано? Были у кого то реальные падения?

И еще: исправить в драйвере AGP GART это можно?

nopentium уверен даст тормоза ... не хочется их. Получится 486 разогнанный до 900MHz с несколькими конвеереами.

saper ★★★★★
()

>А кого они должны информировать? Линуса Торвальдса что-ли :) ??
Могли бы просто на сайте обьявление опубликовать ;)
(а то заявили только 4 minor бага для своих K7)

nick
()
Ответ на: комментарий от saper

invlpg - инструкция процессора (invalidate page) помечает эту страничку в кеше процессора как not up to date или навроде того.

Проблема (так как описана) явно надумана. Но есть другая проблема - заключается она в том что AGP GART драйвера в линуксе мапят видеопамять с включенным ghjwtccjhysv rtitv& В результате после speculative write этот кеш сбрасывается обратно в память и корраптит ее. По крайней мере именно таково воследнее об'яснение ;) mem=nopentium всего-лишь отключает 4M страницы, в результате имеем больше TLB flushes. Если никаких проблем нет - то и mem=nopentium использовать никчему.

green ★★★★★
()
Ответ на: комментарий от green

Я читал списке рассылки kernel-devel хай по этому поводу , но так ничего из него и не понял .. Одни говорят -- надуманно , другие -- нет . Но проскакивало там и то что баг этот может происходить при наличии видеокарт Nvidia и "родных" драйверов к нему .. Грин , ты бы не мог прокоментировать ? Я конечно понимаю что дрова закрытые и наверняка ничего сказать нельзя , но дело в том что как раз на связке Атлон-Джифорс при активном использовании АГП (в сильных играх нередко , в иксах -- раз вмесяц , но стабильно) ядро просто умирает полностью и бесповоротно .. И от коллег такое слышал .. Может -- оно ?

Schlecht
()

Народ, а нахрена вообще страницы 4Мб нужны? Насколько я знаю,всюду широко используются 4Кб страницы (на x86), и это во многих случаях оптимально. Где же четырёхмеговые используются?

An0nymous
()

Нет, я не понял, зачем мой вопрос про то, где юзаются 4Мб страницы удалять. Это, по моему никого не оскорбляет, и , в общем-то в тему...

An0nymous
()
Ответ на: комментарий от An0nymous

4х мегабайтные страницы используются для кернела. В том смысле, что вот распаковался кернел на многа мегабайт, и всего по одной странице на каждые 4 мегабайта создается. Все остальное, естественно, делается через 4х килобайтные страницы.

green ★★★★★
()
Ответ на: комментарий от Schlecht

Я считаю что проблема больше похожа на какие-то проблемы с железом. Причем не ошибки, а именно проблемы. У меня Dual Athlon 1700+ и GeForce 3 какая-то. Первый день все висло очень быстро под нагрузкой. Поставили еще один вентилятор в корпус - все прекратилось.

А игры - они ж как раз процессор и память неслабо загружают...

green ★★★★★
()

>Я считаю что проблема больше похожа на какие-то проблемы с железом. Причем не ошибки, а именно проблемы. У меня Dual Athlon 1700+ и GeForce 3 какая-то. Первый
>день все висло очень быстро под нагрузкой. Поставили еще один вентилятор в корпус - все прекратилось.

>А игры - они ж как раз процессор и память неслабо загружают...
Ссылаясь на комментарии slashdot по этому поводу - эта ошибка исправлена в K7 6:6:2 и новее
т.е. начиная со stepping = 2.

nick
()

Кто-нибудь может доходчиво объяснить какие фичи отключает параметр
ядра mem=nopentium? Использование mmx при копировании блоков памяти
я думаю не должно страдать, так как насколько я понимаю должно
агресивно инлайниться и поэтому не являться отключаемой возможностью.
Вообщим, я думаю могу себе позволить обойтись без 4Mb странички(ек).
Неприятно конечно засирать TLB кучей ядреного мусора.

Toster
()

Интересным образом ошибка никак не затрагивает FreeBSD. Совершенно несознательно они использовали 4M странички для kernel именно безопасным образом. Sheer luck :)

anonymous
()
Ответ на: комментарий от Toster

6:6:x это насколько я понимаю athlon? Что можно сказать о duron'ах? в частности 6:3:1 (у меня такой) глюкав или нет?

Я использую nvidia'вские драйверы, и бывало у меня бывало висла машина, правда очень редко. Вчера поставил mem=nopentium, вроде пока никаких подвисаний, но для уверенности надо погонять подольше.

Что такое TLB? если не сложно, киньте урлов где про него прочитать...

draky
()
Ответ на: комментарий от draky

> Что такое TLB? если не сложно, киньте урлов где про него прочитать...
Translation look-aside buffer. Функционирует как кэш для элементов page table. Чтобы пересчитать виртуальный адрес в физический, процессору необходимо свериться с page table, но читать её всякий раз из медленной памяти слишком накладно получается. Bот уже прочитанные элементы и кэшируются на будущее.
На developer.intel.com гора PDF документов для интересующихся.

kan
()

Я ни разу не видел полного зависания машины с драйверами nvidia. Иксы вешались бывало так,
что клава не действовала, но машина при этом принимала удаленные соединения и полностью
управлялась по ssh. Я думаю, что все кто говорит о зависаниях, видели "зависания"
именно такого характера.

anonymous
()

Новость от 11.09.2000 считается новостью и 23.01.2002? Класс... Не прошло и полтора года как новость дошла.

Ezh

anonymous
()
Ответ на: комментарий от anonymous

Да, в основном наблюдались зависания такого характера. Висли иксы и клавиатура. Но пару раз было так что вешалось вобще всё - машина даже не пинговалась.

draky
()

Иди дальше кури, Еж. Полтора года назад еще не было 2.4 ядер.

anonymous
()

>Новость от 11.09.2000 считается новостью и 23.01.2002? Класс... Не прошло и полтора года как новость дошла.
Комментируя комментарии со slashdot:
вместо того, чтобы сказать - "Это баг железа"
они (AMD) сказали "Здесь патч для Win2k"
и этим полностью притупили бдительность разработчиков 2.4.
Так что новость это или нет для не windows пользователей - это еще вопрос.

nick
()

>6:6:x это насколько я понимаю athlon? Что можно сказать о duron'ах? в частности 6:3:1 (у меня такой) глюкав или нет?
Берешь w2k и запускаешь что-нить 3D (но не quake3) - если повесилась насмерть - значит баг.
Но я так думаю что 6:3:1 просто обязан быть с багом according to stepping (nb: у меня такой же)

nick
()

2Schlecht (*) (2002-01-23 17:18:14.0):

> (в сильных играх нередко , в иксах -- раз вмесяц , но стабильно) ядро просто умирает полностью и бесповоротно .. И от коллег такое слышал .. Может -- оно ?

Именно оно.

Obidos ★★★★★
()
Ответ на: комментарий от anonymous

Нет. поскольку Nvidia драйверя состоят и из в том числе бинарного кернлного модуля. (в котором есть ошибки, например не так давно исправили random memory corruption) то он вполне может вызывать и зависания кернела и все остальное что ему угодно.

Более того, поскольку X сервер может работать с PCI устройствами напрямую (случай fbdev не рассматриваем) он тоже может завесить всю PCI шину при достаточной удаче/неудаче. А за шиной умрет и вся машина.

green ★★★★★
()
Ответ на: комментарий от nick

Тем не менее воплей о виснущих атлонах A2 (6:6:2) немало. И после этой "сенсационой новости" посыпались сообщения о том, что mem=nopentium проблему решает.

green ★★★★★
()
Ответ на: комментарий от green

>Тем не менее воплей о виснущих атлонах A2 (6:6:2) немало. И после этой "сенсационой новости" посыпались сообщения
>о том, что mem=nopentium проблему решает.
Ссылаясь на:
http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/24332...

AMD Athlon≥ Processor Model 6 Revision Guide

Errata Numbers and Description

16 INVLPG Instruction Does Not Flush Entire Four-Megabyte Page Properly with Certain Linear Addresses
>>>A0,A2=present
>>>A5=fixed
17 Deadlock May Occur in a Two-Processor System in the Presence of Probe to
Memory Mapped I/O
>>>unfixed
18 Processor May Issue Non-Connect Bus Cycle After FID Special Cycle
>>>A0,A2=present
>>>A5=fixed
19 Processor Does Not Support Reliable Microcode Patch Mechanism
>>>A0,A2= don't exist
>>>A5=present !!!

Page 7:

16 INVLPG Instruction Does Not Flush Entire Four-Megabyte Page Properly with Certain Linear Addresses

Products Affected. A0, A2

Normal Specified Operation. After executing an INVLPG instruction the TLB should not contain any
translations for any part of the page frame associated with the designated logical address.

Non-conformance. When the logical address designated by the INVLPG instruction is mapped by a 4-MB
page mapping and LA[21] is equal to one it is possible that the TLB will still retain translations after
the instruction has finished executing.

Potential Effect on System. The residual data in the TLB can result in unexpected data access to stale or
invalid pages of memory.

Suggested Workaround. When using the INVLPG instruction in association with a page that is mapped via
a 4-MB page translation, always clear bit 21.

Resolution Status. Fix planned for a future revision.

Так что требуйте при покупке K7 6:6:2 (rev A5)

Так что если комманда Linux все сделает правильно то это будет не баг а фича и никакой потери
производительности ПОЧТИ не будет ;)

nick
()

Да - сильно похоже что в этом diff'е вышеуказанная проблема не фиксится :(

nick
()
Ответ на: комментарий от green

>Прошу привести строчку по ссылке, в которой сказано что Linux делает invlpg на 4M страницы.
Я уже ничего не понимаю:
http://www.geocrawler.com/lists/3/Linux/35/175/7626960/
Теперь выясняется что это баг Linux драйвера AGPGART.
(Хотя AMD и не отрицает уществование подобной ошибки в их камнях)
Т.е. как я понял шум подняли NVidia пользователи!
А AMD считает что это ошибка Linux:
#Our conclusion is that the operating system is creating coherency
#problems within the system by creating cacheable translation to AGP
#GART-mapped physical memory.
Как я понимаю - драйвер работает с AGP памятью как WB вместо WC.

Еще здесь:
http://www.gentoo.org/

nick
()
Ответ на: комментарий от green

>про AGP GART я еще в 10м комментарии об'яснил.
значит AMD была права заявив "Здесь патч для Win2k" и незаострив внимания
что это баг железа. Поскольку все остальные операционки - Linux *BSD не используют
этот баг ;)

nick
()

А у меня постоянно виснет машина с использованием agpgart. Поэтому я решил, что баг в нём и уже хотел писать багрепорт. Нда...

dem1urg
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.