LINUX.ORG.RU
ФорумTalks

Загадка


0

1

Есть два компа, на каждом Debian Amd64 testing одинаковых обновлений.
На компах выполняются одинаковые расчетные задачи (по две на каждом компе):

1. CPU Athlon II X3 440 3.4 + 4 Гб RAM DDR3-12500. Внешняя видеокарта.
- за 4 часа выполнено ~83 % задачи.

помимо рабочей задачи, еще открыто пару десятков окон всякой пакости, одним словом - рабочий десктоп ))
RAM использован на ~60 %

2. CPU Athlon II X3 445 3.4 + 3 Гб RAM DDR2-800. Встроенное видео.
- за 4 часа выполнено ~50 % задачи.

тут ничего лишнего, крутится только рабочая задача,т.е., почти тепличные условия.
RAM использован на ~40 %
---------------
Вопрос :
Что может так сильно влиять на быстродействие и разницу в результатах ?

DDR2 vs DDR3 ? - как-то уж явно многовато и уж слишком в разрез с мнением лабораторных ученных от винды. ))

Встроенное видео ?


★★★

Последнее исправление: elipse (всего исправлений: 2)
Ответ на: комментарий от elipse

я про влияние памяти.

т.е. на сей вопрос

DDR2 vs DDR3 ? - как-то уж явно многовато и уж слишком в разрез с мнением лабораторных ученных от винды. ))

wfrr ★★☆
()
Ответ на: комментарий от wfrr

> я про влияние памяти.

я понимаю
по тестам (хз как они там работают) X3 445 на DDR2 укатывает X3 440 на DDR3. Это сбивает с толку малость.

elipse ★★★
() автор топика
Ответ на: комментарий от elipse

полагаю, что ежели задача такая что кеши цпу почти не используется, то память влиять будет сильно

wfrr ★★☆
()

Если эта задача - boinc, то он может использовать CUDA ^_^
У него так написано, сам я не проверял

darkshvein ☆☆
()

многовато и уж слишком в разрез с мнением лабораторных ученных от винды. ))
В винде вроде как память по другому планируется. И х** знает, есть ли там вообще какие либо оптимизации.

darkshvein ☆☆
()
Ответ на: комментарий от wfrr

> полагаю, что ежели задача такая что кеши цпу почти не используется, то память влиять будет сильно

так и есть, но что так сильно влияет ...

elipse ★★★
() автор топика
Ответ на: комментарий от darkshvein

> то он может использовать CUDA ^_^

угу, если установить еще софт

elipse ★★★
() автор топика
Ответ на: комментарий от drakmail

> А при чем тут видеокарта?

для строенного видео, данные святой дух переносит в видеопамять общую с основным озу ?

elipse ★★★
() автор топика
Ответ на: комментарий от elipse

>для строенного видео, данные святой дух переносит в видеопамять общую с основным озу ?

Ох лол, и Вы думаете, это может повлиять на производительность больше, чем различия в производительности оперативной памяти? Или задача всё-таки связана с использованием видеокарты?

drakmail ★★★★
()
Ответ на: комментарий от anon_666

>Я уже запамятовал,

Ага, типа, уже опытный и все прошел.

а в вашем детсаде явно про такое не рассказывают?


нет, не рассказывают.

elipse ★★★
() автор топика

У DDR2 меньше латентность и меньше пропускная способность. Если задача - типа STREAM, DDR3-based система будет вести себя лучше. Если задача - Random Access, то DDR2-based скорее всего будет лучше. Если задача все время работает в кэш, различия минимальны.

VIT
()
Ответ на: Чипсет тоже влияет от Myp3ik


1-й комп :
00:00.0 Host bridge: ATI Technologies Inc RX780/RX790 Chipset Host Bridge
00:02.0 PCI bridge: ATI Technologies Inc RD790 PCI to PCI bridge (external gfx0 port A)
00:07.0 PCI bridge: ATI Technologies Inc RD790 PCI to PCI bridge (PCI express gpp port D)

а более подробно смотри Biostar TA770XE3

2-й комп - ATI RS780/ HD3200

Biostar ТА789GM2+

elipse ★★★
() автор топика
Ответ на: комментарий от VIT

> система будет вести себя лучше.

лучше..., ну я это раньше замечал и даже тут писал ...

Однако, только сегодня смог выровнять тактовые частоты CPU и запустить
несколько другой набор задач (так как разгон «трудно» дается для блока 320 Вт второго компа, пришлось ограничить число задач до двух и для двух ядер)

elipse ★★★
() автор топика
Ответ на: комментарий от elipse

Ну ...
Тут такой разницы быть не должно.
Какого рода задачи ?
Что-нибудь из распределенных вычислений а-ля BOINC ?

Myp3ik ★★
()
Ответ на: комментарий от Myp3ik

> Что-нибудь из распределенных вычислений а-ля BOINC ?

yes, задачки парные, и в паре идут ровно, т.е., как-то однородны и без завихрений (скажем так).

Уже идет второй прогон , а картина идентична первому.

elipse ★★★
() автор топика
Ответ на: комментарий от elipse

по две на каждом компе

yes, задачки парные,

Все банально, задачки РАЗНЫЕ. т.е. 2 задачи на одном компе НЕ РАВНЫ 2м задачам на другом.

zgen ★★★★★
()
Ответ на: комментарий от darkshvein

Нуето возможно лишь если первая часть задачки собралась и уже подстроилась под процессор и ГПУ :)

Нет, он говорит, что на обоих компах считается BOINC.
Он говорит, что задачи парные. Что парные задачи одинаковы.
Он говорит, что они выполняются попарно, из чего я делаю вывод, что 2 одинаковые парные задачи выполняются только на 1 компе.
Он не говорит, как он проверил, что задача на одном компе и задача на другом компе - абсолютно одинаковые. Моя практика работы работы с BOINC на нескольких проектах говорит о том, что им вполне могут выдаваться разные задачи.

Из чего можно сделать вывод, что скорее всего автор ошибается.

zgen ★★★★★
()
Ответ на: комментарий от zgen

Есть проекты, вроде AQUA, в которых один тип задания считается одно и то же время на одной и той же машине, так что не факт, и требуется уточнение от топикстартера.

Myp3ik ★★
()
Ответ на: комментарий от zgen

Разве что специфичная «корпоративная» задача, основанная на том движке.
У публичного бонинка, насколько я знаю, таких проектов нет.

Myp3ik ★★
()
Ответ на: комментарий от Myp3ik

считается одно и то же время на одной и той же машине

Правильней наверное сказать «на полностью идентичной машине», так?
Тогда да, требуется уточнение. Однако разница в огромные 33 процента всего за 4 часа не дают мне никаких шансов думать что дело в частоте памяти и латентности. Я не припомню распространенных задач, которые масштабируются по памяти настолько сильно.

Если предположить, что автор не заблуждается, то тут 2 выхода:

1)Посмотреть производительность контроллера памяти у AIIx3 DDR2 vs DDR3, если там огромные провалы - тогда возможно.

2) Этим расчетным задачам нужно ТРЕБУЕТСЯ заведомо больше 3GB озу.





zgen ★★★★★
()
Ответ на: комментарий от Myp3ik

У публичного бонинка, насколько я знаю, таких проектов нет.

Вы во всех публичных проектах участвовали, в т.ч. закрытых на данный момент?

zgen ★★★★★
()
Ответ на: комментарий от zgen

>насколько я знаю
Ку ?

А в тех, что мне известны, отличающиеся алгоритмом задачи, как то отсеивание результатов расчетов идет отдельным подпроектом.
То ли ограничение самой платформы, то ли прихоть разработчиков ...
Не разбирался.

Myp3ik ★★
()
Ответ на: комментарий от zgen

>Однако разница в огромные 33 процента всего за 4 часа не дают мне никаких шансов думать что дело в частоте памяти и латентности.

Я предложил убрать фактор памяти лишь затем чтобы более ясно понять обрисовать картину. Чтобы было понятнее.

darkshvein ☆☆
()
Ответ на: комментарий от elipse

> так и есть, но что так сильно влияет ...

DDR3 хуже по времени доступа, но лучше по пропуксной способности. Под DDR3 новые матери, они технологически лучше старых. На одном из компов память может приличная память (например corsair, но тогда подразумевается что мать сможет вытянуть такое).

как различаются матери?

что жрет гуй? Во вчерашних тестах нашей проги, например, выяснилось что в командной строке она в стабильном состоянии жрет 1-2% CPU, а если попробовать открыть вебморду - то тоже 1-2%, временами переходящие в 50-80% (начинает «волноваться» при нажатии определенных кнопок и открытии определенных форм, даже если в командной строке те же самые действия не приводили к повышению нагрузки вообще). Вывод - какой софт стоит?

30% - это не много

stevejobs ★★★★☆
()
Ответ на: комментарий от stevejobs

30% - это не много

Издеваетесь? 30%. за 4 (!) часа. на одной и той же расчетной (!, предполагаем хеви лоад) задаче. На практически идентичных процессорах. С интегрированным контроллером памяти. (к вопросу о матери)

Это ДОФИГА.

zgen ★★★★★
()
Ответ на: комментарий от zgen

на том компьютере что тормозит у него запушено еще куча десктопного софта (он сам сказал). А десктопный софт имеет свойство самопроизвольно начинать жрать ресурсы, когда ему это кажется важным.
Кстате нам ничего не было сказано об изачальной загрузке обоих компутеров до начала тестирования, и о всяких мелочах типа swapiness и устойчивости к 12309 каждого из них.

Допустим, на «тормозящем» компьютере запущен каой-нибудь амарок, которые каждые 10 минут проверяет состояние файлов которые у него в плейлисте. Файлов там 10,000 (это чтобы было больше 9,000 :). Причем они расположены на IDE-харде на участке с медленночитающимися секторами. При попытке распарсить плейлист он жрет 100% процессора и 50% памяти (учитывая что чтение будет отваливаться по таймауту), «рассчетная задача» уходит в глубокий своп с понижением приоритета процесса (и потом полчаса из него вылазит), финальные результаты тестирования отличаются на 200% ;)

stevejobs ★★★★☆
()

Огласите заполнение свопа на каждой из машин

temporary ★★
()
Ответ на: комментарий от stevejobs

Наоборот. Тормозит пустой компьютер.

Xellos ★★★★★
()
Ответ на: комментарий от stevejobs

на том компьютере что тормозит у него запушено еще куча десктопного софта (он сам сказал).

Наоборот же. Читайте внимательней! Чудо!

zgen ★★★★★
()
Ответ на: комментарий от stevejobs

При попытке распарсить плейлист он жрет 100% процессора

Давно у нас DMA при доступе к HDD отменили?

50% памяти

50% от 4GB?!

И вообще, все ваши выкладки неверны изначально, потому что читать внимательно вы не научились.

zgen ★★★★★
()
Ответ на: комментарий от zgen

> Давно у нас DMA при доступе к HDD отменили?

это можно устроить и с наличием DMA ;)

50% от 4GB?!


читаем кусок файла в память (распарсить метаинформацию). Отваливаемся по таймауту (диск тормозит ибо). Повторяем цикле два миллиарда раз, останавливаемся когда система упрется в лимиты. Потом зачищаем ресурсы и повторяем еще раз. На выходе получаем периодическую загрузку памяти, проца и IO без какой-либо видимой активности.

похожую ситуацию видел своими очами в скрпте на PHP. Но там всё было еще печальней, потому что там есть еще и лимит по времени для самого скрипта.

stevejobs ★★★★☆
()
Ответ на: комментарий от stevejobs

это можно устроить и с наличием DMA ;)

Кхм. Вы не путаете стопор всей системы при чтении «с диска с проблемами» (потому что обычно остальным тоже писать/читать надо, а диск занят бедом) со 100% загрузкой CPU, потому как в первом случае загрузка CPU обычно 0 или стремится к нему? Это разные вещи. (я так, на всякий случай спросил)

На выходе получаем периодическую загрузку памяти, проца и IO без какой-либо видимой активности.

Верю, но разве что на PHP потому что такое что называется «специально не придумаешь» ))

zgen ★★★★★
()

когда на первопне запускал memtest86+ (с какого-то диска убунты), то он показывал почти вдвое большую скорость памяти при использовании отдельной простенькой PCI видеокарты, вместо встроенной в чипсет, откусывающей пару Мб RAM.

может тут также?

вопрос ещё в том, насколько можно верить показаниям мемтеста. И как это будет в отношении современных компов.

И сразу же очевидное совпадение, на твоём компе где встроенное видео, там в 2 раза меньше задачи решено.

n_play
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.