LINUX.ORG.RU

Посоветуйте наиболее дешёвый БУ-ноут с авито класса Lenovo/HP/Dell с втыкаемостью в него ОЗУ >= 32 GB?

 


0

1

Интересует, что можно взять из (предпочтительно Lenovo) «энтерпрайзного класса» ремонтопригодных БУ-ноутов, куда втыкается до 32 и более ГБ озу.

Желательно при этом не иметь на борту какую-то nvidia-печку, чтобы меньше чего-то ломалось и жарило.

Плохо разбираюсь в P50, P51, P52 и их недостатках и вообще слабо понимаю мир HP или DELL.

Проц: не-в-хламину устаревшее, т.е. например 4 поколение (или как сказать, которое у проца 4300m, например) - уже не особо старое я считаю. А ещё я нифига не знаю где может быть жопа, если юзать AMD вместо православного Intel.



Последнее исправление: kilokolyan (всего исправлений: 3)
Ответ на: комментарий от WitcherGeralt

Окей, спасибо, погоняю. Я заметил, что этот Linpack Xtreme показывает более низкие результаты в «стресс-тесте», чем в «бенчмарке». На четверть, где-то. Оно и более интересно, на каком уровне производительность остановится для конкретной модели, чем сравнивать Intel и AMD между собой. Linpack любит интелы, особенно последние, но ноуты берут совсем не под перемножение матриц на коленках))

Надо сказать, что Linpack прожаривает проц качественно. На целочисленке у меня такого тротлинга не наблюдалось. Т.е. это можно считать худшим сценарием для проца в ноуте, при котором еще не задействован dGPU.

aist1 ★★★
()
Ответ на: комментарий от aist1

Linpack любит интелы

В теме с патченым под интел линпаком ТС ещё тестил с дебажными параметрами, включающими AVX2. Ещё с этим можно поиграть.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)
Ответ на: комментарий от WitcherGeralt

5950X, твой конфиг без на Linpack Xtreme без дополнительных твиков системы.

Current date/time: Sun Aug  8 02:13:39 2021

CPU frequency:    4.624 GHz
Number of CPUs: 1
Number of cores: 16
Number of threads: 16

Parameters are set to:

Number of tests: 15
Number of equations to solve (problem size) : 1000  2000  5000  10000 15000 18000 20000 22000 25000 26000 27000 30000 35000 40000 45000
Leading dimension of array                  : 1000  2000  5008  10000 15000 18008 20016 22008 25000 26000 27000 30000 35000 40000 45000
Number of trials to run                     : 4     2     2     2     2     2     2     2     2     2     1     1     1     1     1    
Data alignment value (in Kbytes)            : 4     4     4     4     4     4     4     3     1     1     1     1     1     1     1    

Maximum memory requested that can be used=16200901024, at the size=45000

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
1000   1000   4      0.005      144.7744 8.724688e-13 2.975343e-02   pass
1000   1000   4      0.004      153.4720 8.724688e-13 2.975343e-02   pass
1000   1000   4      0.004      156.3531 8.724688e-13 2.975343e-02   pass
1000   1000   4      0.004      159.6664 8.724688e-13 2.975343e-02   pass
2000   2000   4      0.018      292.3835 4.701128e-12 4.089406e-02   pass
2000   2000   4      0.018      291.3086 4.701128e-12 4.089406e-02   pass
5000   5008   4      0.231      361.4641 2.434170e-11 3.394253e-02   pass
5000   5008   4      0.227      367.6745 2.434170e-11 3.394253e-02   pass
10000  10000  4      1.415      471.3023 9.329476e-11 3.289668e-02   pass
10000  10000  4      1.414      471.5199 9.329476e-11 3.289668e-02   pass
15000  15000  4      4.457      504.9333 2.081321e-10 3.278115e-02   pass
15000  15000  4      4.473      503.1174 2.081321e-10 3.278115e-02   pass
18000  18008  4      7.597      511.8729 2.930911e-10 3.209707e-02   pass
18000  18008  4      7.639      509.0537 2.930911e-10 3.209707e-02   pass
20000  20016  4      10.476     509.1862 3.682808e-10 3.260092e-02   pass
20000  20016  4      10.485     508.7361 3.682808e-10 3.260092e-02   pass
22000  22008  3      14.109     503.2076 4.378710e-10 3.207233e-02   pass
22000  22008  3      14.153     501.6298 4.378710e-10 3.207233e-02   pass
25000  25000  1      20.699     503.3168 5.009174e-10 2.848538e-02   pass
25000  25000  1      20.758     501.8720 5.009174e-10 2.848538e-02   pass
26000  26000  1      23.347     501.9418 5.995200e-10 3.152456e-02   pass
26000  26000  1      23.502     498.6333 5.995200e-10 3.152456e-02   pass
27000  27000  1      26.642     492.5927 6.776114e-10 3.304377e-02   pass
30000  30000  1      36.077     498.9833 8.678270e-10 3.420983e-02   pass
35000  35000  1      57.280     499.0526 1.089454e-09 3.162520e-02   pass
40000  40000  1      85.987     496.2386 1.289415e-09 2.867704e-02   pass
45000  45000  1      122.283    496.8315 1.660715e-09 2.921853e-02   pass

Performance Summary (GFlops)

Size   LDA    Align.  Average  Maximal
1000   1000   4       153.5665 159.6664
2000   2000   4       291.8460 292.3835
5000   5008   4       364.5693 367.6745
10000  10000  4       471.4111 471.5199
15000  15000  4       504.0254 504.9333
18000  18008  4       510.4633 511.8729
20000  20016  4       508.9612 509.1862
22000  22008  3       502.4187 503.2076
25000  25000  1       502.5944 503.3168
26000  26000  1       500.2875 501.9418
27000  27000  1       492.5927 492.5927
30000  30000  1       498.9833 498.9833
35000  35000  1       499.0526 499.0526
40000  40000  1       496.2386 496.2386
45000  45000  1       496.8315 496.8315

Residual checks PASSED

aist1 ★★★
()
Ответ на: комментарий от aist1

без дополнительных твиков системы

То есть без переключения scaling_governor в performance?

То ли ядро под Zen 3 пока недостаточно оптимизировано, то ли что, но 5900X тоже в линпаке не раскрывается, показывая 450-500, у тебя к терафлопсу должно приближаться в теории. Следует попробовать MKL_DEBUG_CPU_TYPE=5.

Да и ранний перегрев на лицо, конечно, тоже. Не мониторил температуру?

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 3)
Ответ на: комментарий от WitcherGeralt

То есть без переключения scaling_governor в performance?

Да. С переключением стало чуть хуже, на 5%.

MKL_DEBUG_CPU_TYPE=5 тоже чуть ухудшает. У меня MKL_DEBUG_CPU_TYPE=4 стоит.

Температура была 73С.

Мне надо с машиной разбираться, там кулер, по ходу, хреновый у меня. Может, на водянку перейду. Ну и BIOS надо смотреть еще, что у меня там выставлено.

В целочисленке (пересборка Clang, 4150 файлов) стабильно держит 3.95GHz и 73C.

aist1 ★★★
()
Ответ на: комментарий от Qui-Gon

Троттлинг это же когда проц не в состоянии держать свою базовую частоту.

А тут просто буст не в состоянии работать на максимуме.

Для компиляния такой конфиг должен выиграть у 4 ядерного процессора.

Но вот веговская встройка всё портит. Под линуксом такой проц будет виснуть намертво.

Включу режим ждуна и подожду RDNA2.

pingvinek
()
Последнее исправление: pingvinek (всего исправлений: 2)
Ответ на: комментарий от pingvinek

Да, драйвера веги под линукс кривые. А вот с RDNA2 что-то никак не разродятся - по прежнему вега в качестве встройки. Да и опять же вопрос насколько хороши будут драйвера для вcтроенной версии RDNA2. Как ни крути у встройки свои особенности и драйвера для десктопной версии RDNA2 прямо вот так из коробки не подойдут.

Qui-Gon ★★★★★
()
Ответ на: комментарий от kilokolyan

С одной стороны, если я не ошибаюсь, то это последний 14" финкпад с двумя слотами под раму, если не считать X1 Extreme.

С другой стороны, сразу в закладки: https://github.com/erpalma/throttled

Мне на T580, правда, не помогло, пришлось руками правильную схему питания выставлять. Но и этого не хватило, пришлось немного зарезать по частотам. Но там ещё дискретка была докучи, тебе может и одной только правильной схемы питания хватить. Хотя, в пятнашке и охлад посерьёзней по-идее. Хрен знает.

Это косяк Lenovo и сраный Kaby Lake R.

Не хочешь DELL?

Latitude 7400 за те же деньги, но уже с 16гб рамы (хз одной ли планкой) и i7 вместо i5 на православной Whiskey Lake: https://m.avito.ru/sankt-peterburg/noutbuki/noutbuk_dell_latitude_7400_intel_core_i7_17_shtuk_2190526336

В Москве на десятку дешевле есть вариант с i5 и 8гб.

Минусы: нет привычных кнопок над тачпадом, нет настройки выделяемой памяти ​под встроенный GPU в биосе. Наверное, всё. Плюс пара мелких косяков, с которыми столкнулся лично я: дёрнул live-stick в при выключении (с финкпадами тоже так делал, вырубалось с кнопки без проблем), и так как кнопка питания вместе с клавиатурой не реагировала на нажатие, пришлось вытаскивать батарею, а ещё после пары дней в суспенде может отвалиться обработка тапов по тачпаду (кнопки продолжают работать), это я стараюсь отловить, чтобы зарепортить, но пока не вышло.

Меня жутко бесят все тачпады кроме финкпадовских с тремя кнопками, но в остальном я склоняюсь к DELL.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 2)
Ответ на: комментарий от aist1

Вот я тоже думаю, что с температурой всё норм. Я подозреваю, что у меня ограничение по TDP в бивисе стоит. Потом разберусь)

aist1 ★★★
()
Ответ на: комментарий от WitcherGeralt

То ли ядро под Zen 3 пока недостаточно оптимизировано, то ли что, но 5900X тоже в линпаке не раскрывается, показывая 450-500, у тебя к терафлопсу должно приближаться в теории.

Терафлопс будет на FP32 на multiply-accumulate на 4GHz. На FP64 — уже в 2 раза меньше. Учитывая, что он частоту роняет чуть ли не в 2 раза еще, то результаты выглядят реалистичными относительно пиковых.

aist1 ★★★
()
Ответ на: комментарий от WitcherGeralt

Строго против DELL ничего не умею. Человек привыкает ко всему. НО предпочтительнее конечно lenovo, клава привычнее и больше кнопок на ней. У dell совмещение крайних F-кнопок с home-end-insert-del уже какая-то дичь. И нет кнопки print-screen чё-то. На thinkpad пофиг, опять же человек привыкает ко всему, но я мышь юзаю.

Я пока на троттлинг-проблемы стриггерился. На практике, если не лечить тулзой, это что означает? Что я получаю железку, которая слабее 4300m?

А ещё раз кратко для дебилов: чем каби-лейк-Р хуже, чем виски-лейк?

kilokolyan
() автор топика
Ответ на: комментарий от WitcherGeralt

Если хотеть виски-лейк, то я понял что хотеть надо 8665U или 8565U, ибо там кеша 8 мегабайт, что максимально много среди конкурентов…

kilokolyan
() автор топика
Ответ на: комментарий от aist1

Включил на 5950X PBO, получил +10% к GFLOPS (в районе 550 GFLOPS) и 90С температуру. Думаю, что если хочется больше, то надо водянку ставить. У меня хороший воздух.

aist1 ★★★
()
Ответ на: комментарий от kilokolyan

Я пока на троттлинг-проблемы стриггерился. На практике, если не лечить тулзой, это что означает?

Зависит от. Linpack, которым WitcherGeralt бенчмаркает, очень сильно прожаривает процессор. Т.е. это заранее нештатный режим для любых ноутбуков, которые не игровые и не рабочие станции. Это не те машины, которые создавались под длительные 100%-ные нагрузки.

Ноутбуки «для людей» оптимизируются под пиковую производительность при работе от батарейки. И вот если он в этом режиме тротлит, то всё. Ошибка природы.

Если же конкретно твой ноутбук при работе от сети держит меньшие частоты, чтем у условного Васи, то всё нормально. В твоей модели такой компромисс выбрали.

Если ты хочешь высокую производительность при тонком и легком дизайне, нужно готовиться или долго искать Б/У, или много платить. С Б/У нужно еще на замену батарейки закладываться по деньгам.

Я в конце-концов снова пришел к тому, что разработчику нужен хороший настольный комп и тонкий и легкий ноутбук с хорошим временем работы от батарейки и большой памятью, чтобы удобно было брать в дорогу.

Ездить с тяжелым игровым ноутом или рабочей станцией неудобно. Даже с работы домой и обратно с корпоративным «кирпичом» тоже удовольствия не доставляет. Ноут выбирается по параметрам мобильности в первую очередь. А производительность — это при прочих равных. Но есть особые факапы с некоторыми линейками процов, как с Kaby Lake вышли.

aist1 ★★★
()
Ответ на: комментарий от kilokolyan

нет кнопки print-screen чё-то

Она на F10.

чем каби-лейк-Р хуже, чем виски-лейк?

Интеловские маркетологи поимели физику и занизили TDP, а по факту оно жрёт, греется и троттлит.

На практике, если не лечить тулзой, это что означает?

Там просто скриптуха, а не какая-то сложная тулза. Оно будет перегреваться, тормозить, мб микрофризить гуй даже.

Что я получаю железку, которая слабее 4300m?

Конечно, нет.

Прихвати загрузочную флешку с тем же линпаком, разберись как фиксить троттлинг (мб даже подскажу, если лог сохнарился) и проверь температуру с попугаями сам перед проверкой.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)
Ответ на: комментарий от WitcherGeralt

Прихвати загрузочную флешку с тем же линпаком, разберись как фиксить троттлинг (мб даже подскажу, если лог сохнарился) и проверь температуру с попугаями сам перед проверкой.

Процесс покупки ноута переходит на новый левел…

kilokolyan
() автор топика
Ответ на: комментарий от kilokolyan

Б/У же, я всегда проверяю экран и батарею как минимум, а тесты погонять — почему бы и нет?

WitcherGeralt ★★
()
Ответ на: комментарий от aist1

Но есть особые факапы с некоторыми линейками процов, как с Kaby Lake вышли

Так с Kaby Lake в 7 поколении нормально всё было, а вот в Kaby Lake R в 8 поколении — это разводка какая-то.

Если сравнить i7-7700HQ и i7-8550U, то мы имеем на 2мб кеша больше, а базовую частоту на 1ггц ниже и в бусте чуть выше. Архитектура та же, первое 45W, второе 15W. Что-то тут не сходится уже на первый взгляд.

На практике как раз и не сходится, процессор в пике жрёт сильно дофига.

WitcherGeralt ★★
()
Ответ на: комментарий от kilokolyan

А там чё за особые факапы?

Kaby Lake R грелись сильно и непредсказуемо в первых моделях ноутов. Чип получился более горячим, чем Intel обещал производителям, поэтому все ноуты на нем так или иначе тротлили. Даже макбуки (а эти — эпично).

Потом производители это полечили, и конкретная модель ноута с таким чипом может тротлить, а может и нет. Но батарейку будет держать плохо в любом случае.

Т.е. если ты выбрал конкретную модель и она на Kaby Lake, то идешь читать обзоры на предмет того, на сколько она тротлит. Скорее всего, не сильно, и твоя производительность будет сильно выше условного i3-4300m.

Мой i7-8750H (но это Coffee Lake) на целочисленке (компиляция) не тротлит. На linpack - да. Что мне не так уж важно, так как Lenovo X1 Extreme тонкий, легкий, держит много памяти и у него клава отличная.

Короче, суть. При выборе ноутбука, особенно Б/У и на прошлых поколениях камней всегда нужно смотреть на тротлинг в рабочих для тебя режимах. Частоты камней — дело вторичное.

aist1 ★★★
()
Последнее исправление: aist1 (всего исправлений: 1)
Ответ на: комментарий от WitcherGeralt

Архитектура та же, первое 45W, второе 15W. Что-то тут не сходится уже на первый взгляд.

ЕМНИП, они могли очень быстро разогреваться в штатном режиме, и системы охлаждения просто не успевали от них отводить тепло. Power management issues. В Whiskey Lake как раз это и оптимизировали, понизив до кучи базовые частоты еще сильнее :)

Но таки да, это поколение (Kabi Lake R) стоит избегать. Учитывая, что куча времени прошла с тех пор и есть много чего куда более пригодного.

А так я согласен с тобой. Как мобильная машинка разработчика, что-то на Whiskey Lake будет оптимальна по цена/качество.

aist1 ★★★
()
Ответ на: комментарий от aist1

Поглядел спеки архитектуры, почесал репу, по базовой частоте r9 5950X — 3.4ггц — ​получилось так: 256÷64×2×16×3.4=435

Где-то я видел формулу (порой фотографически запоминаю хрень даже не вникая), там было ещё одно умножение на 2, если мне память всё же не изменяет. Чего оно там делало, хрен знает. Но это бьётся с реальностью, отражаемой результатами в линпаке.

Вот мой Skylake i7-6700 (кроме количества ядер всё то же самое, что в твоём райзене):

  • 256bit (AVX2)
  • 2 FMAC — 2 операции за такт (?)
  • 4 ядра
  • 3.4ггц — 4ггц буст

Имеем: 256÷64×2×4×3.4=108

А линпак при этом выдаёт 202 гигафлопса, что несопоставимо больше даже в сравнении с чудесным бустом на 4 ядра.

Та же история с r9 3900X (256÷64×2×12×3.8=364), где лоровец по ссылке выше намерил 542 гигафлопса.

Где косяк? Почему в реальности выше чем в теории? Полное ощущение, что в в формуле действительно не хватает двойки.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 3)
Ответ на: комментарий от WitcherGeralt

Та же история с r9 3900X (256÷64×2×12×3.8=364), где лоровец по ссылке выше намерил 542 гигафлопса.

Я тут поигрался с настройками. С включенным агрессивным PBO я получаю 90С температуры (по сравнению с 73С) и где-то на 5-10% большую производительность. Если поставлю водянку, получу еще 5% пунктов.

Дело в том, что эти многоядерные чипы ограничены температурой с одной стороны, и каналом в память — с другой. 5900Х получился заметно лучше, чем 3900Х, а вот 5950Х уже не сильно-то лучше, чем 3950Х. Я думаю, что 5950Х упирается уже в канал в память.

Т.е. результаты в 545 GFlops для 3900Х и мой 550 GFlops для 5950Х выглядят правдоподобными, так как для данной задачи мы упираемся в теплопакет. AVX2-блоки очень горячие.

Что же касается GFlops-ов, то надо смотреть, как конкретно Linpack свою формулу рассчитывает. Я согласен, что выглядит так, что еще двойку нужно куда-то вставить. Скорее всего, FMAC считается за 2 операции.

UPD. Короче, да. FMA считается за 2 операции. И у 5950Х должен быть 1 TFlops в FP64 на 4GHz, но частота падает до 2.2GHz из-за температуры блоков AVX2. Поэтому эффективно получается только в районе половины от теоретического.

aist1 ★★★
()
Последнее исправление: aist1 (всего исправлений: 2)
Ответ на: комментарий от aist1

О, как.

частота падает до 2.2GHz из-за температуры блоков AVX2

Всё таки запихивание невероятного количества ядер в десктопный сокет даром не прошло, не смогли тепло отвести. Но тут, видимо, ещё с самой Zen 3 что-то пошло не так, у моего кореша r9 5900X 12 ядрами с огромным двойным Noctua показывает себя заметно хуже аналогично r9 3900X по ссылке выше, давая всего 483 гигафлопса.

WitcherGeralt ★★
()
Ответ на: комментарий от aist1

Да, кстати, скажи, пожалуйста дистр, на котором ты бенчил, и его версию. Я результат к себе в табличку занесу.

Ну, и если на ноутах ещё соберёшься линпак с этим конфигом погонять, то тоже буду благодарен, если отпишешься.

WitcherGeralt ★★
()
Ответ на: комментарий от WitcherGeralt

Везде Ubuntu 20.04, Linpack Xtreme 1.1.5.

Сегодня погоняю тест. Но на R7 4800H могу погонять только на винде. Думаю, это принципиальной разницы не даст.

aist1 ★★★
()
Ответ на: комментарий от WitcherGeralt

у моего кореша r9 5900X 12 ядрами с огромным двойным Noctua

У меня PBO был в Auto в бивисе. И по факту не работал. После его принудительного включения я получил те же 550 GFlops и 90С.

С целочисленкой вроде нормально получается на 16 ядрах. У меня 4GHz на воздухе держатся. А compute надо все равно на акселераторы/ASIC выносить. Этот AVX не сильно-то полезная штука на практике получается. Слишком горячий, слишком медленный.

Т.е. Linpack, конечно, знатно проц прожаривает, но это всё же не штатный режим для десктопов и, тем более, лэптопов.

aist1 ★★★
()
Ответ на: комментарий от aist1

Не, принципиальной точно на даст. А вот если память в одноканале стоит, то там 10-15% разницы выходит в минус. В китайском геймерском вполне может оказаться и одноканал, учитывая, что ты вряд ли в него сам лазил и память докидывал. Судя по этому скриншоту, проверить это можно в таск-менеджере.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)
Ответ на: комментарий от WitcherGeralt

Ну я бы совсем уж отстой одноканальный не брал бы. А это у меня Eluktronics RP-15, который я успел отхватить еще до повышения цен на GPU. И там всё достойное, кроме брэнда и вебки. Просто это машинка жены, она жаловалась на свой какой-то древний двухядерник i5, что ну очень тормозной стал. И я решил вопрос радикально. Happy wife — happy life.

aist1 ★★★
()
Ответ на: комментарий от aist1

Это не SIMD

Много битов, одна инструкция.

Целочисленный SIMD так жарить проц не будет, как FMA.

FMA - может быть целочисленным.

anonymous
()
Ответ на: комментарий от anonymous

Ты придираешься к деталям. Ну не надо на десктопе матрицы перемножать. Под это дело всё равно рабочие станции ставят. FMA для FP горячие, потому что там много кремния нужно для быстрой обработки.

Если кому-то одень нужен научный софт на лэптопе, то возьмут лэптоп класса workstation и, может быть даже, с ECC.

Целочисленный же SIMD не будет таким горячим, как FP.

aist1 ★★★
()
Ответ на: комментарий от aist1

Целочисленный же SIMD не будет таким горячим, как FP.

Что сложнее умножить два 32 битных целых или два 32 битных чисел с плавающей частотой? Проблема не в типе данных, а в выполняемых операциях.

anonymous
()
Ответ на: комментарий от anonymous

Ты сегодня буквоед. Давай так...

Перемножение INT32 будет немного проще, чем FP32, так как не нужно дополнительно отслеживать денормализацию, NAN и прочее. Здесь ты прав, оно не принципиально.

Я имел в виду, что те строковые/битовые операции, которые есть в AVX, и которые были бы полезны обычным приложениям, они сильно проще умножения и не будут так греть камень. Те же POPCNT/LZCNT легко реализуются табличным методом. Что и делали в софте до всех этих AVX.

Что касается перемножения матриц, то делать это лучше на специальных матричных процессорах, построенных на систолических архитектурах. Что и делают во всяких «нейропроцессорах» («тензорных ядрах»). SIMD для этого плохо подходит из-за необходимости много двигать данными туда-сюда.

aist1 ★★★
()
Ответ на: комментарий от luke

Оптимизация свёртки эрмитовской матрицы с вектором

Это?

Слишком много разных попугаев на выходе, чтобы удобно сравнивать, да и на на коленке это не погоняешь, нужно либо собирать, либо бинарники таскать. И таблицу для референсов снуля набивать. Зачем?

Мне pystone в качестве однопоточного теста в любом случае надо на что-то менять, так как второй питон уже дропнули все, и в дальнейшем бенчить будет проблематично. Я думал сэмулировать его на Go, чтобы без проблем под любую кофеварку на мипсах статику можно было кросс-компилять. Только нужно подогнать всё так, чтобы результаты на идентичном железе билисть со старыми пистоновскими, иначе смысла нет.

WitcherGeralt ★★
()
Ответ на: комментарий от aist1

Что же касается строковых и битовых расширений в AVX, то приложениям нужно больше. Мне, например, нужна поддержка алфавитов более 2 символов. Т.е. PopCNT и другие операции для строк с алфавитом 4-8-16-... символов. И много еще чего в том же духе. Такого нет, и тут хоть сам свое железо делай (имеет смысл в эмбедщинке).

aist1 ★★★
()
Ответ на: комментарий от WitcherGeralt

Eluktronics RP-15 R7 4800H, 32GB RAM DDR4-3200, Windows 10, «Gaming mode».

Current date/time: Sun Aug 08 17:09:21 2021

CPU frequency:    4.270 GHz
Number of CPUs: 16
Number of cores: 16
Number of threads: 8

Parameters are set to:

Number of tests: 15
Number of equations to solve (problem size) : 1000  2000  5000  10000 15000 18000 20000 22000 25000 26000 27000 30000 35000 40000 45000
Leading dimension of array                  : 1000  2000  5008  10000 15000 18008 20016 22008 25000 26000 27000 30000 35000 40000 45000
Number of trials to run                     : 4     2     2     2     2     2     2     2     2     2     1     1     1     1     1
Data alignment value (in Kbytes)            : 4     4     4     4     4     4     4     3     1     1     1     1     1     1     1

Maximum memory requested that can be used=3315999136, at the size=45000

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
1000   1000   4      0.005      124.1187 1.031675e-012 3.518276e-002   pass
1000   1000   4      0.005      129.6860 1.031675e-012 3.518276e-002   pass
1000   1000   4      0.005      128.2607 1.031675e-012 3.518276e-002   pass
1000   1000   4      0.005      125.6753 1.031675e-012 3.518276e-002   pass
2000   2000   4      0.044      120.7315 4.382272e-012 3.812040e-002   pass
2000   2000   4      0.044      121.5731 4.382272e-012 3.812040e-002   pass
5000   5008   4      0.443      188.1753 2.581643e-011 3.599893e-002   pass
5000   5008   4      0.449      185.8561 2.581643e-011 3.599893e-002   pass
10000  10000  4      3.428      194.5111 8.700884e-011 3.068020e-002   pass
10000  10000  4      3.329      200.3168 8.700884e-011 3.068020e-002   pass
15000  15000  4      10.969     205.1565 2.225641e-010 3.505422e-002   pass
15000  15000  4      11.171     201.4604 2.225641e-010 3.505422e-002   pass
18000  18008  4      18.603     209.0298 2.894987e-010 3.170367e-002   pass
18000  18008  4      18.597     209.0997 2.894987e-010 3.170367e-002   pass
20000  20016  4      25.371     210.2463 4.097986e-010 3.627616e-002   pass
20000  20016  4      25.391     210.0826 4.097986e-010 3.627616e-002   pass
22000  22008  3      33.524     211.7799 4.548092e-010 3.331299e-002   pass
22000  22008  3      33.800     210.0470 4.548092e-010 3.331299e-002   pass
25000  25000  1      48.865     213.1981 6.089565e-010 3.462917e-002   pass
25000  25000  1      48.869     213.1815 6.089565e-010 3.462917e-002   pass
26000  26000  1      54.614     214.5723 6.669421e-010 3.506981e-002   pass
26000  26000  1      54.664     214.3774 6.669421e-010 3.506981e-002   pass
27000  27000  1      61.076     214.8697 6.672171e-010 3.253690e-002   pass
30000  30000  1      83.347     215.9873 8.421348e-010 3.319704e-002   pass
35000  35000  1      133.166    214.6633 1.085509e-009 3.151068e-002   pass
40000  40000  1      198.196    215.2915 1.466774e-009 3.262155e-002   pass
45000  45000  1      277.092    219.2559 1.711494e-009 3.011194e-002   pass

Performance Summary (GFlops)

Size   LDA    Align.  Average  Maximal
1000   1000   4       126.9352 129.6860
2000   2000   4       121.1523 121.5731
5000   5008   4       187.0157 188.1753
10000  10000  4       197.4139 200.3168
15000  15000  4       203.3084 205.1565
18000  18008  4       209.0648 209.0997
20000  20016  4       210.1644 210.2463
22000  22008  3       210.9134 211.7799
25000  25000  1       213.1898 213.1981
26000  26000  1       214.4748 214.5723
27000  27000  1       214.8697 214.8697
30000  30000  1       215.9873 215.9873
35000  35000  1       214.6633 214.6633
40000  40000  1       215.2915 215.2915
45000  45000  1       219.2559 219.2559

Residual checks PASSED

End of tests

Частоты во время теста прыгали в диапазоне 3.6-4.1GHz при Base=2.9GHz.

aist1 ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.