LINUX.ORG.RU
ФорумTalks

Русские физики выбирают Nvidia

 , , , ,


0

1

Ученые из МГУ имени М.В. Ломоносова сумели применить персональный компьютер с графическим процессором для решения сложнейших уравнений квантовой механики — ранее для этого использовались только мощные и дорогие суперкомпьютеры. По словам ведущего автора работы Владимира Кукулина, персональный компьютер справляется с задачей в разы быстрее: за 15 минут он выполняет работу, на которую суперкомпьютер тратит 2-3 дня.

Эта область представляет огромный интерес для ученых, занимающихся квантовой механикой. Главной их целью было и остается научиться решать эти уравнения. Однако из-за своей невероятной сложности для расчета уравнения долгое время не поддавались исследователям — до тех пор, пока не появились суперкомпьютеры.

Ситуация резко изменилась после того, как группа из НИИЯФ МГУ решила использовать в своем персональном компьютере один из новых графических процессоров корпорации Nvidia, разработанный для работы в игровых приставках. Как утверждает первый автор статьи Владимир Кукулин, заведующий лабораторией теории атомного ядра, процессор, был не самый дорогой — из тех, что можно купить в магазине за 300-500 долларов.

«Мы добились скорости, которая и присниться не может, — рассказал Владимир Кукулин. — Программа работает так, что 260 миллионов сложных интегралов на настольном компьютере она считает за три секунды. И никакого сравнения с суперкомпьютерами! Мой коллега из Тюбингенского университета, лаборатория которого занимается тем же, ведет расчеты с помощью суперкомпьютера BLUEGENE, что на самом деле очень дорогое удовольствие. И то, чего он добивается за двое-трое суток, мы делаем за 15 минут, не потратив ни копейки».

Deleted

Последнее исправление: Deleted (всего исправлений: 2)

Кстати, а насколько сложно смоделировать эффекты СТО и ОТО, скажем, в космосиме? Помню, хотел мужику показать «A slower Speed Of Light», так его ноут через 15-20 секунд игры отключался от перегрева))

Deleted
()

Вот как софт оптимизировать надо

Поаккуратнее с желаниями, а то завтра зависимость от cuda впилят в какой-нибудь systemd...

Кстати, это не вполне софтовая оптимизация, это смена архитектуры. Видимо, задача хорошо параллелится, раз получили такой прирост.

Sadler ★★★
()
Последнее исправление: Sadler (всего исправлений: 2)

Что ученые программировать не умеют - давно не новость.

xnick
()

ведет расчеты с помощью суперкомпьютера BLUEGENE, что на самом деле очень дорогое удовольствие. И то, чего он добивается за двое-трое суток, мы делаем за 15 минут, не потратив ни копейки

Что-то свежо питание да серится с трудом. Сильно сомневаюсь что заточенная под матан числодробилка слабее куды

upcFrost ★★★★★
()
Ответ на: комментарий от dogbert

Они пока на стадии изучения паскаля и васика

Valkeru ★★★★
()

Ну, если этим «мучёным» одной точки после запятой достаточно... то пусть «экономят».

beastie ★★★★★
()

ведущего автора работы Владимира Кукулина
первый автор статьи Владимир Кукулин

А в статье первым стоит Померанцев. Скандалы, интриги, расследования?
Не раскрыта тема того, под какой осью это все считается? Неужели не под вендой?

Deleted
()
Ответ на: комментарий от upcFrost

И разница в архитектуре. На суперкомпьютере скорее всего у много процессоров и у каждого своя память, шарить результаты между вычислительными блоками дорого. А на куде - процессоров много, а память общая, шарить результаты дешево. На некоторых классах задач куда может и обогнать.

xnick
()
Ответ на: комментарий от upcFrost

Сильно сомневаюсь что заточенная под матан числодробилка слабее куды

Ага, учитывая, что карты с поддержкой FP64 недешёвое удовольствие. Какое там количество таких модулей на обычных видеокартах?

grem ★★★★★
()
Последнее исправление: grem (всего исправлений: 1)
Ответ на: комментарий от xnick

http://www.gpgpu.org/static/sc2006/workshop/Apple_GPUintrinsics.pdf

Current GPUs do not support double-precision computation and their single-precision support glosses over important aspects of the IEEE-754 floating-point standard[1], such as correctly rounded results and proper closure of the number system. ... Our results show that there are serious errors with the GPUs' results at certain edge cases, in addition to the incorrect handling of denormalized numbers.

https://en.wikipedia.org/wiki/CUDA#Limitations

Double precision (CUDA compute capability 1.3 and above)[14] deviate from the IEEE 754 standard: round-to-nearest-even is the only supported rounding mode for reciprocal, division, and square root. In single precision, denormals and signalling NaNs are not supported; only two IEEE rounding modes are supported (chop and round-to-nearest even), and those are specified on a per-instruction basis rather than in a control word; and the precision of division/square root is slightly lower than single precision.

PS: нагло украл со stackoverflow

beastie ★★★★★
()
Последнее исправление: beastie (всего исправлений: 1)
Ответ на: комментарий от xnick

Извените, в стортах Г не смыслю. ;)

Меня интересует другое: если они на них считают — они проверили точность расчётов?

Всё таки GPU создавалось под совсем другие нужды и их использование под другие задачи — это скорее конфуз, а не достижение.

TL;DR: шо геймеру нямка, то вчёному смерть. А то знаете, как в том анекдоте: «печатаю быстро, но такая фигня».

beastie ★★★★★
()
Последнее исправление: beastie (всего исправлений: 1)
Ответ на: комментарий от beastie

Вот стековерфлоу ссылка на доку от нвидиа http://developer.download.nvidia.com/assets/cuda/files/NVIDIA-CUDA-Floating-P...

Там написано, Devices with compute capability 2.0 and above support both single and double precision IEEE 754 including fused multiply-add in both single and double precision. Operations such as square root and division will result in the floating point value closest to the correct mathematical result in both single and double precision, by default.

Вы можете дальше продолжать не разбираться и делать расчеты 3 дня вместо 15 минут.

xnick
()
Ответ на: комментарий от beastie

цитуруй уж тогда полностью

Compare results carefully. Even in the strict world of IEEE 754 operations, minor details such as organization of parentheses or thread counts can affect the final result. Take this into account when doing comparisons between implementations.

Если у тебя на cpu однонитиевые вычисления построены так, что ты копишь сумму от меньших чисел к большим - все работает хорошо. А потом ты начинаешь параллельно складывать как бог на душу положит, результат в общем случае будет отличаться. И тут не куда виновата, а ограничения формата представления чисел и недетерминированность параллелизма (даже хоть и на cpu).

Дальше спорить большого смысла не вижу, считай что ты прав, куда -говно.

xnick
()
Ответ на: комментарий от beastie

Нынче девайсы с >5 в ходу.
И таки да, deep learning целиком на CUDA завязан, все в порядке.

Solace ★★
()

Ученые из МГУ имени М.В. Ломоносова сумели применить персональный компьютер с графическим процессором для решения сложнейших уравнений квантовой механики — ранее для этого использовались только мощные и дорогие суперкомпьютеры.
Мы добились скорости, которая и присниться не может

Что будет когда они узнают про BOINC...

Nebuchadnezzar ★★★★
()
Последнее исправление: Nebuchadnezzar (всего исправлений: 1)

Надеюсь, символьно хоть решили. В смысле, аналитически.

buddhist ★★★★★
()
Последнее исправление: buddhist (всего исправлений: 1)
Ответ на: комментарий от Deleted

в статье первым стоит Померанцев

И что это должно значить? Часто встречаются случаи, когда порядок авторов произвольный

buddhist ★★★★★
()
Ответ на: комментарий от next_time

Основные вычисления на CUDA делаются под Ubuntu.

Solace ★★
()
Ответ на: комментарий от Deleted

Автор velocity raptor писал, что задолбался реализовывать и оптимизить алгоритм, хотя игра в этом плане примитивнее не придумаешь. Вообще да, интересно было бы сыграть в космостратегию с такими эффектами, а не просто бродилку со смазанными цветами. Или хотя бы в cursors.io с такой физикой ж)

arturpub ★★
()

Ученые из МГУ имени М.В. Ломоносова сумели применить персональный компьютер ...

тормоза...

crypt ★★★★★
()
Последнее исправление: crypt (всего исправлений: 2)
Ответ на: комментарий от buddhist

Часто встречаются случаи, когда порядок авторов произвольный

В этих частых случаях статьи не именуют с упорством кого-то «первым автором». Что это за термин вообще такой нах?

Deleted
()
Ответ на: комментарий от Deleted

Не уверен, но вроде как это особенность древнего поиска по бумажным табличкам. Найти статью по имени не первого автора в списке авторов было сложнее (если вобще возможно).

xnick
()
Ответ на: комментарий от dogbert

А всё потому, что не хотят выкладывать наработки в open source и пилить их вместе с сообществом энтузиастов.

ns_ramesses
()

учитывая что обычно ПО в институтах обычно пишут студенты у меня есть стойкое подозрение что код просто неоптимизирован был :)

Jopich
()
Ответ на: комментарий от dogbert

Зачем драйверы писать, если видеокарт нету))

Sparx ★★
()
Ответ на: комментарий от Nebuchadnezzar

Что будет когда они узнают про BOINC...

Даже не смешно. Точнее ещё менее смешно, чем игровая видеокарта на пользовательском компьютере. Если не интересоваться BOINC как таковым, то расчёты таким образом — это обмен своего квалифицированного времени (в полном смысле этого слова нужно зависать на форумах) для привлечения геймеров на доступ к их компьютерам, что эффективно только в условиях оскорбительно низкой зарплаты и отсутствия финансирования на что-то кроме зарплаты как класса.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Anonymous

В том же МГУ на том же Ломоносове их там хоть попой жуй.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от Deleted

Вообще-то это (не под виндой) и есть основной сценарий использования Tesla. Обратное весьма и весьма глупо.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)

Кто-то сумел написать на CUDA специализированное и почти одноразовое приложенице для моделирования, и теперь это великое событие? Какой позор...

Quasar ★★★★★
()

Однако из-за своей невероятной сложности для расчета

в чём заключается «невероятная сложность» при решении линейных уравнений?..

Sahas ★★★★☆
()
Последнее исправление: Sahas (всего исправлений: 1)
Ответ на: комментарий от xnick

xnick> А на куде - процессоров много, а память общая

Не знаю, как на кеплере, а на максвелле и разогнанном максвелле, который паскалем обозвали, память у этих ядер вовсе не общая, а привязана к вполне конкретным вычислительным блокам. Именно по этой причине в GeForce GTX970 не 4Gb VRAM, а 3.5 (отключили столько вычислительных блоков, что пол гига как не бывало). Ровно та же картина на Nvidia TITAN X - там вообще половины из 12Gb фактически нет и доступ к ней на скорости на порядок меньшей идёт (как на той половине гига на 970).

Quasar ★★★★★
()

ранее для этого использовались только мощные и дорогие суперкомпьютеры

ранее

Наверное в 80-х.

leg0las ★★★★★
()
Ответ на: комментарий от Quasar

Ну, я думаю, что скорее всего там наверняка изнасиловали журналиста. И да, параллельные алгоритмы — это та ещё засада с любовно разложенными вокруг детскими граблями.

Evgueni ★★★★★
()
Ответ на: комментарий от upcFrost

Может у них заявка на использоание суперкомпьютера 2-3 дня согласовывалась.

cPunk ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.