LINUX.ORG.RU
Ответ на: комментарий от VLev

вроде, ещё Винер этой задачей занимался...

Давно это было.

То есть эти «параметры модели» и являются основным результатом обработки исходного сигнала?

Да. Только изначально сигнал это просто список времени прихода фотонов t_1, t_2,... t_n. Потом можно построить гистограму и ее обработать. Так же есть гистограма отклика, которая входит в модель.

В EM можно работать со списками фотонов.

И еще: Отдельные сигналы обрабатываются независимо?

В тривиальном случае — да. Чаще так сделать нельзя, скажем если есть 2 канала, то они связаны через модель.

Так что если ощущается неэфективность вычислений --- возможно, дело не в доступе в память, а, скажем --- в вычислении экспонент.

В простейшем случае, когда все независимо, можно запросто распаралеллить. Тогда время вычислений на много-корном CPU минуты (около 200-300 гистограм в секунду), а хочется секунды.

С GPU получилось, но все равно не так быстро как хочется. Основное время, если верить нвидиевскому профайлеру, тратится на доступ к памяти. Именно поэтому cache-oblivious алгоритмы меня заинтерисовали. Если это побороть, то можно сделать. Сами по себе вычисления там тривиальные: сложил/умножил, в конце поделил. Вначале да, нужно экспоненту вычислить.

Кстати, откуда берется «и еще смотреть надо что бы в память влезло»?

Когда есть картинка скажем 512х512, в каждом пикселе 4096 ячеек в гистограме. При этом функция отклика зависит от координаты. В сыром виде фотоны свалены в список записей типа (x, y, t). Обычная длина списка ~100 миллионов фотонов.

Вобщем сижу думаю как обхитрить природу.

anonymous
()
Ответ на: комментарий от anonymous

Ваша задача мне более-менее понятна.
Оптимизировать можно, причём разными способами.

время вычислений ... минуты, ... а хочется секунды.

Для этого вначале надо потратить дни, а то и недели на разработку и реализацию алгоритмов --- так что сами смотрите, оправдано ли это вообще с точки зрения общей эффективности. Тем более, что область приложений вроде чисто научная, об экономической эффективности там никто не задумывается --- суперкомпьютер и вперёд.
Я же обычно занимаюсь теми задачами, которые вообще не решаются существующими методами.

если верить нвидиевскому профайлеру, тратится на доступ к памяти

У GPGPU иерархия памяти «вывернута наизнанку» относительно CPU. Так что обычные «cache-oblivious» Вам вряд ли помогут.

Когда есть картинка скажем 512х512, в каждом пикселе 4096 ячеек в гистограме. При этом функция отклика зависит от координаты

Вот эта задачу уже более интересна с точки зрения LRnLA. Если конечно соседние «ячейки» как-то между собой связаны.

VLev
()
Ответ на: комментарий от anonymous

сижу думаю как обхитрить природу.

Природа-то здесь при чём?

VLev
()
Ответ на: комментарий от VLev

область приложений вроде чисто научная, об экономической эффективности там никто не задумывается --- суперкомпьютер и вперёд.

Ну да, это можно. Только все равно не очень удобно практически. Суперкомпьютер это сеть, данные туда слать надо потом назад получать. Понятно что оно конечно все реализуемо. Но хочется что бы записал данные, кнопку нажал и готово на обычном «бытовом» GPU или еще лучше на ноутбуке без сети.

Так что обычные «cache-oblivious» Вам вряд ли помогут.

Это я уже понял.

anonymous
()
Ответ на: комментарий от VLev

можно забыть в этом разрезе

Я бы не был столь категоричен. ;)

и что, прям получится «заставить их добавить пару инструкций»? О_о

процессоры общего назначения скорее движутся к risc схемам

Не, это был тренд 1990-х годов. Сейчас обратный откат. Последний широкоизвестный пример --- реализация аппаратной поддержки AES intel-ом.

а тут просто наличествуют прямоход и портивоход, да инструкции всевозможного толка добавляются и добавляются, но вот на практике, во многих случаях, используется весьма ограниченный набор оных, по разным причинам

shty ★★★★★
()
Ответ на: комментарий от VLev

говорил с членом команды разработчиков Эльбруса. «бизнес-план, норма прибыли, патенты и просто бюрократия» --- несравнимо больше, чем у того же Intel-а.

«бюрократия» - есть функция от количества сотрудников, с точностью до константы, всё прочее несут тараканы из головы руководящего состава, проверено электрониками (с)

shty ★★★★★
()
Ответ на: комментарий от VLev

Кстати, я беседовал на эту тему с людьми, занимающимися подобным в нашем институте. Но дальше приглашения меня на их семинар (так пока и не состоявшийся к тому же) дело не пошло.

ёж птица гордая... (с)

shty ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.