LINUX.ORG.RU

История изменений

Исправление Deleted, (текущая версия) :

Для TF нужны мощные ГПУшки, чтобы он хоть как-то шевелился. На процессорах с ним работать разработчики отказались, на процессоры годится только что-то очень древнее и скромное.

А большие матрицы дробятся на меньшие по объему вычисления, как и в далекие 60-70, и умещающиеся части матриц распределяются и впихиваются в ГПУшки, а в конечном счете затем результат собирается до кучи на самом процессоре. В результате в случае огромных матрицы выгода от ГПУшек не так очевидна и требует много кастомного кода для решения своих задачек.

Но при размерах матриц умещающихся в ГПУшки, ГПУшки шустро ворочают даже тензорами (и даже без прямой поддержки оных в железе), а не только матрицами, потому и тему я создал, чтобы знали что есть такая возможность.

Собственно хотелось бы чтобы magma использовали и в numpy как опцию.

На TF конечно же глупо ожидать высокой производительности при работе с матрицами или даже тензорами, но и назначение TF примерно как Excel для бухгалтерской книги, по любому быстрее чем на ретро-счетах получается при существенном объеме вычислений, хотя до скоростей ассемблерного или даже Сишного кода очень далеко.

Исправление Deleted, :

Для TF нужны мощные ГПУшки, чтобы он хоть как-то шевелился. На процессорах с ним работать разработчики отказались, на процессоры годится только что-то очень древнее и скромное.

А большие матрицы дробятся на меньшие по объему вычисления, как и в далекие 60-70, и умещающиеся части матриц распределяются и впихиваются в ГПУшки, а в конечном счете затем результат собирается до кучи на самом процессоре. В результате в случае огромных матрицы выгода от ГПУшек не так очевидна и требует много кастомного кода для решения своих задачек.

Но при размерах матриц умещающихся в ГПУшки, ГПУшки шустро ворочают даже тензорами (и даже без прямой поддержки оных в железе), а не только матрицами, потому и тему я создал, чтобы знали что есть такая возможность.

На TF конечно же глупо ожидать высокой производительности при работе с матрицами или даже тензорами, но и назначение TF примерно как Excel для бухгалтерской книги, по любому быстрее чем на ретро-счетах получается при существенном объеме вычислений, хотя до скоростей ассемблерного или даже Сишного кода очень далеко.

Исправление Deleted, :

Для TF нужны мощные ГПУшки, чтобы он хоть как-то шевелился. На процессорах с ним работать разработчики отказались, на процессоры годится только что-то очень древнее и скромное.

А большие матрицы дробятся на меньшие по объему вычисления, как и в далекие 60-70, и умещающиеся части матриц распределяются и впихиваются в ГПУшки, а в конечном счете затем результат собирается до кучи на самом процессоре. В результате в случае огромных матрицы выгода от ГПУшек не так очевидна и требует много кастомного кода для решения своих задачек.

Но при размерах матриц умещающихся в ГПУшки, ГПУшки шустро ворочают даже тензорами (без поддержки оных в железе), а не только матрицами, потому и тему я создал, чтобы знали что есть такая возможность.

На TF конечно же глупо ожидать высокой производительности при работе с матрицами или даже тензорами, но и назначение TF примерно как Excel для бухгалтерской книги, по любому быстрее чем на ретро-счетах получается при существенном объеме вычислений, хотя до скоростей ассемблерного или даже Сишного кода очень далеко.

Исходная версия Deleted, :

Для TF нужны мощные ГПУшки, чтобы он хоть как-то шевелился. На процессорах с ним работать разработчики отказались, на процессоры годится только что-то очень древнее и скромное.

А большие матрицы дробятся на меньшие по объему вычисления, как и в далекие 60-70, и умещающиеся части матриц распределяются и впихиваются в ГПУшки, а в конечном счете затем результат собирается до кучи на самом процессоре. В результате в случае огромных матрицы выгода от ГПУшек не так очевидна и требует много кастомного кода для решения своих задачек.

Но при размерах матриц умещающихся в ГПУшки, ГПУшки шустро ворочают даже тензорами (без поддержки оных в железе), а не только матрицами, потому и тему я создал, чтобы знали что есть такая возможность.

На TF конечно же глупо ожидать высокой производительности при работе с матрицами или даже тензорами, но и назначение TF примерно как Excel для бухгалтерской книги, по любому быстрее чем на ретро-счетах получается, хотя до скоростей ассемблерного или даже Сишного кода очень далеко.