Логотип Автор24реферат
Задать вопрос
Курсовая работа на тему: Параллельная реализация численного метода на CUDA
100%
Уникальность
Аа
4911 символов
Категория
Высшая математика
Курсовая работа

Параллельная реализация численного метода на CUDA

Параллельная реализация численного метода на CUDA .doc

Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод Эмоджи на новый заказ в Автор24. Это бесплатно.

При параллельных вычислениях многие вычисления выполняются одновременно в одной или в разных аппаратных средах. В этой главе мы сосредоточимся на реализации параллельной численной схемы над графическими процессорами NVIDIA.
Параллельные вычисления применяются для решения больших задач с использованием высокопроизводительных вычислений (HPC). Эти большие проблемы в основном присутствуют в исследованиях и прогнозировании погоды, климата (например, моделирование экстремальных явлений, где атмосфера-океан взаимодействия имеют большое значение и), планетарных наук и астрономии; а также в инженерии (например, компьютерной, гражданской и механической), где сокращение времени вычислений и повышение скорости имеет фундаментальное значение.
С последними достижениями в области графических карт появились новые численные модели на самостоятельном или гибридном оборудовании, например, MPI и CUDA вместе взятые, например. Это имеет принципиальное значение, так как крупномасштабные проблемы, представленные наборами PDE и их параметризациями, например терминами источника и приемника, которые не могут быть разрешены непосредственно, требуют высокого разрешения для воспроизведения многих характеристик, что сегодня невозможно. Эти крупномасштабные задачи требуют значительного вычислительного времени и памяти для выполнения на обычных компьютерах

Зарегистрируйся, чтобы продолжить изучение работы

.
Вычислительная мощность современных видеокарт во много раз превосходит производительность центральных процессоров. Архитектура GPU обеспечивает большое количество параллельных вычислительных потоков на одном GPU. Кроме того, NVIDIA выпускает карты Tesla, предназначенные исключительно для вычислительных задач, поддерживающих архитектуру CUDA. Существуют кластерные решения, которые объединяют серверы на основе архитектуры x86 и вычислительных узлов TESLA-C, называемых гибридными системами. Технология NVIDIA CUDA была выбрана для реализации метода последовательного приближения.
Рассмотрим реализацию метода последовательного подхода к CUDA [7]. Предполагается, что r должны быть вычислены частные решения (траектории) системы (H). Поскольку расчет разных траекторий не требует обмена данными между ними, траектории могут быть рассчитаны в разных блоках. Итак, нам нужна сетка, содержащая блоки R. В каждом блоке вычисляется только одна траектория. Токи в блоке делятся на измерение системы n и количество M одновременно рассчитанных шагов с течением времени.
Таким образом, в блоке будут потоки M xn, которые вычисляются параллельно и обмениваются результатами вычислений

50% курсовой работы недоступно для прочтения

Закажи написание курсовой работы по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!

Промокод действует 7 дней 🔥
Больше курсовых работ по высшей математике:

Математические методы и модели в таможенном деле на примере задачи

22777 символов
Высшая математика
Курсовая работа
Уникальность

Интегрирующий множитель

37751 символов
Высшая математика
Курсовая работа
Уникальность
Все Курсовые работы по высшей математике
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач