Параллельная реализация численного метода на CUDA
Зарегистрируйся в два клика и получи неограниченный доступ к материалам,а также промокод на новый заказ в Автор24. Это бесплатно.
При параллельных вычислениях многие вычисления выполняются одновременно в одной или в разных аппаратных средах. В этой главе мы сосредоточимся на реализации параллельной численной схемы над графическими процессорами NVIDIA.
Параллельные вычисления применяются для решения больших задач с использованием высокопроизводительных вычислений (HPC). Эти большие проблемы в основном присутствуют в исследованиях и прогнозировании погоды, климата (например, моделирование экстремальных явлений, где атмосфера-океан взаимодействия имеют большое значение и), планетарных наук и астрономии; а также в инженерии (например, компьютерной, гражданской и механической), где сокращение времени вычислений и повышение скорости имеет фундаментальное значение.
С последними достижениями в области графических карт появились новые численные модели на самостоятельном или гибридном оборудовании, например, MPI и CUDA вместе взятые, например. Это имеет принципиальное значение, так как крупномасштабные проблемы, представленные наборами PDE и их параметризациями, например терминами источника и приемника, которые не могут быть разрешены непосредственно, требуют высокого разрешения для воспроизведения многих характеристик, что сегодня невозможно. Эти крупномасштабные задачи требуют значительного вычислительного времени и памяти для выполнения на обычных компьютерах
Зарегистрируйся, чтобы продолжить изучение работы
.
Вычислительная мощность современных видеокарт во много раз превосходит производительность центральных процессоров. Архитектура GPU обеспечивает большое количество параллельных вычислительных потоков на одном GPU. Кроме того, NVIDIA выпускает карты Tesla, предназначенные исключительно для вычислительных задач, поддерживающих архитектуру CUDA. Существуют кластерные решения, которые объединяют серверы на основе архитектуры x86 и вычислительных узлов TESLA-C, называемых гибридными системами. Технология NVIDIA CUDA была выбрана для реализации метода последовательного приближения.
Рассмотрим реализацию метода последовательного подхода к CUDA [7]. Предполагается, что r должны быть вычислены частные решения (траектории) системы (H). Поскольку расчет разных траекторий не требует обмена данными между ними, траектории могут быть рассчитаны в разных блоках. Итак, нам нужна сетка, содержащая блоки R. В каждом блоке вычисляется только одна траектория. Токи в блоке делятся на измерение системы n и количество M одновременно рассчитанных шагов с течением времени.
Таким образом, в блоке будут потоки M xn, которые вычисляются параллельно и обмениваются результатами вычислений
50% курсовой работы недоступно для прочтения
Закажи написание курсовой работы по выбранной теме всего за пару кликов. Персональная работа в кратчайшее время!