Новосибирск, Россия, 30 мая – 4 июня 2011 г.

Международная конференция
«Современные проблемы прикладной математики и механики: теория, эксперимент и практика», посвященная 90-летию со дня рождения академика Н.Н. Яненко
№ гос. регистрации 0321101160, ISBN 978-5-905569-01-2

Малышева С.А.   Головашкин Д.Л.  

Декомпозиция сеточной области при разностном решении уравнений Максвелла на графическом процессоре

Докладчик: Головашкин Д.Л.

     В вычислительной практике все большее применение находит разностное решение уравнений Максвелла (FDTD-метод). Существенным недостатком метода является высокая вычислительная сложность. Его реализации характеризуются большим числом арифметических операций и высокими требованиями к объёму оперативной памяти.
      Одним из способов снижения длительности расчётов по FDTD является векторизация алгоритма и его реализация на GPU (FastFDTD, CUDA FDTD Library). Однако, объем оперативной памяти доступных GPU невелик, что накладывает ограничения на размер решаемых задач. Актуальность решения проблемы возрастает в приложении к оптике волноводов, где размеры вычислительной области измеряются сотнями и тысячами длин волн.
      Поэтому перспективной представляется идея декомпозиции сеточной области в FDTD-методе, основанной на том, что излишне производить расчет поля в тех частях области, где излучение уже устоялось, и в тех, куда еще не дошло. Следовательно, уместно разбиение на подобласти, в каждой из которых ищется разностное решение с последующим согласованием на границах посредством задания падающей волны. Применение этого подхода сокращает длительность вычислений и снимает ограничения на размер области, связанные с объемом оперативной памяти (что особенно важно при реализации на графических процессорах).
      В работе приведены эксперименты по выявлению зависимости длительности вычислений от линейных размеров области. Например, задачи размером свыше 31 млн. отчетов не могут быть рассчитаны на GPU (NVIDIA GeForce GT 240) без применения декомпозиции сеточной области в связи с ограниченностью объема памяти (512 МБ). Декомпозиция на две подобласти позволяет последовательно помещать в глобальную память и проводить расчет по каждой из них, в два раза снижая требования к объему оперативной памяти. Кроме того, достигается ускорение в 2,06 раза за счет снижения числа арифметических операций при декомпозиции.

Файл тезисов: Малышева_Головашкин.doc
Файл с полным текстом: MalyshevaSA.pdf


К списку докладов
© 1996-2019, Институт вычислительных технологий СО РАН, Новосибирск