Novosibirsk, Russia, May, 30 – June, 4, 2011

International Conference
"Modern Problems of Applied Mathematics and Mechanics: Theory, Experiment and Applications", devoted to the 90th anniversary of professor Nikolai N. Yanenko

Malysheva S.A.   Golovashkin D.  

Декомпозиция сеточной области при разностном решении уравнений Максвелла на графическом процессоре

Reporter: Golovashkin D.

     В вычислительной практике все большее применение находит разностное решение уравнений Максвелла (FDTD-метод). Существенным недостатком метода является высокая вычислительная сложность. Его реализации характеризуются большим числом арифметических операций и высокими требованиями к объёму оперативной памяти.
      Одним из способов снижения длительности расчётов по FDTD является векторизация алгоритма и его реализация на GPU (FastFDTD, CUDA FDTD Library). Однако, объем оперативной памяти доступных GPU невелик, что накладывает ограничения на размер решаемых задач. Актуальность решения проблемы возрастает в приложении к оптике волноводов, где размеры вычислительной области измеряются сотнями и тысячами длин волн.
      Поэтому перспективной представляется идея декомпозиции сеточной области в FDTD-методе, основанной на том, что излишне производить расчет поля в тех частях области, где излучение уже устоялось, и в тех, куда еще не дошло. Следовательно, уместно разбиение на подобласти, в каждой из которых ищется разностное решение с последующим согласованием на границах посредством задания падающей волны. Применение этого подхода сокращает длительность вычислений и снимает ограничения на размер области, связанные с объемом оперативной памяти (что особенно важно при реализации на графических процессорах).
      В работе приведены эксперименты по выявлению зависимости длительности вычислений от линейных размеров области. Например, задачи размером свыше 31 млн. отчетов не могут быть рассчитаны на GPU (NVIDIA GeForce GT 240) без применения декомпозиции сеточной области в связи с ограниченностью объема памяти (512 МБ). Декомпозиция на две подобласти позволяет последовательно помещать в глобальную память и проводить расчет по каждой из них, в два раза снижая требования к объему оперативной памяти. Кроме того, достигается ускорение в 2,06 раза за счет снижения числа арифметических операций при декомпозиции.

Abstracts file: Малышева_Головашкин.doc
Full text file: MalyshevaSA.pdf


To reports list
© 1996-2017, Institute of computational technologies of SB RAS, Novosibirsk