Назад

Кочуров А.В.   Головашкин Д.Л.  

Решение сеточных уравнений на графических вычислительных устройствах. Метод пирамид

Докладчик: Кочуров А.В.

     Сеточные методы решения дифференциальных уравнений широко применяется для компьютерного моделирования разнообразных явлений в физике, химии, экономике и других отраслях.
     Повышение производительности центральных процессоров (CPU) достигается сегодня путем увеличения числа ядер при малом росте частоты. Однако количество ядер у процессоров x86 из-за недостатков архитектуры сравнительно невелико (достигает 16).
     Архитектура графических процессоров (GPU) изначально разрабатывалась для параллельных вычислений: GPU содержат до сотен ядер и обладают развитыми средствами синхронизации потоков. Во множестве приложений GPU демонстрируют существенно большую производительность, нежели CPU. В частности, для алгоритмов решения сеточных уравнений в среднем достигается десятикратное преимущество в скорости перед CPU. Однако объем видеопамяти недостаточен для многих задач (например, при исследовании и проектировании нанообъектов).
     В предлагаемой публикации описан прием работы с сеточными областями, превышающими объем доступной видеопамяти, основанный на известном методе пирамид, позволяющем сокращать количество коммуникаций между ветвями параллельного алгоритма засчет дублирования вычислений.
      Рассмотрены варианты декомпозицией сеточной области по одной или нескольким пространственным осям на перекрывающиеся подобласти для явной разностной схемы нестационарного уравнения теплопроводности. Предложен метод нахождения оптимальных параметров разбиения, построены теоретические оценки быстродействия параллельного алгоритма.
     Для двумерного случая представлен параллельный алгоритм, реализованный по технологии OpenCL для видеокарты GeForce GT330M. Наилучшее быстродействие достигнуто при одномерной декомпозиции сеточной области на полосы, размер которых ограничивался объемом доступной видеопамяти. В ходе вычислительных экспериментов установлено восьмикратное преимущество в производительности перед программой для CPU Intel Core i5 M430. Теоретические оценки быстродействия подтверждены с точностью 5-7%%.
     Приведенный метод актуален для решения других дифференциальных уравнений, предполагается его применение для метода FDTD для задач электродинамики.

Файл тезисов: тезисы3.doc
Файл с полным текстом: kochurov_final.pdf


К списку докладов