Отрывок: На втором этапе для вычисления 𝑥𝑖′ используются значения 𝑘𝑖 (𝑞) и 𝑏𝑖 (𝑞) . Таким образом, на втором этапе каждой нити необходимо единовременно хранить в разделяемой памяти по одному элементу массивов коэффициентов и массива 𝑥. Реализация алгоритма PARACR на GPU с использованием разделяемой памяти происходит по схеме, описанной в пункте 1.3. Опишем алгоритм функции ядра. На первом этап...
Название : | Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве |
Авторы/Редакторы : | Погорельских К. С. Логанова Л. В. Суханов С. В. Министерство образования и науки Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) Институт информатики математики и электроники |
Дата публикации : | 2018 |
Библиографическое описание : | Погорельских, К. С. Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве : вып. квалификац. работа по направлению подгот."Прикладная математика и информатика" (уровень бакалавриата) / К. С. Погорельских ; рук. работы Л. В. Логанова ; нормоконтролер С. В. Суханов ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, м. - Самаpа, 2018. - on-line |
Аннотация : | Целью данной работы является реализация и исследование существующих алгоритмов решения СЛАУ трехдиагонального вида, основанных на методе прогонки и алгоритме циклической редукции с использованием программно-аппаратной архитектуры CUDA (с применением разделяемой и глобальной памяти).Рассмотрены алгоритм прогонки и алгоритм циклической редукции. Изучены основы работы с технологией CUDA, особенности взаимодействия с разными типами памяти.Разработаны и исследованы компьютерные программы, реализующие алгоритм прогонки и две версии алгоритма циклической редукции на CPU, на GPU без использования разделяемой памяти и на GPU с использованием разделяемой памяти.Программа написана на языке С++. |
Другие идентификаторы : | RU\НТБ СГАУ\ВКР20180907144745 |
Ключевые слова: | параллельные алгоритмы разделяемая память метод прогонки циклическая редукция графический процессор глобальная память |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Погорельских_Ксения_Сергеевна_Реализация_исследование_параллельного.pdf | 2.05 MB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.