Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве

Погорельских К. С.; Логанова Л. В.; Суханов С. В.; Институт информатики; Министерство образования и науки Российской Федерации; математики и электроники; Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)

Отрывок: На втором этапе для вычисления 𝑥𝑖′ используются значения 𝑘𝑖 (𝑞) и 𝑏𝑖 (𝑞) . Таким образом, на втором этапе каждой нити необходимо единовременно хранить в разделяемой памяти по одному элементу массивов коэффициентов и массива 𝑥. Реализация алгоритма PARACR на GPU с использованием разделяемой памяти происходит по схеме, описанной в пункте 1.3. Опишем алгоритм функции ядра. На первом этап...

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Погорельских К. С.	ru
dc.contributor.author	Логанова Л. В.	ru
dc.contributor.author	Суханов С. В.	ru
dc.contributor.author	Министерство образования и науки Российской Федерации	ru
dc.contributor.author	Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)	ru
dc.contributor.author	Институт информатики	ru
dc.contributor.author	математики и электроники	ru
dc.coverage.spatial	параллельные алгоритмы	ru
dc.coverage.spatial	разделяемая память	ru
dc.coverage.spatial	метод прогонки	ru
dc.coverage.spatial	циклическая редукция	ru
dc.coverage.spatial	графический процессор	ru
dc.coverage.spatial	глобальная память	ru
dc.creator	Погорельских К. С.	ru
dc.date.issued	2018	ru
dc.identifier	RU\НТБ СГАУ\ВКР20180907144745	ru
dc.identifier.citation	Погорельских, К. С. Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве : вып. квалификац. работа по направлению подгот."Прикладная математика и информатика" (уровень бакалавриата) / К. С. Погорельских ; рук. работы Л. В. Логанова ; нормоконтролер С. В. Суханов ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, м. - Самаpа, 2018. - on-line	ru
dc.description.abstract	Целью данной работы является реализация и исследование существующих алгоритмов решения СЛАУ трехдиагонального вида, основанных на методе прогонки и алгоритме циклической редукции с использованием программно-аппаратной архитектуры CUDA (с применением разделяемой и глобальной памяти).Рассмотрены алгоритм прогонки и алгоритм циклической редукции. Изучены основы работы с технологией CUDA, особенности взаимодействия с разными типами памяти.Разработаны и исследованы компьютерные программы, реализующие алгоритм прогонки и две версии алгоритма циклической редукции на CPU, на GPU без использования разделяемой памяти и на GPU с использованием разделяемой памяти.Программа написана на языке С++.	ru
dc.format.extent	Электрон. дан. (1 файл : 2,0 Мб)	ru
dc.title	Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве	ru
dc.type	Text	ru
dc.subject.rugasnti	50.01	ru
dc.subject.udc	004.9	ru
dc.textpart	На втором этапе для вычисления 𝑥𝑖′ используются значения 𝑘𝑖 (𝑞) и 𝑏𝑖 (𝑞) . Таким образом, на втором этапе каждой нити необходимо единовременно хранить в разделяемой памяти по одному элементу массивов коэффициентов и массива 𝑥. Реализация алгоритма PARACR на GPU с использованием разделяемой памяти происходит по схеме, описанной в пункте 1.3. Опишем алгоритм функции ядра. На первом этап...	-
Располагается в коллекциях:	Выпускные квалификационные работы

Файлы этого ресурса:

Файл	Размер	Формат
Погорельских_Ксения_Сергеевна_Реализация_исследование_параллельного.pdf	2.05 MB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета