Отрывок: На втором этапе для вычисления 𝑥𝑖′ используются значения 𝑘𝑖 (𝑞) и 𝑏𝑖 (𝑞) . Таким образом, на втором этапе каждой нити необходимо единовременно хранить в разделяемой памяти по одному элементу массивов коэффициентов и массива 𝑥. Реализация алгоритма PARACR на GPU с использованием разделяемой памяти происходит по схеме, описанной в пункте 1.3. Опишем алгоритм функции ядра. На первом этап...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Погорельских К. С. | ru |
dc.contributor.author | Логанова Л. В. | ru |
dc.contributor.author | Суханов С. В. | ru |
dc.contributor.author | Министерство образования и науки Российской Федерации | ru |
dc.contributor.author | Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) | ru |
dc.contributor.author | Институт информатики | ru |
dc.contributor.author | математики и электроники | ru |
dc.coverage.spatial | параллельные алгоритмы | ru |
dc.coverage.spatial | разделяемая память | ru |
dc.coverage.spatial | метод прогонки | ru |
dc.coverage.spatial | циклическая редукция | ru |
dc.coverage.spatial | графический процессор | ru |
dc.coverage.spatial | глобальная память | ru |
dc.creator | Погорельских К. С. | ru |
dc.date.issued | 2018 | ru |
dc.identifier | RU\НТБ СГАУ\ВКР20180907144745 | ru |
dc.identifier.citation | Погорельских, К. С. Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве : вып. квалификац. работа по направлению подгот."Прикладная математика и информатика" (уровень бакалавриата) / К. С. Погорельских ; рук. работы Л. В. Логанова ; нормоконтролер С. В. Суханов ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, м. - Самаpа, 2018. - on-line | ru |
dc.description.abstract | Целью данной работы является реализация и исследование существующих алгоритмов решения СЛАУ трехдиагонального вида, основанных на методе прогонки и алгоритме циклической редукции с использованием программно-аппаратной архитектуры CUDA (с применением разделяемой и глобальной памяти).Рассмотрены алгоритм прогонки и алгоритм циклической редукции. Изучены основы работы с технологией CUDA, особенности взаимодействия с разными типами памяти.Разработаны и исследованы компьютерные программы, реализующие алгоритм прогонки и две версии алгоритма циклической редукции на CPU, на GPU без использования разделяемой памяти и на GPU с использованием разделяемой памяти.Программа написана на языке С++. | ru |
dc.format.extent | Электрон. дан. (1 файл : 2,0 Мб) | ru |
dc.title | Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве | ru |
dc.type | Text | ru |
dc.subject.rugasnti | 50.01 | ru |
dc.subject.udc | 004.9 | ru |
dc.textpart | На втором этапе для вычисления 𝑥𝑖′ используются значения 𝑘𝑖 (𝑞) и 𝑏𝑖 (𝑞) . Таким образом, на втором этапе каждой нити необходимо единовременно хранить в разделяемой памяти по одному элементу массивов коэффициентов и массива 𝑥. Реализация алгоритма PARACR на GPU с использованием разделяемой памяти происходит по схеме, описанной в пункте 1.3. Опишем алгоритм функции ядра. На первом этап... | - |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Погорельских_Ксения_Сергеевна_Реализация_исследование_параллельного.pdf | 2.05 MB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.