Отрывок: Затем происходит спад ускорения, поскольку высоки затраты на обмен данными с графическим устройством. Пиковое значение ускорения приближается к значению 3,3. 27 Можно предположить, что при увеличении размера блока мы сможем добиться большего ускорения. Проведем аналогичные эксперименты при размере блока равном 5120. Результаты вычислительных экспериментов по блочному р...
Название : | Исследование эффективности реализации разложения Холецкого плотной матрицы на графическом процессоре с помощью языка программирования CUDA Fortran |
Авторы/Редакторы : | Шаркунов А. В. Головашкин Д. Л. Востокин С. В. Министерство образования и науки Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) Институт информатики математики и электроники |
Дата публикации : | 2017 |
Библиографическое описание : | Шаркунов, А. В. Исследование эффективности реализации разложения Холецкого плотной матрицы на графическом процессоре с помощью языка программирования CUDA Fortran : вып. квалификац. работа по спец. "Прикладная математика и информатика" / А. В. Шаркунов ; рук. работы Д. Л. Головашкин; рец. С. В. Востокин ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и. - Самара, 2017. - on-line |
Аннотация : | Объектом исследования является блочный алгоритм разложенияХолецкого для плотных матриц.Цель работы – реализация разложения Холецкого плотной матрицы награфическом процессоре с помощью языка программирования CUDA Fortran.Разработана программная реализация блочного алгоритма Холецкогоплотной матрицы на графическом процессоре с помощью языкапрограммирования CUDA Fortran. В ходе исследования эффективностиалгоритма было получено ускорение в 6,3 раз по сравнению с реализацией нацентральном процессоре. |
Другие идентификаторы : | RU\НТБ СГАУ\ВКР20170919160427 |
Ключевые слова: | плотные матрицы язык программирования CUDA Fortran блочный алгоритм векторный алгоритм вычислительные эксперименты разложение Холецкого графические процессоры |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Шаркунов_Александр_Владимирович_Исследование_эффективности_реализации_разложения.pdf | 11.06 MB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.