Отрывок: Затем происходит спад ускорения, поскольку высоки затраты на обмен данными с графическим устройством. Пиковое значение ускорения приближается к значению 3,3. 27 Можно предположить, что при увеличении размера блока мы сможем добиться большего ускорения. Проведем аналогичные эксперименты при размере блока равном 5120. Результаты вычислительных экспериментов по блочному р...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Шаркунов А. В. | ru |
dc.contributor.author | Головашкин Д. Л. | ru |
dc.contributor.author | Востокин С. В. | ru |
dc.contributor.author | Министерство образования и науки Российской Федерации | ru |
dc.contributor.author | Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) | ru |
dc.contributor.author | Институт информатики | ru |
dc.contributor.author | математики и электроники | ru |
dc.coverage.spatial | плотные матрицы | ru |
dc.coverage.spatial | язык программирования CUDA Fortran | ru |
dc.coverage.spatial | блочный алгоритм | ru |
dc.coverage.spatial | векторный алгоритм | ru |
dc.coverage.spatial | вычислительные эксперименты | ru |
dc.coverage.spatial | разложение Холецкого | ru |
dc.coverage.spatial | графические процессоры | ru |
dc.creator | Шаркунов А. В. | ru |
dc.date.issued | 2017 | ru |
dc.identifier | RU\НТБ СГАУ\ВКР20170919160427 | ru |
dc.identifier.citation | Шаркунов, А. В. Исследование эффективности реализации разложения Холецкого плотной матрицы на графическом процессоре с помощью языка программирования CUDA Fortran : вып. квалификац. работа по спец. "Прикладная математика и информатика" / А. В. Шаркунов ; рук. работы Д. Л. Головашкин; рец. С. В. Востокин ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и. - Самара, 2017. - on-line | ru |
dc.description.abstract | Объектом исследования является блочный алгоритм разложенияХолецкого для плотных матриц.Цель работы – реализация разложения Холецкого плотной матрицы награфическом процессоре с помощью языка программирования CUDA Fortran.Разработана программная реализация блочного алгоритма Холецкогоплотной матрицы на графическом процессоре с помощью языкапрограммирования CUDA Fortran. В ходе исследования эффективностиалгоритма было получено ускорение в 6,3 раз по сравнению с реализацией нацентральном процессоре. | ru |
dc.format.extent | Электрон. дан. (1 файл : 10,8 Мб) | ru |
dc.title | Исследование эффективности реализации разложения Холецкого плотной матрицы на графическом процессоре с помощью языка программирования CUDA Fortran | ru |
dc.type | Text | ru |
dc.subject.rugasnti | 50.01 | ru |
dc.subject.udc | 004.9 | ru |
dc.textpart | Затем происходит спад ускорения, поскольку высоки затраты на обмен данными с графическим устройством. Пиковое значение ускорения приближается к значению 3,3. 27 Можно предположить, что при увеличении размера блока мы сможем добиться большего ускорения. Проведем аналогичные эксперименты при размере блока равном 5120. Результаты вычислительных экспериментов по блочному р... | - |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Шаркунов_Александр_Владимирович_Исследование_эффективности_реализации_разложения.pdf | 11.06 MB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.