Отрывок: Описание вариантов использования приведено в таблице 4. 35 Пользователь Система Ввести ключевые слова Сервер Обратиться по API Вернуть данные Система Вывести результат Пользователь Система Сервер Система Рисунок 9 – Диаграмма вариантов использования 36 Таблица 4 – Таблица вариантов использования № Имя Описание 1 Название Ввести ключевые слова Предусловия Система запущена Актеры Пользоват...
Название : | Исследование и разработка методов сбора, обработки и последующей классификации текстовых данных социальной сети |
Авторы/Редакторы : | Рыцарев И. А. Благов А. В. Иващенко А. В. Министерство образования и науки Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) Институт информатики математики и электроники |
Дата публикации : | 2017 |
Библиографическое описание : | Рыцарев, И. А. Исследование и разработка методов сбора, обработки и последующей классификации текстовых данных социальной сети : вып. квалификац. работа по спец. "Прикладная математика и информатика" / И. А. Рыцарев ; рук. работы А. В. Благов; рец. А. В. Иващенко ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и элект. - Самара, 2017. - on-line |
Аннотация : | Работа посвящена исследованию и разработке алгоритмов классификации текстовых данных социальных сетей. В качестве объекта исследования были выбраны данные социальной сети Twitter. Сбор данных произведен по определенным геолокациям, при этом собирались, обрабатывались и анализировались текстовые данные. Для получения необходимой информации были проведены исследования в области оптимизации сбора данных социальной сети Twitter. Разработано программное средство, обеспечивающее сбор необходимых данных из заданных геолокаций. Исследованы и апробированы существующие алгоритмы кластеризации и последующей классификации данных, преимущественно большого объема, предложены модифицированные распределенные алгоритмы для работы с текстовыми данными коротких сообщений социальной сети Twitter. |
Другие идентификаторы : | RU\НТБ СГАУ\ВКР20170906140515 |
Ключевые слова: | HADOOP данные сверхбольшого объема классификация данных алгоритмы кластеризации данных TF-IDF LDA K-MEANS текстовый анализ |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Рыцарев_Игорь_Андреевич_Исследование_разработка_методов.pdf | 2.28 MB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.