Разработка и исследование алгоритмов кластеризации данных сверхбольшого объема

Рыцарев, И.А.; Благов, А.В.

Отрывок: Совместное распределение тогда выглядит так: (2) В отличие от обычной кластеризации с априорным распределением Дирихле или обычным распределением Байеса, мы не выбираем кластер один раз, а затем «накидываем» слова из этого кластера, а для каждого слова сначала выбираем по распределению θ тему, а уже потом «набрасываем» это слово по данной теме. [18] В ходе работы э...

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Рыцарев, И.А.	-
dc.contributor.author	Благов, А.В.	-
dc.date.accessioned	2017-05-25 13:46:45	-
dc.date.available	2017-05-25 13:46:45	-
dc.date.issued	2017	-
dc.identifier	Dspace\SGAU\20170523\64149	ru
dc.identifier.citation	Рыцарев И.А. Разработка и исследование алгоритмов кластеризации данных сверхбольшого объема / И.А. Рыцарев, А.В. Благов // Сборник трудов III международной конференции и молодежной школы «Информационные технологии и нанотехнологии» (ИТНТ-2017) - Самара: Новая техника, 2017. - С. 1774-1777.	ru
dc.identifier.uri	http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Razrabotka-i-issledovanie-algoritmov-klasterizacii-dannyh-sverhbolshogo-obema-64149	-
dc.description.abstract	Работа посвящена исследованию алгоритмов кластеризации текстовых данных. В качестве объекта исследования были выбраны данные социальной сети Twitter. Собирались, обрабатывались и анализировались при этом текстовые данные. Для решения задачи получения необходимой информации были проведены исследования в области оптимизации сбора данных социальной сети Twitter. Разработано программное средство, обеспечивающее сбор необходимых данных из заданных геолокаций. Исследованы и апробированы существующие алгоритмы кластеризации данных, преимущественно большого объема.	ru
dc.language.iso	rus	ru
dc.publisher	Новая техника	ru
dc.subject	алгоритмы кластеризации данных	ru
dc.subject	данные сверхбольшого объема	ru
dc.subject	текстовый анализ	ru
dc.subject	k-means	ru
dc.subject	tf-idf метрика	ru
dc.subject	lda	ru
dc.subject	метод судьи	ru
dc.title	Разработка и исследование алгоритмов кластеризации данных сверхбольшого объема	ru
dc.type	Article	ru
dc.textpart	Совместное распределение тогда выглядит так: (2) В отличие от обычной кластеризации с априорным распределением Дирихле или обычным распределением Байеса, мы не выбираем кластер один раз, а затем «накидываем» слова из этого кластера, а для каждого слова сначала выбираем по распределению θ тему, а уже потом «набрасываем» это слово по данной теме. [18] В ходе работы э...	-
Располагается в коллекциях:	Информационные технологии и нанотехнологии

Файлы этого ресурса:

Файл	Описание	Размер	Формат
paper 319_1774-1777.pdf	Основная статья. Раздел: Наука о данных	832.21 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета