Отрывок: Совместное распределение тогда выглядит так: (2) В отличие от обычной кластеризации с априорным распределением Дирихле или обычным распределением Байеса, мы не выбираем кластер один раз, а затем «накидываем» слова из этого кластера, а для каждого слова сначала выбираем по распределению θ тему, а уже потом «набрасываем» это слово по данной теме. [18] В ходе работы э...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Рыцарев, И.А. | - |
dc.contributor.author | Благов, А.В. | - |
dc.date.accessioned | 2017-05-25 13:46:45 | - |
dc.date.available | 2017-05-25 13:46:45 | - |
dc.date.issued | 2017 | - |
dc.identifier | Dspace\SGAU\20170523\64149 | ru |
dc.identifier.citation | Рыцарев И.А. Разработка и исследование алгоритмов кластеризации данных сверхбольшого объема / И.А. Рыцарев, А.В. Благов // Сборник трудов III международной конференции и молодежной школы «Информационные технологии и нанотехнологии» (ИТНТ-2017) - Самара: Новая техника, 2017. - С. 1774-1777. | ru |
dc.identifier.uri | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Razrabotka-i-issledovanie-algoritmov-klasterizacii-dannyh-sverhbolshogo-obema-64149 | - |
dc.description.abstract | Работа посвящена исследованию алгоритмов кластеризации текстовых данных. В качестве объекта исследования были выбраны данные социальной сети Twitter. Собирались, обрабатывались и анализировались при этом текстовые данные. Для решения задачи получения необходимой информации были проведены исследования в области оптимизации сбора данных социальной сети Twitter. Разработано программное средство, обеспечивающее сбор необходимых данных из заданных геолокаций. Исследованы и апробированы существующие алгоритмы кластеризации данных, преимущественно большого объема. | ru |
dc.language.iso | rus | ru |
dc.publisher | Новая техника | ru |
dc.subject | алгоритмы кластеризации данных | ru |
dc.subject | данные сверхбольшого объема | ru |
dc.subject | текстовый анализ | ru |
dc.subject | k-means | ru |
dc.subject | tf-idf метрика | ru |
dc.subject | lda | ru |
dc.subject | метод судьи | ru |
dc.title | Разработка и исследование алгоритмов кластеризации данных сверхбольшого объема | ru |
dc.type | Article | ru |
dc.textpart | Совместное распределение тогда выглядит так: (2) В отличие от обычной кластеризации с априорным распределением Дирихле или обычным распределением Байеса, мы не выбираем кластер один раз, а затем «накидываем» слова из этого кластера, а для каждого слова сначала выбираем по распределению θ тему, а уже потом «набрасываем» это слово по данной теме. [18] В ходе работы э... | - |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
paper 319_1774-1777.pdf | Основная статья. Раздел: Наука о данных | 832.21 kB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.