Отрывок: Рядом друг с другом в данном случае значит в близких контекстах. Word2vec анализирует контексты употребления слов и делает вывод, что являются или не являются близкими по смыслу. Так как подобные выводы word2vec делает на основа- нии большого количества текста, выводы оказываются вполне адекватными. Алгоритмы, на которых базируется word2vec подробно изложены в работах [1...
Название : | Классификация текстовых данных социальной сети Twitter |
Авторы/Редакторы : | Рыцарев, И.А. Благов, А.В. |
Ключевые слова : | big data обработка данных анализ данных кластеризация классификация TF-IDF latent dirichlet allocation |
Дата публикации : | 2016 |
Издательство : | Издательство СГАУ |
Библиографическое описание : | Материалы Международной конференции и молодёжной школы «Информационные технологии и нанотехнологии», с. 1073-1076 |
Аннотация : | В социальные сети играют большую роль в современном мире, важным при этом является определение значимых и популярных обсуждаемых тем. В данной статье рассматриваются вопросы сбора текстовых данных социальной сети Twitter и дальнейшей кластеризации и классификации собранных данных. |
URI (Унифицированный идентификатор ресурса) : | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Klassifikaciya-tekstovyh-dannyh-socialnoi-seti-Twitter-60919 |
ISBN : | 978-5-7883-1078-7 |
Другие идентификаторы : | Dspace\SGAU\20161219\60919 |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
1073-1076.pdf | Основная статья | 412.58 kB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.