Отрывок: Рассмотрен и реализован алгоритм Шинглов, предназначенный для поиска «нечетких дубликатов» текста. Создан и реализован алгоритм оп­ ределения тематики текста. Использован аппарат теории нейронных сетей. Решена проблема определения начальной формы слов. Собрана база слов, не несущих семантического веса. Проведен анализ омонимии, явления на­ личия в языке слов одинаковых по написанию, но разных по значению. Алгоритм скорректирован для работы не только...
Название : Автоматизированное определение тематики уникального текста
Авторы/Редакторы : Шумович А.
Русакова М. С.
Дата публикации : 2011
Библиографическое описание : Шумович, А. Автоматизированное определение тематики уникального текста / А. Шумович ; научный руководитель М. С. Русакова // Сорок вторая (XLII) научная конференция студентов : 4-9 апр. 2011 г., Самара, Россия : тез. докл. / М-во образования и науки Рос. Федерации, Самар. гос. ун-т. - Самара : Изд-во "Самар. ун-т", 2011Ч. 1: / [отв. за вып. Н. С. Комарова, Л. А. Свистунова]. - 2011. - С. 49-50.
Другие идентификаторы : RU\НТБ СГАУ\445240
Ключевые слова: алгоритм шинглов
определение тематики текста
определение уникальности текста
Располагается в коллекциях: Сорок вторая (XLII) научная конференция студентов

Файлы этого ресурса:
Файл Размер Формат  
XLII Научная конференция-49-50.pdf1.22 MBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.