Отрывок: На этом этапе вводится массив весов предложений исходного текста (weightOfSentences). Для подсчет веса каждого предложения необходимо просуммировать веса всех стемм (tempWeight), встречающихся в нем. Вес отдельно взятой стеммы приравнивается к количеству её вхождений во всем тексте. Метод getTotalHits производит подсчет вхождений заданной словоформы во временном файле индексов. После, подсчета весов каждого...
Название : | Автоматизированная система аннотирования текстов на русском языке |
Авторы/Редакторы : | Каназин И. А. Сопченко Е. В. Министерство образования и науки Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) Институт информатики математики и электроники |
Дата публикации : | 2018 |
Библиографическое описание : | Каназин, И. А. Автоматизированная система аннотирования текстов на русском языке : вып. квалификац. работа по спец. "Информатика и вычислительная техника" / И. А. Каназин ; рук. работы Е. В. Сопченко ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и электроники, Фак-т инфор. - Самара, 2018. - on-line |
Аннотация : | Целью выпускной квалификационной работы является разработкаавтоматизированной системы аннотирования текстов на русском языке. Взадачи входит изучение методов аннотирования текста, изучение методоввыделения слов, обзор систем-аналогов и разработка информационно-логического проекта системы.Разрабатываемая система должна обладать достаточным функционаломдля построения общих справочных аннотаций монографического характера свозможностью редактирования объемов свертывания.Система реализована на языке Java с использованием библиотекиполнотекстового поиска Lucene. |
Другие идентификаторы : | RU\НТБ СГАУ\ВКР20180625142238 |
Ключевые слова: | ключевые слова аннотирование текстов автоматизированные системы метод Стемминга лемматизация статистический подход |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Каназин_Илья_Андреевич_Автоматизированная_система_аннотирования_текстов.pdf | 10 MB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.