Отрывок: На этом этапе вводится массив весов предложений исходного текста (weightOfSentences). Для подсчет веса каждого предложения необходимо просуммировать веса всех стемм (tempWeight), встречающихся в нем. Вес отдельно взятой стеммы приравнивается к количеству её вхождений во всем тексте. Метод getTotalHits производит подсчет вхождений заданной словоформы во временном файле индексов. После, подсчета весов каждого...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Каназин И. А. | ru |
dc.contributor.author | Сопченко Е. В. | ru |
dc.contributor.author | Министерство образования и науки Российской Федерации | ru |
dc.contributor.author | Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) | ru |
dc.contributor.author | Институт информатики | ru |
dc.contributor.author | математики и электроники | ru |
dc.coverage.spatial | ключевые слова | ru |
dc.coverage.spatial | аннотирование текстов | ru |
dc.coverage.spatial | автоматизированные системы | ru |
dc.coverage.spatial | метод Стемминга | ru |
dc.coverage.spatial | лемматизация | ru |
dc.coverage.spatial | статистический подход | ru |
dc.creator | Каназин И. А. | ru |
dc.date.issued | 2018 | ru |
dc.identifier | RU\НТБ СГАУ\ВКР20180625142238 | ru |
dc.identifier.citation | Каназин, И. А. Автоматизированная система аннотирования текстов на русском языке : вып. квалификац. работа по спец. "Информатика и вычислительная техника" / И. А. Каназин ; рук. работы Е. В. Сопченко ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и электроники, Фак-т инфор. - Самара, 2018. - on-line | ru |
dc.description.abstract | Целью выпускной квалификационной работы является разработкаавтоматизированной системы аннотирования текстов на русском языке. Взадачи входит изучение методов аннотирования текста, изучение методоввыделения слов, обзор систем-аналогов и разработка информационно-логического проекта системы.Разрабатываемая система должна обладать достаточным функционаломдля построения общих справочных аннотаций монографического характера свозможностью редактирования объемов свертывания.Система реализована на языке Java с использованием библиотекиполнотекстового поиска Lucene. | ru |
dc.format.extent | Электрон. дан. (1 файл : 9,8 Мб) | ru |
dc.title | Автоматизированная система аннотирования текстов на русском языке | ru |
dc.type | Text | ru |
dc.subject.rugasnti | 50.01 | ru |
dc.subject.udc | 004.9 | ru |
dc.textpart | На этом этапе вводится массив весов предложений исходного текста (weightOfSentences). Для подсчет веса каждого предложения необходимо просуммировать веса всех стемм (tempWeight), встречающихся в нем. Вес отдельно взятой стеммы приравнивается к количеству её вхождений во всем тексте. Метод getTotalHits производит подсчет вхождений заданной словоформы во временном файле индексов. После, подсчета весов каждого... | - |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Каназин_Илья_Андреевич_Автоматизированная_система_аннотирования_текстов.pdf | 10 MB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.