Отрывок: 7% неестественных текстов. 976 текстов из 41796 были признаны неестественными, что является 2.4% ошибки на базе текстов «ruscorpora». Процент ошибки является приемлемым, а значит если «степень неестественности» текста больше 3, то текст считается неестественным. Метод может успешно использоваться и давать положительный результат для поиска неестественных текстов. И в составе классификатора данный метод поможет опред...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Житкова А. В. | ru |
dc.contributor.author | Кнутова Е. М. | ru |
dc.contributor.author | Пиявский С. А. | ru |
dc.contributor.author | Министерство образования и науки Российской Федерации | ru |
dc.contributor.author | Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) | ru |
dc.contributor.author | Институт информатики | ru |
dc.contributor.author | математики и электроники | ru |
dc.coverage.spatial | тематическое разнообразие | ru |
dc.coverage.spatial | тематическая структура текста | ru |
dc.coverage.spatial | генератор текста | ru |
dc.coverage.spatial | поисковый спам | ru |
dc.coverage.spatial | закон Ципфа | ru |
dc.coverage.spatial | спам | ru |
dc.coverage.spatial | неестественные тексты | ru |
dc.coverage.spatial | F-мера | ru |
dc.coverage.spatial | методы порождения неестественных текстов | ru |
dc.coverage.spatial | методы обнаружения неестественных текстов | ru |
dc.creator | Житкова А. В. | ru |
dc.date.issued | 2017 | ru |
dc.identifier | RU\НТБ СГАУ\ВКР20170220101356 | ru |
dc.identifier.citation | Житкова, А. В. Методы обнаружения неестественных текстов, порожденных на основе обучающей выборки : вып. квалификац. работа по спец. "Компьютерная безопасность" / А. В. Житкова ; рук. работы Е. М. Кнутова; рец. С. А. Пиявский ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и элек. - Самара, 2017. - on-line | ru |
dc.description.abstract | Рассмотрены основные методы создания текстового спама.Проанализированы методы обнаружения неестественных текстов,порожденных на основе обучающей выборки. Реализована программа,выполняющая вычисление параметра тематического разнообразия в законеЦипфа, | ru |
dc.format.extent | Электрон. дан. (1 файл : 0,9 Мб) | ru |
dc.title | Методы обнаружения неестественных текстов, порожденных на основе обучающей выборки | ru |
dc.type | Text | ru |
dc.subject.rugasnti | 50.37.23 | ru |
dc.subject.udc | 004.056 | ru |
dc.textpart | 7% неестественных текстов. 976 текстов из 41796 были признаны неестественными, что является 2.4% ошибки на базе текстов «ruscorpora». Процент ошибки является приемлемым, а значит если «степень неестественности» текста больше 3, то текст считается неестественным. Метод может успешно использоваться и давать положительный результат для поиска неестественных текстов. И в составе классификатора данный метод поможет опред... | - |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Житкова_Анастасия_Владимировна_Методы_обнаружения_неестественных_текстов,.pdf | 877.54 kB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.