Отрывок: Чтобы учесть дисбаланс классов при оценке моделей для задачи многоклассовой классификации, была использована метрика F1-мера. Была исследована зависимость метрики точности модели от выбора N-грамм (см. Таблицу I). Таблица I. ЗАВИСИМОСТЬ F1-МЕРЫ ДЛЯ КАЖДОЙ МОДЕЛИ В ЗАВИСИМОСТИ ОТ ВЫБОРА N-ГРАММЫ Модель машинного обучения N-грамма Униграмма Биграмма Триграмма Наивный байесовский классификатор 0,67 0,59 0,48 Метод оп...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Баканов Д. С. | ru |
dc.contributor.author | Куприянов А. В. | ru |
dc.coverage.spatial | BERT | ru |
dc.coverage.spatial | TF-IDF | ru |
dc.coverage.spatial | эмоциональный контент | ru |
dc.coverage.spatial | обработка естественного языка | ru |
dc.coverage.spatial | переносимое обучение | ru |
dc.coverage.spatial | оценка эмоционального окраса | ru |
dc.coverage.spatial | социальные сети | ru |
dc.coverage.spatial | статистическое обучение | ru |
dc.coverage.spatial | трансформер | ru |
dc.creator | Баканов Д. С., Куприянов А. В. | ru |
dc.date.accessioned | 2023-10-06 09:21:40 | - |
dc.date.available | 2023-10-06 09:21:40 | - |
dc.date.issued | 2023 | ru |
dc.identifier | RU\НТБ СГАУ\541711 | ru |
dc.identifier.citation | Баканов, Д. С. Построение алгоритма аннотирования русскоязычных текстовых данных социальных сетей с использованием переносимого обучения / Д. С. Баканов, А. В. Куприянов // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 5: Науки о данных / под ред. Е. В. Гошина. - 2023. - С. 050942. | ru |
dc.identifier.uri | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Postroenie-algoritma-annotirovaniya-russkoyazychnyh-tekstovyh-dannyh-socialnyh-setei-s-ispolzovaniem-perenosimogo-obucheniya-106021 | - |
dc.description.abstract | Рассматриваются способы построения алгоритма аннотирования русскоязычных текстов из социальных сетей. В качестве аннотирования будем понимать оценку эмоциональногоокраса текста. Статья затрагивает как классические базовые методы статистического обучения, так и современные методы глубокого обучения, основанные на переносимом обучении и трансформерах. В заключении строится модель, которая совмещает модель трансформера и статистическую модель машинного обучения градиентного бустинга. Актуальность данной работы заключается в создании легковесной и независимой от тематики модели, которую можно использовать для анализа текстового содержимого постовв социальных сетях. | ru |
dc.language.iso | rus | ru |
dc.relation.ispartof | Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 | ru |
dc.source | Информационные технологии и нанотехнологии (ИТНТ-2023). - Т. 5 : Науки о данных | ru |
dc.title | Построение алгоритма аннотирования русскоязычных текстовых данных социальных сетей с использованием переносимого обучения | ru |
dc.type | Text | ru |
dc.citation.spage | 050942 | ru |
dc.citation.volume | 5 | ru |
dc.textpart | Чтобы учесть дисбаланс классов при оценке моделей для задачи многоклассовой классификации, была использована метрика F1-мера. Была исследована зависимость метрики точности модели от выбора N-грамм (см. Таблицу I). Таблица I. ЗАВИСИМОСТЬ F1-МЕРЫ ДЛЯ КАЖДОЙ МОДЕЛИ В ЗАВИСИМОСТИ ОТ ВЫБОРА N-ГРАММЫ Модель машинного обучения N-грамма Униграмма Биграмма Триграмма Наивный байесовский классификатор 0,67 0,59 0,48 Метод оп... | - |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
978-5-7883-1921-6_2023-050942.pdf | 293.4 kB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.