Отрывок: Таким образом, исследование проводилось на материале трех коллекций текстов. Полученные результаты сравнены с результатами модели BART, дообученной только на списках ключевых слов, а также ряда моделей для извлечения ключевых слов: 1) TFIDF; 2) TopicRank [10]; 3) KeyBERT [11]; 4) KeyBART [3]. Для реализации моделей использовались библиотеки PKE [12] и Transformers [13]. Качество моделей было оценено с помощью F-меры, рассчитанной на основе к...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Глазкова А. В. | ru |
dc.contributor.author | Морозов Д. А. | ru |
dc.coverage.spatial | BART | ru |
dc.coverage.spatial | генерация текста | ru |
dc.coverage.spatial | автоматическое реферирование текстов | ru |
dc.coverage.spatial | многозадачное обучение | ru |
dc.coverage.spatial | ключевые слова | ru |
dc.coverage.spatial | обработка естественного языка | ru |
dc.coverage.spatial | научный текст | ru |
dc.creator | Глазкова А. В., Морозов Д. А. | ru |
dc.date.accessioned | 2023-10-03 15:45:58 | - |
dc.date.available | 2023-10-03 15:45:58 | - |
dc.date.issued | 2023 | ru |
dc.identifier | RU\НТБ СГАУ\541245 | ru |
dc.identifier.citation | Глазкова, А. В. Многозадачное дообучение для генерации ключевых слов к научным текстам / А. В. Глазкова, Д. А. Морозов // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 4: Искусственный интеллект / под. ред. А. В. Никонорова. - 2023. - С. 040872. | ru |
dc.identifier.uri | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Mnogozadachnoe-doobuchenie-dlya-generacii-kluchevyh-slov-k-nauchnym-tekstam-105729 | - |
dc.description.abstract | В работе исследуется эффективность использования заголовков научных текстов в качестве дополнительной информации при обучении модели генерации списка ключевых слов. Описывается подход к многозадачному дообучению (multi-task fine-tuning) модели BART с помощью управляющих кодов. Показано, что данный подход позволяет улучшить качество BART, обученной для решения только одной задачи. Кроме того, в ряде случаев представленная многозадачная модель превосходит другие современные модели извлечения ключевых слов. | ru |
dc.language.iso | rus | ru |
dc.relation.ispartof | Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 | ru |
dc.source | Информационные технологии и нанотехнологии (ИТНТ-2023). - Т. 4 : Искусственный интеллект | ru |
dc.title | Многозадачное дообучение для генерации ключевых слов к научным текстам | ru |
dc.type | Text | ru |
dc.citation.spage | 040872 | ru |
dc.citation.volume | 4 | ru |
dc.textpart | Таким образом, исследование проводилось на материале трех коллекций текстов. Полученные результаты сравнены с результатами модели BART, дообученной только на списках ключевых слов, а также ряда моделей для извлечения ключевых слов: 1) TFIDF; 2) TopicRank [10]; 3) KeyBERT [11]; 4) KeyBART [3]. Для реализации моделей использовались библиотеки PKE [12] и Transformers [13]. Качество моделей было оценено с помощью F-меры, рассчитанной на основе к... | - |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
978-5-7883-1920-9_2023-040872.pdf | 232.41 kB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.