Многозадачное дообучение для генерации ключевых слов к научным текстам

Глазкова А. В.; Морозов Д. А.

Отрывок: Таким образом, исследование проводилось на материале трех коллекций текстов. Полученные результаты сравнены с результатами модели BART, дообученной только на списках ключевых слов, а также ряда моделей для извлечения ключевых слов: 1) TFIDF; 2) TopicRank [10]; 3) KeyBERT [11]; 4) KeyBART [3]. Для реализации моделей использовались библиотеки PKE [12] и Transformers [13]. Качество моделей было оценено с помощью F-меры, рассчитанной на основе к...

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Глазкова А. В.	ru
dc.contributor.author	Морозов Д. А.	ru
dc.coverage.spatial	BART	ru
dc.coverage.spatial	генерация текста	ru
dc.coverage.spatial	автоматическое реферирование текстов	ru
dc.coverage.spatial	многозадачное обучение	ru
dc.coverage.spatial	ключевые слова	ru
dc.coverage.spatial	обработка естественного языка	ru
dc.coverage.spatial	научный текст	ru
dc.creator	Глазкова А. В., Морозов Д. А.	ru
dc.date.accessioned	2023-10-03 15:45:58	-
dc.date.available	2023-10-03 15:45:58	-
dc.date.issued	2023	ru
dc.identifier	RU\НТБ СГАУ\541245	ru
dc.identifier.citation	Глазкова, А. В. Многозадачное дообучение для генерации ключевых слов к научным текстам / А. В. Глазкова, Д. А. Морозов // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 4: Искусственный интеллект / под. ред. А. В. Никонорова. - 2023. - С. 040872.	ru
dc.identifier.uri	http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Mnogozadachnoe-doobuchenie-dlya-generacii-kluchevyh-slov-k-nauchnym-tekstam-105729	-
dc.description.abstract	В работе исследуется эффективность использования заголовков научных текстов в качестве дополнительной информации при обучении модели генерации списка ключевых слов. Описывается подход к многозадачному дообучению (multi-task fine-tuning) модели BART с помощью управляющих кодов. Показано, что данный подход позволяет улучшить качество BART, обученной для решения только одной задачи. Кроме того, в ряде случаев представленная многозадачная модель превосходит другие современные модели извлечения ключевых слов.	ru
dc.language.iso	rus	ru
dc.relation.ispartof	Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6	ru
dc.source	Информационные технологии и нанотехнологии (ИТНТ-2023). - Т. 4 : Искусственный интеллект	ru
dc.title	Многозадачное дообучение для генерации ключевых слов к научным текстам	ru
dc.type	Text	ru
dc.citation.spage	040872	ru
dc.citation.volume	4	ru
dc.textpart	Таким образом, исследование проводилось на материале трех коллекций текстов. Полученные результаты сравнены с результатами модели BART, дообученной только на списках ключевых слов, а также ряда моделей для извлечения ключевых слов: 1) TFIDF; 2) TopicRank [10]; 3) KeyBERT [11]; 4) KeyBART [3]. Для реализации моделей использовались библиотеки PKE [12] и Transformers [13]. Качество моделей было оценено с помощью F-меры, рассчитанной на основе к...	-
Располагается в коллекциях:	Информационные технологии и нанотехнологии

Файлы этого ресурса:

Файл	Размер	Формат
978-5-7883-1920-9_2023-040872.pdf	232.41 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета