Отрывок: Метод k-средних разделяет X документов на k кластеров (k ≤ X) , чтобы минимизировать суммарное квадратичное отклонение точек кластеров от центроидов этих кластеров [8]. Минимальное суммарное отклонение рассчитывается по формуле 4. min [∑ ∑ ‖𝑥(𝑗) − 𝑢𝑖‖ 2 𝑥(𝑗)∈𝑆𝑖 𝑘 𝑖=1 ] (4) где ui - центроид для кластера Si 5. Формирование научных групп по заданной тематике. Для реализации предложенного алгоритма был разработа...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Дырночкин А. А. | ru |
dc.contributor.author | Мошкин В. С. | ru |
dc.coverage.spatial | анализ текста | ru |
dc.coverage.spatial | векторизация текстов | ru |
dc.coverage.spatial | кластеризация k-means | ru |
dc.coverage.spatial | кластеризация библиографической информации | ru |
dc.coverage.spatial | извлечение библиографической информации | ru |
dc.coverage.spatial | наукометрический анализ публикаций | ru |
dc.coverage.spatial | парсинг веб-страниц | ru |
dc.creator | Дырночкин А. А., Мошкин В. С. | ru |
dc.date.issued | 2022 | ru |
dc.identifier | RU\НТБ СГАУ\491071 | ru |
dc.identifier.citation | Дырночкин, А. А. Подход к извлечению и кластеризации библиографической информации / А. А. Дырночкин, В. С. Мошкин // Информационные технологии и нанотехнологии (ИТНТ-2022) : сб. тр. по материалам VIII Междунар. конф. и молодеж. шк. (г. Самара, 23 - 27 мая) : в 5 т. / М-во науки и образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - фил. ФНИЦ "Кристаллография и фотоника" РАН. - Самара : Изд-во Самар. ун-та, 2022Т. 4: Искусственный интеллект / под ред. А. В. Никонорова. - 2022. - С. 041172. | ru |
dc.description.abstract | В данной статье представлена система извлечения библиографической информации для последующего наукометрического анализа публикаций. Описан алгоритм загрузки и предобработки статей. Предложен подход для формирования научных групп по заданной тематике посредством кластеризации текстов аннотаций статей. Также в работе представлены результаты экспериментов с данными по статьям из научной библиотеки elibrary. | ru |
dc.language.iso | rus | ru |
dc.relation.ispartof | Информационные технологии и нанотехнологии (ИТНТ-2022) : сб. тр. по материалам VIII Междунар. конф. и молодеж. шк. (г. Самара, 23 - 27 мая) : в 5 т. - | ru |
dc.source | Информационные технологии и нанотехнологии (ИТНТ-2022). - Т. 4 : Искусственный интеллект | ru |
dc.title | Подход к извлечению и кластеризации библиографической информации | ru |
dc.type | Text | ru |
dc.citation.spage | 041172 | ru |
dc.citation.volume | 4 | ru |
dc.textpart | Метод k-средних разделяет X документов на k кластеров (k ≤ X) , чтобы минимизировать суммарное квадратичное отклонение точек кластеров от центроидов этих кластеров [8]. Минимальное суммарное отклонение рассчитывается по формуле 4. min [∑ ∑ ‖𝑥(𝑗) − 𝑢𝑖‖ 2 𝑥(𝑗)∈𝑆𝑖 𝑘 𝑖=1 ] (4) где ui - центроид для кластера Si 5. Формирование научных групп по заданной тематике. Для реализации предложенного алгоритма был разработа... | - |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
ИТНТ-2022. Том 4. Искусственный интеллект/978-5-7883-1792-2_2022-041172.pdf | 957.5 kB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.