Отрывок: Для выполнения процедуры проверки орфографии в рамках данной работы использовалась сторонняя библиотека. Параллельно производится учёт количества постов и комментариев. После выполнения описанных этапов, подсчёт количества вхождений каждого уникального слова w во всём множестве S текстовых данных осуще...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Рыцарев, И.А. | - |
dc.contributor.author | Парингер, Р.А. | - |
dc.contributor.author | Куприянов, А.В. | - |
dc.contributor.author | Rytsarev, I.A. | - |
dc.contributor.author | Paringer, R.A. | - |
dc.contributor.author | Kupriyanov, A.V. | - |
dc.date.accessioned | 2019-04-22 11:40:03 | - |
dc.date.available | 2019-04-22 11:40:03 | - |
dc.date.issued | 2019-05 | - |
dc.identifier | Dspace\SGAU\20190421\75722 | ru |
dc.identifier.citation | Рыцарев И.А. Применение метода главных компонент для выявления семантических различий и анализа изменения положения в пространстве при анализе информационного контента сетевых сообществ / Рыцарев И.А., Парингер Р.А., Куприянов А.В. // Сборник трудов ИТНТ-2019 [Текст]: V междунар. конф. и молодеж. шк. "Информ. технологии и нанотехнологии": 21-24 мая: в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В.А. Фурсова]. - Самара: Новая техника, 2019 – Т. 4: Науки о данных. - 2019 - С. 780-787. | ru |
dc.identifier.uri | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Primenenie-metoda-glavnyh-komponent-dlya-vyyavleniya-semanticheskih-razlichiĭ-i-analiza-izmeneniya-polozheniya-v-prostranstve-pri-analize-informacionnogo-kontenta-setevyh-soobshestv-75722 | - |
dc.description.abstract | В работе мы предлагаем подход к анализу социальных групп и их положения относительно друг друга на основе выявления семантических различий в текстах, представленных в виде частотных словарей. Исходные текстовые данные мы получили путём сбора записей тематических интернет-сообществ. Для сбора записей мы реализовали специализированный программный модуль, позволяющий анализировать и загружать как посты, так и комментарии из интересующих открытых сообществ социальной сети ВКонтакте. Для составления частотного словаря, мы разработали, алгоритм, который учитывает особенности данных, собираемых из социальных сетей. В статье мы предлагаем подход, основанный на использовании методов снижения размерности пространств признаков, для выявления ключевых слов на основе анализа частоты их употребления. Алгоритм, который мы представили, использует метод главных компонент. В результате работы мы показали, что, используя коэффициенты полученного линейного преобразования можно оценить значимость слов. С использованием полученных оценок, мы не только смогли выявить не только ключевые слова, но и составить семантические различия в сообществах социальных сетей, а так же построить графики изменения положения этих групп в пространстве относительно друг друга. | ru |
dc.description.sponsorship | Работа выполнена при частичной поддержке Федерального агентства научных организаций (соглашение No 007-ГЗ/Ч3363/26); Министерства образования и науки РФ в рамках реализации мероприятий Программы повышения конкурентоспособности Самарского Университета среди ведущих мировых научно-образовательных центров на 2013–2020 годы; грантов РФФИ No 16- 41-630761, No 17-01-00972, No 18-37-00418; в рамках госзадания по теме No 0026-2018-0102 "Оптоинформационные технологии получения и обработки гиперспектральных данных". | ru |
dc.language.iso | rus | ru |
dc.publisher | Новая техника | ru |
dc.title | Применение метода главных компонент для выявления семантических различий и анализа изменения положения в пространстве при анализе информационного контента сетевых сообществ | ru |
dc.title.alternative | Analysis of components to identify semantic proximity and analyzing changes in position in space in tasks of content analysis of social networks | ru |
dc.type | Article | ru |
dc.textpart | Для выполнения процедуры проверки орфографии в рамках данной работы использовалась сторонняя библиотека. Параллельно производится учёт количества постов и комментариев. После выполнения описанных этапов, подсчёт количества вхождений каждого уникального слова w во всём множестве S текстовых данных осуще... | - |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
paper98.pdf | Основная статья | 274.75 kB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.