Отрывок: е. примерно N e прецедентов не войдут в неё вообще. Построим решающее дерево, которое классифицирует прецеденты данной подвыборки, причём в ходе создания нового узла дерева будем выбирать признак, на основе которого производится разбиение, не из всех M признаков, а только из m случайно выбранных. Наилучший из этих m признаков может выбираться р...
Название : | Сравнительное исследование алгоритмов классификации больших объемов данных |
Авторы/Редакторы : | Ситникова, Н.В. Парингер, Р.А. Куприянов, А.В. |
Ключевые слова : | классификация большие данные параллельные вычисления MapReduce BigData |
Дата публикации : | 2016 |
Издательство : | Издательство СГАУ |
Библиографическое описание : | Материалы Международной конференции и молодёжной школы «Информационные технологии и нанотехнологии», с. 1096-1099 |
Аннотация : | Приводится краткий обзор двух методов классификации: метод ближайшего соседа и случайный лес. Оба метода реализованы с помощью технологии MapReduce, с целью применения к большим объемам данных. Приводится сравнительный анализ результатов, полученных на тестовых данных Heterogeneity Activity Recognition Data Set из репозитория UCI. |
URI (Унифицированный идентификатор ресурса) : | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Sravnitelnoe-issledovanie-algoritmov-klassifikacii-bolshih-obemov-dannyh-60924 |
ISBN : | 978-5-7883-1078-7 |
Другие идентификаторы : | Dspace\SGAU\20161219\60924 |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
1096-1099.pdf | Основная статья | 289.01 kB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.