Отрывок: Определяется точность распознавания с помощью расстояния Левенштейна (см. формулу 19). В качестве входных данных использовались фотографии печатного текста, которые подвергались различного рода помехам. Помехи были разделены по следующим группам: − затенения и засветы; − монохромный и цветной шум; − помехи во время съемки; − пуассоновский и лаплассовский шум; − различная четкость и насыщенность; − физические помехи. Автоматизиров...
Название : | Исследование методов предварительной обработки изображений в задаче распознавания текста |
Авторы/Редакторы : | Ефимов А. А. Кудрина М. А. Соловьева Я. В. Министерство образования и науки Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) Институт информатики математики и электроники |
Дата публикации : | 2020 |
Библиографическое описание : | Ефимов, А. А. Исследование методов предварительной обработки изображений в задаче распознавания текста : вып. квалификац. работа по направлению подгот. 09.04.01 "Информатика и вычислительная техника" (уровень магистратуры) / А. А. Ефимов ; рук. работы М. А. Кудрина ; нормоконтролер Я. В. Соловьева ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, матема. - Самара, 2020. - on-line |
Аннотация : | Целью настоящей работы является разработка и реализация программного обеспечения для исследования влияния различных алгоритмов бинаризации изображения на решение задачи распознавания текста. В системе были реализованы следующие алгоритмы: бинаризация с нижним порогом, бинаризация с двойным ограничением, метод Брэдли, метод Саувола, метод Оцу, медианная фильтрация, подсчет точности распознавания с помощью расстояния Левенштейна. Тестирование разработанной системы производилось с использованием фотографий с различными видами искажений. Полученные результаты были показаны на графиках, наглядно показывающих, какие методы являются наиболее подходящими для каждого вида искажений. Создана информационно-логическая модель программной системы в нотации UML с помощью CASE-средства StarUML. Система реализована на языке Java в интегрированной среде разработки IntelliJ IDEA, пользовательский интерфейс реализован на основе фреймворка JavaFX. |
Другие идентификаторы : | RU\НТБ СГАУ\ВКР20200914101851 |
Ключевые слова: | алгоритм Брэдли Tesseract бинаризация интегральные изображения расстояние Левенштейна распознавание текстов удаление шумов |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Ефимов_Артем_Андреевич_Исследование_методов_предварительной_обработки.pdf | 2.14 MB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.