Распознавание печатной формы. Оптимальный алгоритм? Добрый день! Задача состоит в распознавании сканированной печатной формы и конвертации её к html виду. На данный момент я применяю tess4j java-форк библиотеки tesseract. Однако, возникла проблема сегментации изображения на подобласти (div регионы) с целью мак. качества распознавания. Существуют ли другие решения, оч. желатательно freeware?

21 Авг 2019 в 06:08
149 +1
0
Ответы
1

Добрый день! Для задачи распознавания печатной формы и конвертации ее в HTML вид существует несколько алгоритмов и инструментов, которые могут помочь вам. Одним из таких инструментов является OpenCV, который предоставляет богатый набор функций для обработки изображений, включая сегментацию и распознавание текста.

Вы можете использовать OpenCV вместе с другими библиотеками, такими как Tesseract, для достижения лучших результатов в распознавании печатной формы. Кроме того, существуют другие бесплатные инструменты, такие как Keras OCR, которые также могут быть полезны для данной задачи.

Учитывая вашу текущую проблему с сегментацией изображения, рекомендуется изучить возможности OpenCV для этой задачи. Вы также можете обратиться к сообществу разработчиков на форумах или в чатах для получения советов и рекомендаций относительно оптимального подхода к решению данной проблемы.

Надеюсь, эта информация будет полезна для вас. Удачи в вашем проекте!

20 Апр в 13:23
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Название заказа не должно быть пустым
Введите email
Бесплатные доработки
Гарантированные бесплатные доработки
Быстрое выполнение
Быстрое выполнение от 2 часов
Проверка работы
Проверка работы на плагиат
Интересные статьи из справочника
Поможем написать учебную работу
Название заказа не должно быть пустым
Введите email
Доверьте свою работу экспертам
Разместите заказ
Наша система отправит ваш заказ на оценку 92 718 авторам
Первые отклики появятся уже в течение 10 минут
Прямой эфир