3 онлайн-услуги OCR для преобразования отсканированных документов в текст

  • Brian Curtis
  • 0
  • 894
  • 73
Реклама

OCR расшифровывается как оптическое распознавание символов.

Технология восходит к концу 1920-х годов, когда в Германии был выдан первый патент OCR. Сегодня OCR в основном используется для преобразования отсканированных документов в текст. Это может пригодиться, если вы хотите использовать текст из изображения или редактировать отсканированный документ.

В этой статье я опишу три бесплатных онлайн-сервиса OCR, которые предлагают самые всесторонние функции и лучшее качество.

OnlineOCR

Этот сервис может распознавать текст и символы из файлов PDF и изображений и преобразовывать их в несколько форматов файлов, включая PDF и Microsoft Word. Исходное форматирование, такое как таблицы, столбцы, маркеры и графика, будет сохранено. Эта последняя функция редко встречается среди веб-сервисов OCR..

Вы можете использовать онлайн-сервис ocr без регистрации, однако вы столкнетесь с несколькими ограничениями. Вы можете загрузить один файл размером не более 1 МБ, распознаваемый язык установлен на английский по умолчанию и не может быть изменен, а на выходе получается обычный текст без форматирования.

Если вы решите зарегистрироваться, вы сможете выбрать один из нескольких языков распознавания и форматов вывода, а также загрузить несколько файлов одновременно объемом до 30 МБ. Вы начнете с 5 кредитов, тогда как один кредит позволяет загрузить один файл изображения (один или несколько страниц) и распознать одну страницу.

Если вы не хотите использовать кредит, вы можете проверить> Демонстрационный режим чтобы увидеть предварительный просмотр и понять, чего ожидать. Вы можете приобрести дополнительные кредиты, начиная с 6 центов за страницу.

Я проверил сервис с отсканированным официальным письмом. Отсканированное изображение содержало четкие складывающиеся края и штриховку. Тем не менее, распознавание форматирования и текста работали безупречно. К сожалению, этот сервис не распознает рукописный текст.

NewOCR

Бесплатный онлайн OCR прост. Количество загрузок не ограничено. Размер файла не может превышать 5 МБ для файлов изображений и 20 МБ для документов PDF. При загрузке файла для оптического распознавания символов вы можете выбрать язык для оптимизированных результатов и повернуть документ. Регистрация не требуется.

К сожалению, все форматирование потеряно, и Free Online OCR не распознает рукописный текст. Более того, в моем тестовом документе некоторые части снизу отсканированного документа появились в заголовке. Следовательно, этот инструмент полезен только для получения простого текста, который вы хотите скопировать и вставить в новый документ. Тем не менее, это быстрый и простой в использовании.

Бесплатный OCR

Бесплатный OCR принимает изображения и PDF-файлы размером до 2 МБ. Он распознает только первую страницу PDF. Вы можете выбрать язык документа, чтобы улучшить распознавание определенных символов языка. Бонус в том, что вы можете загружать до 10 изображений в час. Хотя многостолбцовый текст поддерживается, результатом распознавания является простой текст, означающий, что все форматирование потеряно. Нет варианта членства.

Хотя этот сервис кажется очень популярным, в моем тесте он дал плохие результаты. Многие персонажи, которые отлично распознавались другими онлайн-сервисами OCR, вообще не распознавались. По-видимому, ранее упоминавшийся фальцовка была проблемой для Free OCR. Более того, несколько частей текста появлялись в случайном порядке, что могло быть связано с их техникой сканирования форматированного текста..

Карл написал подробную статью о бесплатном распознавании текста. Ознакомьтесь с другими советами и рекомендациями по получению лучших результатов: Преобразование изображений в текст в Интернете с помощью бесплатного распознавания текста Преобразование изображений в текст в Интернете с помощью бесплатного распознавания текста Преобразование изображений в текст в Интернете с помощью бесплатного распознавания текста

Если вы ищете дополнительные веб-службы OCR, взгляните на WeOCR.

Как вы уже поняли, использование веб-службы OCR подходит только для быстрого и грязного распознавания текста. Если вам нужно отсканировать несколько документов и вам нужен идеально отформатированный текст, я бы порекомендовал загрузить и установить программное обеспечение OCR. Вот две статьи, которые помогут вам начать:

  • Как извлечь текст из изображений (OCR) - только для Windows Как извлечь текст из изображений (OCR) Как извлечь текст из изображений (OCR) Лучший способ извлечь текст из изображения - это использовать оптическое распознавание символов (OCR). Мы покажем вам семь бесплатных инструментов OCR для этой работы. Варун
  • Лучшие 5 бесплатных программных инструментов для распознавания текста для преобразования изображений в текст 7 Лучшие бесплатные приложения для распознавания текста для преобразования изображений в текст 7 Лучшие бесплатные приложения для распознавания текста для преобразования изображений в текст Хотите программное обеспечение для распознавания текста бесплатно? В этой статье собраны семь лучших программ, которые превращают изображения в текст. Сайкат

Каков ваш опыт работы с онлайн-сервисами OCR??

Изображение предоставлено: mihow




О современных технологиях, просто и доступно.
Ваш гид в мире современных технологий. Узнайте как использовать технологии и гаджеты, которые нас окружают каждый день и научитесь открывать интересные вещи в Интернете.