Использование систем распознавания текста (OCR) позволяет быстро выдернуть
из отсканированной страницы или картинки нужный текст. Например, можно
воспользоваться сервисом ABBYY
FineReader Online, позволяющий быстро и легко конвертировать отсканированные
документы и цифровые фотографии в редактируемые форматы. Система умеет
распознавать документы размером не более 10 Мб любого из форматов BMP, PCX,
DCX, JPEG/JPEG 2000, PNG, TIFF/TIF, GIF, DjVu на русском, английском, немецком
и французском языках. При этом результат распознавания может быть сохранен в
виде DOC, XLS, RTF, TXT или PDF-файла. В настоящий момент FineReader Online
работает в тестовом режиме и после регистрации позволяет пользователю бесплатно
распознавать до 50 страниц в день.
Также можно воспользоваться другим коммерческим сервисом Online OCR. Его особенностями являются
возможность выбора из 28-ми языков распознавания и функция извлечения текста с
определенных листов многостраничного документа. Системе можно скармливать файлы
форматов TIFF, JPEG/JPG, BMP, PCX, PNG, GIF и PDF размером не более 7 Мб. Для
получения качественного результата распознавания разрешение картинок должно
быть не меньше 200 dpi. Выходные форматы файлов - DOC, XLS, RTF, TXT, PDF и
HTML. Услуги Online OCR платные, и стоимость их варьируется от 80 копеек до 2,5
рублей за страницу распознанного текста. Для проверки настроек и качества
распознавания в системе предусмотрен демонстрационный режим, функционирующий
бесплатно и сканирующий только часть страниц.
OCR Online
Сервис OCROnline
позволяет бесплатно распознавать текст из изображений JPG, PNG, GIF, TIFF и
файлов в формате PDF. Файлы должны быть не более 10 Мб и содержать не более 100
страниц. Поддерживается более 150 языков. На выходе вы можете получить файл в
формате DOC, PDF, RTF или TXT.
Работа с сервисом очень проста и состоит всего из нескольких операций:
указание языка и формата вывода, загрузка исходного документа, обработка и
сохранение результата. При тестировании OCROnline показал весьма приличные
результаты распознавания и даже сохранил форматирования в довольно сложном
документе.
К достоинствам сервиса можно отнести прежде всего бесплатность, неплохое
качество распознавания и скорость работы. Недостатком является то, что нельзя
добавить более одного языка распознавания, поэтому если ваш документ содержит
слова на иностранном языке, то результаты будут не удовлетворительными.
Разумеется, данный сервис нельзя рекомендовать для серьезных OCR-работ, но
как палочка-выручалочка при разовой необходимости вполне сгодится, поэтому
однозначно заслуживает место в закладках. На всякий случай.
Одной строкой
Pocketmod — это все, что может пригодиться
размером с кошелёк: календарик, список дел, нотный стан и многое другое.
ePrintable — онлайновый
генератор календаря для распечатки. Можно добавлять свои подписи и картинки.
PaperCDcase — генерирует
PDF-файл с бумажкой для коробки CD.
Sudoku
Generator — генератор Sudoku, который отдается вам в формате PDF.
Documents
Templates — генератор различных шаблонов для документов — бизнес-план,
презентация, контракт на аренду, соглашение о неразглашении.
Big.First.Name —
бесплатное онлайновое решения для печати красивых бейджиков.
MyBrochureMaker —
создание красивых брошюр и лифлетов.
iPaperCraft – Cash
Wallet — создаем бумажные кошельки и визитницы.
|