English
RSS-лента
Рассылка
(архив)
 
  • ПРОГРАММЫ
  • /
  • Офисные
  • /
  • Распознавание текста

Распознавание текста

Оптическое распознавание текста англ. optical character recognition (сокр. OCR) — перевод последовательности изображений символа в последовательность кодов, использующихся для представления в текстовом редакторе. Перевод осуществляется с помощью различных алгоритмов, после преобразования изображения в набор элементарных точек.

В данный момент очень сложно найти бесплатную программу для распознавания текста. Но Вам повезло, здесь Вы можете скачать такую программу.


Версия
для печати

CuneiForm 12

  • Размер: 35.1 МБ
  • Интерфейс: Русский/Английский
  • Платформа: Windows 98/ME/2000/XP/2003/Vista/7
  • Посмотреть: скриншот
  • Обновлено: 15.12.2009
  • Сайт разработчиков:  http://www.cuneiform.ru/downloads/index.html
  • Платный аналог: ABBYY FineReader 11 Professional Edition Download (3590 руб.)

Реклама на форуме. Тарифы на рекламу.

Скачать CuneiForm 12 для Windows (32-bit)

Похожая программа: Офис OpenOffice.org

CuneiForm 12

Бесплатная программа для автоматического распознавания отсканированного текста. Вид у программы не карамельный, но дело своё она знает.

Сканирование с Распознавание текста CuneiForm 12 Компьютер уже уверенно вошел в жизнь рядового гражданина. Когда надо получить сравнительно небольшой объем печатной информации, проще всего набрать этот текст вручную при помощи текстового редактора. Однако иногда надо «переписать» целую книгу. В таких случаях рациональнее всего использовать сканер. Но сам по себе сканер делает только фотокопию текста, которую никак нельзя редактировать. Для того, чтобы изменить информацию на полученном изображении следует провести распознавание документа.

Бесспорным лидером в этом деле является система OCR (англ. optical character recognition — оптическое распознавание текста) от Abbyy — FineReader. Но стоит она довольно дорого и не каждый может позволить себе иметь в своем арсенале такой инструмент. Сегодня мы познакомимся с бесплатной альтернативой Файн Ридера — программой CuneiForm. Приведу сравнительную таблицу возможностей обеих пакетов:

Сравнение распознавалки текста CuneiForm с платным аналогом FineReader


Особенности CuneiForm FineReader
Стоимость бесплатно от 1340 р.
Количество языков распознавания 34 184
Возможность комбинировать языки распознавания - +
Сохранение исходного форматирования текста + +
Пакетное распознавание текста + +/-
Ограничение по разрешению файла-скана до 400 dpi нет
Поддержка всех типов сканеров только с TWAIN-интерфейсом +

Как видим, если хочется бесплатно распознавать текст, придется кое в чем уступить. Первое, с чем придется смириться — неумение CuneiForm работать с некоторыми сканерами (в особенности сканерами МФУ). Поэтому придется сканировать документ при помощи стандартных функций Windows. Второе — надо следить за разрешением сканирования. Это связано с тем, что CuneiForm не может обрабатывать большие файлы (свыше 100 Кбайт), а чем выше разрешение, тем больший размер файла-скана. Зато качество распознавания текста в программе намного выше, чем у платного конкурента, а поэтому оптимальным вариантом параметров скана будет 200 dpi (можно и больше, но тогда есть вероятность, что программа просто зависнет). Количество языков тоже невелико, но основные есть. Более того, хоть комбинировать языки и нельзя, зато в CuneiForm есть смешанный англо-русский режим распознавания! На этом минусы заканчиваются :). Можно начинать установку.

Установка CuneiForm

Здесь сложностей нет, поскольку Вам поможет инсталлятор. Просто запускайте установочный файл и следуйте инструкциям. После установки в меню «Пуск» появится новый раздел. Открываем его и запускаем CuneiForm.

Окно Распознавание текста CuneiForm 12


Интерфейс программы

Интерфейс CuneiForm намного проще, чем у Fine Reader, и почти не требует настройки. Программой можно полностью управлять благодаря кнопкам на панели инструментов. Рассмотрим их более детально:

Интерфейс Распознавание текста CuneiForm 12

Программа может работать в режиме мастера, который активируется первой кнопкой. Но если CuneiForm не поддерживает Ваш сканер, то от этого режима стоит отказаться. Следующая кнопка запускает процесс сканирования (опять же, если есть поддержка сканера). На этой и следующих кнопках Вы можете заметить небольшие стрелочки. Нажав на них, мы получим доступ к некоторым дополнительным функциям.

Работа с CuneiForm

Теперь давайте опробуем CuneiForm на практике. Если программа поддерживает Ваш сканер, то первой кнопкой, которую следует нажать, будет «Получить изображение». Если же такой возможности нет, то откроем уже готовый скан (поддерживаются форматы JPG, GIF, BMP, PNG (не всегда корректно), а также TIF (в полной мере)).

Открытие документа в Распознавание текста CuneiForm 12

Теперь следует произвести разметку. Она помогает определить блоки, из которых состоит страница. Поддерживается распознавание блоков в виде текста (синяя рамка), рисунков (зеленая рамка) или таблиц (оранжевая рамка) (автоматическую разметку можно доработать вручную, используя контекстное меню блока).

Разметка документа в Распознавание текста CuneiForm 12

Когда текст обозначен, самое время провести его распознавание. Для этого нажимаем следующую кнопку. По окончании процесса распознавания в рабочем окне отобразится текст, который можно редактировать в небольшом встроенном текстовом редакторе похожем на Microsoft Word. При этом Вы сразу сможете увидеть те слова, в которых программа «не уверена» (голубая подсветка) и в которых есть ошибка (сомнительная буква — розовая).

Распознавание и редактирование документа в Распознавание текста CuneiForm 12

И, наконец, после успешного редактирования можно сохранить результат нашей работы. Кликаем последнюю кнопку на панели инструментов и сохраняем текст как RTF, HTML или TXT-файл.

Сохранение документа в Распознавание текста CuneiForm 12

Если же Вы желаете большего, то, нажав на стрелочку сбоку, Вы сможете выбрать опции экспорта в одну из предложенных программ (Microsoft Word, Excel или Евфрат).

Варианты сохранения документа в Распознавание текста CuneiForm 12

Посмотрите на предыдущий скриншот. Наверняка вы обратили внимание, что в дополнительных меню кнопок, начиная с «Разметки» и заканчивая «Сохранением», есть в конце пункт «Автомат». Активирование этой опции освобождает Вас от нажатия выбранной кнопки. То есть можно автоматизировать процесс обработки скана до того, что Вы будете лишь открывать новый документ. Все остальное CuneiForm сделает сама!

Общие настройки CuneiForm

Программа изначально настроена самым оптимальным образом, но если Вы что-то захотите изменить, просто зайдите в меню «Файл» и выберите опцию «Общие параметры». Это может пригодиться для смены языка и некоторых других параметров распознавания, форматирования и сканирования текстов.

Настройки Распознавание текста CuneiForm 12

Пакетное распознавание

На этом можно было бы и закончить, если бы в пакет CuneiForm не входила еще одна утилитка. Откройте «Пуск» снова и в папке с программой обнаружите еще одно приложение — «Пакетное распознавание». Представьте, что Вы отсканировали целую книгу! и теперь надо ее распознать!!! Если открывать каждый файл-скан по отдельности на это уйдет уйма времени, пакетный же режим представляет возможность указать нужные файлы, а об остальном программа позаботится сама.

Утилита Распознавание текста CuneiForm 12 для пакетного распознавания

Для начала нужно создать новый пакет файлов. Нажимаем соответствующую кнопку и следуем подсказкам запустившегося мастера:

Мастер пакетного распознавания Распознавание текста CuneiForm 12

На последнем этапе мы можем либо просто сохранить наш пакет, либо начать немедленное распознавание. В последнем случае запустится режим распознавания, который может затянуться на несколько минут (в зависимости от количества файлов-сканов).

Процесс пакетного распознавания в Распознавание текста CuneiForm 12

По окончании распознавания Вы сможете увидеть в основном окне все распознанные документы. Если распознавание прошло успешно, то в левой боковой панели Вы обнаружите активными только два списка: «Исходные» и «Обработанные». Если же будут файлы, которые не удалось распознать, их мы найдем в разделе «Ошибки».

Результат пакетного распознавания в Распознавание текста CuneiForm 12

Теперь остается только сохранить полученные файлы и радоваться жизни :).

Потенциал у CuneiForm явно хороший, однако разработка ведется довольно медленно. Несмотря на открытый исходный код, компания Cognitive, видимо, очень требовательна к разработчикам, раз прогресс так долго не появляется. Остается только надеяться, что дело сдвинется с мертвой точки и программа станет еще лучшей, а пока довольствуемся малым. Но такое ли уж оно и малое… Выбор за Вами!

P.S. Данная статья предназначена для свободного распространения. Приветствуется её копирование с сохранением авторства Руслана Тертышного и всех P.S. и P.P.S.

P.P.S. Вам также может пригодится еще одна довольно занятная программа. Kleptomania, пусть и не полноценная система распознавания, но может помочь Вам захватить текст и графику с экрана для последующей обработки:
Захват экрана http://gold-free.ru/soft/office/capture.php

Магазин выживальщицких товаров. Товары для охотников и рыболовов на 60market.ru

СКАЧАТЬ CuneiForm 12
для Windows (32-bit)



← кнопка для выражения благодарности :)




Похожие программы:
Офис: OpenOffice.org Офис: OpenOffice.org OpenOffice.org — это международный проект с открытыми исходными кодами, созданный для того, чтобы разработать универсальный офисный пакет, работающий на разных операционных платформах, имеющий открытый API и формат файлов, основанный на XML.
Захват экрана: Kleptomania Захват экрана: Kleptomania Программа позволяет захватить и обработать текст и графику в любой, даже не подозревающей о буфере обмена, программе.
Транслит: Цифирица Транслит: Цифирица Небольшая программка-транслитератор с большими способностями. Выполняет транслит текста с русского на латинский шрифт и обратно.
Кодировка текста: Штирлиц Кодировка текста: Штирлиц Программа с патриотичным названием, предназначенная для перевода текста в читабельную кодировку.
Блокнот: TigerPad Блокнот: TigerPad Текстовый и HTML редактор со множеством функций. Он имеет небольшой размер, быстро работает, красиво выглядит.
Коллекция шрифтов: Font Navigator Коллекция шрифтов: Font Navigator Программка для удобного просмотра и установки шрифтов на компьютер, плюс отличный набор русских шрифтов на все случаи жизни.
Формат DjVu: WinDjView Формат DjVu: WinDjView Быстрая и компактная программа для просмотра файлов формата DjVu под Windows с режимом непрерывной прокрутки и расширенными возможности печати
Программа для чтения PDF: STDU Viewer Программа для чтения PDF: STDU Viewer Универсальная программа для чтения электронных книг в форматах PDF, DJVU и TIFF и некоторых других.
Формат MDI: MDI2PDF Converter Формат MDI: MDI2PDF Converter Простая, но симпатичная программка, для просмотра файлов в формате MDI. Бесплатная версия не позволяет распознавать текст и копировать его.
Каталогизатор книг: Calibre Каталогизатор книг: Calibre Бесплатный каталогизатор для учёта книг в домашней (и не только) библиотеке.
Проверка орфографии: Orfo Switcher Проверка орфографии: Orfo Switcher Программа проверки орфографии и автопереключения раскладки клавиатуры. Проверка орфографии вводимого текста или слова ненавязчиво работает параллельно с вами в любой активной программе.


Лаборатория Хакера - Всё лучшее только для вас!

Правила добавления комментариев:

1. Все комментарии проходят цензуру, нет смысла спамить.
2. Однозначно будут удалены:
Бессмысленные, нецензурные, глупые комментарии, неаргументированная критика, а также ссылки на файлообменники и прочие сайты не в тему.
3. Приветствуются:
Аргументированные отзывы о данной программе, а также грамотность и умение формулировать свою мысль в рамках приличия.

Денис 2011-11-03 12:52:49

↑ +14 ↓
TrywaR 2011-12-01 14:30:29

↑ -10 ↓
Антон Иванов 2011-12-01 22:09:19

↑ +1 ↓
Татьяна 2011-12-13 15:50:19

↑ +1 ↓
Ирина 2011-12-15 12:33:23

↑ +5 ↓
Вячеслав 2011-12-20 17:38:07
+100500!
↑ -1 ↓
Марина 2011-12-27 17:18:47

↑ -2 ↓
Юрий 2011-12-28 09:46:35

↑ +1 ↓
Андрей 2012-01-05 14:32:29

↑ +5 ↓
Ваня 2012-01-07 18:20:17

↑ +5 ↓
Денис 2012-01-24 12:04:25

↑ +4 ↓
Алексей 2012-01-27 09:11:43

↑ +2 ↓
Юрий 2012-02-02 17:19:32

↑ +10 ↓
Валерий 2012-02-12 20:13:27

↑ +1 ↓
Лера 2012-02-13 04:10:52

↑ +2 ↓
Максим 2012-02-14 11:14:45

↑ -5 ↓
Василий 2012-02-24 00:55:10

↑ -5 ↓
саня 2012-02-26 12:42:58

↑ +9 ↓
прадо 2012-02-29 09:40:21

↑ -3 ↓
ильнур 2012-03-07 13:30:47

↑ 0 ↓
Антон Иванов 2012-03-08 07:20:51

↑ 0 ↓
Наталия 2012-03-19 12:51:28

↑ -2 ↓
Лера 2012-04-04 08:04:10

↑ +1 ↓
Rina 2012-04-04 17:30:14

↑ -1 ↓
Юрий 2012-04-07 14:22:19

↑ +3 ↓
Евгения 2012-04-08 13:44:58

↑ -1 ↓
Елена 2012-05-01 19:34:58

↑ -2 ↓
Эд 2012-05-24 22:11:04

↑ +1 ↓
владимир 2012-06-08 07:03:28

↑ +1 ↓
Dark 2012-06-10 14:39:15

↑ +2 ↓
Dark 2012-06-10 14:45:06

↑ +4 ↓
Сергей 2012-07-09 15:37:43

↑ +1 ↓
Сергей 2012-07-09 15:47:24

↑ +1 ↓
Юлия 2012-07-09 19:30:09

↑ +1 ↓
Сергей 2012-08-17 21:04:32

↑ +1 ↓
Алиса 2012-09-09 11:34:37

↑ 0 ↓
kilocy 2012-10-03 10:49:44

↑ 0 ↓
Геннадий 2012-10-24 16:05:56

↑ 0 ↓
Руслан Тертышный 2012-10-26 21:37:59

↑ 0 ↓
Кирилл 2012-11-05 16:00:18

↑ 0 ↓
VIA 2015-05-24 21:00:55

↑ 0 ↓

Оставить комментарий


Ваше имя:

RSS
 
Комментарий:
Введите символы: *
captcha
Обновить

 

Бесплатный софт:

Полезности:

Развлечения:

САМОРЕАЛИЗАЦИЯ
ГАДАНИЕ НА СОФТЕ
  
Мы в Google+
Надёжное место для Вашего сайта

Система Orphus