QSOCR.narod.ru

12 июня 2005 г.
Едранов Денис Евгеньевич

Говорят, что человек использует лишь 10% своего мозга.
Размышляя над системами распознавания, понимаешь, чем заняты остальные 90.


ЦЕЛЬ


Как мне известно, под ОС Linux на сегодняшний день нет "правильной" системы распознавания, как FineReader под ОС Windows. Конечно, существуют gocr и ocrad,но в них отсутствует поддержка кириллицы. Можно пытаться встраивать кириллицу в эти системы, но лично мне показалось намного интереснее создать OCR с нуля, ради самого процесса творчества.

Итак, я пытаюсь создать OCR для ОС Linux, которая будет называться QSOCR (qsocr), обязательно на условиях GNU GPL, с поддержкой кириллицы и модульной архитектурой. Все идеи и исходный код будут выкладываться на сайте.

Любые замечания и помощь приветствуются.

ПРОЕКТ


Предполагается в процессе разработки разбить программу на несколько модулей:
    1. Создание контурной и цветовой схемы изображения
    2. Создание схемы текстовых строк
    3. Создание схемы текстовых колонок. Формирование "непрерывной" строки с форматированием
    4. Разделение строки на буквы. Определение гарнитуры и наклона символа. Отсечение шумов.
    5. Непосредственное распознавание букв.
На вход каждого модуля передается изображение вышедшее из предыдущего. Таким образом, создается своеобразный конвеер распознавания.

Работа над каждым модулем может вестись отдельно. Содержание и порядок модулей может меняться в процессе разработки.

НОВОЕ НА САЙТЕ


    12 июня 2005 г. - Открытие сайта

ПОЛЕЗНЫЕ ССЫЛКИ


http://ocrai.narod.ru/ - полезные статьи, посвященные OCR

http://yandex.ru/ - поиск статей про OCR Linux проекты

Даже не знаю, что сложнее - научить компьютер выигрывать в шахматы гроссмейстера
или отгадывать детские загадки.

Едранов Денис Евгеньевич
e-mail: qsocr@yandex.ru
ICQ: 288825105