После того, как все уже сделано, остановится на этом просто себя не уважать, не говоря уж об остальных.
Для добавления распознанного текстового слоя в djvu книгу потребуется две программы. Первая это FineReader 7.0 или 8.0 версии. Вторая программа, это небольшая утилита DjvuOCR 2.1 от болгарского камрада Gencho.
Загружаем все, обработанные в кромсаторе, тифы в FineReader, те из которых была сделана djvu книжка, и распознаем в пакетном режиме. После распознавания, ничего не правим, не вычитываем, просто сохраняем пакет на диск, желательно путь для того пакета надо выбирать попроще, у DjvuOCR могут быть проблемы, если в названии пакета и/или пути будут кириллические символы. С FineReader все. Ура, ура, ура, появилась новая версия этой утилиты 2.2, в которой сняты эти ограничения. Теперь можно редактировать текст после распознавания в ФР, соблюдая некоторые ограничения:
а) при редактировании сохранять некоторые символы оригинального текста (например интервалы), т.е. не переписывать большие блоки;
б) желательно сохранять количество строк в параграфе (т.е. не стирать знаки конца строки).
Кстати, для наших целей вполне подойдет триальная версия FineReader, которую можно свободно скачать с официального сайта разработчика.
Запускаем DjvuOCR, жмем на кнопку Manual made OCR manager
Далее, тоже все просто:
FineReader Project directory – выбираем каталог с проектом.
Output OCR text file – это любой, пустой текстовой файл, помещенный в каталог с проектом.
Ставим галочку на Burn DJVU file и выбираем djvu книжку.
Нажимаем Process.
Ждем несколько минут. И всё.