FAQ по сборке (созданию) DjVu книги из сырых сканов


 

[Цитировать]

FAQ по сборке (созданию) DjVu книги из сырых скановЦель создания этого FAQ-а — рассмотреть все нюансы. Чтобы после прочтения не возникало вопросов. -

1. Сканирование книги

Сканировать нужно в 300 DPI (где текст очень мелкий, то в 600 DPI). Если текст очень мелкий и вы выведите сканы в ч/б режиме 300 Dpi, то может появиться ошибка Инь.
Update/ Я пришлел к выводу что нужно сканить в 400 DPI вместо 300 DPI.
Сохранять в формате Tiff без сжатия. Размера не пугайтесь.
Подготовьте место на HDD, порядка 5-ти гигов для 1-й книги. После хорошей обработки и кодировки, размер книги будет в приделах 1-200 мегабайт.-Старайтесь сканировать так, чтобы не было засветов:

Потому что после обработки не будет виден текст:

И при распознавании в ФР будут проблемы:
--Процесс сканированияУстанавливаете драйвер на свой сканер. Ставите прогу IrfanView.
Подсоединяете сканер к компу. Запускаете IrfanView:
Выбираете драйвер сканера

Нажимаете Ctrl + Shift + A, выставляете настройки как на скрине:

Выбираете только размер DPI и режим сканирования.
Если на странице есть цветные картинки, фото - выбираете 24 бита (цветное сканирование).
Если на странице только ч/б текст или ч/б текст + ч/б картинка или фотография - то выбираем режим оттенки серого.

Никаких фильтров не ставим! Ни цветопередачу, ничего короче кроме DPI, режима сканирования и области захвата.

И для всех сканов выставляете один размер захвата. На все стекло растягиваете и так сканите. Только меняете режим сканирования в зависимости от содержания страниц (фотка или ч/б текст).
P.S. Обложки тоже сканируем. Так как при обработке, все страницы будем подгонять под размер обложки. Да и что это за книга без обложки?--Как отсканировать то, что не влазит на стекло сканера?Если у вас есть большая книга A3 формата или большой плакат. Их страницы можно отсканировать частями и потом эти части склеить.
Для того чтобы мы могли правильно отсканить и нам было удобно, я советую снять крышку сканера.
Страницы будут клеиться на хлёст

Сканируем...

После у нас есть два скана:

Нам нужно исправить их ориентацию. Запускаем FastStone Image Viewer 4.7 и в нем исправляем ориентацию:

Исправили:
-Устанавливаем PanaVue Image Assembler.
Запускаем. Нажимаем на кнопку New project -> ставим галочку Image Stitching и нажимаем Ок.

Переходим на вкладку настроек (Options) и ставим как на скрине:

Затем переключаемся на вкладку Images и добавляем наши "куски":

Задаем положение "кусков":

Выставляем флажки и склеиваем:

После того как удачно склеило куски - нужно сохранить результат:

2. Обработка сырых сканов

Например у нас есть такие сканы:
-Качаем Scan Tailor Featured.
Устанавливаем. Запускаем. Заходим в Инструменты -> Настройки -> ставим галочки как на скрине:
-Открываем новый проект (папку со сканами): Файл -> новый проект -> Обзор
--1. Исправление ориентацииОбычно когда отсканируешь книгу, то некоторые страницы вверх ногами.
Справа в колонке список страниц. Проходимся по ним мышкой. И смотрим, первая страница вверх ногами под номером 3.
Нажимаем на нее ЛКМ. Слева есть кнопки. Нажимаем например 2-ва раза влево.

Теперь страница имеет правильную ориентацию.

Но обычно таких страниц много и идут они через одну. В СТ и на этот счет есть функция.
У нас кроме 3-й еще 5 и 7-я страницы вверх ногами. Потому после того как мы исправили ориентацию 3-й страницы нажимаем Применить к ... -> К каждой второй -> Ок -> и нажимаем на -> ждем окончания процесса. После окончания может быть такое что некоторые страницы с правильной ориентацией перевернуло вверх ногами. Ищем и переворачиваем ...
--2. Разрезка страницВ нашем случае резать пополам ничего не нужно. Нажимаем на кнопку -> Изменить ... -> Вручную -> Ко всем страницам -> Ок -> и нажимаем на -> ждем окончания процесса.

В том случае если на скане по 2-ве страницы (разворот). Нажимаем сразу на -> ждем окончания процесса. Оно его само порежет на 2-ве части. Потом только пролистаете список и посмотрите правильно ли порезало (может не по середине разрезать). Ищем такую страницу и передвигаем ползунок на нужную нам позицию.
--3. Компенсация наклонаПосле разрезки могут оставаться пустые страницы.
до

после

В списке нажимаем ПКМ на пустую страницу -> Удалить из проекта ....-Тут все просто. Нажали на -> ждем окончания процесса.
Иногда (почти всегда) остаются страницы с неправильным наклоном. Нужно пролистать список страниц и исправить наклон вручную.

Если мышкой не удается подобрать нужный наклон (милииметраж) -> зажимаем Ctrl и крутим колесико мышки вверх или вниз.--4. Полезная областьНажали на -> ждем окончания процесса.
Тут теперь все сложнее. После завершения, смотрим как оно определило область. Процентов 20 страниц по любом придется подправить вручную (полезную область). Я просматриваю каждую страницу (если 400 страниц, сами понимаете что это долго).

Прокрутом колеса мышки можно приблизить (увеличить страницу) для удобства.

Бывают случаи когда область на какой-то странице не была создана автоматом. Нажимаем на странице ПКМ -> Создать полезную область
-Область передней обложки выделяем по максимуму. Мы по ней потом размер остальных страниц подгоним и заднюю обложку.

Область задней обложки выделяем меньше на сантиметр (на глаз) с каждой стороны.
--5. ПоляПосле перехода к полям видим такую картину:

Начинаем с обложки. Чтобы все страницы подогнались под нее -> нужно убрать ее поля. Значения 5,0 и 10,0 меняем на 0 (Сверху, Снизу, Слева, Справа) и применяем ко всем страницам. А также Выравнивание ставим по центру и применяем ко всем страницам.

В итоге видим следующее:

Если вы видите такую картину - значит полезная область какой-то страницы, больше чем полезная область обложки.

Дальше нужно отрегулировать положение текста (или картинки) некоторых страниц. Потому что полезная область не у всех страниц одинакова. Это обычно конец или начало главы.
Вот пример:

Потому просматриваем страницы и определяем стандарт (страницу) по которому будем выравнивать страницы положение текста которых не соответствует положению в бумажной книге.
Вот у меня например эта страница стандарт (это 95% страниц):

Я беру "ложу палец на монитор" под номер страницы.

У кого моник новый то на глаз подганяйте. Мой уже доживает свое, то его не жалко.
Держу палец на том месте -> переключаюсь страницу которую нужно подогнать -> смотрите на скриншоте:

Есть страницы где наоборот, вверх нужно подгонять.--6. ВыводСразу выставляем для всех страниц 400DPI.

Обложки и картинки, фотографии без текста на всю страницу -> выводим в режиме цветной/серый

Страницы где картинки, фотографии без текста не на всю страницу -> выводим в режиме цветной/серый + ставим галочку белые поля (все что выходит за рамки полезной области будет заливаться белым цветом)

Страницы где ч/б текст -> выводим в режиме Черно-белый

Страницы где ч/б текст + цветные картинки или фото (даже серые (ч/б) фотки) -> выводим в режиме Смешанный

В смешанном режиме не всегда правильно определяется область картинок. Потому их нужно обвести вручную.

Бывает такое, что вместе с картинками выделяется (автоматом) и текст как область картинки. Потому их нужно тоже обвести вручную -> ПКМ по обведенной области -> вычесть из автослоя

Можно так обвести всю страницу -> вычесть из автослоя и потом поверх обвести нужную вам область и добавить к автолслою.
Бывает такое что вы выделили несколько разных областей (кое что добавили, кое что вычли) и ни что не выделилось. Тогда нужно поиграться с галочками в свойствах зоны:
-Также при выводе можно очищать страницы от мусора.
Автоматически:

Можно выбрать 3 уровня автоматической очистки.
То что не убирается автоматом можно убрать вручную:

Примечание: иногда при выводе обработаных сканов вылетает ошибка. - Решается изменением полезной области на той странице с которой идет вылет программы.

3. Сборка книги из обработанных сканов

Скачиваем DjVu Small v0.4.4 и Document Express Editor v5.0.0 Build 16
Запускаем DjVu Small v0.4.4 -> Открыть файлы -> заходим в папку out (в ней СТ сохраняет обработаные сканы) -> ставим Вид - Эскизы страниц (для того чтобы было видно сканы) -> выделяем сканы (вначале выделяем и кодируем ч\б, потом цветные или наоборот. Делайте как вам удобнее) -> открыть;
нажимаем обзор - выбираем выходную папку (где будет сохранен DjVu) -> выбираем профиль кодирования (Ч/б сканы кодируем профилем Default . Цветные сканы кодируем профилем Photo ) -> нажимаем Пуск
Примечание: после того как вы закодировали (на пример ч/б сканы) в выходной папке создается файл DjVu Encoded.djvu. Его нужно переименовать (например в def.djvu). Потому что когда после вы будете кодировать цветные сканы, то прога DjVu Small его перезапишет.
Я использую такие названия: def и fot.--Теперь нам нужно ч/б (def) и цветные сканы (fot) собрать в кучу и выставить страницы в правильном порядке.
Запускаем Document Express Editor v5.0.0 Build 16 -> File -> Open -> выбираем любой из двух закодированных DjVu файлов. Обычно я открываю тот файл - в котором больше страниц.
Слева в столбце видим страницы. Нажимаем ПКМ по первой странице -> выбираем вставить перед (Before) . Теперь в столбце мы видим страницы которые мы вставили .
Дальше мы будем вырезать по одной и вставлять те страницы на свое место. Можно и по несколько вырезать, если они идут одна за одной по номеру.
Кликаем по нужной нам странице ПКМ -> вырезать (Cut) .
Дальше кликаем ПКМ по той странице, после (или перед) которой хотим вставить вырезаную страницу .
После того как выставили все страницы на свои места -> нажимаем сохранить (Save)
Советую переодически нажимать SAVE, так как прога иногда вылетает
Конечный файл - тот который вы изначально открыли и в него вставили страницы.


Последний раз редактировалось: admin (2015-11-15 20:03), всего редактировалось 1 раз

[Цитировать]

Дополнительные материалы:

Использование DjVu Imager при создании DjVu-книги by <Ra>

Что такое "DjVu Imager" и зачем он нужен?

Текст и иллюстрации кодируются при создании DjVu-файла по-разному. Точнее, противоположными по смыслу способами.
Текст кодируется максимально чётко, а вот иллюстрации - наоборот, значительно "размываются" (по резкости).
Например есть такой скан:
Если кодировать его "как текст", то фотография теряет плавные переходы тонов:
Если же кодировать "как фото", то текст вокруг иллюстрации получался совершенно размытым и практически не читаемым:
И однажды человек по имени manfred предложил так называемый "Метод разделённых сканов".
Суть его в том, что на сканах, где есть текст с иллюстрациями, текст предварительно отделяется от иллюстраций в другой файл (до DjVu-кодирования), затем оба этих файла кодируются в DjVu отдельно друг от друга (своими оптимальными способами), а полученные в итоге 2 DjVu-файла совмещаются воедино специальным образом:

Слева - текст, отделённый от исходника (по методу разделённых сканов). Называется "передний субскан".
Справа - иллюстрация, отделённая от исходника (по методу разделённых сканов). Называется "задний субскан".
В результате имеем четкий текст, иллюстрация сохраняет полутона и меньший размер djvu файла:
Программа DjVu Imager предназначена для кодирования в DjVu сканов книг, содержащих иллюстрации (полутоновые и/или многоцветные).

Использование DjVu Imager:

Использование DjVu ImagerОбработка в Scan Tailor FeaturedОбрабатываете сырые сканы в Scan Tailor Featured. На стадии "вывод" для сканов, содержащих иллюстрации и текст, выбираете режим вывода "смешанный". После автоматического распознавания переходите на вкладку "зоны картинок" и проверяете правильно ли они были распознаны:

Форма картинок (на скрине обведено квадратом) есть трех видов:

-Свободная - программа в свободной форме очерчивает зону картинок;
-Обведенная - форма зоны будет прямоугольной;
-Квадро - форма зоны будет прямоугольной, но будут контуры, потянув за которые можно изменить форму.
Если зоны картинок были распознаны неправильно, поправьте их (подробнее об этом написано выше в "Обработка сырых сканов").
После обработки сканов их необходимо экспортировать. Меню Инструменты :arrow: Экспорт:
В появившемся окне ставите обе галочки:
Программа создаст папку "Экспорт" (в папке "Out" в текущем проэкте), в которой будут подпапки "1" и "2".
В первой будут черно-белые сканы, во второй - иллюстрации. Файлы будут иметь сквозную нумерацию, что важно.--Обработка в DjVu Small DjVu Small нужна для того, чтобы создать DjVu-заготовку (DjVu-книгу без иллюстраций). И в нее мы подклеим картинки.
Нажимаете "Открыть папку" и выбираете папку "1". Если не разбираетесь в профилях кодирования, то ставьте "Default".
И выбираете куда сохранять ("Выберите выходную папку").
На этом все.--Обработка в DjVu ImagerСкачиваем DjVu Imager.
1. Нажмите кнопку "Опции" и установите галку "Произвольные файлы":
2. Нажимаете "Открыть папку" и указываете путь к папке "2" (в которой сохранили иллюстрации):
3. В столбце "№" автоматически формируются номера загруженных файлов. Каждый такой номер обозначает номер той DjVu-страницы, куда будет вклеен данный загруженный графический файл (в качестве иллюстрации).
При необходимости можно изменить вручную любой такой номер (по двойному щелчку мыши на нём, т.е. на ячейке столбца, содержащей номер):
4. Есть два параметра кодирования: ДЗФ (делитель (разрешения) заднего фона) и Качество задн. фона (качество заднего фона).
Рекомендуемое значение для ДЗФ - от 2 до 4.

Что такое ДЗФ:

Это аббревиатура - "делитель заднего фона". Спецификация формата DjVu допускает, что задний фон может храниться в DjVu-файле с геометрическими размерами (длина и ширина) в 1...12 раз меньше, чем слой маски (переднего плана). Но при открытии такого DjVu-файла любой DjVu-просмотрщик автоматически и незаметно для пользователя масшабирует такой задний фон назад к нормальному размеру. ДЗФ и задаёт - во сколько раз (от 2 до 12) мы хотим уменьшить хранимый размер заднего фона (иллюстраций) при создании DjVu-файла.
ДЗФ - это самое эффективное средство для регулировки соотношения "размер/качество" вклеиваемых иллюстраций (в будущем DjVu).
Параметр Качество задн. фона можно вообще не использовать - он мало что даёт.
Если не использовать ДЗФ, то размер иллюстраций уменьшаться не будет (останется исходный размер).
Выставленные параметры можно применить как ко всем файлам, так и к отдельным. Для этого нужно выбрать в списке необходимый файл, нажать "Текущий файл" и выставить необходимые параметры:
5. Нажмите кнопку "Пуск". Программа закодирует иллюстрации в режиме "DjVuPhoto". Результат можно увидеть нажав на кнопку "Просмотр".
Если нажать на кнопку "Текущий", то будет кодироваться только тот файл, который выбран в списке, с установленными для него параметрами.
6. Нажмите кнопку "Источн." и выберите в появившемся окне DjVu-заготовку (файл без иллюстраций, который мы создали с помощью DjVu small).
По умолчанию он имеет имя "DjVu Encoded".
Нажмите на кнопку "Вставить в DjVu". Программа вклеит иллюстрации и сохранит результат в файле.
Он будет иметь то же имя + ".out" и сохранится там же, где и заготовка (если Вы не указали другой путь). Т.е. в данном примере DjVu Encoded.out.

Некая общая схема как убрать "паразитный" жёлтый фон книги/журнала не затронув сам текст (by Shassukkum)

Некая общая схема как убрать "паразитный" жёлтый фон книги/журнала не затронув сам текст, сделать чётче буквы, убрать рингинг, деспеклировать и в конечном счёте уменьшить размер скана не затронув его качество. И естественно — автоматизировать этот процесс.
Итак.
1. Переводим PDF в набор сканов:
Можно это сделать несколькими программами но я выбрал PDF-XChange Viewer.
2. Берём любой файл из полученных и копируем его в какое-то другое место на винте. Над ним мы сначала и будем издеваться. Все файлы должны быть тифовскими, это одно из условий.
3. Запускаем Adobe Photosop. У меня CS5 Extendet. Открываем в нём наш файл, над которым мы будем издеваться.
4. Можете сразу не создавать action а немного "помучить" картинку, я-же напишу сразу пример создания самого действия ("action").
5. Итак, открываем наш скан.
Увеличиваем, для удобства, навигатором нашу картинку (Вкладка Navigator).
6. Пишем "Действие". Жмём на вкладку Action. Если её нет то (Alt+F9) или во вкладке Windows. Жмём на кнопку, внизу, Create New Action, загнутый листочек, левее от значка "мусорка".
7. Выскакивает окно New Action.
Жмём кнопку Record (запись). Началась запись действия.
8. Для удобства я перехожу во вкладку Layers (Слои).
9. Создаём новый слой, жмём на кнопку в самом низу Create New Layers (Создать новый слой), он в виде загнутого листочка. В итоге у нас получилось вот что
10. Берём, слева, пипетку (Eyedropper Tool) и делаем забор цвета,
Потом берём "ведро" (Paint Bucket Tool) и заливаем наш новый слой, тем цветом что мы выбрали пипеткой.
11. Меняем режим наложения с Normal на Divide,
больше ничего не трогаем.
12. Сливаем оба слоя в один. ПКМ в верхнем слое и выбираем Flatten Image.
13. Выравниваем наш скан по свету. В шапке Image → Ajustments → или жмём Levels (Ctrl+L). Там передвигаем левый ползунок вправо таким образом
и жмём ОК
14. "Паразитный шум" по периферии скана можно убрать таким образом: Image → Ajustments → Replace Color (Замена цвета).
15. Пипеткой жмём на жёлтом цвете и выставляем значение Lightness в самый край, +100, (т. е. белый). Ползунком Fuzziness задаём область применения, я оставил где-то значение 63, см. выше. Жмём ОК
16. Можете повторить эту операцию с заменой цвета и для других оттенков. Хотя, не забывайте, в СТ поля обрезаются, так что особо не усердствуйте.
— Далее идёт операция по убиранию шума и улучшению качества букв, их чёткости. Если у вас с этим всё нормально то нижнее два пункта можно проигнорировать и не писать в экшен. —
17. Я ранее говорил, что скан был неважного качества, с jpeg'овским шумом вокруг букв. Из этой ситуации я вышел таким образом. Уменьшил разрешение с помощью Image → Image Size или (Alt+Ctrl+I) Процент, вместо 100 поставил 50 и нажал ОК
18. С помощью плагина Blow Up от Alien Skin, увеличил размер вдвое.
Жмём ОК
Для этих целей можно применить и другие похожие продвинутые плагины, например Genuine Fractals, т. е. те кто работают с фрактальным преобразованием, можно применить и плагины со сплайновыми "заморочками". Эксперементируйте!
19. Жмём Filter → Sharpen → Unsharp Mask (Примерные значения 105 и 18). ОК.
20. Закрываем наш файл, жмём на крестике справа. → Yes. → ОК
21. Переходим во вкладку Action и жмём на кнопке "Остановить" в виде квадратика.
22. Запускаем наш экшэн.
23. File → Automate → Batch. Кнопками Choose выбираем начальную папку, где мы складировали из PDF'ки наши сканы и конечную папку, где будут наши обработанные сканы находиться. Жмём ОК.
24. Всё!
Дополнение: Некоторые процессы можно и опустить, например с разрешением скана, некоторые дополнить, применив перед заливкой, для умного размытия фильтр Smart Blur из шапки Filter, что-бы убрать фактуру бумаги, или ещё какой шумодав внешних разработчиков. Или поменять процессы местами, применив Levels до заливки и сведения слоёв.
После сепарирования Scan Tailor Featured cканы с фото надо дообработать отдельно.

Удаление паразитного фона в сканах программой GIMP (by $Shorox)

Удаление паразитного фона в сканах программой GIMPПри сканировании книг часто на сканах проявляется паразитный (чаще всего жёлтый) фон. Устраняем его при помощи программы GIMP.
Пример:
Исходный скан:Открываем файл. В панели инструментов выбираем "Прямоугольное выделение". Обводим область.Жмем "Выделение" -> "Инвертировать выделение". Этим мы делаем неактивной (недоступной для редактирования) область в выделенной области.Выбираем инструмент "Пипетка", делаем ею забор белого цвета из какой-нибудь зоны.Выбираем инструмент "Плоская заливка", и из ведёрка заливаем зоны с паразитным цветом.Результат:

RasterStitch (by $Shorox)

RasterStitchРазработчик: Vextrasoft
Программа дает возможность создавать единое изображение на основе нескольких графических файлов, "сшивая" их по краям. Программа может использоваться для создания панорам, для соединения в единое целое отсканированных документов большого размера, для составления карт из отдельных фрагментов и т.д. Точки совмещения краев изображений RasterStitch находит автоматически. Программа работает с файлами BMP, PCX, TIFF, GIF, JPG, TGA и PNG. В ней есть также инструменты для зеркального отражения, поворота и обрезки.
Пользоваться программой очень просто.
1. Выбираем файлы для сшивания.2. Кнопками "Split Horizotal", "Split Vertical", "Swap" выставляем правильно изображения.3. Нажимаем "Avto point", программа сама находит совпадающие точки.4. Нажимаем кнопку "Stitch", изображения сшиваются.5. Продолжаем в таком же порядке сшивать остальные части изображения. Когда соберем все части сохраняем результат "Save".Сшивал этой программой до 16 сканов.Скачать: RasterStitch

Исправление дефектов отсканированных страниц книги в GIMP (by $Shorox)

Исправление дефектов отсканированных страниц книги в GIMP1. В книге была порвана и неровно склеена страница.Скачиваем программу : GIMP
Открываем страницу в GIMP.
Выбираем в "Панели инструментов" инструмент "Свободное выделение (Лассо)" - выделяем (обводим) с помощью мышки контур ->Выбираем "Выделение" на панели задач или вызываем эту функцию правой кнопкой мыши -> Выбираем "Сделать плавающим" ->Захватываем мышью выделенную область -> Совмещаем порванные части страницы -> Выбираем "Слой" -> "Прикрепить плавающий слой" ->Сохраняем результат ->.С помощью инструмента "Прямоугольное выделение" -> "Правка" -> "Копирование" -> "Вставить" вставляем испорченные фрагменты ->Инструментом "Штамп" и "Лечебная кисть" ретушируем пятна и повреждённые части ->Финал такой:

Урок по Adobe Photoshop от Rusaloсhka - Как сделать печать на книге (by $Shorox)

Урок по Adobe Photoshop от Rusaloсhka - Как сделать печать на книге
Вопрос от $Shorox Rusaloсhka-е
Есть два изображения:
Печать:Мне надо эту печать поставить на обложку так, чтобы белого фона не было. Чтобы было вот так:Ответ от Rusaloсhka:
1. Открываем наше изображение в Adobe Photoshop и снимаем защиту с фона (переводим фон в слой) и получаем такое окошко:Жмем "ОК" и дальше с этим слоем можно работать.
2. Берем инструмент "Волшебная палочка" и кликаем по фону который надо убрать. Получаем вот такое выделение и жмем "Delete".Повторяем это на всех белых местах:На вид вроде бы все, но если присмотреться, то видно что все равно где то есть белые пятнышки.Чтобы уж быть абсолютно уверенным, что у нас нет косяков, лучше создать новый слой, перетянуть его вниз и залить его контрастным цветом (например черным).Видите сколько погрешностей?
Переходим на слой с печатью и убираем все наши косяки по очереди выделяя все белые пятна "Волшебной палочкой" и кликая клавишу "Delete".Когда все удалили, проверили, можете сохранять свою печать.Можете отключить слой с черным фоном, а можете его удалить .
Ну и меню "Файл" -> "Сохранить как" -> "Выбираем формат" и получите вашу печать.

Создание интерактивного оглавления (by $Shorox)

Создание интерактивного оглавления
Из сети мы скачиваем книги в формате *.djvu. Часто для нормального чтения они непригодны: грязные, кривые страницы, нет интерактивного оглавления и множество других дефектов.
Для того чтобы книгу было удобно читать делаем интерактивное оглавление.
Скачиваем программу HandyOutliner for DjVu / PDF
На странице скачивания есть инструкция по использованию программы. На простом примере объясню как ею пользоваться.
1. Cоздаём текстовый документ, открываем его и книгу. В книге открываем вкладку "Страницы". Листаем её и записываем в текстовый документ названия разделов, глав и так далее. В конце строки ставим номер страницы соответствующий вкладке "Страницы". Иерархия закладок определяется клавишей Tab. Сохраняем текстовый документ.2. Открываем программу HandyOutliner for DjVu / PDF
В строке "Закладки" указываем путь к текстовому файлу с оглавлением.
В строке "Документ" указываем книгу.
3. Жмём "Записать" -> "ОК"Результат получается такой:Книгу удобно читать и листать.
Ошибки при работе с программой HandyOutliner for DjVu / PDF.
Если в окне программы "Сообщения" (Output) вы увидите желтые треугольники, это означает, что вы написали строку неправильно:
Line x - строка с ошибкой
Pos x - номер символа с ошибкой в этой строке

Видеоуроки:

:arrow: Урок по обработке сканов через Photoshop от slava_kry :arrow2:

Снятие "паразитного" фона со скана с помощью Фотошопа и последующая его оцифровка в программе ABBYY FineReader v.11.0.110.122 (by Shassukkum)

Снятие "паразитного" фона со скана с помощью Фотошопа и последующая его оцифровка в программе ABBYY FineReader v.11.0.110.122
Необходимые программы:
— Adobe Photoshop)
— Scan Tailor Featured v.0.9.11.1 Автор: monday2000
(скачать) → http://sourceforge.net/projects/scantailor/files/sc...-devel/featured/
— DjVu Small v0.4.4
(тема) → http://www.djvu-scan.ru/forum/index.php?topic=42.0 Автор: monday2000
(скачать) → http://www.djvu-soft.narod.ru/soft/djvu_small_v0_4_4.rar
или можно использовать
— DjVu Small Mod v. 0.6.0* Автор: textsharik
(тема) → http://www.djvu-scan.ru/forum/index.php?topic=1099.0
(скачать) → http://rusfolder.com/33369910
— FR11 DjVu Text Layer Crutch v0.21 Автор: NME
http://forum.ru-board.com/topic.cgi?forum=5&topic=38467
(описание) → http://forum.ru-board.com/topic.cgi?forum=5&top...imit=1&m=1#1
(скачать) → http://rusfolder.com/34882354
_________________________________________
Маленькое дополнение)
* "textsharik - 999966666 страниц в словаре - ненужное "улучшение" - небольшой выигрыш в размере при падении юзабилити как итоговой книги так и кодера. лизартеш рекомендует словарь на 20 страниц. я - на 50. кодируется приемлемо быстро, открывается (cel d 2.4 1gb ram + drweb 7 проверяет ВСЕ) приемлемо быстро.
два часа создавал словарь!!! и это на c2d e8400 4gb ram xpsp3rus без антивирусов!!! полученный выигрыщ - 1200 (!!!) кб (50 страниц - 20,7 мб, 9999 страниц - 19,2 мб) - оно того не стоит..." — NBell
Сам видеоурок можно скачать здесь → http://yadi.sk/d/bHvnKiiK3Tvnr Автор: yuree
или посмотреть здесь → https://vimeo.com/62495660

Оцифровка текста в дореформенной грамматике и последующий перевод его на гражданский русский язык. (by Shassukkum)

Оцифровка текста в дореформенной грамматике и последующий перевод его на гражданский русский язык.
Необходимые программы:
— Abbyy Finereader 11.0.110.122
— Hieroglyph 3.7
(скачать) → http://www.adelaida.net/hieroglyph/
— Алгоритм замены. Автор: Павел Черников (ака Чароплёт)
(скачать) → http://yadi.sk/d/gTu43Q-Q3fCIU
— Словарь русской орфографии. Авторы: Александр ЛебедевСергей ВиницкийchaourceПавел Черников
(скачать) → http://yadi.sk/d/nHZpWPoN3VsZN
— Словарь-дополнение. Можете соорудить свой)
— Видеоурок по дореформке.
(скачать) → http://yadi.sk/d/IN6wFssQ3fCQG
(посмотреть) → https://vimeo.com/63005073

Уточнение

В видеоуроке я копировал и вставлял текст в Иероглиф копипастом. Если текст большой то можно сохранить в txt или в rtf формате, после замены. То-же касается и создания fb2 файла. Вообщем, кому как удобнее)
Видео-помощь по СТ

Пояснения:

Отсканированные страницы + слой распознанного текста и Распознанный текст без ошибок (OCR), какая между ними разница ?

Оригинал

Отсканированные страницы

Распознанный текст без ошибок (OCR)
-Отсканированные страницы - это закодированная картинка в контейнер (DjVu). К которой можно подшить слой текста. Что даст возможность скопировать текст проведя мышкой по картинке.
Распознанный текст без ошибок (OCR) - это распознанный в ФР текст ("векторный").

Дополнительно к нему ничего распознавать и подшивать не нужно. Его сразу можно выделять и копировать. + Он без мусора.


Показать сообщения:    

Текущее время: 06-Дек 17:10

Часовой пояс: UTC + 3


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы