vitus_wagner | Я это совершил

Задача - имеется директория куда сваливаются отсканированные страницы в формате pgm. С именами вида произведение1.pgm, произведение2.pgm и так далее. Надо из этого получить .djvu файл, содержащий все произведение целиком. Почему-то мне упорно хотелось решить эту задачу исключительно средствами make. Чтобы говоришь ему

make  произведение.djvu

а оно само определяет сколько там есть страниц и собирает, конвертируя сначала в pbm, а потом упаковывая cjb2.

Вот что получилось:

%.pbm: %</     font>.pgm
    pgmtopbm $+</  b> >$@</ b>
%.djvu: %</    font>.pbm
    cjb2 -clean $+  $@

define tmpl 
$1.djvu: </    font>$$(patsubst %.pgm,%.djvu,</ b>$$(wildcard $1?.pgm))
    djvm -create $$@ $$+ 
endef   

$(foreach</    font> song,$(wildcard *1.pgm),$(eval  $(call  tmpl,$(song:%1.pgm=%))))

Flat | Top-Level Comments Only

From:

jno2004.livejournal.com

осталось сделать варианты на шелле, авке, питоне, перле, тикле... :-)

#!/bin/bash
result="$1"
name=$(basename "$1" .djvu)
for pgm in ${name}*.pgm
do nm=$(basename "$pgm" .pgm)
   pgmtopbm "$pgm" > "$nm".pbm
   cjb2 -clean "$nm".pbm "$nm".djvu # && rm -f "$nm".pbm
done
djvm -create "$result" "${name}"?*.djvu # && rm -f "${name}"?*.djvu

как-то так? :-)

From:

vitus_wagner

Меняем последнюю строчку в Makefile на

SONGS:=$(patsubst %1.pgm,%,$(wildcard *1.pgm))

all: $(patsubst %,%.djvu,$(SONGS))

$(foreach song,$(SONGS),$(eval $(call tmpl,$(song))))

И получаем новое качество - make без параметров делает всё, что требуется сделать.
Повторите то же самое на shell-е. С учетом того, что может потребоваться перестроить .djvu-файл при изменении pgm одной страницы.

Кроме того, в приведенном шелловском скрипте нет контоля ошибок (на tcl, кстати, по умолчанию будет), и нету удаления временныйх файлов (а это придется лапсами писать на любом императивном языке)

From:

jno2004.livejournal.com

ну, да. да...
список должен был выглядеть так: осталось сделать варианты на прологе, рефале, лиспе, хаскеле... :-)

From:

vitus_wagner

Боюсь все хуже - "на любом языке общего назначения", куда пролог вполне попадает. Это make может себе позволить неестественный интеллект по поводу того, какие файлы грохать, а какие - оставить. Плюс ручка под названием PRECIOUS чтобы этот интеллект оверрайдить.

From:

jno2004.livejournal.com

зато на некоторых языках можно практически обойтись без временных файлов! :-P

From:

vitus_wagner

А смысл? Пускай VFS layer разбирается что там в памяти держать, что на диск сбрасывать. Файлы-то немаленькие.

From:

ignik.livejournal.com

Осталось довести до кнопки для оператора рядом с sane с отправлением результатов под index.html за очередной день.

Кстати, это очень полезный пакет получится...

From:

vitus_wagner

Там осталось несколько больше ручных операций

1. Исправление косого положения листа в сканер. Немножко нетривиальная задачка по обработке изображений. Но OCR-пакеты это как-то делают. Причем даже по-моему clara и gocr умеют, так что есть откуда стянуть код.
2. Подбор правильного порога при преобразовании grayscale изображения в битональное.
3. Кадрирование - задача, видимо, наиболее простая. Нужна в основном ради отказа от preview-сканирования. Сосканировать всё и потом резать в gimp даже руками, намного быстрее чем ждать результатов preview scan.

Вот если эти три вещи пофиксить, то процесс сканирования будет автоматзирован абсолютно. От оператора останется только нажать какую-нибудь кнопку (можно на сканере) когда вкладывается лист, и ввести название произведения (после чего софт должен будет автомагически сбросить номер страницы в 1).

From:

ignik.livejournal.com

. Косая бумага:
Правильные сканеры имеют *чёрную* верхнюю крышку. С ней оно просто.
Выравнивание по строчкам делается довольно просто:

Суммируем по горизонтали, получаем функцию у которой мало между строк и много там где строки.
Вычисляем интеграл от нормы её производной. Это резкость. Выбираем такую горизонталь (из диапазона +/-15 градусов, иначе оператор - алкоголик :) , у которой резкость максимальна.

. Для книжек абсолютная точность порога не очень критична, важно чтобы он не менялся от листа к листу. Можно родить отдельную кнопку калибровки, нажимаемую при замене документа.

. preview не надо, надо postview для контроля.

From:

vitus_wagner

Угол у меня получается ±1.5°. Если по модулю менье 0,25° то не правлю. А с черным фоном - облом. При сканировании переплетенной книжки более другие страницы могут очень сильно исказить картину.

А насчет функции стоит подумать. К сожалению, в нотном тексте точность будет не абсолютной. Там довольно много всяких вертикальных палок, зато много и сплошных горизонтальных.

From:

ignik.livejournal.com

Если нужно качественно, то я подкладываю чёрный лист под следующую страницу.
Кончено наверное в принципе возможно её убрать программно..

Flat | Top-Level Comments Only

Profile

vitus_wagner

My Website

April 2026

S	M	T	W	T	F	S
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Page Summary

Style Credit

Style: Clarity for Paletteable by branchandroot
Resources: Holiday

Expand Cut Tags

No cut tags

Page generated Apr. 15th, 2026 02:41 am

Журнал Витуса

Я это совершил

Я это совершил

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

April 2026

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags