Apr. 2nd, 2019

vitus_wagner: My photo 2005 (Default)
Попробовал конвертировать odt в fb2 pandoc-ом. Да, я знаю что есть OOFb2tools и они у меня даже стоят. Но у меня стоит задача читать регулярно обновляемый и редактируемый odt-файл. (вот возьму вообще incron прикручу, чтобы каждый раз как Ирина выкладывает новую версию этого файла с ноутбука на большую машину, оно бы конвертировалось и складывалось ко мне в ~/Books/Е/Емельянова_Ирина)

Поэтому операция должна быть пакетной. Ну да, pandoc категорически не умеет заполнять метаинформацию fb2. Настолько категорически, что проще оказалось пропустить его вывод через
sed s '!<description>.*</description>!<description>правильное содержимое</description>!'


Но тут выяснилось что еще и empty-line внутрь p пихает (откуда вообще в офисном документе empty-line? Там в принципе принято это пустыми параграфами делать). Но это тоже пофиксить sed-ом несложно.

Теперь вот думаю что делать с этим скриптом. Хорошо бы его обобщить, возможно это не единственный odt-файл, который надо регулярно преобразовывать в fb2. Но тогда надо придумать способ как-то метаинформацию держать отдельно от скрипта.
vitus_wagner: My photo 2005 (Default)
По просьбе апстрим-авторов поставил свежий pandoc (2.7.1).
Оказывается, он таки почти научился генерировать fb2. И даже картинку с обложкой вставляет.
Что осталось:

1. Мне не удалось задать жанр - ни через Yaml блок во входном markdown (или --metadata-file, если входной формат odt), ни через --metadata. За исключением жанра выдает вполне валидирующийся title-info. То есть автора, язык, заголовок, дату и cover-image вполне правильно задает.
2. document-info оно пока не научилось. Пишет только
<program-used>pandoc</program-used>
.

Profile

vitus_wagner: My photo 2005 (Default)
vitus_wagner

May 2025

S M T W T F S
    1 2 3
4 56 7 8 9 10
11 12 131415 1617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 23rd, 2025 05:37 am
Powered by Dreamwidth Studios