Генерация pdf из командной строки
Oct. 27th, 2014 04:02 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Интересно, чем бы таким опенсурсным и не использующим X-овых библиотек (headless, серверным) можно в наше время генерировать PDF-документы, содержащие в основном обычный текст с минимальными шрифтовыми выделениямии (уровня примерно HTML 2.0 - заголовки двух-трех уровней, пара видов логического выделения в тексте, 2-3 вида списоков).
Но чтобы нормально работало по меньшей мере со всем Basic Multilingual Plane юникода (входной формат - что-то в utf-8).
Варианты на базе pdftex не предлагать. Про них и лежащие там грабли сам знаю.
Варианты на базе xelatex или luatex готов посмотреть, если мне убедительно объяснят, что вот здесь все хорошо, и будет работать со всеми буковками, которые есть в шрифте DejaVuSans, LiberationSerif или что там оно испольузе
В принципе, сейчас библиотеки для создания pdf есть во всех подряд языках. Но вот попробовал питоновскую (которая reporlab, вернее командно-строчная обертка вокруг неё - rst2pdf) не тянет кириллицы совсем. Это я еще не злобствую, и не подсовываю туда right-to-left письменности.
То что у libreoffice есть headless-режим я знаю.
Про apache fop с удовольствием бы послушал рассказы тех, кто щупал.
Но чтобы нормально работало по меньшей мере со всем Basic Multilingual Plane юникода (входной формат - что-то в utf-8).
Варианты на базе pdftex не предлагать. Про них и лежащие там грабли сам знаю.
Варианты на базе xelatex или luatex готов посмотреть, если мне убедительно объяснят, что вот здесь все хорошо, и будет работать со всеми буковками, которые есть в шрифте DejaVuSans, LiberationSerif или что там оно испольузе
В принципе, сейчас библиотеки для создания pdf есть во всех подряд языках. Но вот попробовал питоновскую (которая reporlab, вернее командно-строчная обертка вокруг неё - rst2pdf) не тянет кириллицы совсем. Это я еще не злобствую, и не подсовываю туда right-to-left письменности.
То что у libreoffice есть headless-режим я знаю.
Про apache fop с удовольствием бы послушал рассказы тех, кто щупал.
no subject
Date: 2014-10-29 01:55 pm (UTC)no subject
Date: 2014-10-29 02:55 pm (UTC)no subject
Date: 2014-10-27 01:36 pm (UTC)Решение работает под Солярисом в Транстелекоме уже лет 7, все довольны ;)
no subject
Date: 2014-10-27 01:43 pm (UTC)no subject
Date: 2014-10-27 01:45 pm (UTC)Мне нужен весь BMP, то есть по крайней мере вся латиница (включая польский и исландский), греческий и нормальная пунктуация, и это в одном документе с кириллицей.
Пробовать даже не интересно, по причине отсутсрвия документов, которые можно было бы без потерь сконвертить в 8-битную кодировку.
Хотя вот нет - попробовал и убедился, что cp1251 Оно только делает вид, что понимает.
no subject
Date: 2014-10-27 01:46 pm (UTC)В следующий раз за попытку что-то сказать на таком уровне понимания темы - забаню.
no subject
Date: 2014-10-27 01:47 pm (UTC)no subject
Date: 2014-10-27 01:58 pm (UTC)Простые случаи - это какие языки? Русский и английский? В каком формате исходно пишется/генерируется документ и как потом преобразуется в XSL-FO?
no subject
Date: 2014-10-27 02:04 pm (UTC)no subject
Date: 2014-10-27 02:09 pm (UTC)no subject
Date: 2014-10-27 02:12 pm (UTC)no subject
Date: 2014-10-27 02:13 pm (UTC)Вот кого б я убил с особой жестокостью, так это тех троллей. которые qt написали.
no subject
Date: 2014-10-27 02:15 pm (UTC)no subject
Date: 2014-10-27 02:15 pm (UTC)no subject
Date: 2014-10-27 02:15 pm (UTC)Без него никак.
no subject
Date: 2014-10-27 02:16 pm (UTC)no subject
Date: 2014-10-27 02:17 pm (UTC)no subject
Date: 2014-10-27 02:19 pm (UTC)Мне надо из одного формата документа сделать другой.
И НЕ СМЕТЬ НИЧЕГО РЕНДИРИТЬ. Рендирить будет pdf viewer совсем в другом месте и на другой платформе. А дело требуемой утилиты - аккуратно положить в pdf-файл инструкции что и как рендирить - графические примитивы, шрифты, jpeg и png картинки.
no subject
Date: 2014-10-27 02:19 pm (UTC)no subject
Date: 2014-10-27 02:22 pm (UTC)no subject
Date: 2014-10-27 02:31 pm (UTC)ну или поискать готовый html2ps на перле
no subject
Date: 2014-10-27 02:37 pm (UTC)no subject
Date: 2014-10-27 02:38 pm (UTC)no subject
Date: 2014-10-27 02:42 pm (UTC)no subject
Date: 2014-10-27 02:45 pm (UTC)Впрочем, даже если такой конвертер найдется, то увы, gostscript генерирует безобразные pdf-ы - без оглавления, без возможностей поиска, да еще и шрифты в кривые преобразовать норовит.
"готовый html2ps на perl-e" увы. не развивался с тех пор как я 15 лет назад его патчил на предмет поддержки хоть какой кириллицы. За пределами 8 битных кодировок ничего не умеет, шрифты включать не умеет.