vitus_wagner: My photo 2005 (Default)
[personal profile] vitus_wagner
Тут [livejournal.com profile] shaplov втянул меня в проект fb2-perl-tools. Потом уже я втянул туда [livejournal.com profile] gegmopo4, который, правда на perl не пишет, но вычисткой коллекций fb2 занимается.

Надо бы туда в wiki манифест какой-нибудь написать про что этот проект, какие составные части и так далее.

В общем, если кто интересуется обработкой fb2, а особенно если еще и на perl писать умеет,
welcome. Основные дискуссии, правда, сейчас ведутся в англоязычном списке рассылки проекта.

Date: 2007-06-04 06:42 pm (UTC)
ocehb: (Default)
From: [personal profile] ocehb
а чем они отличаются? в русском -- 3 письма, в английском -- 4...

Date: 2007-06-04 06:51 pm (UTC)
From: [identity profile] ibnteo.livejournal.com
Приспичило перегнать данные в fb2, оказалось что софта недостаточно для меня.
Тоже занялся проблемой, но с другой стороны - конвертация .abw (AbiWord) в .fb2 через XSLT трансформацию.

Date: 2007-06-06 07:57 am (UTC)
From: [identity profile] ibnteo.livejournal.com
Обойдешься, т.к. формат .abw тоже Base64 кодирование использует, и складывает картинки в свой xml файл.
Формат у него свой, но в пакете abiword-plugins есть поддержка кучи форматов чужих для импорта и экспорта.

Date: 2007-06-04 07:30 pm (UTC)
From: [identity profile] b-a-t.livejournal.com
А почему .abw, а не .odt например? Всяко ОО умнее по части .doc, например.

Date: 2007-06-06 08:03 am (UTC)
From: [identity profile] ibnteo.livejournal.com
.odt хранит картинки в бинарном виде, поэтому одним XSLT не обойдешься, придется кодировать из бинарного вида в Base64 сначала.

Date: 2007-06-04 07:31 pm (UTC)
From: [identity profile] blacklion.livejournal.com
А там XSLT + text utils недостаточно? :) Ну, для разкладки коллекции по своему вкусу, создания индексов, etc?

Date: 2007-06-05 06:07 am (UTC)
From: [identity profile] blacklion.livejournal.com
давно задуманный
Хе-хе. про себя могу тоже самое сказать -- тоже давно задумал ровно такой конвертер :)

А картинки в FB2 вообще тем отдельная и зряшная, IMHO.

Date: 2007-06-05 09:14 am (UTC)
From: [identity profile] awind.livejournal.com
а что, оно уже научилось картинки понимать? а таблицы?

Date: 2007-06-05 01:35 pm (UTC)
From: [identity profile] awind.livejournal.com
в художественной не нужны, а в научно-популярной, включая историческую, уже нужны. так что книжки с милитеры приходится таки в iSilo читать.

Date: 2007-06-05 07:09 am (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Тут shaplov втянул меня в проект fb2-perl-tools
Никто никого никуда не втягивал... Ты сам по ссылке пошел... ;-)

Основные дискуссии, правда, сейчас ведутся в англоязычном списке рассылки проекта.
Да... наверное надо перейти в русский... Все равно все русскоязычные...
В английский собирался постить только важные для истории моменты (по крайней мере до тех пор пока не появится кто-то не русско говорящий)

А забытый rb?

Date: 2007-06-05 10:01 am (UTC)
From: [identity profile] dinozavr.livejournal.com
А несчастные владельцы Rocket Book и REB1100, 1200? судя по тому же альдебарану, да и фикшнлиб, таких не так уж и мало...

Не думали ли Вы хотя б о минимальной тулзе (комманд лайн) для конвертации книг в формат rb? Что работала в линуксе.

Пока под линукс существует всего лишь одна (все та же) rbmake . С исходниками. Которую, однако, мне не удалось заставить поддерживать русский язык ни в одним linux (utf-8, koi8-r). При том что в Windows (2k, XP, ... ) он, собраный из исходников русский язык (cp1251) отлично конвертирует в читаемый на моем REB1100.

Автор про проблемы русского языка принципиально мейлом не отвечает.
(про другие - отвечает быстро и по делу.)

Вот и получается в сухом остатке, что русскоязычные пользователи Unix, Linux книги на русском языке для своей электронной книги конвертировать не могут. Только на английском.

Или винду грузить. У кого она есть...

Это единственное приложение, которое у меня осталось не работающее в linux. Де-факто, я к дочке бегаю с флешкой, на которой записан windows rbmake.

Решили б вы эту проблему - оч. много русскоязычных фанатов Рокетов спасибо бы сказали. Рокеты всех поколений не понимают ни fb2, ни pdf, ни txt, ни html - то есть единственный способ в них что-то запихать - только rb.

Честно скажу, мне - видимо слабО самому разобраться. Там все концы в библиотеки уходят.
Если возьметесь - готов предложить свою помощь в тестировании, отладке, документировании. Есть для тестов Solaris с 7 по 10, xubuntu 7.04, Zen Walk 4.6, CentOS.

Re: А забытый rb?

Date: 2007-06-05 12:54 pm (UTC)
From: [identity profile] dinozavr.livejournal.com
Можно ли назвать закрытым и проприетарным формат, для которого доступны конвертеры и ридеры В ИСХОДНИКАХ?

Интересен также факт, что компания, которая им занималась, приложила силы для того чтоб РАСКРЫТЬ формат, исходники и способ общения с девайсом еще до своей смерти.

Скорей беда компании, чем вина, что она давно померла.
А за ней померла компания, купившая ее остатки.
Так что даже шнурок с телефонным разъемом в устройстве теперь бесполезен - нет ни того сайта, ни того номера телефона.

Интересно также то, что устройства эти люди находят и покупают даже спустя 7 лет после их выпуска. Видимо, есть какой-то у них резон, по сравнению с хорошими и открытыми современными устройствами? И это отнюдь не цена.

Линкуется там не libxml, а libxml2 (это кстати нигде не указано). Что ж, попробую как-нибудь поставить что-нибудь ненужное в locale 1251 и проверить предположения...

Re: А забытый rb?

Date: 2007-06-07 01:07 pm (UTC)
From: (Anonymous)
кроме n800 новый palm интересен

он конечно не карманного формата, но все равно достаточно небольшой и тонкий, чтобы иметь его с собой почти всегда.
по сравнению с n800 плюсом идет практически обычная ноутбучная клавиатура

Date: 2007-08-13 12:40 pm (UTC)
From: [identity profile] blacklion.livejournal.com
Я вот подумываю, что давно задуманный конвертер fb2 в latex надо не через xslt делать, а через обычный SAX-парсинг.
А ты его так и не сделал пока?

Date: 2007-08-13 12:59 pm (UTC)
From: [identity profile] blacklion.livejournal.com
Питон? Не подкручу :)
Придётся, видимо, таки на перле… Действительно, на SAX'е…

Date: 2007-08-14 01:32 pm (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Гм... чем XSLT таки не угодил? Он в каком-то смысле лучше тем, что этот шаблон можно перетащить из одного языка в другой с минимальными усилиями...

Date: 2007-08-14 01:47 pm (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
вас понял...

Date: 2007-08-14 03:58 pm (UTC)
From: [identity profile] blacklion.livejournal.com
Картинки доставать неудобно XSLT'шкой.

Date: 2007-08-13 01:01 pm (UTC)
From: [identity profile] blacklion.livejournal.com
А то задолбало RTF'ы с альдебарана руками править в OO…

Date: 2007-08-13 01:13 pm (UTC)
From: [identity profile] blacklion.livejournal.com
На самом деле, не так всё плохо.
(1) Открываем, сохрянем в ODT
(2) Замещаем styles.xml файлом из предыдущей книжки, правя header потом руками
(3) Удаляем нафик все пустые абзацы из content.xml регекспом.
(4) Удаляем metainfo с обложкой руками. Это даже чаще в шаге (1)
(5) Применяем первой странице стиль default руками.

По сути — всё.

Profile

vitus_wagner: My photo 2005 (Default)
vitus_wagner

June 2025

S M T W T F S
1 23 4 56 7
89 1011121314
15161718192021
22232425262728
2930     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 11th, 2025 01:57 pm
Powered by Dreamwidth Studios