vitus_wagner: My photo 2005 (Default)
[personal profile] vitus_wagner
В связи с воплями народа, "Ах, gitweb неправильно показывает файлы в koi8-r" попробовал сконвертировать исходники «Детей пространства» в utf-8. Во-первых, пришлось при смене опции у inputenc с koi8-r на utf-8 пришлось подключить еще пакет textcomp, а то со знаками градуса получилась полная труба. Во вторых, конструкция вида \'и не работает. Пришлось \'{и} писать.

Во-вторых, пришлось с latex2html перейти для генераци html на tex4ht. Потому что latex2html с utf-8 работает совсем хреново. Правда tex4ht не сильно лучше. Он генерирует либо utf-8 html, либо валидный. Потому что забыть в utf-8 html-е 8-битные символы latin1 - ° « » это как-то совсем не комильфо. Пришлось генерировать html в том, что он считает 8859-5, а я - скорее 8859-1 с русскими буквами в виде 16-ричных entities, а потом править маленьким скриптом на Tcl.

Зато, правда, знаки градуса и верхние индексы в обозначениях физических величини (м/с2) попадают в HTML корректно.

Еще оно умеет odt делать. Правда~--- хреново. Все неразрывные пробелы съедаются. И с бабелевским заголовком оглавления оно справиться не может. И верхние индексы в названиях физических величин не тянет.

Еще бы придумать теперь способ это в EPUB или FB2 пакетным способом конвертить.

Date: 2012-10-04 07:45 pm (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
А я вот подумываю к ReST присмотреться. Ну его нафиг Тьюринг-полные языки разметки, я уже слишком стар для ТеХакерства.

Date: 2012-10-05 03:22 am (UTC)
From: [personal profile] d1f
Я уже присмотрелся.
Потрахаться тоже придётся, причём, с техом тоже, если хотите pdf.
Итог приемлем, но жёстковат.

Вот примеры:
http://sigrand.ru/dl/camera/ti/sigticam-doc-ru/
http://sigrand.ru/dl/camera/ti/sigticam-doc-ru.pdf

Стили малоуправляемы, приходится копировать css,
чтобы поменять даже стиль таблиц,
параметров почти нет.

Исходник доки: http://sigrand.ru/gitweb/?p=sgdoc_sigticam.git
Общие настройки: http://sigrand.ru/gitweb/?p=df_sphinx_doc_set.git
Edited Date: 2012-10-05 03:22 am (UTC)

Date: 2012-10-05 07:55 am (UTC)
ext_646638: (Default)
From: [identity profile] rdia.livejournal.com
Помимо latex2html и tex4ht есть ещё hevea - http://hevea.inria.fr/

Что меня поражает - более гуманного, чем LaTeX, формата для набора просто нет. Все остальные по сравнению с ним не предназначены для редактирования человеком.

Кстати, совершенно непонятно, зачем сделали HTML, когда можно было в урезанный TeX вставить гиперссылки.

??

Date: 2012-10-05 05:24 pm (UTC)
From: [personal profile] greenkrokodilla
Хм.. а разве не проще уже готовый ХТМЛ в любой кодировке превращать из скрипта в ХТМЛ в любой другой, чем мучаться с исходником??

iconv -f WINDOWS-1251 -t UTF-8 -o new.file.utf.html old.file.html

Re: ??

Date: 2012-10-05 05:27 pm (UTC)
From: [personal profile] greenkrokodilla
iconv -f KOI8-RU -t UTF-8 -o new.file.utf.html old.file.html

Сам iconv по-моему есть в любой Linux distribution, а если нет, то он компилируется и ставится элементарно.

Re: ??

Date: 2012-10-05 09:23 pm (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
Вот перловый txt2html некоторое время назад норовил кириллицу в utf-8 записать, словно это iso8859-1, преобразуя не-ascii в именованные html entitities. И некоторые конвертеры из TeX-а страдали тем же.

Date: 2012-10-06 07:24 pm (UTC)
From: [identity profile] max630.net
по силам утилите recode, вроде

Re: ??

Date: 2012-10-05 06:40 pm (UTC)
From: [personal profile] greenkrokodilla
ну как, любой оконечный (для чтения через браузер) хтмл файл живет в некой единой кодировке.

Его взять, прогнать через iconv и положить как статический файл.
Или делать пдобное динамически скриптом, но там сами смотрите как у вас сделано и как включить его в цепочку.

Хотя я не представляю себе ваш setup, а потому конечно вам виднее

Re: ??

Date: 2012-10-05 09:18 pm (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
UTF-8 изобретён в 1992 году.

Profile

vitus_wagner: My photo 2005 (Default)
vitus_wagner

May 2026

S M T W T F S
      12
345 6789
10 1112 13 14 1516
17181920212223
24252627282930
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 20th, 2026 05:46 am
Powered by Dreamwidth Studios