vitus_wagner: My photo 2005 (Default)
[personal profile] vitus_wagner
У catdoc в Debian завелся новый мейнтейнер. Из UK. Накоммитил хрен знает каких патчей, и, естественно, сломал кириллицу (конкретно работу с маленькой буквой я в кодировке 1251). А ко мне с баг-репортами пристают,
Подозреваю, что, судя по словам cp932 в changelog-е, компиляцию для основной target platform он тоже сломал.

Потому что catdoc - нифига не юниксовая программа. Это 16-битная досовская программа, которая написана достаточно переносимо, чтобы собираться под unix.

В общем, нельзя носителям английского доверять работу с софтом, основная задача которого - преобразование кодировок.

Date: 2011-11-14 01:55 pm (UTC)
From: [identity profile] mynine.livejournal.com
Это точно. Хотя, и дойчи тоже не сильно лучше. Мне тоже приходилось искать, исправлять и тыкать носом (и, боюсь, еще придется) в явные баги после перехода одного опен продукта на UTF8. Латиница-то у них абсолютно корректно работала, а сыпалось на кириллице :)

Date: 2011-11-14 02:29 pm (UTC)
From: [identity profile] rblaze.livejournal.com
В немецком же есть расширеные символы, \u00df например.

Date: 2011-11-14 02:34 pm (UTC)
From: [identity profile] mynine.livejournal.com
Я знаю, но тем не менее. Судя по всему, таких символов попадается слишком мало в текстах, чтобы проявлялись те эффекты.

Date: 2011-11-14 05:32 pm (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
А что в ихних кодировках с кодом 0xFF?

Date: 2011-11-15 02:17 am (UTC)
From: [identity profile] fenster.livejournal.com
Например, при неправильном обращении это EOF. Ошибка на уровне студенческой делать char c = fgetc(f) и потом сравнивать c и EOF. Не утверждаю, конечно, что в случае catdoc поломалось именно это.

Date: 2011-11-15 02:19 am (UTC)
From: [identity profile] fenster.livejournal.com
И да, проблема не в ихних, а в наших (точнее, в cp1251) кодировках :) Какого фига надо было на 0xFF навешивать реальную букву алфавита, спрашивается.

Date: 2011-11-24 03:40 pm (UTC)
From: [identity profile] avr-forever.livejournal.com
Как бы EOF == (int) -1, а не (unsigned char) -1.

Date: 2011-11-24 04:19 pm (UTC)
From: [identity profile] fenster.livejournal.com
Absolutely. Но проблема-то в том, что англоязычные товарищи считают нормальным читать символы в char c и сравнивать if (c == EOF), получая при прочитанном в c символе 0xFF истину при сравнении в том (частом) случае, когда char по умолчанию signed.

Date: 2011-11-16 04:36 pm (UTC)
From: [identity profile] edo-rus.livejournal.com
а есть ли смысл так заботиться о поддердке dos?

если не считать windows 98, то в последний раз dos я видел на компьютере, обслуживающем старый томограф.
насколько я знаю, тот томограф уже списан несколько лет назад. да и не был бы списан - catdoc там совершенно не нужен.

Date: 2011-11-14 01:59 pm (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Ты добавь в дистритубив набор тестов, чтобы любой белый сэр мог догадаться, что в нашей африке приличествует делать, а что нет... Просто какой-то док файл с кириллицей проверять чтобы оттуда выходила тоже кириллица...

Date: 2011-11-14 05:28 pm (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
catdoc же вроде и на plain text использовать можно.

Зачем какой-то?

Date: 2011-11-14 05:55 pm (UTC)
pargentum: (Default)
From: [personal profile] pargentum
Просто написать во всех основных кодировках:

съешь же ещё этих мягких французских булок, да выпей чаю

Date: 2011-11-15 06:50 am (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Ну, для начала, просто подойдет тест вида "doc c русскими буквами внутри". Оно сразу помешает англичанину все попортиь...

А если попорчанье идет на более древних версиях, я например старые компакт диски еще не выкинул. Могу поставить какое-то старье на виртуалке, и файл с русскими буквами сделать...

Date: 2011-11-15 07:32 am (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Ну, понятно что всех вариантов сейчас уже не покрыть. Но я продолжаю говорить и полезности покрытия базовых вариантов тестов, и предлагаю некоторое сове соучастие...

А остальное, если хочется доказать что что-то сложно, то это тогда отдельный разговор...

Date: 2011-11-14 03:47 pm (UTC)
slobin: (Default)
From: [personal profile] slobin
А японцы обычно пытаются решать слишком общую задачу, и в итоге тоже получается плохо, потому что до мелочей реальной жизни руки у них не доходят. Лучше всего получается у греков, но греческих программ в мире как-то очень мало. Но та одна, что я видел, таки да работала! :-)

... Эстонский штопор ...

Date: 2011-11-14 05:28 pm (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
Братья по алфавиту. Двоюродные.

Date: 2011-11-17 07:49 pm (UTC)
From: [identity profile] dottedmag.net
transifex.net?

Date: 2011-11-14 05:31 pm (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
Помнится, я тебе когда-то (много лет назад) присылал патч, исправляющий детские ошибки при работе с EOF.
mashckoff: (Default)
From: [personal profile] mashckoff


Помнится флешмоб по поводу включения русского словаря для проверки орфографии в официальную локализованную версию OpenOffice.org (или то была проблема фильтра xls95?).

Потому как (с другой стороны), локальная толпа набигает (тм) и разработчики/мантейнеры вынуждены менять приоритеты.

ЗЫ: я понимаю, что Вы автор программы и иллюстрация может выглядеть немного не подходящей.

Date: 2011-11-14 10:02 pm (UTC)
From: [identity profile] silly-sad.livejournal.com
беда в том, что этим censored уже доверили разработку самих кодировок.
остальное -- мелочи.

Date: 2011-11-15 07:47 am (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
Да с CP1251 оно вообще сейчас не работает — сегфолтится даже без буквы «я». Причём, на первый взгляд, в части, не тронутой мейнтейнером.

Почему бы тебе не принять в мейнстрим часть патчей выборочно? Там есть вполне разумные и безобидные изменения. Заодно включил бы мой патч по работе с iconv — и пусть собирают с ним, сразу же часть патчей по поддержке азиатских кодировок окажется ненужной.

Date: 2011-11-15 08:15 am (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
Ничего он не ломает. iconv используется для посимвольной перекодировки, меняется только реализация функций convert_char и to_unicode. Можно сделать и эффективнее, но это влияет только на скорость, а переписывать придётся больше.

Кроме азиатских кодировок (из-за которых дебиановский патч в 4 раза больше оригинального кода) там есть и другие изменения.

Date: 2011-11-15 08:43 am (UTC)
ext_605364: geg MOPO4 (Default)
From: [identity profile] gegmopo4.livejournal.com
Ты всё же отделяй зёрна от плевел. Исправление «becouse» там по делу.

А вот что в патч включены генерируемые файлы, вроде catdoc.{1,ps,txt} или config.h — хм…

Date: 2011-11-16 05:20 pm (UTC)
From: [personal profile] ramendik
А какой толк международным дебиановским юзероам от русского комментария в блоге?

Вариантов решения, кроме "ты получаешь ключ и звание DD", "ты находищь вменяемого майнтейнера" и "ты пишешь тому майнтейнеру письмо, чтобы он делал уже форк", я не вижу.

Profile

vitus_wagner: My photo 2005 (Default)
vitus_wagner

April 2026

S M T W T F S
    123 4
5 6 7 89 1011
12 13 1415161718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Apr. 15th, 2026 02:41 am
Powered by Dreamwidth Studios