vitus_wagner: My photo 2005 (Default)
vitus_wagner ([personal profile] vitus_wagner) wrote2007-09-03 11:10 pm

15 лет UTF-8

Как любят говорить на ЛОРе, годовщина подкралась тихо и незаметно.
Но хитроумный [livejournal.com profile] slobin её всё же отследил и опубликовал ссылку
на исторический документ.

Как выясняется, и эту вещь изобрели Роб Пайк и Кен Томпсон. Ну просто талант у людей изобретать нечто, что выглядит жутко, вызывает массу ругани, но все пользуются, потому что лучше никто придумать не может.

[identity profile] vadiml.livejournal.com 2007-09-04 05:27 am (UTC)(link)
ага, я irc клиента с кодировкой utf8 как-то выписывал -- радость еще та, все время перепроверял чтоб ни чего не забыть

[identity profile] alamar.livejournal.com 2007-09-04 05:43 am (UTC)(link)
А что надо было сделать?
Вместо UTF-8?

[identity profile] silly_sad.livejournal.com 2007-09-05 10:29 am (UTC)(link)
надо было выбросить саму идею юникода на помойку.
или хотябы не пособничать преступникам из IETF в распространении этой мерзости.

[identity profile] alamar.livejournal.com 2007-09-05 10:36 am (UTC)(link)
А какой вариант тебя лично более устроил бы?
Какую замену уникоду ты видишь?

P.S. Я знаю несколько ответов на этот вопрос, но хочу услышать твой.

[identity profile] silly_sad.livejournal.com 2007-09-05 10:39 am (UTC)(link)
> Какую замену уникоду ты видишь?

ту которая решит поставленную задачу.
поставленной задачи нет? - значит и замена не нужна.
когда мне стал не нужен фотоувеличитель, я его выбросил и не искал ему замены.

[identity profile] alamar.livejournal.com 2007-09-05 10:56 am (UTC)(link)
Задача есть, она звучит так примерно:
Представление произвольного текста на всех широкораспространенных языках и со всеми встречающимися в нем спецсимволами, общеупотребительными и типографическими символами в виде непрерывного однородного потока байт.

[identity profile] silly_sad.livejournal.com 2007-09-05 11:15 am (UTC)(link)
я незнаю откуда вы эту задачу взяли.
но у неё есть два решения, любое из них лучше юникода:

1) взять все буквы всех алфавитов, совокупно со всеми известными знаками препинания и разделителями, и пронумеровать их любым образом.
2) пронумеровать любым желанным способом все буквы каждого одного алфавита совокупно со всеми знаками препинания и разделителями, затем пронумеровать все алфавиты.

Возможны технические детали, о которых спорить уже безсмыссленно.

Второй вариант мне лично нравится больше, потому что его можно компактнее представлять (если с умом ввести нумерацию) и он не так сильно требует знать что такое "все алфавиты" - а это помоему очень важно. Я например не знаю что такое "все".

[identity profile] alamar.livejournal.com 2007-09-05 11:22 am (UTC)(link)
Эта задача стоит, и она офигенно остро стоит. Зачем еще можно делать такую кодировку?

Уникод, по-моему, это просто-напросто ваш первый вариант минус превратности реального мира минус лоббизм.
Второй вариант тоже очень даже был, предполагалось - что уникод будет состоять из nnn таблиц для разных языков. У него есть свои минусы - искушение отбросить все таблицы, кроме своей. К тому же, знаки препинания и тому подобное - будут очень сильно дублироваться, куда сильнее, чем в уникоде сейчас.

[identity profile] silly_sad.livejournal.com 2007-09-05 11:31 am (UTC)(link)
> Уникод, по-моему, это просто-напросто ваш первый вариант минус...

Извините, но мы говорим на слишком разных языках.
Ничего из сказанного мной не было понято.

[identity profile] alamar.livejournal.com 2007-09-05 11:40 am (UTC)(link)
Значит, конструктивных предложений нет.
Коммуникация не состоялась...

[identity profile] silly_sad.livejournal.com 2007-09-05 11:45 am (UTC)(link)
ещё один товарищ, который не понимает разницу между алфавитом и его графическим представлением.