vitus_wagner (
vitus_wagner) wrote2007-09-03 11:10 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
15 лет UTF-8
Как любят говорить на ЛОРе, годовщина подкралась тихо и незаметно.
Но хитроумный
slobin её всё же отследил и опубликовал ссылку
на исторический документ.
Как выясняется, и эту вещь изобрели Роб Пайк и Кен Томпсон. Ну просто талант у людей изобретать нечто, что выглядит жутко, вызывает массу ругани, но все пользуются, потому что лучше никто придумать не может.
Но хитроумный
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
на исторический документ.
Как выясняется, и эту вещь изобрели Роб Пайк и Кен Томпсон. Ну просто талант у людей изобретать нечто, что выглядит жутко, вызывает массу ругани, но все пользуются, потому что лучше никто придумать не может.
no subject
Сравни как-нибудь время работы grep на файле utf-8 и в однобайтной кодировке.
А сколько граблей (так до сих пор и непреодоленных) породило притаскивание UTF-8 в X11...
no subject
no subject
Вместо UTF-8?
no subject
no subject
или хотябы не пособничать преступникам из IETF в распространении этой мерзости.
no subject
Какую замену уникоду ты видишь?
P.S. Я знаю несколько ответов на этот вопрос, но хочу услышать твой.
no subject
ту которая решит поставленную задачу.
поставленной задачи нет? - значит и замена не нужна.
когда мне стал не нужен фотоувеличитель, я его выбросил и не искал ему замены.
no subject
Представление произвольного текста на всех широкораспространенных языках и со всеми встречающимися в нем спецсимволами, общеупотребительными и типографическими символами в виде непрерывного однородного потока байт.
no subject
но у неё есть два решения, любое из них лучше юникода:
1) взять все буквы всех алфавитов, совокупно со всеми известными знаками препинания и разделителями, и пронумеровать их любым образом.
2) пронумеровать любым желанным способом все буквы каждого одного алфавита совокупно со всеми знаками препинания и разделителями, затем пронумеровать все алфавиты.
Возможны технические детали, о которых спорить уже безсмыссленно.
Второй вариант мне лично нравится больше, потому что его можно компактнее представлять (если с умом ввести нумерацию) и он не так сильно требует знать что такое "все алфавиты" - а это помоему очень важно. Я например не знаю что такое "все".
no subject
Уникод, по-моему, это просто-напросто ваш первый вариант минус превратности реального мира минус лоббизм.
Второй вариант тоже очень даже был, предполагалось - что уникод будет состоять из nnn таблиц для разных языков. У него есть свои минусы - искушение отбросить все таблицы, кроме своей. К тому же, знаки препинания и тому подобное - будут очень сильно дублироваться, куда сильнее, чем в уникоде сейчас.
no subject
Извините, но мы говорим на слишком разных языках.
Ничего из сказанного мной не было понято.
no subject
Коммуникация не состоялась...
no subject
no subject