А что у нас прямое?
Oct. 14th, 2019 05:23 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
https://developers.slashdot.org/story/19/10/12/2134246/larry-wall-approves-re-naming-perl-6-to-raku
В отличие от Гвидо, который таки прогнул пользователей Python переползти на Python3, Ларри сдался.
И признал что perl 6 это не perl, а Raku. А perl останется тем, что мы уже лет двадцать знаем как perl5.
В отличие от Гвидо, который таки прогнул пользователей Python переползти на Python3, Ларри сдался.
И признал что perl 6 это не perl, а Raku. А perl останется тем, что мы уже лет двадцать знаем как perl5.
no subject
Date: 2019-10-14 02:31 pm (UTC)no subject
Date: 2019-10-14 08:25 pm (UTC)no subject
Date: 2019-10-14 02:51 pm (UTC)no subject
Date: 2019-10-15 06:06 am (UTC)Я знал, я знал !
no subject
Date: 2019-10-15 09:30 am (UTC)no subject
Date: 2019-10-15 09:34 am (UTC)no subject
Date: 2019-10-15 04:11 pm (UTC)no subject
Date: 2019-10-17 07:24 am (UTC)wchar_t это не 16 бит, а 32. 16 бит он только в тостерах и кофеварках (в смысле Win32 и Java).
no subject
Date: 2019-10-17 03:32 pm (UTC)Продуктивнее использовать компактный utf-8 (без x4 роста объёма занимаемой памяти из-за "в документе попался модный смайлик"), передавать его по сети как есть (ибо стандарт), а при необходимости на лету конвертировать к utf-16 для вызова легаси API на "кофеварках".
no subject
Date: 2019-10-18 08:31 am (UTC)А если еще учесть что даже без учета кодировки символов внутреннее представление документа (например дерево XML DOM) занимает на порядок больше памяти, чем сериализованное, то удвоение места на текстовое представление никто не заметит. Указатели (нынче везде 64-битные) место жрут, а вовсе не буковки.
no subject
Date: 2019-10-18 01:41 pm (UTC)Моя позиция в том, что задачи делятся на:
1. "Не важно как хранить" (из множества utf-8, utf-16, utf-32).
2. "Не важно как хранить, но должно быть компактно и быстро" (только utf-8).
3. "Нужен произвольный O(1) доступ к _любым_ отдельным code points" (только utf-32).
И последняя группа не только самая малочисленная, но и состоит в основном из решений "на ASCII работало, авось и тут будет". При том, что код вроде "найти точку и заменить расширение файла" в неё не входит, и прекрасно работает на utf-8.