vitus_wagner: My photo 2005 (Default)
[personal profile] vitus_wagner
[livejournal.com profile] shaplov - тестер от бога. Причем сильно подозреваю, что бога в данном случае зовут Шива.

Date: 2016-03-23 12:55 pm (UTC)
phd_ru: (Default)
From: [personal profile] phd_ru
Такой ценой исправлено, что может, лучше не надо?

Date: 2016-03-23 01:18 pm (UTC)
phd_ru: (Default)
From: [personal profile] phd_ru
Да вот ровно этим и не нравиться — тотальной юникодизацией. Я предпочитаю иметь возможность не использовать юникод там, где он мне не нужен или мешает.

Date: 2016-03-23 01:41 pm (UTC)
phd_ru: (Default)
From: [personal profile] phd_ru
В ближайшие 100 лет кодировки никуда не денутся, так что выбросьте из головы эти мечты. С моей точки зрения правильным способом программирования на Python3 является использования байтовых строк, и лишь в редких случаях юникода.

Несколько примеров из моей личной практики:
— FTP сервер и rsync; имена файлов в koi8-r, cp1251, utf-8;
— файлы mp3; теги в них в cp1251, реже в utf-8;
— zip-архив или torrent с файлами mp3 и плей-листами; имена файлов будут в локальной кодировке ФС или в utf-8, а плей-листы будут обязательно в cp1251.

Date: 2016-03-23 02:20 pm (UTC)
phd_ru: (Default)
From: [personal profile] phd_ru
> Увидев … надо немедленно
[skip]
> Тэги в MP3 надо использовать…

Ага, ага, надо. Только почему-то это тебе надо, а тем, кто реально это использует, ни фига не надо. Как же так? ;-)

> Кодировки имен файлов в zip-архиве, это все равно такая задница, что иначе как частотным анализом не разберешься.

Бу-га-га. Там давно твой любимый юникод, но именно на него ты ругаешься. Прекрасно!

> Зачем нужна такая хрень как плей-листы, я никогда не понимал.

Ты вообще в музыке ничего не понимаешь. Плей-листы нужны для того, чтобы слушать произведения в том порядке, как это задумал автор альбома или сборника, не внося при этом нумерацию в имена файлов.

Date: 2016-03-23 02:32 pm (UTC)
phd_ru: (Default)
From: [personal profile] phd_ru
Ну, тебе надо, мне надо, ещё двум-трём людям надо. Больше пока не видно, чтобы было надо. И я в любом случае имена и содержимое файлов, теги и плей-листы перекодирую в koi8-r. :-)

Да, в старых zip, конечно, не юникод, там cp437 поверх cp866.
См. http://phdru.name/Software/Python/misc/

(no subject)

From: [personal profile] phd_ru - Date: 2016-03-23 02:50 pm (UTC) - Expand

(no subject)

From: [personal profile] phd_ru - Date: 2016-03-23 02:57 pm (UTC) - Expand

(no subject)

From: [personal profile] phd_ru - Date: 2016-03-23 03:00 pm (UTC) - Expand

(no subject)

From: [personal profile] phd_ru - Date: 2016-03-23 03:31 pm (UTC) - Expand

Date: 2016-03-23 02:30 pm (UTC)
From: [identity profile] qkowlew.livejournal.com
когда вымрут такие ретрограды как ты и Толченов

то настанет пора вымирать тебе, так как актуальной кодировкой станет какое-нибудь UTF-64

Date: 2016-03-23 03:32 pm (UTC)
From: [identity profile] qkowlew.livejournal.com
Не думаю, кстати, что больше 36 битов в ближайшее время понадобится.

Да-да, про 640 килобайт мы все помним... :)
Прикол не в том, что "не понадобится".

Прикол в том, что тот же UTF-8 есть вторичный продукт "взаиможействия старой и новой логики". И дальше число стандартов ни в коем случае не будет уменьшаться. Только увеличиваться.

и UTF-64 родится не из-за нехватки пространства значений, а просто потому что найдутся очередные "делатели единого стандарта, в который надо запихнуть всё и отказаться от".

НЕ ОТКАЖУТСЯ. :(

Date: 2016-03-24 08:33 am (UTC)
From: [identity profile] mc6312.livejournal.com
> Увидев имя файла, в 8-битной кодировке надо немедленно сказать на него convmv.

Увидев имя файла в 8-битной кодировке нужно немедленно забить ржавый гвоздь в голову автора ФС.
Хотя бы за то, что в суперблоке ФС (в частности, у ext2/3/4) нет поля "кодировка имён файлов".

Date: 2016-03-24 09:53 am (UTC)
From: [identity profile] mc6312.livejournal.com
> Причем здесь суперблок файловой системы,
При том, что могут приволочь, например, внешний (или не внешний) диск с другой машины.

> на которой живут файлы разных юзеров, с которыми работают разные процессы, запущенные в разных локалях

"локаль" != "кодировка". А у кого это не так, тому по пальцам арматуриной. Как, например, MS, у которых в консольных тулзах строки гвоздями приколочены, и гадят те тулзы на консоль с CP866 строками в CP1251 или еще какой-нибудь. И в новомодной ихней powershell я на такое натыкался.

PS. В NTFS еще и длина имени файла в символах (той самой UTF-16), а не в байтах (а это еще один гвоздь в голову авторам ext*, где таки, емнимс, байты, и их мало). Очень приятно получить архив с длинными именами из-под винды и получить при распаковке ругань про "имена не влезают".

> Кстати GNOME уже довольно давно
А вот какого [censored] DE думает об кодировке имён файлов? Не его ума дело.

(no subject)

From: [identity profile] mc6312.livejournal.com - Date: 2016-03-24 12:03 pm (UTC) - Expand

(no subject)

From: [identity profile] mc6312.livejournal.com - Date: 2016-03-24 12:22 pm (UTC) - Expand

(no subject)

From: [identity profile] mc6312.livejournal.com - Date: 2016-03-24 01:01 pm (UTC) - Expand

(no subject)

From: [identity profile] mc6312.livejournal.com - Date: 2016-03-24 03:20 pm (UTC) - Expand

Date: 2016-03-24 12:16 pm (UTC)
From: [identity profile] tzirechnoy.livejournal.com
Переменная называется G_FILENAME_ENCODING ...

Date: 2016-03-23 04:10 pm (UTC)
From: [identity profile] besm6.livejournal.com
... и эти теги потом кракозябрами показываются в телефоне, и не могут по-другому, поскольку кодировка в них не указана.

Если кодировка не указана, она должна быть UTF-8, при наличии BOM в начале может быть UTF-16. Если указана, то должна быть такой, какая указана. С этой вашей cp1251 обычное дело - отдать контент в cp866...

У меня как раз с повсеместным внедрением UTF-8 наступило счастье с именами файлов. Они все стали в одной кодировке. FTP я, правда, практически не пользуюсь.

Date: 2016-03-23 04:01 pm (UTC)
From: [identity profile] tzirechnoy.livejournal.com
Кодировки utf-8 несуществует. Это довольно обшырный набор стандартных кодировок и деталей их поддержки плюс пачка нестандартных расшырений для того, что не влезло в стандарт.

Date: 2016-03-23 04:04 pm (UTC)
From: [identity profile] tzirechnoy.livejournal.com
И да, я, в отличие от некоторых собеседников, категорически против юникода. Люди, поставившые себе цэль перечислить все используемые человечеством символы -- либо дебилы либо идиоты, а, скорее всего, и то и другое. Пользоваться их поделиями не следует.

Date: 2016-03-23 04:05 pm (UTC)
From: [identity profile] tzirechnoy.livejournal.com
Описка, читать "либо дебилы либо психи".

Date: 2016-03-24 11:04 am (UTC)
From: [identity profile] shadowfoto.livejournal.com
интереса для, а как решать в таком случае проблему смешанных текстов?

Date: 2016-03-24 11:34 am (UTC)
From: [identity profile] tzirechnoy.livejournal.com
Указывая каким-то образом источник списка символов когда он меняется. Ну, или можно для каждого символа это указывать.

Date: 2016-03-24 11:35 am (UTC)
From: [identity profile] shadowfoto.livejournal.com
так а разница в чем?

Date: 2016-03-24 11:48 am (UTC)
From: [identity profile] tzirechnoy.livejournal.com
В отсутствии единого цэнтра, в котором есть все символы.

(no subject)

From: [identity profile] mc6312.livejournal.com - Date: 2016-03-24 12:05 pm (UTC) - Expand

(no subject)

From: [identity profile] shadowfoto.livejournal.com - Date: 2016-03-24 12:12 pm (UTC) - Expand

(no subject)

From: [identity profile] mc6312.livejournal.com - Date: 2016-03-24 12:25 pm (UTC) - Expand

(no subject)

From: [identity profile] shadowfoto.livejournal.com - Date: 2016-03-24 12:27 pm (UTC) - Expand

Profile

vitus_wagner: My photo 2005 (Default)
vitus_wagner

June 2025

S M T W T F S
1 23 4 56 7
89 1011121314
15161718192021
22232425262728
2930     

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 11th, 2025 11:52 am
Powered by Dreamwidth Studios