vitus_wagner | Semantic locality

http://esr.ibiblio.org/?p=7421

Раймонд умный пост написал по поводу концепций, которые лежат под Unix way. Я эту мысль про семантическую локальность три дня думать буду.

Crossposts: http://vitus-wagner.livejournal.com/1264268.html

Flat | Top-Level Comments Only

From:

livelight

Мы говорим Unix Way - подразумеваем Unix Shell, говорим Unix Shell - подразумеваем Unix Way :)

В принципе, Unix Way не противоречит тому, чтобы собрать сложную ветвящуюся и сходящуюся структуру обработчиков потоков, и даже с типами данных (шеллу это всё уже не по зубам). Но как только у нас случится первая исключительная ситуация где-то в глубинах конвейера - тут уже ой, всё.

From:

amarao-san.livejournal.com

Я давно про это думал. Удивительно или нет, но мне кажется, что единственное решение тут - это монады. Мы передаём на вход утилиты, ожидающей Just data, вывод утилиты, выдающей Maybe Data, и получаем ошибку прям от шелла со словами, который говорит "нельзя". Мы ставим между ними в пайп, конвертор, который знает, что делать когда дата не "Just", и у нас всё работает точно. Наверное, под нужды шелла можно написать и более выразительные монады.

From:

anonim_legion

От слова "монада" перекосит тех, кто писал (и работает с) bash. Если у них уж скобки в if должны непременно отделяться пробелами, то какие уж тут монады...

На этом месте мне вспомнился чудовищных размеров флейм с КЫВТа, где люди (в том числе те, кто компиляторы пишут, а не энтерпрайз какой) спорили о сравнительном удобстве и производительности между передачей кодов ошибок, как в Golang и исключениями, как много где. В теории, исключения лучше, если они реализованы правильно, и особенно они хороши в случае вызовов с в 40 уровнями вложенности в стеке, когда программист попросту устанет передавать ошибку наверх руками.

В типичном же unixway вряд ли можно встретить цепочку, где вызывалось бы больше 5 утилит. Вдобавок, нет никакого механизма "исключений", которые летали бы между процессами (и слава богу, наверное).

Чего нет в типичных пайпах - так это общепринятых границ сообщений. Даже для потоковых данных может появиться смысл в передаче данных некими кусками, chunk'ами. В виндовых named pipes есть механизм передачи отдельных сообщений, в юниксах же, насколько мне известно, подобное есть только в d-bus. Самостоятельно сделать разбивку на сообщения несложно, но - каждый раз это все равно нужно делать, и всякий будет делать это по-своему.

From:

vitus_wagner

Вот, блин, с тех пор как плохих программистов научили пользоваться исключениями, сообщения об ошибках везде, от файрфокса до банкоматов стали абсолютно неинформативными. Потому что за сорок уровней раскрутки стэка теряется контекст, и приходится выводить сообщение вида "у вас случилась полнейшая фигня". Еще привычку завели в этом сообщении давать единый на все случаи жизни длинный текст про наиболее частые ошибки. Не про случившуюся, а про наиболее частые.

Например банкомат вместо "у меня сейчас нет достаточного количества купюр нужного достоинства" говорит "вы ввели неправильную сумму", хотя я ее не вводил, я ее из его же собственной менюшки выбрал.

Почему-то паттерна обработки ошибок вида "навесить на исключение дополнительный контекст, предназначенный для обработчика более высокого уровня и передать дальше" не применяют. Хотя по умолчанию интерпретаторы и компиляторы делают именно такой stack trace. Но не машинночитаемый и не пользователечитаемый.

Система с кодами ошибок провоцирует, хотя и неявно именно такое поведение - донести наверх, до обработчика именно содержательный смысл ошибки, выдать такое сообщение. на которое кто-то (вышележащий код или пользователь) сможет осмысленно отреагировать.

From:

slobin

Чего-то задумался над мировоззренческим вопросом, что мешает плохому программисту. Ну, в смысле, по сравнению с танцором.

... Наше будущее лучезарно как никогда ...

From:

vitus_wagner

Текстовый редактор ему мешает.

From:

livelight

Стек-трейсы придуманы для программистов команды поддержки и исходных разработчиков. Тех, кто показывает стек-трейс конечному пользователю без особой просьбы с его стороны, надо больно бить по рукам. Тех, кто сообщение для показывания пользователю выбирает от балды, - тоже.

From:

vitus_wagner

Бить по рукам надо тех менеджеров проектов, которые требуют от программистов беречь хрупкую психику пользоватьеей и скрывать от них существенно важную информацию.

Тут в общем-то выхода нет. Если у тебя ошибки обрабатываются через исключения, то нужно показывать пользователю результат обработки stack trace. Причем не абы какого, а умного. Т.е. на входе в каждую функцию добавлять в этот стэк ту содержательно важную информацию, которая потребуется для устранения проблемы, если вдруг в этом месте проихошла ошабка. Например при входе в функцию открытия файла - имя файла.

Но так никто не делает. В результате чего в распоряжении обработчика ошибок есть только тип ошибки, который без этой дополнительной информации мало что пользователю говорит, и тот самый stack trace который показывать нельзя.

Что остается делать? Только показывать сообщение от балды "у нас тут все настолько плохо, что мы уже сами не можем понять, что именно не так. Но попробуйте это, это и это - вдруг поможет".

From:

livelight

У нормального исключения есть внятный текст исходной ошибки для любого пользователя, тип исключения для продвинутого пользователя и стек-трейс для баг-репортов. Самые умные могут текст (например: "Connection to 10.11.12.13:1415 refused") и другие известные им поля исходного исключения преобразовывать в высокоуровневую ошибку для пользователя же (например: "Cannot connect to backend server"), оставляя опять же для баг-репортов всю иерархию исключений.
А вот криворукие программисты могут и такое делать, как выше сказано, да.

From:

inkelyad

Я так понял, проблема в том, что если из конструкции вида
foo[bar(..)]
нам прилетает какой-нибудь IndexOutOfBound, из за того, что внутри bar действительно ошибка есть(алгоритм неправильно написали), то мы не можем ничего разумного в текст написать, т.к. мы про этот факт не знаем и можем думать, что сами из foo неправильный индекс достать пытаемся.
А текст исходной ошибки в данном случае явно ничего умного не скажет.

From:

livelight

Такой IndexOutOfBound можно для конечного пользователя превратить только во что-нибудь типа "500 Internal server error" (со складыванием стек-трейса туда, где его сможет забрать команда поддержки). А вот вышеприведённые примеры с банкоматами говорят в том числе о том, что: 1) не проведена внятная валидация ввода; 2) после чего случившуюся в глубинах ошибку ещё и не привели во внятный вид. Как минимум два повода надавать по шее тем программистам.

From:

inkelyad

Имеется в виду, что foo[] и может быть той самой валидацией.
Из логики "индекса в массиве не нашлось, значит, пользователь неправильное значение ввел. Ловим исключение и по нему ругаемся."
А тут внезапно индекс не нашелся где-то глубже по вызовам и поэтому все сломалось.

From:

livelight

По возрастающей степени дебилизма способы валидации такие:

1. Проверяем индекс ("индекса в массиве не нашлось, значит, пользователь неправильное значение ввел"), и если он плохой - внятно ругаемся
2. "Ловим исключение и по нему ругаемся" -- опять же внятно.
3. Прокидываем исключение выше, там пишут 500 Internal Server Error
4. Показываем пользователю кишки системы, а также кровь, распидарасило и стектрейс

From:

inkelyad

2. "Ловим исключение и по нему ругаемся" -- опять же внятно.
try
... = foo[bar()]
catch IndexOutOfBound
ShowMessage("У вас нет такого номера счета")

Мы вот решили поймать исключение при индексировании foo и внятно выругаться.
Семантика у foo такая, что если в нем чего-то нет, то пользователь не тот счет ввел
Вот только оказалось, что исключение прилетело не от нашего индексирования, а из глубин bar.
И все - при какой-то совершенно посторонней ошибке пользователю показывается "У вас нет такого счета".
А потом еще интефейс усовершенствовали, чтобы вводить ничего не надо, а надо выбрать из списка, но проверку оставили.

From:

livelight

То есть, предлагаете присвоить такому способу третий уровень идиотизма, а не второй? :)

From:

inkelyad

А вот бы знать.
Это демонстрация того, как я понял утверждения хозяина журнала о потере контекста - что одно и то же исключение, которое бросилось тут и или там, нужно как-то различать , но это немного затруднительно.

(no subject)

From:

livelight - Date: 2017-03-18 01:46 pm (UTC) - Expand

(no subject)

From:

vitus_wagner - Date: 2017-03-18 03:01 pm (UTC) - Expand

(no subject)

From:

livelight - Date: 2017-03-18 06:32 pm (UTC) - Expand

(no subject)

From:

vitus_wagner - Date: 2017-03-19 07:05 am (UTC) - Expand

(no subject)

From:

yurikhan - Date: 2017-03-19 04:25 pm (UTC) - Expand

From:

vitus_wagner

А дело все в том, что никто до сих пор не придумал более высокоуровевого языка, чем shell. Ну разве что язык поисковых запросов в веб-искалках.

Все попытки сделать "шелл лучше чем bourne shell" сводились к тому, чтобы напихать в скриптовый язык более низкоуровневых конструкций - объектов, методов, массивов.

А надо было идти в противоположном направлении - к более человеческому языку, системе общих контекстов и умолчаний, которые естественным образом выстраиваются в процессе диалога.

From:

rdia.livejournal.com

> Все попытки сделать "шелл лучше чем bourne shell" сводились к тому, чтобы напихать в скриптовый язык более низкоуровневых конструкций - объектов, методов, массивов.

Проблема в том, что люди вообще не понимают, что bash - это язык со встроенной ленивостью, с офигительной параллельностью (& явно легче написать даже чем Хаскеллевский par, а в ленивом вызове | вообще всё по-умолчанию выполняется параллельно). Ну и когда пытаются заменить bash питоном всё "немного предсказуемо".

------------------------
И, конечно, это правда насчёт общих контекстов и умолчаний. Я не хочу писать кавычки у каждого строкового параметра ls, не хочу писать .0 у каждого float'а, хочу сразу иметь неограниченные целые числа и любую точность вещественных.

С другой стороны, нужно, всё-таки, иметь определённую строгость. Хотя бы в скриптах. Возможно, тут должно быть разделение - в интерактивном shell мы можем быть более вольны, а в скриптовом - более строги.

Т.е. сделать язык, который имеет несколько режимов: мягкий, когда это почти Питон по раздолбайству и жёсткий, когда это ML (вернее Хаскель). Так, чтобы когда мы пишем скрипт на 1 раз, можно было допускать ошибки, а когда это часть системы запуска, проверки были дай боже.

From:

vitus_wagner

Щаз ка-а-ак встанет из могилы призрак Раскина и ка-а-ак нас поколотит... Режими, режимы, режимы. То, против чего он всю жизнь боролся.

Но вообще более строгий скриптовый контекст получается как естественное расширение системы контекстов используемых при интерактивной работе.

Ну то есть разница должна быть как в естественных языках между устной и письменной речью.

From:

phd_ru

Я время от времени заменяю bash питоном, а то и сразу пишу на питоне. Потому что для каждого из этих скриптовых языков своя область применения. bash хорошо работает с программами и процессами, питон с файлами, структурами данных и сетевыми протоколами.

From:

vitus_wagner

НА мой взгляд, на bash писать вообще нельзя. Если ты пишешь шелловский скрипт, надо писать на /bin/sh. Если тебе не хватает выразительных возможностей /bin/sh, то надо сразу переходить на что-то более серьезное - python, perl, tcl.

А башизмам в скриптах надо сказать "No passaran".

Башевские расширения sh - для интерактивной работы, а не для скриптования.

К zsh я отношусь так же. Хотя он малость попрямее, но зато и больше вероятность неожиданно обнаружить что его на машине нет.

Да, под /bin/sh я понимаю пересечение возможностей dash,ash bsd-шного и солярисного sh.

Edited Date: 2017-03-17 06:36 am (UTC)

From:

phd_ru

Я отчасти с тобой согласен и отчасти нет. Когда мне хватает возможностей урезанного /bin/sh, я именно его и использую. А когда не хватает, тогда думаю, что использовать вместо. Ну и бывает, что использую bash. Если в shell-скрипте — то с #! /usr/bin/env bash. Или, например, я точно знаю, что интерпретатором команд .travis.yml на Travis CI является bash, почему бы мне тогда не использовать его возможности, когда они нужны? Я и использую.

From:

vitus_wagner

Какой ты хитрый c env-ом-то. А я тут давеча в одном скрипте (не мной написанном, а переписывать на C лень), написал

#! @BASH@

Благо этот скрипт все равно уже препроцессировался configure.

From:

phd_ru

Я частенько попадаю на FreeBSD, где bash в /usr/local/bin/

From:

vitus_wagner

У меня понимаешь засада - выпускаем релизы мы только для 64-битных линуксов. Но тестируем код еще и на спарке, bsd и 32-битных линуксах. Поскольку на всем этом сразу вылезает кое-чего из того что на стандартной платформе вылезет очень не сразу и толькоп под нагрузкой.

Поэтому если вылезает ошибка, специфичная для одной из этих систем, разработчики морщят нос и делают вид, что я над ними издеваюсь.

Flat | Top-Level Comments Only

Profile

vitus_wagner

My Website

June 2025

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Page Summary

livelight - (no subject)

Style Credit

Style: Clarity for Paletteable by branchandroot
Resources: Holiday

Expand Cut Tags

No cut tags

Page generated Jun. 21st, 2025 03:22 pm

Журнал Витуса

Semantic locality

Semantic locality

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

no subject

no subject

no subject

b и p

Башизм не пройдет

Баш на dash

Re: Баш на dash

no subject

no subject

Profile

June 2025

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags