vitus_wagner: My photo 2005 (Default)
vitus_wagner ([personal profile] vitus_wagner) wrote2007-11-02 03:40 pm

Хроники пикирующего компьютера

Болею я, соображается плохо. Не могу сходу сообразить как решить вот такую задачу - имеется списока моментов перезагрузки компьютера. Как по нему определить, какой должен быть аптайм, чтобы можно было с заданной доверительной вероятностью утверждать, что проблема, вызывавшая эти перезагрузки, устранена?

Решения учитывающие долговременный тренд и суточную динамику неучтенных факторов, способствующих появлению глюка, приветствуются.

На данный момент рабочая гипотеза - блок питания из-за поплытия параметров каких-нибудь конденсаторов перестал вытягивать второй винчестер. То что в компьютере было исходно - тянет, а при работе двух винчестеров одновременно - отказывает от перегрузки и делает brownout.

[identity profile] oort.livejournal.com 2007-11-02 01:25 pm (UTC)(link)
Справочники дома, я на работе, навскидку -- сравнение средних.
x - μy) / sqrt (σx2 / Nx + σy2 / Ny)
распределена по гауссиане. Отсчеты -- интервалы между перезагрузками. Там есть ограничение снизу по количеству, но я его не помню.

[identity profile] oort.livejournal.com 2007-11-02 02:05 pm (UTC)(link)
Сорри, про один я не подумал. Но экспоненциальное, насколько я помню, можно (огрубленно) рассматривать как нормальное с сигмой равною мю. И если аптайм вышел за мю плюс две сигмы, то 95% уверенности уже есть.

[identity profile] oort.livejournal.com 2007-11-02 02:18 pm (UTC)(link)
Да, цифирь я не анализировал. Тогда это и не экспоненциальное. Тогда увы, нужен справочник, всех этих изгибов я не помню. :(

[identity profile] tzirechnoy.livejournal.com 2007-11-02 03:14 pm (UTC)(link)
Ты что, второй промежуток, в сутки -- за глюк считаешь?

А вообще -- предлагаю взять максимальное (сутки там или 6 часов -- как хочешь) и не париться.

[identity profile] tzirechnoy.livejournal.com 2007-11-02 03:38 pm (UTC)(link)
Я, собственно, про полученные 50 минут среднее и 1:20 сигма. У меня если ничего не выкидывать -- получается 2:00:05 среднее и 4:05:33 сигма. А если выкинуть -- тот как раз и получится 0:54:55 среднее.

[identity profile] tzirechnoy.livejournal.com 2007-11-02 04:26 pm (UTC)(link)
То есть вот так вот, время жызни системы уменьшается, значит.

Способ для нормального человека -- взять максимум.

Математик можэт начать сравнивать гистограмму полученных данных и кривые плотности вероятности распределений. Для построения того и другого могу посоветовать взять plplot -- там, например, для построения гистограммы:

package require Pltcl

matrix pluptimes f [llength $uptimes]
for {set i 0} { $i < [llength $uptimes] } { incr i } { 
   set nextuptime [expr [lindex $uptimes $i] * 1.0]
   pluptimes $i = $nextuptime
};

plhist [llength $uptimes] pluptimes 0.0 10000.0 30 PL_HIST_DEFAULT
plreplot
pleop



На посмотреть можэшь начать с Гамма-распределения -- у него по мат.ожыданию и дисперсии легко считаются параметры. Экспоненцыальное тебе не очень подойдёт -- у него мат.ожыдание равно сигме, что у тебя не выполняется.

Хотя, для таких цэлей... Собственно, если на графике какое-либо из найденных дажэ экспоненцыальных (либо с параметром 1/<среднее>, либо 1/<сигма>, либо что-то между ними) будет примерно соответствовать твоим точкам -- возьми его.

Да, то, что тебе нужно, после того, как нашёл распределение -- чтобы функцыя распределения от твоего uptimeа была большэ, чем твоя заданная доверительная вероятность. Считать, соответственно, либо функцыю распределения вероятности от твоего текущего uptime для твоего найденного распределения -- получишь в результате максимальный "доверительный интэрвал". Либо искать формулу для квантили твоего распределения с заданной доверительной вероятностью -- и сравнивать результат со своим uptimeом.


Если полезешь за гамма-распределением -- я брал все эти бэта-функцыи как определённые интэгралы. ::math::calculus::integralExpr, math::calculus идёт в tcllib. 1000 шагов за глаза хватает обычно.

[identity profile] oort.livejournal.com 2007-11-02 06:50 pm (UTC)(link)
(придя с работы и подумав) Характер распределения должен задаваться физикой процесса, а не анализом средней и сигмы пары выборок. Если нет предположения, какое распределение должно быть, мне кажется, разумнее принять гипотезу о ненормально выглядящем нормальном (или вычислительно сводимом к нему экспоненциальном), чем подбирать нужную кривую по форме.
А без осознанного задания распределения любая цифирь будет отфонарной.
Впрочем, решение, насколько я понимаю, уже принято. :)

[identity profile] tzirechnoy.livejournal.com 2007-11-02 06:57 pm (UTC)(link)
А как это экспоненцыальное сводить к нормальному??

Теоретически -- базу даёт именно физика. Практически -- после физики идёт проверка теории практикой. Невыдержывающие гипотезы выкидываются.

На нормальное не с чего быть похожым. Экспоненцыальное -- ещё понятно. Но у экспоненцыального мат.ожыдание равно сигме, а тут отличаются вдвое.

[identity profile] tzirechnoy.livejournal.com 2007-11-03 02:48 pm (UTC)(link)
Вообще-то -- с экспоненцыальным. А Пуассона -- вообще дискретное, оно не для интэрвалов.

[identity profile] semiurg.livejournal.com 2007-11-02 01:30 pm (UTC)(link)
А вот у меня запуск любого торрент-клиента непременно приводит к глухому зависанию или спонтанному перезагрузу. Но не сразу - а когда он какое-то время поработает. Клиенты пробовал разные - эффект стабилен. Даже представить себе не могу, почему именно торрент-клиенты. Все остальное работает стабильно.

Мистика, блин.

[identity profile] oal.livejournal.com 2007-11-02 01:33 pm (UTC)(link)
Торрент-клиенты прогружают сеть и винт. Покрути им хвост, чтобы использовали не standard allocation, а sparse. Ну и max connections, max upload, max download.

[identity profile] semiurg.livejournal.com 2007-11-02 01:36 pm (UTC)(link)
Тогда почему даунлоад-менеджеры прекрасно работают и фтп-клиенты? Они даже больше нагружают сеть и винт - поток больше. А "max connections, max upload, max download" - это само собой.

[identity profile] krivye-ru4ki.livejournal.com 2007-11-02 02:14 pm (UTC)(link)
Это не так, можно запустить perfmon и посмотреть число пакетов/сек. и дисковую очередь при торрентах и при ftp.

[identity profile] oal.livejournal.com 2007-11-02 02:22 pm (UTC)(link)
Дело не в потоке. Торрент-клиент может тасовать скачанные куски. И/или качать N кусков одновременно.

[identity profile] dmitrmax.livejournal.com 2007-11-02 10:02 pm (UTC)(link)
А ты запусти cpuburn на часик, может у тебя проц под нагрузкой перегревается? У меня однажды было такое - ставлю компилить ядро, комп через некоторое время перезагружается, при этом все остальные, нужные мне вещи компилились без ребута. Я уж грешным делом думал магия какая-то. Оказолось перегрев под нагрузкой компилятора. Торрент, конечно, не gcc, но разные клиенты бывают выделяются тем, что хавают процик.

[identity profile] fk0.livejournal.com 2007-11-02 11:29 pm (UTC)(link)
Подключи 4. И никакой математики.

Параметры боюсь не поплыли, а просто потеряли ёмкость. Нет там параметров...

[personal profile] laruldan 2007-11-04 06:32 am (UTC)(link)
Вообще-то, если это БП так себя ведёт - его надо не "тестировать", а заменять, и СРАЗУ.
И скорее всего - на более другого производителя (надеюсь, это хоть не linkworld/kme/gp/spark/codegen?).
Потому что ни винчестеры, ни материнка (электролиты в преобразователях питания) плохого питания долго не выдерживают (а если оно не тянет второй винчестер в процессе работы - оно заведомо дохлое: современные винчестеры в раскрученном состоянии жрут ничтожно мало).