
Sheridan
12.01.2017
20:30:56
Отказа одного сервера но не отказа сервиса !!!

Nikolay
12.01.2017
20:30:57

Andrey
12.01.2017
20:31:24
У меня есть сервер мой личный с аптаймом около 2.5k дней

Sheridan
12.01.2017
20:31:27
Я про сервисы, а вы про железо похоже

Google

Nikolay
12.01.2017
20:31:29

Sheridan
12.01.2017
20:32:04
Несколько раз в сколько времени?

Andrey
12.01.2017
20:32:08

Nikolay
12.01.2017
20:32:15
и похер всем было, чо и где, задача была - вернуть все обратно в кратчайший срок

Sheridan
12.01.2017
20:32:27
Отказа одного сервера но не отказа сервиса !!!

Nikolay
12.01.2017
20:32:30

Sheridan
12.01.2017
20:32:48

Nikolay
12.01.2017
20:33:01
задача всегда стоит - быстро переподнять, в идеале - добиться подобия zero-downtime

Andrey
12.01.2017
20:33:20

Sheridan
12.01.2017
20:33:44
Это

Andrey
12.01.2017
20:33:46
Например есть хранилище данных на петабайт

Google

Sheridan
12.01.2017
20:33:54
Прощу паузу до завтра
Я за женой
Потом спать

Andrey
12.01.2017
20:34:25
Там фактор репликации 3

Nikolay
12.01.2017
20:34:42
Прощу паузу до завтра
давай, спокойной ночи. Но смотри в приличном обществе не скажи, что задача админа - "100% аптайм иначе уволен"
побьют-с

Sheridan
12.01.2017
20:35:34
Ну с уволен я погорячился конечно, но я бы взбодрил такого

Nikolay
12.01.2017
20:36:25
и неважно даже, из-за чего он упал изначально

Andrey
12.01.2017
20:36:45
И например это 3к винчестеров
Какова вероятность выхода 3 виечестеров ?

Nikolay
12.01.2017
20:37:34
на деле даже при падении серверной стойки все должно продолжать отдаваться в нормальном хранилище
там же ринг используется

Andrey
12.01.2017
20:38:48
Если успело отреплецироватья

Марк ☢
12.01.2017
20:39:01

Vladimir
12.01.2017
20:39:06

Andrey
12.01.2017
20:40:00
А еще внимание вопрос что будет с вероятностью если использовать не 3к винчестеров а 1.5

Марк ☢
12.01.2017
20:40:16
1.5 винчестера ?

Nikolay
12.01.2017
20:40:17

Google

Andrey
12.01.2017
20:40:18

Nikolay
12.01.2017
20:40:25
это другие цифры на порядок

Andrey
12.01.2017
20:40:45
Так
На самом деле конечно все сложней
Но для илюстрации подходит

Nikolay
12.01.2017
20:41:56
На самом деле конечно все сложней
на самом деле в датацентрах есть статистика выхода из строя винчестеров конкретных производителей и их тупо вынимают и заменяют, даже если они еще работают, просто списывают по устареванию

Andrey
12.01.2017
20:42:18

Nikolay
12.01.2017
20:42:23
это в крупных, конечно, но вообще это становится нормальной практикой

Vladimir
12.01.2017
20:42:25
Дело в том что когда у тебя тысячи железок вероятность развала рейда 6 - далеко не ноль

Andrey
12.01.2017
20:42:28
Ещё 2004
Ну я как бы аодтверждаю примером другой тезис

Vladimir
12.01.2017
20:43:22
И рейда 10. И случается смерть всего.

Nikolay
12.01.2017
20:43:35

Andrey
12.01.2017
20:43:49

Vladimir
12.01.2017
20:44:04

Andrey
12.01.2017
20:44:07

Nikolay
12.01.2017
20:44:35

Vladimir
12.01.2017
20:44:36
99% админов локалхоста не увидят смерть 3х дисков в рейде 6

Andrey
12.01.2017
20:45:04
Есть задача проилюстрировать что чем больше железа тем больше оно ломается

Google

Nikolay
12.01.2017
20:45:29

Andrey
12.01.2017
20:45:30
И тем более подвержен сервис разлому

Nikolay
12.01.2017
20:45:37
все от прямоты рук зависит

Vladimir
12.01.2017
20:45:37
Да банально - вероятность события 1 тысячная процента - на 100000 железок уже 100%

Andrey
12.01.2017
20:46:12

Nikolay
12.01.2017
20:46:21

Andrey
12.01.2017
20:46:26
От данных и много чего еще

Nikolay
12.01.2017
20:46:33
например, чем дольше работает хард - тем больше вероятность, что он сдохнет

Admin
ERROR: S client not available

Nikolay
12.01.2017
20:46:45
и метод монте-карло решает в случае датацентров

Andrey
12.01.2017
20:48:08
Условный нат на локалхосте подключенный к упсу имеет шанс не сломаться никогда

Nikolay
12.01.2017
20:48:30

Марк ☢
12.01.2017
20:48:47

Andrey
12.01.2017
20:48:57
А вот если их 2 кластере с плавающим айпи то скорее всего обратного переключения не произойдет

Марк ☢
12.01.2017
20:48:59
И деградация кремния. И кернелпаники

Andrey
12.01.2017
20:49:15
Да это понятно
Все

Марк ☢
12.01.2017
20:49:41
Вот у нас хуяк и память сбоить начала
Внезапно

Vladimir
12.01.2017
20:50:34
Веселее когда ты заказал 400 серверов а из них 4 не включается потому что новая память - битая

Google

Марк ☢
12.01.2017
20:51:03

Andrey
12.01.2017
20:51:18
4 процента норм

Марк ☢
12.01.2017
20:51:20
Эппл блять.

Nikolay
12.01.2017
20:51:32

Andrey
12.01.2017
20:51:33

Марк ☢
12.01.2017
20:51:51
Нет такого тэга

Andrey
12.01.2017
20:52:19

Vladimir
12.01.2017
20:52:26

Марк ☢
12.01.2017
20:52:35

Andrey
12.01.2017
20:52:47
Точнее плчти 4 утра
Так да не смог в процент попасть
Я называю это пиздоглазие

Марк ☢
12.01.2017
20:54:18

Andrey
12.01.2017
20:56:21

Марк ☢
12.01.2017
20:56:38

Andrey
12.01.2017
20:56:53

Марк ☢
12.01.2017
20:57:06
Неа
А вот загугли и узнаешь при чем это

Andrey
12.01.2017
20:57:25
Что я должен увидеть много флеш модулей ?

Марк ☢
12.01.2017
20:57:42

Andrey
12.01.2017
20:58:47