@devops_ru

Страница 2219 из 4568
Sheridan
05.02.2017
21:04:37
бизнесу дешевле оплатить один сервер чем терять клиента
один? ха! И часто бизнес такой, что сервер стоит дешевле клиента?

Старый
05.02.2017
21:04:52
чтением
вот тебе пример, сбой в серверах, периодически подвисает запись, в логах пусто, смарт чистый

Sheridan
05.02.2017
21:04:53
ахахаха
Ну так поделись, Гуру

Daniel
05.02.2017
21:04:53
клиенты бывают разные

Google
Zhenia
05.02.2017
21:04:55
да почти у всех

Zhenia
05.02.2017
21:05:28
клиент не только человек, но и репутация компании, что довольно важно

Sheridan
05.02.2017
21:05:31
Старый
05.02.2017
21:05:36
запись чегно и куда?
postgre, kvm, общий размер баз 12 тб

? мне кажется, или этот разговор уже тут был

Марк ☢
05.02.2017
21:06:01
ну и срач тут у вас. отвлёкся на минутку называется....

Старый
05.02.2017
21:06:03
только вместо шеридана был другой человек

Sheridan
05.02.2017
21:06:05
курить в туда

Zhenia
05.02.2017
21:06:12
ну и да, если использовать тот же графит, он нормально переваривает метрики раз в минуту на тачке с двумя сатами

Старый
05.02.2017
21:06:14
чтото не то с бд
поздравляю, не верно

Sheridan
05.02.2017
21:06:19
изучать что за запросы ходят

Google
Zhenia
05.02.2017
21:06:23
а мунин загнется

Sheridan
05.02.2017
21:06:35
поздравляю, не верно
догов же нет ты говорил

Старый
05.02.2017
21:06:48
догов же нет ты говорил
а другого нет, и в логах чисто

Sheridan
05.02.2017
21:07:26
а другого нет, и в логах чисто
ну так значит тормоза - штатное поведение. Следовательно надо искать что тормозит в софте

либо тормозит виртуалака

посмотреть и туда

Старый
05.02.2017
21:08:16
ну так значит тормоза - штатное поведение. Следовательно надо искать что тормозит в софте
всё проще, тупняк был в контроллере железного рейда, в логах пусто, но тупил он

Старый
05.02.2017
21:09:35
как мониторился девайс?
3 года прошло, у нас нагиос был, но рук отдела смотрел сервак, и в логах чисто было

Sheridan
05.02.2017
21:10:18
Ясно. Никак ничего не мониторилось

простотак ио не падает

чтото да изменится

а это видно и при опросе хоть раз в 10 минут

потому что надо смотреть на тренды, а не на конкретные цифры

Сколько том процентов кпу или памяти или сколько прямо щас qps к бд - посрать. Совсем.

А вот как это изменилось за 10 минут, 20, сутки, месяц - полезно знать

а тут я смотрю все меряются сколько они сенсоров в секунду читают. Бесполезная трата ресурсов, скажу я вам

Google
Sheridan
05.02.2017
21:14:52
очень редко бывает надо знать столько

очень редко нужно такое разрешение

Старый
05.02.2017
21:15:17
очень редко бывает надо знать столько
?ну ты свои объёмы и их не путай

Sheridan
05.02.2017
21:15:30
слишком дорогие решения получаются для "а вдруг пригодится!?"

Sergey
05.02.2017
21:15:32
очень редко нужно такое разрешение
Да, если на то как работает продукт - пофиг

Sheridan
05.02.2017
21:15:53
Старый
05.02.2017
21:15:56
Sheridan
05.02.2017
21:16:00
тяпляп и в прод?

Sergey
05.02.2017
21:16:03
Слишком - когда у тебя мало машин, мало кода и мало денег

тяпляп и в прод?
Ты пустил в прод и получил просадку в 2% на 2% запросов

Обычно всем пофиг

Для некоторых - повод для отката

Тестирование никогда не даёт полных гарантий. Просто не может.

Sheridan
05.02.2017
21:17:19
увидел чтото не то, уменьшил шаг опроса сенсоров

Sergey
05.02.2017
21:17:38
Я однажды наблюдал баг, когда процессор не работал 120 мс в каждой секунде. Тупо time sleep 1 занимал 1120 мс.

Sheridan
05.02.2017
21:17:38
нашли косяк, исправили, вернули шаг обратно

Sergey
05.02.2017
21:17:56
Sergey
05.02.2017
21:18:25
Когда у тебя много всего - каждый день форс-мажор

Google
Sheridan
05.02.2017
21:18:33
просто увижу их завтра-послезавтра

Sergey
05.02.2017
21:18:54
просто увижу их завтра-послезавтра
за это время продолбаешь кучу денег.

Sheridan
05.02.2017
21:19:12
а вы монитоите тупо все рычаги в максимум и посрать сколько это стоит

Sergey
05.02.2017
21:19:13
тренды я увижу хоть при шаге в час
нет. я неделю однажды ловил пакетлоссы в сети

а вы монитоите тупо все рычаги в максимум и посрать сколько это стоит
нет, не поэтому. потому что мы знаем стоимость проблем.

Sheridan
05.02.2017
21:19:48
нет. я неделю однажды ловил пакетлоссы в сети
То есть неделю ловить баг можно, а шаг при необходимости за пару секунд поменить нельзя. Ничтак чо

Sergey
05.02.2017
21:20:23
нет. я неделю однажды ловил пакетлоссы в сети
только когда я снизил частоту съема до 10 мс мы смогли увидеть явную корреляцию с определенным кодом, выполняющимся на коммутаторах.

Sheridan
05.02.2017
21:20:49
Стоимость проблем... Ну-ну. Я вижу. 2.5 млн сенсоров в секунду собирать это уже очень хорошая стоимость

Sheridan
05.02.2017
21:21:23
Sheridan
05.02.2017
21:21:36
Sergey
05.02.2017
21:22:03
после того как проблема была найдена и устранена мы не разрушали это решение. потому что его поддержка - почти бесплатна.

Sheridan
05.02.2017
21:22:06
1М это, на секундочку, машину купить можно. Дом.

Sheridan
05.02.2017
21:22:21
это дорого, камрад

Sergey
05.02.2017
21:22:27
дорого для чего?

ты пойми, что не все мыслят категориями "один сервер - это дорого".

Sheridan
05.02.2017
21:22:40
для бизнеса

Google
Sergey
05.02.2017
21:22:46
1М это, на секундочку, машину купить можно. Дом.
это мелочь по сравнению с тем что "мониторится" этим железом

Sergey
05.02.2017
21:22:46
просто потому что "один сервер - это не дорого".

а деградация 15к серверов на 10% из-за неуловимых лагов сети - вот это дорого.

Sheridan
05.02.2017
21:23:36
вы что, правда считаете нормальным снимать кучу бесполезных метрик в наджежде авось когда нибудь пригодится?

Roman
05.02.2017
21:24:09
потому что надо смотреть на тренды, а не на конкретные цифры
а что тебе скажут тренды для быстротечных процессов?

Sergey
05.02.2017
21:24:09
вы что, правда считаете нормальным снимать кучу бесполезных метрик в наджежде авось когда нибудь пригодится?
если это почти бесплатно - да. но не обязательно снимать бесполезные метрики. нужно снимать полезные.

Sheridan
05.02.2017
21:24:55
а что тебе скажут тренды для быстротечных процессов?
То же что и для медленно текущих. Правильно подбирать частоту опроса нужно в обоих случаях, а не давить тупо рычаги в максимум

Sergey
05.02.2017
21:25:35
1М это почти бесплатно??? о0
да что тебя смущает-то?

Sheridan
05.02.2017
21:25:52
да что тебя смущает-то?
то что вы 1М считаете не деньгами

Sergey
05.02.2017
21:25:52
или ты думаешь, что мы под каждую метрику заводим 2 сервера, каждый из которых по 0.5М?

Roman
05.02.2017
21:25:56
То есть неделю ловить баг можно, а шаг при необходимости за пару секунд поменить нельзя. Ничтак чо
проблема часто комплексная. уменьшив шаг всего на 1 метрике ты ничего не увидишь

Sheridan
05.02.2017
21:26:25
проблема часто комплексная. уменьшив шаг всего на 1 метрике ты ничего не увидишь
Я гдето писал что надо забить и не искать проблему? Спасибо, кэп, за помощь

Sergey
05.02.2017
21:26:30
то что вы 1М считаете не деньгами
это сотые доли процента от стоимости парка

Sheridan
05.02.2017
21:26:43
сотые доли процента все равно остаются 1М

Zhenia
05.02.2017
21:27:55
сотые доли процента все равно остаются 1М
лол, этот миллион может спасти вас от куда больших потерь

Roman
05.02.2017
21:28:14
То же что и для медленно текущих. Правильно подбирать частоту опроса нужно в обоих случаях, а не давить тупо рычаги в максимум
ещё раз: 300к метрик в секунду можно снимать на зеркале из пары sata. если взять пару ssd - можно хоть несколько млн снимать.

Sheridan
05.02.2017
21:28:30
лол, этот миллион может спасти вас от куда больших потерь
Я непротив, если оно посчитано, прикинуто и действительно спасет

Но так тут же разговор про "Да, всего лишь пара серверов ценой в 1М"

Sergey
05.02.2017
21:29:01
Я непротив, если оно посчитано, прикинуто и действительно спасет
прикинь, примерно, сколько стоит минута простоя booking.com

Страница 2219 из 4568