
Navern
17.06.2018
09:57:27
В плохо спроектированной системе архитекьурные косяки затыкаются людьми
И для тебя этого не видно
А подход Владимира подразумевает как минимум неплохо спроектированную систему)

Google

Vladimir
17.06.2018
09:58:30
Ровно чтобы такие вещи дебажить придумали трейсинг, принят подход "давайте собирать все метрики" и пр

Navern
17.06.2018
09:58:49
Не подразумевает
М? Может я тогда тоже чтото не понимаю) если у тебя не собираются метрики и трейсинга нет, то что происходит?

Vladimir
17.06.2018
10:00:11

pl
17.06.2018
10:00:18
Метрики можно и в плохую архитектуру всобачить

Vladimir
17.06.2018
10:00:24
И хорошо спроектированная система

Navern
17.06.2018
10:00:43
Лан, я подразумевал что у тебя хотя бы есть какие то инструменты и настроенный мониторинг

Евгений
17.06.2018
10:00:49

Vladimir
17.06.2018
10:00:49
Место куда слать трейсы, логи, эвенты, метрики - это вот задача инфраструктуррых инженеров

Navern
17.06.2018
10:00:51
Слово архитектура тут не подходит мб

Vladimir
17.06.2018
10:00:55
И это сделать просто

Navern
17.06.2018
10:01:43
И это сделать просто
Просто когда ты понимаешь почему это нужно и зачем) а если ты привык админить руками то парадишму измениьь сложнее

Google

Navern
17.06.2018
10:01:54

Vladimir
17.06.2018
10:02:10

Евгений
17.06.2018
10:02:47

Vladimir
17.06.2018
10:04:07

Евгений
17.06.2018
10:05:22

Vladimir
17.06.2018
10:05:50

Navern
17.06.2018
10:05:55
Другие люди мне чаще могут придумать контрпримеры чем я сам
Унижать когото в инете смысла мало

Евгений
17.06.2018
10:09:20
Ну таск изначальный (который мы обсуждали) такой -- у тебя на входе всей системы что-то не работает (не мониторинг орёт, не хелсчеки проваливаются), а тупо не работает чо-то (например при заданных параметрах в клауде создаётся нерабочий пул виртуалок).
Как ты будешь это обрабатывать без человека, у которого в голове есть общая картина?

Sergey
17.06.2018
10:10:44

Navern
17.06.2018
10:11:16

Vladimir
17.06.2018
10:11:28
Для начала надо подумать, может ли быть человек с общей картиной в голове

Navern
17.06.2018
10:11:32
Так что вроде как я ничо не придумал

Евгений
17.06.2018
10:12:13

Vladimir
17.06.2018
10:12:45
И тебе надо понять какая виновата

Navern
17.06.2018
10:13:03

Vladimir
17.06.2018
10:13:17

Google

Navern
17.06.2018
10:13:20
Типа интеграция не работает?

Евгений
17.06.2018
10:13:38

Vladimir
17.06.2018
10:13:39
И клиента который жалуется что у него виртуалки не пингуются
И ссш на них не пашет и консоль ничего не показывает
И он пишет в саппорт именно aws с этой инфой
И вот это пример того где нужно понимание взаимодействия систем чтобы понять баг ли это (или клиент просто добавил что то в iptables и ансиблом раскатал)
И если баг, то чей
Или даже несколько багов

Navern
17.06.2018
10:15:48
Ну так тебе все равно надо декомпозировать проблему и проверить разные уровни.
Команда точно так же это может сделать, все упирается в коммуникации
И обмен инфой

Vladimir
17.06.2018
10:16:32

Navern
17.06.2018
10:16:32
Ну как я это вижу

Vladimir
17.06.2018
10:16:42
Ты можешь попросить каждую проверить
Но эффективнее иметь человека который скажется что это команда вот эта

Navern
17.06.2018
10:18:40
Ну уволился у тебя этот чувак, дальше что?
С тем что это удобно когда один человек все знает и умеет удобно я согласен) это вообще все упрощает)
(На короткой дистанции точно)

Vladimir
17.06.2018
10:21:34
Но их компетенции немного не совпадают с компетенциями админа и в общем даже саппорта

Google

Navern
17.06.2018
10:22:12
Какая разница как ты их называешь?
(исключая найм и хвастовство на вечеринках)

Vladimir
17.06.2018
10:23:01
Почему?
Потому что это именно фокус на траблшутинг и широкие знания везде

Navern
17.06.2018
10:24:04

Vladimir
17.06.2018
10:26:23
И как искать поломки
Один из скиллов, возведенный в абсолют
И требование к широте знаний больше

Admin
ERROR: S client not available

Vladimir
17.06.2018
10:27:04
Админ может не понимать как работает балансировка

Navern
17.06.2018
10:27:19
Я понял о чем ты)

Vladimir
17.06.2018
10:27:25
В такой человек должен с закрытыми глазами мочь начертить жизнь пакета в системе
Например

Navern
17.06.2018
10:27:48
Ты типа выделяешь чуваков с функцией дебага в отдельную группу

Vladimir
17.06.2018
10:28:19
Во внутренних сервисах такие люди не нужны

Navern
17.06.2018
10:32:27
@elemir90 я так понимаю считает что такие люди нужны во внутреннем продукте так же

Vladimir
17.06.2018
10:33:38
За счет чего?
За счёт того что подземный стук в сервисе значит что его должны дебажить те кто владеют сервисом

Google

Vladimir
17.06.2018
10:33:58
И за счёт того что внутренние клиенты прошли процесс собеса и соответствуют минимальному уровню

Navern
17.06.2018
10:34:33
Ты же с этого начал?
Типа не оч эффективно чтобы все сами деьажили

Vladimir
17.06.2018
10:35:05
И область изначально уже

Navern
17.06.2018
10:35:59
Я просто не оч понимаю в какой момент эти вещи расходятся) точнее я понимаю пример с авсом, он хороший) но чисто теоретически у тебя такое будет и во внутреннем продукте, просто гораздо реже

Vladimir
17.06.2018
10:38:08
И когда у тебя поток запросов и юзкейс огромный

Navern
17.06.2018
10:38:26
А я понял твой поинт

Vladimir
17.06.2018
10:38:29
Внутри у тебя и поток ограничен
И люди менее вероятно стреляют в ноги
И масштаб бедствия меньше

Navern
17.06.2018
10:38:58
Типа во внутреннем продукте ты ожидаешь что такие ситуации будут редко и разбираться всеми коммандами в кросс-кейсе вы будете раз в месяц а не каждые двп дня
Оке
Я тебя понял

Vladimir
17.06.2018
10:39:16
А значит даже на сверхкрупной инфраструктуре не нужно иметь отдельных дебаггеров из мяса

Navern
17.06.2018
10:40:40

Vladimir
17.06.2018
10:40:43
Там речь не о "раз в два дня"
А о "раз в час"

Алексей
17.06.2018
10:42:20