@ru_devops

Страница 85 из 999
Andrew
23.09.2016
20:07:11
Алексей
23.09.2016
20:07:21
нее не руками

ансиблом всё

Google
imya
23.09.2016
20:07:38
etckeeper
➜ root@localhost ~ ➜ root@localhost ~ cd /etc ➜ root@localhost /etc git:(master) git status # On branch master nothing to commit, working directory clean ➜ root@localhost /etc git:(master)

Алексей
23.09.2016
20:08:07
просто я не верю что бывают плейбуки которые с бареметал делают сервер. мой чертовски близок... но все равно далёк.

Andrew
23.09.2016
20:08:09
ну тогда зачем что то на сервере инспектить? можно если надо из ансибла того же генерировать

но ок, послушаем у кого есть что сказать

Andrew
23.09.2016
20:09:50
> ты ему сервер он тебе доку. поставлены такие то пакеты, с момента установки сервера обновлены такие то файлы в диреткории etc ты ему ямл файлики, а он тебе вот это

Алексей
23.09.2016
20:10:27
Андрей, у вас так много серверов что на 98% вы никогда не были по ssh ?

один фиг во время любой эксплуатации копятся файлы настройки и прочая фигня которая со временем имеет свойство накапливаться.

и в результате сервера идентично настроены ансиблом. но тут вот sysctl поправлен.

Andrew
23.09.2016
20:12:42
сейчас у меня вообще продакшена нет :) но высокая степень автоматизации и иммутабельность виртуалок приводит к тому, что ноды часто меняются ;)

imya
23.09.2016
20:12:55
Алексей
23.09.2016
20:13:13
а на этом пасять сгорела и вместо 256G стоит 192G это слегка сказалось на настройках

Google
Алексей
23.09.2016
20:14:11
и в результате городятся какие то исключения.

Andrew
23.09.2016
20:14:27
ну лично мне кажется, что вы сами себе создали проблему, а теперь пытаетесь не решить ее, а сверху замок построить

imya
23.09.2016
20:15:37
я б за такое по рукам въебал и все ;)
etckeeper —> autocommit —> remote —> hook —> hotfix branch —> alert comitter (mattermost, sms)

Алексей
23.09.2016
20:16:00
Его будет видно в etckeeper 'daily autocommit' (git log)
принципиально мне не нравится идея что /etc лежит в гите. это создает фальшивую уверенность.

мне не нравится и идея того что сервера со временем перестают быть идентичными

Andrew
23.09.2016
20:16:34
а как надо ?
никаких настроек руками, просто забыть об этом. ну или вон вам подсказывают, что можно хотя бы логировать и документировать изменения через гит

Алексей
23.09.2016
20:17:29
Andrew
23.09.2016
20:18:34
ну если уж так дорого ему память чинить — делать спешиал кейс в конфигах

imya
23.09.2016
20:18:39
и в результате городятся какие то исключения.
Это не "исключение", это повод заточить плэйбуки: 1) параметризовать 2) добавить тестов всё автоматизируемо!

Алексей
23.09.2016
20:18:57
вы все праивльно говорите.

и я бы тоже самое сейчас говорил.

и в плейбуке для расчета sysctl у меня формулы.

но это не дока же.

imya
23.09.2016
20:21:26
мне не нравится и идея того что сервера со временем перестают быть идентичными
Для этого используем дифференциальный анализ файловых систем etckeeper - простейший инструмент, секьюрнет я вам не советую ? и эншуры (puppet ensure, забыл как аналог в ансамбле называется)

Алексей
23.09.2016
20:21:55
точнее это не та дока которую можно кому то сдать.

я вот etckeeper сейчас на ноутбук поставлю

он там хорошо и праивльно ляжет

а в проде я почему то хочу не так.

Google
imya
23.09.2016
20:25:36
но это не дока же.
Если 0дмин руками правит файл и не документирует это заранее обговоренным способом (commit message —> changlog —> дока по эксплуатации) - гоните его, всё равно у вас всё рухнет если/когда его собъёт машина.

commit template

Алексей
23.09.2016
20:28:37
ладно это была скучная часть. инструментальная.

а что с интерсной частью ? методикой документирования ?

как понять что документация достаточна ?

что должно быть написано в документации ?

Alexey
23.09.2016
20:29:44
Если 0дмин руками правит файл и не документирует это заранее обговоренным способом (commit message —> changlog —> дока по эксплуатации) - гоните его, всё равно у вас всё рухнет если/когда его собъёт машина.
У нас в своё время новому сетевику дали ноут, дали кабель и пароль для ближайшего роутера. Сказав, что старый сетевик считай что умер.

Алексей
23.09.2016
20:30:25
в интернеах я помню был тест лимончелли и его примером по тому как надо вести доку

https://docs.google.com/document/pub?id=1r2-0CH-ZnCjzyl214JRu4jYr25HHNPGoRtE5QQlDe1M#h.reo6xpjp5h0j

вот это вот

Алексей
23.09.2016
20:30:48
может есть еще какие то подходы ?

imya
23.09.2016
20:31:45
что должно быть написано в документации ?
1) у вас УЖЕ есть дока по эксплуатации от авторов - велосипед с круглыми колёсами 2) вы пишите комментарии к патчу (diff-у) конфига —> commit message

Алексей
23.09.2016
20:32:33
imya это похоже на правду. но это лишь что делано.

а есть еще дока по работе во время сбоя

перенос сервиса на другой сервер

отработка триггеров

и прочее

методички, хаутушки

Google
Алексей
23.09.2016
20:34:01
то что можно делегировать на дежурную смену сняв с админа

да сейчас оглядывая хозяйство даже смешные вещи типа реглмента по перезапуску сервиса

imya
23.09.2016
20:36:33
а есть еще дока по работе во время сбоя
1) Какой вывод и какой команды достаточен для того, чтобы доказать, что проблема вне зоны ответственности команды. 2) В каком порядке инцидент обходит команды

Алексей
23.09.2016
20:37:17
imya я немного о другом.

Алексей
23.09.2016
20:37:27
дока по написани доки

такое вот хочу

Admin
ERROR: S client not available

Алексей
23.09.2016
20:38:46
diff/patch/commit message
эм. сириос ?

Алексей
23.09.2016
20:39:44
видимо в комимт мессадже будет информация по отключению 3 сервисов там и перезапуску двух там. потом рестарту самого сервиса с новым конфигом.

и хранится будет не вики а тупо гит репа в которой будет сделан полнотекстовый поиск.

отличная идея. но это не то. я совсем не про это спрашиваю ведь.

imya
23.09.2016
20:42:01
видимо в комимт мессадже будет информация по отключению 3 сервисов там и перезапуску двух там. потом рестарту самого сервиса с новым конфигом.
Тебе нужно порядок уведомления, согласования и отчёта (пост-мортема в случае неудачи) - разбора полётов согласовывать. Если ты будешь вручную "по хаутушке" это (переезд сервера) делать - как 20 лет назад - тебе не в этот чат.

Алексей
23.09.2016
20:42:44
imya есть чо почитать ?

книги ?

статьи ?

imya
23.09.2016
20:42:55
Google
imya
23.09.2016
20:45:00
видимо в комимт мессадже будет информация по отключению 3 сервисов там и перезапуску двух там. потом рестарту самого сервиса с новым конфигом.
Вероятность ошибки == 100%, даже при идеальной инструкции. Человеческий фактор - противоречие с принципом Инфрастуктура-как-код

Алексей
23.09.2016
20:45:43
еще раз. что бы сделать что то сложное надо сделать это через плейбук.

что бы знать какой плейбук запустить нужна дока.

в которой будет написано иди делай вот это.

imya
23.09.2016
20:46:40
в которой будет написано иди делай вот это.
"иди делай" == Вероятность ошибки 100%

Алексей
23.09.2016
20:47:34
я всё понял. спасибо. есть еще мнения ?

imya
23.09.2016
20:51:24
я всё понял. спасибо. есть еще мнения ?
Ты сейчас демонстрируешь подход построения идеальной инфраструктуры по идеальной документации. Идеально немасштабируемой и неподдерживаемой. 0дмины нужны для автоматизации, т.е. уменьшения затрат ФОТ. А ты - наоборот - создаёшь рабочие места: 1) человек, поддерживающий актуальность доков который на практике превращается в 2) человека, знающего, что в доках неправильно 3) человека, умеющего правильно

Алексей
23.09.2016
20:53:48
нет, я всего лишь стремлюсь сделать так что бы люди ходили в отпуска. и что бы люди которые назыаются девопс могли спокойно спасть когда надо решить мелкую проблему.

imya
23.09.2016
20:54:07
Вся документация должна быть в коде, на каждую строку конфига (stanza) - две строки: 1) что делает код 2) почему (зачем) он делает так

Алексей
23.09.2016
20:54:13
а еще что бю люди могли уходить и можно было нанимать новых людей.

если с помощью какого либо инструментария можно поддерживать документацию в более актуальном состоянии чем это делается через wiki + playbook это здорово. но речь не об этом же.

Вся документация должна быть в коде, на каждую строку конфига (stanza) - две строки: 1) что делает код 2) почему (зачем) он делает так
напрочь не понимаю как документирование конфигов соотносится с документацией по решению типичных косяков.

совсем не понимаю как документирование конфигов помогает дежурной смене устранять триггеры по скорому окончанию места в разделе

imya
23.09.2016
21:00:15
нет, я всего лишь стремлюсь сделать так что бы люди ходили в отпуска. и что бы люди которые назыаются девопс могли спокойно спасть когда надо решить мелкую проблему.
1) исключить участие человека, т.е. 0дмин ничего не должен делать руками всё через код код должен быть стандартным т.е. проходить через линт и не содержать антипаттернов (опенсорс или парное администрирование) в абсолюте - он не должен писать никаких скриптов и никаких команд не выполнять а брать готовые плейбуки и патчить их 2) все свои заклинания он должен расшифровывать описывая только отличия например, пусть откроет хистори и к непонятным командам сделает "алиасы" на русском языке - они и будут "документацией" а к частым - плэйбук для крона

Алексей
23.09.2016
21:00:55
как обовсем это узнает новый админ ?

imya
23.09.2016
21:01:15
а еще что бю люди могли уходить и можно было нанимать новых людей.
для этого у тебя всё должно быть стандартное а все отличия (зоопарк+говнокод) - подробно документированными

Алексей
23.09.2016
21:01:39
>- подробно документированными ну слава богу

какова методика документирования то ?

imya
23.09.2016
21:02:02
как обовсем это узнает новый админ ?
хистори распечатывается и сдаётся в первый отдел, безопаснику ?

Алексей
23.09.2016
21:02:34
Имя. я просто вынужден спросить.

когда ты последний раз что то админил ?

ptchol
23.09.2016
21:02:49
Имя. я просто вынужден спросить.
иди в церковь, поясни за диски )

Страница 85 из 999