
imya
23.09.2016
20:06:47

Andrew
23.09.2016
20:07:11

Алексей
23.09.2016
20:07:21
нее не руками
ансиблом всё

Google

imya
23.09.2016
20:07:38
etckeeper
➜ root@localhost ~
➜ root@localhost ~ cd /etc
➜ root@localhost /etc git:(master) git status
# On branch master
nothing to commit, working directory clean
➜ root@localhost /etc git:(master)

Алексей
23.09.2016
20:08:07
просто я не верю что бывают плейбуки которые с бареметал делают сервер. мой чертовски близок... но все равно далёк.

Andrew
23.09.2016
20:08:09
ну тогда зачем что то на сервере инспектить? можно если надо из ансибла того же генерировать
но ок, послушаем у кого есть что сказать

Алексей
23.09.2016
20:09:18

Andrew
23.09.2016
20:09:50
> ты ему сервер он тебе доку. поставлены такие то пакеты, с момента установки сервера обновлены такие то файлы в диреткории etc
ты ему ямл файлики, а он тебе вот это

Алексей
23.09.2016
20:10:27
Андрей, у вас так много серверов что на 98% вы никогда не были по ssh ?
один фиг во время любой эксплуатации копятся файлы настройки и прочая фигня которая со временем имеет свойство накапливаться.
и в результате сервера идентично настроены ансиблом. но тут вот sysctl поправлен.

Andrew
23.09.2016
20:12:42
сейчас у меня вообще продакшена нет :) но высокая степень автоматизации и иммутабельность виртуалок приводит к тому, что ноды часто меняются ;)

imya
23.09.2016
20:12:55

Andrew
23.09.2016
20:12:59

Алексей
23.09.2016
20:13:13
а на этом пасять сгорела и вместо 256G стоит 192G это слегка сказалось на настройках

Google

Алексей
23.09.2016
20:14:11
и в результате городятся какие то исключения.

Andrew
23.09.2016
20:14:27
ну лично мне кажется, что вы сами себе создали проблему, а теперь пытаетесь не решить ее, а сверху замок построить

imya
23.09.2016
20:14:29

Алексей
23.09.2016
20:14:47

imya
23.09.2016
20:15:37

Алексей
23.09.2016
20:16:00
мне не нравится и идея того что сервера со временем перестают быть идентичными

Andrew
23.09.2016
20:16:34
а как надо ?
никаких настроек руками, просто забыть об этом. ну или вон вам подсказывают, что можно хотя бы логировать и документировать изменения через гит

Алексей
23.09.2016
20:17:29

Andrew
23.09.2016
20:18:34
ну если уж так дорого ему память чинить — делать спешиал кейс в конфигах

imya
23.09.2016
20:18:39

Алексей
23.09.2016
20:18:57
вы все праивльно говорите.
и я бы тоже самое сейчас говорил.
и в плейбуке для расчета sysctl у меня формулы.
но это не дока же.

imya
23.09.2016
20:21:26

Алексей
23.09.2016
20:21:55
точнее это не та дока которую можно кому то сдать.
я вот etckeeper сейчас на ноутбук поставлю
он там хорошо и праивльно ляжет
а в проде я почему то хочу не так.

Google

Алексей
23.09.2016
20:24:00
но это тоже не дока.

imya
23.09.2016
20:25:36
но это не дока же.
Если 0дмин руками правит файл и не документирует это заранее обговоренным способом (commit message —> changlog —> дока по эксплуатации) - гоните его,
всё равно у вас всё рухнет если/когда его собъёт машина.
commit template

Алексей
23.09.2016
20:28:37
ладно это была скучная часть. инструментальная.
а что с интерсной частью ? методикой документирования ?
как понять что документация достаточна ?
что должно быть написано в документации ?

Alexey
23.09.2016
20:29:44

Алексей
23.09.2016
20:30:25
в интернеах я помню был тест лимончелли и его примером по тому как надо вести доку
https://docs.google.com/document/pub?id=1r2-0CH-ZnCjzyl214JRu4jYr25HHNPGoRtE5QQlDe1M#h.reo6xpjp5h0j
вот это вот

Алексей
23.09.2016
20:30:48
может есть еще какие то подходы ?

imya
23.09.2016
20:31:45

Алексей
23.09.2016
20:32:33
imya это похоже на правду. но это лишь что делано.
а есть еще дока по работе во время сбоя
перенос сервиса на другой сервер
отработка триггеров
и прочее
методички, хаутушки

Google

Алексей
23.09.2016
20:34:01
то что можно делегировать на дежурную смену сняв с админа
да сейчас оглядывая хозяйство даже смешные вещи типа реглмента по перезапуску сервиса

imya
23.09.2016
20:36:33
а есть еще дока по работе во время сбоя
1) Какой вывод и какой команды достаточен для того, чтобы доказать, что проблема вне зоны ответственности команды.
2) В каком порядке инцидент обходит команды

Алексей
23.09.2016
20:37:17
imya я немного о другом.

imya
23.09.2016
20:37:18

Алексей
23.09.2016
20:37:27
дока по написани доки
такое вот хочу

imya
23.09.2016
20:37:44

Admin
ERROR: S client not available

Алексей
23.09.2016
20:38:46

imya
23.09.2016
20:39:15

Алексей
23.09.2016
20:39:44
видимо в комимт мессадже будет информация по отключению 3 сервисов там и перезапуску двух там. потом рестарту самого сервиса с новым конфигом.
и хранится будет не вики а тупо гит репа в которой будет сделан полнотекстовый поиск.
отличная идея. но это не то. я совсем не про это спрашиваю ведь.

imya
23.09.2016
20:42:01

Алексей
23.09.2016
20:42:44
imya есть чо почитать ?
книги ?
статьи ?

imya
23.09.2016
20:42:55

Google

imya
23.09.2016
20:45:00

Алексей
23.09.2016
20:45:43
еще раз. что бы сделать что то сложное надо сделать это через плейбук.
что бы знать какой плейбук запустить нужна дока.
в которой будет написано иди делай вот это.

imya
23.09.2016
20:46:40

Алексей
23.09.2016
20:47:34
я всё понял. спасибо. есть еще мнения ?

imya
23.09.2016
20:51:24
я всё понял. спасибо. есть еще мнения ?
Ты сейчас демонстрируешь подход построения идеальной инфраструктуры по идеальной документации.
Идеально немасштабируемой и неподдерживаемой.
0дмины нужны для автоматизации, т.е. уменьшения затрат ФОТ.
А ты - наоборот - создаёшь рабочие места:
1) человек, поддерживающий актуальность доков
который на практике превращается в
2) человека, знающего, что в доках неправильно
3) человека, умеющего правильно

Алексей
23.09.2016
20:53:48
нет, я всего лишь стремлюсь сделать так что бы люди ходили в отпуска. и что бы люди которые назыаются девопс могли спокойно спасть когда надо решить мелкую проблему.

imya
23.09.2016
20:54:07
Вся документация должна быть в коде,
на каждую строку конфига (stanza)
- две строки:
1) что делает код
2) почему (зачем) он делает так

Алексей
23.09.2016
20:54:13
а еще что бю люди могли уходить и можно было нанимать новых людей.
если с помощью какого либо инструментария можно поддерживать документацию в более актуальном состоянии чем это делается через wiki + playbook это здорово. но речь не об этом же.
совсем не понимаю как документирование конфигов помогает дежурной смене устранять триггеры по скорому окончанию места в разделе

imya
23.09.2016
21:00:15

Алексей
23.09.2016
21:00:55
как обовсем это узнает новый админ ?

imya
23.09.2016
21:01:15

Алексей
23.09.2016
21:01:39
>- подробно документированными
ну слава богу
какова методика документирования то ?

imya
23.09.2016
21:02:02

Алексей
23.09.2016
21:02:34
Имя. я просто вынужден спросить.
когда ты последний раз что то админил ?

ptchol
23.09.2016
21:02:49