@ru_devops

Страница 367 из 999
Ruslan
28.08.2017
20:34:37
>хттп которое стриггерит пулл

Марк ☢
28.08.2017
20:34:39
Тогда без крона можно

Ruslan
28.08.2017
20:34:42
вот это место непонятно

Марк ☢
28.08.2017
20:35:10
Блять. Байда на питоне (вебсервер) который сделает через сабпроцее гит пулл

Google
Марк ☢
28.08.2017
20:35:19
А там хуки и дальше поехало

Например так

Нонахуа

Ruslan
28.08.2017
20:35:45
думал github source repo + gitlab private playbook repo + docker container который слушает HTTP url и который возьмет исходники и playbook и описание инстанса и его поднимет

Марк ☢
28.08.2017
20:36:27
Убери гитхаб из цепочки и будет заебца

Нахер он тебе сдался

Vlad
28.08.2017
20:48:33
думал github source repo + gitlab private playbook repo + docker container который слушает HTTP url и который возьмет исходники и playbook и описание инстанса и его поднимет
Зачем слушать http url? Добавь в приватный проект на gitlab свой gitlab-runner который и будет запускать ansible.

Алексей
28.08.2017
20:49:06
я так понял что этот вариант рассмотрен и почему то отвержен

Ruslan
28.08.2017
20:50:07
да не, я забыл про GitLab CI встроенный. спасибо. но тут смущает что все credentials придется вывалить в (закрытую) репу на gitlab

Алексей
28.08.2017
20:50:32
не надо их туда вываливать. их можно держдать у себя.

их можно держать в приватных енв перемнных

Google
Алексей
28.08.2017
20:51:15
или в приватных енв перменных держать ключ расшифровки файла на своем раннере

Ruslan
28.08.2017
20:54:19
Храни на своем gitlab-runner
хорошая идея про gitlab-runner. можно запустить через докер и вызываться будет через gitlab.com. Спасибо!

Pavel
29.08.2017
14:29:12
Коллеги, а кто нибудь проводил реальные замеры на боевых базах сколько воркеров оптимально при репликации? Вот есть такая статья: https://www.percona.com/blog/2016/02/10/estimating-potential-for-mysql-5-7-parallel-replication/ там все сводится к тому мол 4 оптимальны. Почему 4, а не 8 или там CPU_COUNT? кто-нить вникал?

No1
29.08.2017
14:34:36
Ого,живой мускуль)

Pavel
29.08.2017
14:35:23
Ого,живой мускуль)
а щоб ему быть мертвым?

No1
29.08.2017
14:36:59
Да чёт проблемы детские у нее, мультимастер полное уг. Вот вы сейчас что то с репликой разбираетесь:)

Pavel
29.08.2017
14:37:32
да он работает, хочу понять как :)

Sergey
29.08.2017
15:15:20
А есть не УГ мултимастер?
смотря что считать мультимастером

Phil
29.08.2017
15:16:45
No1
29.08.2017
15:17:15
Да мм сам по себе сложный в реализации.

Dmitry
29.08.2017
15:18:15
смотря что считать мультимастером
смотря что считать под "работает" )))

Sergey
29.08.2017
15:18:47
Да мм сам по себе сложный в реализации.
опять же, смотря что считать мультимастером

технически на двух серверах запустить while true ; do rsync -av /path/to/root rsync://remote/share/ ; done - тоже мультимастер.

No1
29.08.2017
15:20:40
Ну

Sergey
29.08.2017
15:22:07
Не пройдет jepsen
смотря какие гарантии заявить

jepsen же проверяет только соответствует ли поведение заявленному

Uncel
31.08.2017
04:29:37
никогда, никогда, НИКОГДА не используйте collectd. он однопоточный и синхронный.
в последнее время часто вижу инсталяции с ним, есть линк где эти грабли описаны?

Vitaliy
31.08.2017
04:44:48
в последнее время часто вижу инсталяции с ним, есть линк где эти грабли описаны?
я бился об эти грабли лично. Любая долго отвечающая метрика тормозит весь цикл получения и отправки метрик. Далее срабатывает алерт что всё упало и катастрофа

Google
Uncel
31.08.2017
04:49:12
Спасибо. Непонятно почему при таком поведении, везде collectd is heavily multi-threaded

Pavel
31.08.2017
06:10:14
Ни разу не тормоз

Phil
31.08.2017
06:41:03
Собственно он удобен как "быстпо воткнул получить сисиемные"

Alex
31.08.2017
08:17:31
А чем принято сейчас долгие метрики собирать?

Vitaliy
31.08.2017
08:34:57
Достаточно странно через коллектд брать долгоаолучаемые метрики
некоторые условно системные метрики могут долго отвечать

А чем принято сейчас долгие метрики собирать?
если говноед (95%), то заббикс. Здоровые люди использует Прометей

Алексей
31.08.2017
08:40:01
прометей прометеем. коллеткоры нужны к прометею

я так себе довольен стабильность телеграфа. думал как раз про коллектд.

@upovod ответь плиз про многопоточность.

Denys ??
31.08.2017
08:46:29
Если я правильно понимаю collectd то он должен отдавать метрики каждые Interval секунд

Denys ??
31.08.2017
08:47:25
И каждый плагин по идее работает в своём потоке и его блокировка не должна блочить остальные плагины

Но если заблочить один плагин, то логично что он будет заблоченым. @Civiloid должен точно знать , у него контрибуторская футболочка от Collectd есть, но вроде его в этом канале нет.

Ну или в irc спросить на #collectd, когда то он был весьма жив

Vladimir
31.08.2017
08:58:41
в одном ифе

(и я не шучу)

но впрочем мне казалось что оно именно так и работает в 5.x

плагин в своем тредике

Google
Vladimir
31.08.2017
08:59:26
если нужно что-то системное коллектить есть плагин принимающий по сокету

Vladimir
31.08.2017
08:59:33
и там все вроде довольно умно таймаутами обвешано было

Admin
ERROR: S client not available

Vladimir
31.08.2017
09:00:50
впрочем что плагин пер тред можно убедится погрепав по phtread_create по сырцам

или по " plugin_thread_create"

Алексей
31.08.2017
10:23:16
господа, а в чем проблемы с cpu/memmory hot plug в vmware esxi ? почему галка по дефолту off

Ruslan
31.08.2017
10:54:30
Если помните обсуждали как выкладывать автоматом без Jenkins и крона. Получилось как то так...

Если нужно могу дать примеры скриптов, у меня java tomcat webapp.

Dmitriy
31.08.2017
12:23:17
Привет всем подскажите что может означать последная линия eth0 Link encap:Ethernet HWaddr 74:d0:2b:9a:85:22 inet addr:144.76.154.38 Bcast:144.76.154.63 Mask:255.255.255.224 inet6 addr: 2a01:4f8:200:222e::2/64 Scope:Global inet6 addr: fe80::76d0:2bff:fe9a:8522/64 Scope:Link UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:61092 errors:0 dropped:0 overruns:0 frame:0 TX packets:19269 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:89085429 (89.0 MB) TX bytes:1944761 (1.9 MB) Interrupt:17 Memory:f7d00000-f7d20000

гуглил подобную строку - у всех что то было по аппаратной части

kevit
31.08.2017
12:26:09
lspci -vvv на этот девайс нужен

в целом это скорее всего ring buffer

Dmitriy
31.08.2017
12:31:15
Что то определенное скинуть? тут просто очень много

kevit
31.08.2017
12:31:47
ну там скорее всего Region0 или Region2 совпадает с этой строкой

pl
31.08.2017
12:32:13
какую проблему вы решаете?

kevit
31.08.2017
12:32:26
да нет проблемы, человек интересуется что там написано)

Dmitriy
31.08.2017
12:33:15
root@cloude-02 ~ # lspci -vvv | grep "^[0-9]" 00:00.0 Host bridge: Intel Corporation Xeon E3-1200 v2/Ivy Bridge DRAM Controller (rev 09) 00:01.0 PCI bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port (rev 09) (prog-if 00 [Normal decode]) 00:02.0 VGA compatible controller: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor Graphics Controller (rev 09) (prog-if 00 [VGA controller]) 00:06.0 PCI bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port (rev 09) (prog-if 00 [Normal decode]) 00:16.0 Communication controller: Intel Corporation 6 Series/C200 Series Chipset Family MEI Controller #1 (rev 04) 00:1a.0 USB controller: Intel Corporation 6 Series/C200 Series Chipset Family USB Enhanced Host Controller #2 (rev 05) (prog-if 20 [EHCI]) 00:1c.0 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 1 (rev b5) (prog-if 00 [Normal decode]) 00:1c.5 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 6 (rev b5) (prog-if 00 [Normal decode]) 00:1c.7 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 8 (rev b5) (prog-if 00 [Normal decode]) 00:1d.0 USB controller: Intel Corporation 6 Series/C200 Series Chipset Family USB Enhanced Host Controller #1 (rev 05) (prog-if 20 [EHCI]) 00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev a5) (prog-if 01 [Subtractive decode]) 00:1f.0 ISA bridge: Intel Corporation C206 Chipset Family LPC Controller (rev 05) 00:1f.2 SATA controller: Intel Corporation 6 Series/C200 Series Chipset Family SATA AHCI Controller (rev 05) (prog-if 01 [AHCI 1.0]) 00:1f.3 SMBus: Intel Corporation 6 Series/C200 Series Chipset Family SMBus Controller (rev 05) 04:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection 05:00.0 USB controller: ASMedia Technology Inc. ASM1042 SuperSpeed USB Host Controller (prog-if 30 [XHCI])

проблема в cледующем есть сервер в хетцнере под нагрузкой порядка 30К активных соединений на nginx начинает раватся tcp и вот такие сообщения сыпятся в syslog Aug 31 06:25:18 cloud-2 kernel: [3019110.080288] net_ratelimit: 1393 callbacks suppressed Aug 31 06:25:18 cloud-2 kernel: [3019110.080289] TCP: too many orphaned sockets Aug 31 06:25:18 cloud-2 kernel: [3019110.080408] TCP: too many orphaned sockets Aug 31 06:25:18 cloud-2 kernel: [3019110.080418] TCP: too many orphaned sockets Aug 31 06:25:18 cloud-2 kernel: [3019110.080432] TCP: too many orphaned sockets Aug 31 06:25:18 cloud-2 kernel: [3019110.080704] TCP: too many orphaned sockets Aug 31 06:25:18 cloud-2 kernel: [3019110.080727] TCP: too many orphaned sockets Aug 31 06:25:18 cloud-2 kernel: [3019110.081321] TCP: too many orphaned sockets Aug 31 06:25:18 cloud-2 kernel: [3019110.123276] TCP: too many orphaned sockets Aug 31 06:25:18 cloud-2 kernel: [3019110.123377] TCP: too many orphaned sockets Aug 31 06:25:18 cloud-2 kernel: [3019110.123531] TCP: too many orphaned sockets

Google
kevit
31.08.2017
12:35:05
проблема не в железе.

tcp_max_orphans или память крутить под сокеты

Dmitriy
31.08.2017
12:38:12
ubuntu 16.04 два одинаковых сервера на проблемном затюнил вот таким образом net.ipv4.ip_local_port_range = 2000 65000 net.ipv4.tcp_syncookies = 1 net.ipv4.tcp_synac_retries = 2 net.ipv4.tcp_fin_timeout = 3 net.ipv4.tcp_tw_reuse = 1 net.ipv4.tcp_max_syn_backlog = 3240000 net.ipv4.tcp_max_tw_buckets = 1440000 net.ipv4.tcp_window_scaling = 1 net.core.somaxconn = 5000 net.core.netdev_max_backlog = 15000 net.core.netdev_budget = 8196 net.core.rmem_default = 8388608 net.core.rmem_max = 16777216 net.core.wmem_max = 16777216 net.ipv4.tcp_rmem = 4096 87380 16777216 net.ipv4.tcp_wmem = 4096 65536 16777216 net.ipv4.tcp_congestion_control = cubic net.ipv4.tcp_tw_recycle = 1 #net.ipv4.netfilter.ip_conntrack_tcp_timeout_time_wait = 1 #net.netfilter.nf_conntrack_tcp_timeout_established=600 #net.netfilter.nf_conntrack_max=1048576 #net.nf_conntrack_max = 1048576 net.ipv4.tcp_slow_start_after_idle=0 и запустил sysctl —system но еффекта не было.

подскажите пожалуйста какой это именно ключ под память сокетов

kevit
31.08.2017
12:39:50
tcp_mem, но я бы сначала подумал почему получаются orphaned сокеты

т.е насколько я понимаю процесс сокет закрыл

но tcp все еще есть к этому сокету

kevit
31.08.2017
12:42:36
и их 64к

раз начало это отбиваться

Dmitriy
31.08.2017
12:44:46
сейча покажу. как раз подумал о том какое кол-во и каких у меня соединений это живой не глючный вроде сервер root@Ubuntu-1604-xenial-64-minimal ~ # netstat -nat | awk '{print $6}' | sort | uniq -c | sort -n 1 established) 1 Foreign 7 LISTEN 12 CLOSE_WAIT 237 CLOSING 261 FIN_WAIT2 511 SYN_RECV 703 FIN_WAIT1 5793 TIME_WAIT 38329 ESTABLISHED 92215 LAST_ACK ` вот так приблизительно выглядело на поломанном 1 established) 1 Foreign 7 LISTEN 12 CLOSE_WAIT 261 FIN_WAIT2 511 SYN_RECV 703 FIN_WAIT1 5793 TIME_WAIT 6237 CLOSING —— вот таких много было 38329 ESTABLISHED 92215 LAST_ACK

kevit
31.08.2017
12:46:01
ну у него очень маленький таймаут стоит на tcp_fin_timeout у него не будет много TIME_WAIT

Страница 367 из 999