
N
15.08.2016
05:52:27

Roman
15.08.2016
05:52:36
таких нет

N
15.08.2016
05:52:37
kldload libastral

Александр
15.08.2016
05:52:59
Я думал уже модуль для ядра запилили

Google

santa
15.08.2016
05:53:13
Замена sata проводка это вопрос о ста рублях
На какие-то админские отмазки похоже

N
15.08.2016
05:53:15

Anton
15.08.2016
05:54:05
У меня hetzner. Там любая херня размагнитится может.

Александр
15.08.2016
05:54:15
Ну бля

Pavel
15.08.2016
05:54:26
Тонко

Александр
15.08.2016
05:54:31
Мог бы сказать, что сервант удаленный?
Тут нужна телепатия иного порядка

N
15.08.2016
05:54:48

Anton
15.08.2016
05:55:18
Оно зависает раз в несколько недель. Так просто эксперимент провернуть не получится

Konstantin
15.08.2016
05:55:40
ваш чатик мне напоминает sql.ru... да и любой русский форум технарей
помощи ноль - один стёб :)

Александр
15.08.2016
05:56:00

Google

N
15.08.2016
05:56:14
Тогда сложнее. Тогда ставь в while true dd if=/dev/zero of=диск-с-данными и гоняйте его так

Konstantin
15.08.2016
05:56:16
вопрос как вопрос

Александр
15.08.2016
05:56:36
"У меня хуй его знает что непонятно где"

N
15.08.2016
05:56:43
Это раскрутит шпиндели и заставит диски обратно намагнититься. А они перекинут все на южный мост
ёба

Александр
15.08.2016
05:56:52
Вопрос уровня у меня монитор не загружается

N
15.08.2016
05:57:04

Konstantin
15.08.2016
05:57:11
ну чел не знает куда копать, симптопы описал

Александр
15.08.2016
05:57:12

Aleksandr
15.08.2016
05:57:18

Александр
15.08.2016
05:57:31

Anton
15.08.2016
05:57:39
Ну в том и дело, что спрашиваю куда копать. В dmesg ничего нет. Вот он работал, и вот его нет

N
15.08.2016
05:58:15

Anton
15.08.2016
05:58:34
Гм, я видел такое про харды. А там и про сервер есть?

Konstantin
15.08.2016
05:58:39
"в любой непонятной ситуации меняй сервер"

N
15.08.2016
05:59:15
Но попробовать можно

ILIYA
15.08.2016
05:59:23
"нельзя просто так взять и поменять сервер"

Pavel
15.08.2016
06:01:41

Anton
15.08.2016
06:02:18
А мы тут все ленивые :(

Google

Александр
15.08.2016
06:02:31
Это я уже заметил

Anton
15.08.2016
06:03:41
"Облачность" в общем случае требует немного другого отношения в FS и других рецептов приготовления DB. Работы там максимум на месяц, но этого месяца уж какой год найти не могу :(


Aleksandr
15.08.2016
06:03:42
Ребят - хитрый вопрос :P Иногда зависает сервер. Просто "замирает". Только ресет помогает. Проблема судя по всему в железе. "Админ" говорит, что такое бывает если глючит блок питания или кабеля. У нас на самом деле пару лет назад на одном из серверов SATA кабель немного помер и было примерно похожее поведение. Но вопрос в другом - на какие приборы смотреть и как проверить "железо". Как найти слабое звено!?
причин миллиард, но поскольку это арендованный dedicated, время арендовать второй сервер на время, перенести туда все сервисы и писать в поддержку про первый сервер, подкрепляя наблюдения максимально возможными найденными логами из syslog, messages, last -x shutdown reboot
когда починят первый сервер (или заменят), приложения можно будет перенести обратно
хотя, с такими обстоятельствами проще тогда уж остаться на втором
в этом недостаток аренды оборудования - никогда не знаешь, насколько поношенной или рабочей тебе достанется конфигурация, всегда могут быть фантомные проблемы


Anton
15.08.2016
06:05:41
Это было бы самое простое решение. Мы там уже два раза делали. "Вот прямо сейчас" по финансам не пройдет. Там же далеко не один сервер :(

Alex
15.08.2016
06:06:37
Всем привет. Александр. Админ в паре сервисов партнерок. Осваиваю питон. #whois

Aleksandr
15.08.2016
06:06:58
В интересах бизнеса найти финансы
иначе сервисы так и будут дальше прерываться раз в неделю
если убытки от этого (включая возможную потерю данных) несопоставимы с доходом, то можно и забить

Anton
15.08.2016
06:09:05
Вылет одного сервера не критичен. Потери данных быть не может (glusterfs на 4 серверах, каждый из которых raid1). Да и рестарт прилетит через 5 минут - админ в Австралии живет, так что 24 часа в сутки кто-то да есть.
Надоело просто это дело - куда бы ты не ехал, возьми ноут с собой.

Alex
15.08.2016
06:10:30

Anton
15.08.2016
06:10:48
Нет. После последней смены пошло больше трех лет :)

Alex
15.08.2016
06:12:10
Хех. Ну могу посоветовать состояние дисков глянуть smartctl-ом
за 3 года ушататься могут легко при активном rw

Pavel
15.08.2016
06:12:52

Aleksandr
15.08.2016
06:13:31

Anton
15.08.2016
06:13:40
По смарту вроде живые, w низкий. При этом один диск из рейда иногда вылетает.

Alex
15.08.2016
06:14:29
эммм... вроде живой диск вряд ли будет из рейда самопроизвольно вылетать

Vladimir
15.08.2016
06:15:43

Google

Alex
15.08.2016
06:15:48
а если и второй такой же, то вот оно. У меня как-то в ITL после добавления винтов половина существующих дисков отвалилась. Ибо шлейфы как попало воткнуты были

N
15.08.2016
06:21:38

Alexandr
15.08.2016
06:26:41
Ребят, никто не заморачивался настройкой gssapi (sso) на серверах ejabberd ?

Andrey
15.08.2016
06:27:03
когда-то очень давно, я что-то такое делал ))

Alexandr
15.08.2016
06:27:16

Anton
15.08.2016
06:27:18
А «по смарту вроде живые» это как?
MART overall-health self-assessment test result: PASSED Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 23991 -

Andrey
15.08.2016
06:27:25
мне кажется что да

N
15.08.2016
06:27:34
И что, то оно passed?

Admin
ERROR: S client not available

N
15.08.2016
06:27:45
Там гору атрибутов для красоты прикрутили что ли?

Alexandr
15.08.2016
06:27:55

Andrey
15.08.2016
06:28:18
слишком давно было (

Anton
15.08.2016
06:28:38

N
15.08.2016
06:29:11

Alexandr
15.08.2016
06:29:11
слишком давно было (
я так понимаю из коробки gssapi не работает? надо патчить сам пакет и еще сверху ставить erlang-esasl?

Vladimir
15.08.2016
06:29:14
Надо учиться

N
15.08.2016
06:29:18
Как можно не понимать смарт, епт?

Anton
15.08.2016
06:29:58
Доктор. Я буду жить?

Alexandr
15.08.2016
06:30:00

Andrey
15.08.2016
06:30:14
Не, ничего

Google

Phil
15.08.2016
06:31:36
Приходится использовать ssh
Внезапно ansible тоже использует SSH. Нет смысла использовать ansible там, где тебе нужет только ssh. Ещё раз - потому что ansible и делает ssh (причем достаточно тупо (в хорошем смысле) просто вызывает команду ssh). Ты можешь наверное использовать ad-hoc команду shell, но смысл?

Aleksandr
15.08.2016
06:32:36

N
15.08.2016
06:33:40
ну вот то, что Pre-Fail это критикал-параметры. Thresh - это параметр, когда пиздец близок. Value это то, что сейчас
Очевидно же все

Phil
15.08.2016
06:33:48

Alex
15.08.2016
06:33:58
Я бы порекомендовал почитать про Reallocated sector ct.

N
15.08.2016
06:34:33

Anton
15.08.2016
06:35:02
Если у меня первый параметр 200, а Thresh - 57 - это вообще в клочья?

N
15.08.2016
06:35:10
А 117 это там прям вот реальная температура на диске что ли?

Aleksandr
15.08.2016
06:35:26
ох гадатели

Phil
15.08.2016
06:35:30
Как можно не понимать смарт, епт?
Элементарно. Поля часто не соответствуют спецификации. Внутри даже автомат иногда интерпретировать не умеет, а голову вообще сломать можно. Если тулза не определила фейл, то я например сходу без специального гугления тоже ничего не пойму

Maxim
15.08.2016
06:35:43

N
15.08.2016
06:36:19

Aleksandr
15.08.2016
06:36:45
https://ru.wikipedia.org/wiki/S.M.A.R.T.
здесь хорошо отмечено красненьким, на что смотреть в смарте
если значения в value нечитабельны, смотреть нужно raw справа

Phil
15.08.2016
06:37:30

N
15.08.2016
06:37:36

Phil
15.08.2016
06:37:43

N
15.08.2016
06:38:14
лол

Maxim
15.08.2016
06:38:24