@nocproject

Страница 272 из 2357
Dmitry
05.09.2016
07:57:55
клиента это не волнует совсем

на конце ставятся два пробника

Dmitry
05.09.2016
07:58:24
да, но мы должны бежать исправлять плохое качество канала до того, как позвонит клиент и обложит нас матом

Dmitry
05.09.2016
07:58:28
клиент видит картину и понимает, что жопа

Google
Dmitry
05.09.2016
07:58:34
выкатывает претензию

начинаем разбираться

локализуя зону ответсвенности, выясняем, что петя - пидорас в худшем смысле

пакеты берет и не отдает

все пиздим Петю

Dmitry
05.09.2016
07:59:28
Дим, то же самое, только наоборот разбираться начинаем ДО того, как позвонит клиент

Dmitry
05.09.2016
07:59:34
еще раз

разбираться начинаем, имея объективную картину

у меня была идея с 2 порогами

для клиента и для себя

сами дергаемся, когда срабатывает наш порог

это случай, когда зона ответсвенности проходит по порту клиента

а теперь в другую сторону

Google
Dmitry
05.09.2016
08:00:57
мы -- клиент

з/о по порту оператора

кроссировку мы заказывали отдельно

мы видим, что из конца в конец у нас жопа

Dmitry
05.09.2016
08:01:45
нет

Dmitry
05.09.2016
08:01:50
но нужно понять, кому претензию выставлять

Dmitry
05.09.2016
08:01:53
мы - оператор

Dmitry
05.09.2016
08:01:56
дим

NOC может использоваться и там и там

Ilya
05.09.2016
08:02:23
мы - оператор
Мы оператор и мы заказываем каналы как клиент

Dmitry
05.09.2016
08:02:23
да смотри. у нас канал, идущий через 10 железок

на железке, стоящей в середине видим такое: WARN: Broadcast storm is occurring (port: 13)

это означает, что канал, идущий через эту железку уже не 100% качества

Dmitry
05.09.2016
08:03:13
ты опять полез в детали

Dmitry
05.09.2016
08:04:39
я рассказываю, как оно реально звонит клиент, жалуется на качество наши действия - заходить на все 10, 20, 30 железок, через которые идет канал, и смотреть, на какой из них проблема

Dmitry
05.09.2016
08:05:31
ты не поверишь, мы этим занимаемся половину рабочего времени

смотреть все железки в нашей зоне ответсвенности

мы предоставляем каналы банкам. т.е. через нас подключены куча банкоматов и отделений

после звонка начинаем, на каждой железке show log show error ports N show ddm ports N cable diag ports N

Google
Dmitry
05.09.2016
08:09:52
https://www.evernote.com/l/ADndseLG3zNJaY_qqEDq488-sch2QUuG5lc

Дим, давай автодиагностику попробуем потом обсудить

вот третий вариант

Канал продолжает быть арендованной сущностью

к нему есть подключение

каждое подключение -- список услуг и зон ответсвенности

они типизированы

порт -- это порт, выделенный под канал

еще есть кроссировка

и до кучи -- чужие vlan'ы

а то и другие vpn'ы

Dmitry
05.09.2016
08:11:36
Порт "промежуточной" железки тут предусмотрен ?

Dmitry
05.09.2016
08:12:06
теоретически можно

Ilya
05.09.2016
08:12:29
достал попкорн

Dmitry
05.09.2016
08:13:10
у нас операторы дебилы Пропадает электричество на промежуточном узле а они еще пол-часа звонят, и спрашивают, почему не работают каналы, проходящие через этот узел

Dmitry
05.09.2016
08:16:12
Вот. Поэтому мы должны "плясать" от MO. Если проблема с MO - то деградируют каналы, через него проходящие

Ilya
05.09.2016
08:17:18
Вот. Поэтому мы должны "плясать" от MO. Если проблема с MO - то деградируют каналы, через него проходящие
проблемный МО может быть не в нашей зоне ответственности и управлении

Dmitry
05.09.2016
08:17:51
Может. А может быть и в нашей.

Google
Ilya
05.09.2016
08:17:51
его вообще нет в ноке, допустим

Dmitry
05.09.2016
08:18:54
да пофиг у нас типичная ситуация проблемы UA-IX через него идет несколько каналов разных клиентов

Dmitry
05.09.2016
08:19:30
эта штука нужна, чтобы РТ знал о проблеме

Dmitry
05.09.2016
08:20:06
Правильно. Только проблему нужно локализовать до того, как позвонит клиент

и сразу "отметить" каналы, зависящие от проблемной железки, как "неработающие"

Dmitry
05.09.2016
08:21:12
вот я и хочу

смотри

логика такая

если у нас указан порт

и он или железка лежит -- канал подшиваем в аварии

там хоть в fm.alarms выводи -- какие каналы валяются

Dmitry
05.09.2016
08:22:13
да, но не только "конечная" железка, а и промежуточная

Dmitry
05.09.2016
08:22:21
любая

для которой задан порт

если ты их там десять указал -- твое право

любая неработающая -- цепочка оборвалась

Dmitry
05.09.2016
08:22:53
т.е. "канал" у нас состоит из "железок" и "портов" на них

Dmitry
05.09.2016
08:23:27
нет

это дурной вырожденный случай

Google
Dmitry
05.09.2016
08:24:10
если у нас промежуточная циска написала "%FABRIC-3-CRC: Switch card 1", то это явно не улучшит качество канала, проходящего через нее

Ilya
05.09.2016
08:25:52
@dvolodin видимо хочет фактами оперировать, а ты на предотвращение @dmitryluhtionov

Dmitry
05.09.2016
08:26:39
факт - проблема на промежуточной железке. мы вполне можем сделать фиксированный список проблем, которые влияют на качество канала

У нас для этого есть FM и метрики

Dmitry
05.09.2016
08:27:38
https://www.evernote.com/l/ADndseLG3zNJaY_qqEDq488-sch2QUuG5lc

вот четверный вариант

через сервисную модель

то же, что и в 3-м

но не вводя лишних сущностей

Dmitry
05.09.2016
08:29:32
Дим. Проблема может быть не только на порту, но и на самой железке. Те же CRC ошибки на TCAM

Dmitry
05.09.2016
08:29:45
как это вляет на модель данных?

Dmitry
05.09.2016
08:30:24
кроме порта нужно еще и MO туда засунуть

Ilya
05.09.2016
08:30:41
как это вляет на модель данных?
порт не упал - не подшили к каналу аварию на железке

Andrey
05.09.2016
08:30:48
@dmitryluhtionov по хорошему поиск железок по которым проходит канал надо автоматизировать

иначе убиться можно забивать 1000 каналов руками

Ilya
05.09.2016
08:31:13
ага

Andrey
05.09.2016
08:31:23
учитывая что через железку их может много проходить

Dmitry
05.09.2016
08:31:24
на самом деле даже автоматизировать не надо

для железки понятны все сервисы, которые от нее зависят

Dmitry
05.09.2016
08:31:42
например C6KENV-SP-4-MINORTEMPALARM: RP 1/0 inlet temperature crossed threshold #1(=50C). It has exceeded normal operating temperature range. вполне может влиять на деградацию канала

Dmitry
05.09.2016
08:31:42
канал -- тот же сервис

тут дело вот в чем

Страница 272 из 2357