
Dmitry
05.09.2016
07:57:55
клиента это не волнует совсем
на конце ставятся два пробника

Dmitry
05.09.2016
07:58:24
да, но мы должны бежать исправлять плохое качество канала до того, как позвонит клиент и обложит нас матом

Dmitry
05.09.2016
07:58:28
клиент видит картину и понимает, что жопа

Google

Dmitry
05.09.2016
07:58:34
выкатывает претензию
начинаем разбираться
локализуя зону ответсвенности, выясняем, что петя - пидорас в худшем смысле
пакеты берет и не отдает
все пиздим Петю

Dmitry
05.09.2016
07:59:28
Дим, то же самое, только наоборот
разбираться начинаем ДО того, как позвонит клиент

Dmitry
05.09.2016
07:59:34
еще раз
разбираться начинаем, имея объективную картину
у меня была идея с 2 порогами
для клиента и для себя
сами дергаемся, когда срабатывает наш порог
это случай, когда зона ответсвенности проходит по порту клиента
а теперь в другую сторону

Google

Dmitry
05.09.2016
08:00:57
мы -- клиент
з/о по порту оператора
кроссировку мы заказывали отдельно
мы видим, что из конца в конец у нас жопа

Dmitry
05.09.2016
08:01:45
нет

Dmitry
05.09.2016
08:01:50
но нужно понять, кому претензию выставлять

Dmitry
05.09.2016
08:01:53
мы - оператор

Dmitry
05.09.2016
08:01:56
дим
NOC может использоваться и там и там

Ilya
05.09.2016
08:02:23

Dmitry
05.09.2016
08:02:23
да
смотри. у нас канал, идущий через 10 железок
на железке, стоящей в середине видим такое:
WARN: Broadcast storm is occurring (port: 13)
это означает, что канал, идущий через эту железку уже не 100% качества

Dmitry
05.09.2016
08:03:13
ты опять полез в детали

Dmitry
05.09.2016
08:04:39
я рассказываю, как оно реально
звонит клиент, жалуется на качество
наши действия - заходить на все 10, 20, 30 железок, через которые идет канал, и смотреть, на какой из них проблема

Ilya
05.09.2016
08:05:24

Dmitry
05.09.2016
08:05:31
ты не поверишь, мы этим занимаемся половину рабочего времени
смотреть все железки в нашей зоне ответсвенности
мы предоставляем каналы банкам. т.е. через нас подключены куча банкоматов и отделений
после звонка начинаем, на каждой железке
show log
show error ports N
show ddm ports N
cable diag ports N

Google

Dmitry
05.09.2016
08:09:52
https://www.evernote.com/l/ADndseLG3zNJaY_qqEDq488-sch2QUuG5lc
Дим, давай автодиагностику попробуем потом обсудить
вот третий вариант
Канал продолжает быть арендованной сущностью
к нему есть подключение
каждое подключение -- список услуг и зон ответсвенности
они типизированы
порт -- это порт, выделенный под канал
еще есть кроссировка
и до кучи -- чужие vlan'ы
а то и другие vpn'ы

Dmitry
05.09.2016
08:11:36
Порт "промежуточной" железки тут предусмотрен ?

Dmitry
05.09.2016
08:12:06
теоретически можно

Ilya
05.09.2016
08:12:29
достал попкорн

Dmitry
05.09.2016
08:13:10
у нас операторы дебилы
Пропадает электричество на промежуточном узле
а они еще пол-часа звонят, и спрашивают, почему не работают каналы, проходящие через этот узел

Ilya
05.09.2016
08:14:22
перефразировал

Dmitry
05.09.2016
08:16:12
Вот. Поэтому мы должны "плясать" от MO.
Если проблема с MO - то деградируют каналы, через него проходящие

Ilya
05.09.2016
08:17:18

Dmitry
05.09.2016
08:17:51
Может. А может быть и в нашей.

Google

Ilya
05.09.2016
08:17:51
его вообще нет в ноке, допустим

Dmitry
05.09.2016
08:18:54
да пофиг
у нас типичная ситуация
проблемы UA-IX
через него идет несколько каналов разных клиентов

Dmitry
05.09.2016
08:19:30
эта штука нужна, чтобы РТ знал о проблеме

Dmitry
05.09.2016
08:20:06
Правильно. Только проблему нужно локализовать до того, как позвонит клиент
и сразу "отметить" каналы, зависящие от проблемной железки, как "неработающие"

Dmitry
05.09.2016
08:21:12
вот я и хочу
смотри
логика такая
если у нас указан порт
и он или железка лежит -- канал подшиваем в аварии
там хоть в fm.alarms выводи -- какие каналы валяются

Ilya
05.09.2016
08:22:07

Dmitry
05.09.2016
08:22:13
да, но не только "конечная" железка, а и промежуточная

Dmitry
05.09.2016
08:22:21
любая
для которой задан порт
если ты их там десять указал -- твое право
любая неработающая -- цепочка оборвалась

Dmitry
05.09.2016
08:22:53
т.е. "канал" у нас состоит из "железок" и "портов" на них

Dmitry
05.09.2016
08:23:27
нет
это дурной вырожденный случай

Google

Dmitry
05.09.2016
08:24:10
если у нас промежуточная циска написала "%FABRIC-3-CRC: Switch card 1", то это явно не улучшит качество канала, проходящего через нее

Ilya
05.09.2016
08:25:52
@dvolodin видимо хочет фактами оперировать, а ты на предотвращение @dmitryluhtionov

Dmitry
05.09.2016
08:26:39
факт - проблема на промежуточной железке.
мы вполне можем сделать фиксированный список проблем, которые влияют на качество канала
У нас для этого есть FM и метрики

Dmitry
05.09.2016
08:27:38
https://www.evernote.com/l/ADndseLG3zNJaY_qqEDq488-sch2QUuG5lc
вот четверный вариант
через сервисную модель
то же, что и в 3-м
но не вводя лишних сущностей

Dmitry
05.09.2016
08:29:32
Дим. Проблема может быть не только на порту, но и на самой железке. Те же CRC ошибки на TCAM

Dmitry
05.09.2016
08:29:45
как это вляет на модель данных?

Dmitry
05.09.2016
08:30:24
кроме порта нужно еще и MO туда засунуть

Ilya
05.09.2016
08:30:41

Andrey
05.09.2016
08:30:48
@dmitryluhtionov по хорошему поиск железок по которым проходит канал надо автоматизировать
иначе убиться можно забивать 1000 каналов руками

Ilya
05.09.2016
08:31:13
ага

Andrey
05.09.2016
08:31:23
учитывая что через железку их может много проходить

Dmitry
05.09.2016
08:31:24
на самом деле даже автоматизировать не надо
для железки понятны все сервисы, которые от нее зависят

Dmitry
05.09.2016
08:31:42
например
C6KENV-SP-4-MINORTEMPALARM: RP 1/0 inlet temperature crossed threshold #1(=50C). It has exceeded normal operating temperature range.
вполне может влиять на деградацию канала

Dmitry
05.09.2016
08:31:42
канал -- тот же сервис
тут дело вот в чем