New subject: [nav-ref] Om link up/down

18 Aug 2014


      Hei,
morten.brekkevold@uninett.no said:
...
On Thu, 07 Aug 2014 17:09:24 +0200 Borge Brunes borge.brunes@uit.no wrote:
...
Hmm. Sikkert. Tja.
Jeg ser jo at noe av variablene, bla. ifname, jeg savner allerede ligger 
inne, men blir ikke funnet/postet?
Hvor finner jeg oversikt over hvilke variabler jeg kan bruke?
Det finnes dessverre ingen god enhetlig oversikt over det, men vi burde
dokumentere litt mer rundt det Ã¥ modifisere maltekstene selv.
Noen variabler er tilgjengelig for _alle_ alarmer, fordi de kommer fra
selve AlertHistory og/eller AlertQueue-modellene til NAV. I tillegg kan
alle programsnutter som genererer events velge Ã¥ legge ved et eget sett
med "custom" variabler med tekstverdier til hver enkelt hendelse. Det er
disse som blir vanskelig Ã¥ lage noen god oversikt over.
Med releasen i gÃ¥r la jeg til muligheten for Ã¥ debuglogge
alarmtekst-produksjonen til eventengine. Om man slÃ¥r pÃ¥ debuglogging av
loggeren "nav.eventengine.alerts.template" i logging.conf, vil
eventengine for hver genererte alarm debuglogge hvilke variabler den har
tilgjengeliggjort for malene, og ogsÃ¥ hvordan den utfylte malen ser ut
med den gitte alarmens verdier.
Det er lite fleksibelt om all kode som poster events mÃ¥ huske pÃ¥ Ã¥ legge
til det samme settet med customvariabler, spesielt hvis den samme
eventen kan postes av forskjellige delsystemer (som raskt er tilfelle
i krysningen mellom snmptrapd og idpevpoll).
En bedre lÃ¸sning for fremtiden vil antageligvis vÃ¦re at man bygger inn
mer kunnskap om de forskjellige alarmene i modellen til NAV, slik at man
i maltekstene kan hente ut alarm-subjektet i en egen variabel. Dette vil
da vÃ¦re en Netbox-instans, om alarmen omhandler en netbox, eller en
Interface-instans om alarmen omhandler en port, osv.  Det er noe sÃ¥nt
jeg vil vurdere Ã¥ lage som respons pÃ¥ feature-requesten din, BÃ¸rge.
Dette blir kanskje litt på siden, men jeg skriver noen ord likevel.
Under sjakk-ol her i Tromsø så hadde vi ansvaret for nettet sammen
med Datametrix. Fungerte alderes utmerket.
Ganske snart så ble det klart at Cisco PRIME ikke var bra nok for overvåking 
av utstyret/nettet, så vi måtte finne på noe som var enkelt å hive 
opp. Vurderte NAV, men Dax hadde ikke erfaring med dette så det ble The Dude
fra Mikrotik: http://www.mikrotik.com/thedude
Veldig mange år siden jeg sist hadde sett på denne. Utviklingen er stoppet opp, 
kjører på Windows (men med web-grensenitt også), men bortsett fra det så gjorde
den jobben.
Når vi først hadde satt den opp så spanderte jeg litt tid på hvordan ting 
fungerte, og synes at det er et par ting som vi bør se nærmere på:
1) Først og fremt så synes jeg at "StatusKartet" er veldig bra, med flere
   nivåer slik at store nett kan deles opp. Slik NAVs nettmap er i dag så
   bruker ikke vi dette fordi det er for omfangsrik, og det ikke er mulig dele
   opp etter f.eks. bygg. Våre brukere (bla. Orakeltjenesten) har etterspurt
   denne type kart med oversikt slik at man kan på en enkelt måte se om
   alt er "grønnt".
2) Konfigurering av hva som skal overvåkes på en boks er veldig greit. 
   Ønsker man å overvåke endring i f.eks. status på en link så legger 
   bare inn overvåking av OID til interface så legges denne inn som en tjeneste
   som overvåkes.
Anbefaler dere å ta en kjapp titt på The Dude for å hente inspirasjon og
se hvordan andre har løst de samme problemstillingene som vi har hatt.
Børge

Re: [nav-ref] Om link up/down