Folks,
På møtet vårt så ble ønsket om alarmfunksjon knyttet til topologilink fremsatt. Flere ønsker/muligheter ble diskutert, og dette kom vel også frem på vår top5-liste som ble sendt inn i etterkant av møtet.
På et el. annet tidspunkt så har deler av denne funksjonaliteten blitt implementert. Veldig bra!
Imidlertid så trenger den å justeres noe.
Eks.:
Mon, 13 Feb 2012 09:58:40 Box prestK200-sw.infra.uit.no does not reply to ping requests Mon, 13 Feb 2012 10:01:47 Box prestK200-sw.infra.uit.no is down Mon, 13 Feb 2012 10:02:48 Link down on prest-gsw.infra.uit.no: Te2/10 Mon, 13 Feb 2012 10:05:52 Box prestK200-sw.infra.uit.no is up Mon, 13 Feb 2012 10:08:53 Link up on prest-gsw.infra.uit.no: Te2/10
Topologien her er at prestK200-sw henger bak prest-gsw (interface t2/10). Det er ingen andre forbindelser mellom disse to boksene.
Slik jeg ser det så er det unødvendig og skaper bare ekstra støy at det sendes ut "Link down" når boksen bak "Link down" allerede er meldt nede.
Imidlertid så er det svært nyttig å få melding dersom en link går ned uten at boksen bak går ned. Gjelder selvsagt bare for bokser med redundante uplinker.
God helg.
Børge
On Fri, 17 Feb 2012 13:32:49 +0100 Borge Brunes borge.brunes@uit.no wrote:
Folks,
På møtet vårt så ble ønsket om alarmfunksjon knyttet til topologilink fremsatt. Flere ønsker/muligheter ble diskutert, og dette kom vel også frem på vår top5-liste som ble sendt inn i etterkant av møtet.
På et el. annet tidspunkt så har deler av denne funksjonaliteten blitt implementert. Veldig bra!
Det stemmer, som jeg nevnte på det forrige referansegruppemøtet så var det ikke stor hokus pokus å gjøre dette, så det ble implementert til 3.10-releasen, med de begrensningene du allerede har observert.
Imidlertid så trenger den å justeres noe.
Eks.:
Mon, 13 Feb 2012 09:58:40 Box prestK200-sw.infra.uit.no does not reply to ping requests Mon, 13 Feb 2012 10:01:47 Box prestK200-sw.infra.uit.no is down Mon, 13 Feb 2012 10:02:48 Link down on prest-gsw.infra.uit.no: Te2/10 Mon, 13 Feb 2012 10:05:52 Box prestK200-sw.infra.uit.no is up Mon, 13 Feb 2012 10:08:53 Link up on prest-gsw.infra.uit.no: Te2/10
Topologien her er at prestK200-sw henger bak prest-gsw (interface t2/10). Det er ingen andre forbindelser mellom disse to boksene.
Slik jeg ser det så er det unødvendig og skaper bare ekstra støy at det sendes ut "Link down" når boksen bak "Link down" allerede er meldt nede.
Imidlertid så er det svært nyttig å få melding dersom en link går ned uten at boksen bak går ned. Gjelder selvsagt bare for bokser med redundante uplinker.
Er enig i tankegangen her. Pr. i dag gjør ikke eventEngine noen særbehandling av linkState-events, de bare dyttes ukritisk til alarmkøen.
Det medfører også et annet problem vi har observert: Noen konfigurerte alle HP-switchene sine til å sende linktraps til NAV. De hadde en rekke porter som flapper som bare det, og ble dermed bombardert med alarmer fra NAV.
Sett bort i fra at de ikke burde ukritisk sende alle slike traps til NAV (hvem bryr seg om linkstate-alarmer på aksessporter?), så burde eventEngine gjøre som for boxState/moduleState og innføre karantenetid på linkState-alarmer, slik at flapping ikke utløser alarmskred. Dette er forøvrig nevnt her: https://bugs.launchpad.net/nav/+bug/939429
Ser ut som noen(tm) må knekke noen Java-knoker likevel ;P