Heisan nav-ref,
Da har alle gitt sin input til sin topp 5 liste. Takker!
https://openwiki.uninett.no/gigacampus:topp5_101111
Morten jobber nå med å slippe 3.10 neste torsd 15/12 (3.9.4 bugs blir innlemmet og 3.9.4 slippes trolig samtidig). Men etter det vil vi begynne å jobbe mot 3.11 og da er det _høyst_ relevant å jobbe ut i fra de prioriteringer dere har gitt!
Vi kommer tilbake til andre ting dere har prioritert, men tar nå med en gang tak i det både NTNU og UiTø mener er viktigst, nemlig at kvaliteten på NAV dataene må opp.
Morten har allerede fikset en del ting som er inne i 3.9.3. I tillegg er en bug fikset for 3.9.4 relatert til at det er feil visning av spanning tree blocked states i IP Dev Info.
Det er fint hvis dere alle kan gå gjennom deres NAV 3.9.3 installasjon og lete etter feil. Dersom dere ser en feil i IP Dev Info eller nettkast elns, sjekk om feilen også er i "tilsvarende" rapport i Report. Det kan jo hende at det er front end tool som har bug, ikke bakenforliggende innsamling og database. Uansett vil vi gjerne vite om feilen.
Når dere har påvist en feil, send da en url til siden som påviser dette og en beskrivelse av feilen.
Det skader ikke om dette går på nav-ref lista, det tror jeg vi tåler. (generelt sett bør bugs som skal diskuteres gå på nav-users, dernest rapporteres på launchpad, men her tar vi dette i en felles dugnad på nav-ref for å jobbe i samarbeid om dette viktige punktet).
Morten vil ikke behandle dette før tidligst 16/12, så dere har ut neste uke å gi en slik input.
For NTNU kan vi i tillegg foreslå et møte med Gro-Anita der vi sitter ned og går gjennom ting, der Gro-Anita har forberedt ting i forkant. Møte kan f.eks. legges til mandag 19/12 kl 13. Passer det?
mvh - Vidar
--On Tuesday, December 06, 2011 10:30:14 AM +0100 Vidar Faltinsen vidar.faltinsen@uninett.no wrote:
Heisan nav-ref,
Da har alle gitt sin input til sin topp 5 liste. Takker!
https://openwiki.uninett.no/gigacampus:topp5_101111
Morten jobber nå med å slippe 3.10 neste torsd 15/12 (3.9.4 bugs blir innlemmet og 3.9.4 slippes trolig samtidig). Men etter det vil vi begynne å jobbe mot 3.11 og da er det _høyst_ relevant å jobbe ut i fra de prioriteringer dere har gitt!
Vi kommer tilbake til andre ting dere har prioritert, men tar nå med en gang tak i det både NTNU og UiTø mener er viktigst, nemlig at kvaliteten på NAV dataene må opp.
Morten har allerede fikset en del ting som er inne i 3.9.3. I tillegg er en bug fikset for 3.9.4 relatert til at det er feil visning av spanning tree blocked states i IP Dev Info.
Det er fint hvis dere alle kan gå gjennom deres NAV 3.9.3 installasjon og lete etter feil. Dersom dere ser en feil i IP Dev Info eller nettkast elns, sjekk om feilen også er i "tilsvarende" rapport i Report. Det kan jo hende at det er front end tool som har bug, ikke bakenforliggende innsamling og database. Uansett vil vi gjerne vite om feilen.
Når dere har påvist en feil, send da en url til siden som påviser dette og en beskrivelse av feilen.
Veldig fornøyd med at det nå vises software versjon for C4506 switcher og. :-) Bortsett fra en.. krs-studby-gw, ruter til hybler og er GSW mens alle andre er GW.
https://nav.uia.no/report/netbox?typeid=324
Ser ikke software eller serial for UNINETT sin Juniper MX80, men det er går kanskje under utstyr som ikke er støttet ennå?: https://nav.uia.no/report/netbox?catid=GW%2CGSW&op_catid=in
For øvrig sliter jeg med Tresholds det lille jeg har prøvd. Noen andre som har prøvd?
-rune
Det skader ikke om dette går på nav-ref lista, det tror jeg vi tåler. (generelt sett bør bugs som skal diskuteres gå på nav-users, dernest rapporteres på launchpad, men her tar vi dette i en felles dugnad på nav-ref for å jobbe i samarbeid om dette viktige punktet).
Morten vil ikke behandle dette før tidligst 16/12, så dere har ut neste uke å gi en slik input.
For NTNU kan vi i tillegg foreslå et møte med Gro-Anita der vi sitter ned og går gjennom ting, der Gro-Anita har forberedt ting i forkant. Møte kan f.eks. legges til mandag 19/12 kl 13. Passer det?
mvh
- Vidar
-- +----------------------------------------------------------------------+ ! Rune Kittelsen E-post: rune.kittelsen@uia.no ! ! Universitetet i Agder, IT-avdelingen Tlf: 47-38 14 17 99 ! ! (University of Agder) Fax: 47-38 14 17 01 ! ! Gimlemoen 25D, Serviceboks 422 o Privat: 47-38 09 15 93 ! ! N-4604 Kristiansand S, Norway _ /-_ Mob.: 47-91 87 35 02 ! +--------------------------------(_)>(_)-------------------------------+
On Tue, 06 Dec 2011 11:08:25 +0100 Rune Kittelsen rune.kittelsen@uia.no wrote:
Veldig fornøyd med at det nå vises software versjon for C4506 switcher og. :-) Bortsett fra en.. krs-studby-gw, ruter til hybler og er GSW mens alle andre er GW.
NAV har ikke klart å finne Supervisor-modulen på denne, fordi den ikke følger det navnemønsteret som forventes, men det kan lett fikses :-)
Ser ikke software eller serial for UNINETT sin Juniper MX80, men det er går kanskje under utstyr som ikke er støttet ennå?: https://nav.uia.no/report/netbox?catid=GW%2CGSW&op_catid=in
Vi har ingen støtte for proprietære Juniper MIB-er enda, nei, og Junipers største mangel er at de ikke støtter IETFs ENTITY-MIB, der denne typen informasjon kan hentes.
NAV 3.10 vil forsøke å tolke software-versjon fra SNMPv2-MIB::sysDescr - her mangler det foreløpig et mønster som vil tolke for JUNOS, men det fikser vi også lett :-)
For øvrig sliter jeg med Tresholds det lille jeg har prøvd.
Om det er noe vi skal feilsøke trenger vi i alle fall langt mer detaljer enn "sliter med".
On Tue, 06 Dec 2011 11:27:57 +0100 Morten Brekkevold morten.brekkevold@uninett.no wrote:
NAV 3.10 vil forsøke å tolke software-versjon fra SNMPv2-MIB::sysDescr - her mangler det foreløpig et mønster som vil tolke for JUNOS, men det fikser vi også lett :-)
Rettelse: JUNOS-versjonsummer ser ut til å tolkes fint av 3.10-koden allerede.
Den 06.12.2011 11:27, skrev Morten Brekkevold:
On Tue, 06 Dec 2011 11:08:25 +0100 Rune Kittelsenrune.kittelsen@uia.no wrote:
[...snipp...]
For øvrig sliter jeg med Tresholds det lille jeg har prøvd.
Om det er noe vi skal feilsøke trenger vi i alle fall langt mer detaljer enn "sliter med".
Neste linje var "noen andre som har prøvd?". Håpet noen hadde gjort leksa og kunne si at de hadde prøvd og at det gikk bra... :-)
Men her kommer detaljer.
Har sett på denne: http://metanav.uninett.no/thresholdmanager
Ønsker å teste
1. Varsle CPU load over 90% på GSW. 2. Varsle trafikklast over 80% på link krs-grm. Evt. over et antall pakker på denne 1Gb/s forbindelse.
1. Viss jeg velger cpu5min og gsw får jeg opp og kan skrive inn en verdi. Har prøvd å sette en verdi men får ikke noe varsling. Viss jeg prøver med 90% får jeg ikke lov pga manglende Max.
2. Bruker ifHCOutOctets. Heller ikke her kan jeg skrive inn 90% pga manglende Max. Prøver å legge inn verdien 90. Men får heller ikke varsling.
For begge har jeg prøvd forskjellige verdiger og varsling høyere enn eller lavere enn.
Her ligger de to jeg har lagt inn: https://nav.uia.no/threshold/all/
Det dukker ikke opp noe i /var/log/nav/thresholdMon.log. Ikke annet enn at den sier thresholdMon.py kjøres. Er det en kommando man kan kjøre for å se hva som skjer eller kjøre debug?
-rune
On Wed, 07 Dec 2011 11:08:13 +0100 Rune Kittelsen rune.kittelsen@uia.no wrote:
Har sett på denne: http://metanav.uninett.no/thresholdmanager
Ønsker å teste
Varsle CPU load over 90% på GSW.
Varsle trafikklast over 80% på link krs-grm. Evt. over et antall pakker på denne 1Gb/s forbindelse.
Viss jeg velger cpu5min og gsw får jeg opp og kan skrive inn en verdi. Har prøvd å sette en verdi men får ikke noe varsling. Viss jeg prøver med 90% får jeg ikke lov pga manglende Max.
cpu5min er en verdi som normalt allerede måles i prosent. Benevning skal ikke være med i terskelverdien, så prøv heller med bare tallet "90".
- Bruker ifHCOutOctets. Heller ikke her kan jeg skrive inn 90% pga manglende Max. Prøver å legge inn verdien 90. Men får heller ikke varsling.
Her er det meningen at max-verdien skal fylles ut automatisk når Cricket-konfigurasjonen genereres, men det skjer tydeligvis ikke.
Jeg har undersøkt litt og funnet en feil i cricket-konfiguratoren (mcc.py) som jeg retter nå, se [1].
For begge har jeg prøvd forskjellige verdiger og varsling høyere enn eller lavere enn.
Her ligger de to jeg har lagt inn: https://nav.uia.no/threshold/all/
Det dukker ikke opp noe i /var/log/nav/thresholdMon.log. Ikke annet enn at den sier thresholdMon.py kjøres. Er det en kommando man kan kjøre for å se hva som skjer eller kjøre debug?
Man kan kjøre thresholdMon.py manuelt med loggnivå 3 (thresholdMon.py -l 3).
Da får jeg dette på kristiansand-vk:
Starting thresholdMon at Thu Dec 8 12:07:11 2011 -- NEW DATASOURCE (243785) -- cpu5min is in exceptions -- NEW DATASOURCE (185998) -- Adding datasource 185998 Getting data from 185998 (ifHCOutOctets) Value returned = 29389577.5616 Threshold is 80 Threshold not surpassed (29389577.5616,80,None) /usr/lib/nav/thresholdMon.py executed in 0 seconds.
Når jeg ser i koden er cpu5min i en hardkodet unntaksliste; jeg aner ikke hvorfor.
Hvordan den etterpå mener at verdien 29389577.5616 ikke er en overskridelse av grensen på 80 aner jeg heller ikke.
Så, med Cc: til utviklerne av threshold-systemet (John-Magne og Trond) vil spørre om:
1. Hvorfor er cpu5min spesifikt unntatt fra terskelvarsling? 2. Hvorfor mener koden at 29389577.5616 ikke er større enn 80 (delimiter='>' iflg. databasen). 3. Kan thresholdMon være så snill å bruke logging-modulen til Python i stedet for det hjemmesnekrede som er der nå?
[1] https://bugs.launchpad.net/nav/+bug/901623
--On Thursday, December 08, 2011 12:18:47 PM +0100 Morten Brekkevold morten.brekkevold@uninett.no wrote:
On Wed, 07 Dec 2011 11:08:13 +0100 Rune Kittelsen rune.kittelsen@uia.no wrote:
Har sett på denne: http://metanav.uninett.no/thresholdmanager
Ønsker å teste
Varsle CPU load over 90% på GSW.
Varsle trafikklast over 80% på link krs-grm. Evt. over et antall pakker på denne 1Gb/s forbindelse.
Viss jeg velger cpu5min og gsw får jeg opp og kan skrive inn en verdi. Har prøvd å sette en verdi men får ikke noe varsling. Viss jeg prøver med 90% får jeg ikke lov pga manglende Max.
cpu5min er en verdi som normalt allerede måles i prosent. Benevning skal ikke være med i terskelverdien, så prøv heller med bare tallet "90".
Det var det første jeg prøvde - før jeg leste dokumentasjon :-D Den står og har stått til "90" hele tiden.
- Bruker ifHCOutOctets. Heller ikke her kan jeg skrive inn 90% pga manglende Max. Prøver å legge inn verdien 90. Men får heller ikke varsling.
Her er det meningen at max-verdien skal fylles ut automatisk når Cricket-konfigurasjonen genereres, men det skjer tydeligvis ikke.
Jeg har undersøkt litt og funnet en feil i cricket-konfiguratoren (mcc.py) som jeg retter nå, se [1].
Flott!
-rune
For begge har jeg prøvd forskjellige verdiger og varsling høyere enn eller lavere enn.
Her ligger de to jeg har lagt inn: https://nav.uia.no/threshold/all/
Det dukker ikke opp noe i /var/log/nav/thresholdMon.log. Ikke annet enn at den sier thresholdMon.py kjøres. Er det en kommando man kan kjøre for å se hva som skjer eller kjøre debug?
Man kan kjøre thresholdMon.py manuelt med loggnivå 3 (thresholdMon.py -l 3).
Da får jeg dette på kristiansand-vk:
Starting thresholdMon at Thu Dec 8 12:07:11 2011 -- NEW DATASOURCE (243785) -- cpu5min is in exceptions -- NEW DATASOURCE (185998) -- Adding datasource 185998 Getting data from 185998 (ifHCOutOctets) Value returned = 29389577.5616 Threshold is 80 Threshold not surpassed (29389577.5616,80,None) /usr/lib/nav/thresholdMon.py executed in 0 seconds.
Når jeg ser i koden er cpu5min i en hardkodet unntaksliste; jeg aner ikke hvorfor.
Hvordan den etterpå mener at verdien 29389577.5616 ikke er en overskridelse av grensen på 80 aner jeg heller ikke.
Så, med Cc: til utviklerne av threshold-systemet (John-Magne og Trond) vil spørre om:
- Hvorfor er cpu5min spesifikt unntatt fra terskelvarsling?
- Hvorfor mener koden at 29389577.5616 ikke er større enn 80 (delimiter='>' iflg. databasen).
- Kan thresholdMon være så snill å bruke logging-modulen til Python i stedet for det hjemmesnekrede som er der nå?
[1] https://bugs.launchpad.net/nav/+bug/901623
-- Morten Brekkevold UNINETT
-- +----------------------------------------------------------------------+ ! Rune Kittelsen E-post: rune.kittelsen@uia.no ! ! Universitetet i Agder, IT-avdelingen Tlf: 47-38 14 17 99 ! ! (University of Agder) Fax: 47-38 14 17 01 ! ! Gimlemoen 25D, Serviceboks 422 o Privat: 47-38 09 15 93 ! ! N-4604 Kristiansand S, Norway _ /-_ Mob.: 47-91 87 35 02 ! +--------------------------------(_)>(_)-------------------------------+
--On Thursday, December 08, 2011 12:18:47 PM +0100 Morten Brekkevold morten.brekkevold@uninett.no wrote:
[..snipp..]
Man kan kjøre thresholdMon.py manuelt med loggnivå 3 (thresholdMon.py -l 3).
Da får jeg dette på kristiansand-vk:
Starting thresholdMon at Thu Dec 8 12:07:11 2011 -- NEW DATASOURCE (243785) -- cpu5min is in exceptions -- NEW DATASOURCE (185998) -- Adding datasource 185998 Getting data from 185998 (ifHCOutOctets) Value returned = 29389577.5616 Threshold is 80 Threshold not surpassed (29389577.5616,80,None) /usr/lib/nav/thresholdMon.py executed in 0 seconds.
Når jeg ser i koden er cpu5min i en hardkodet unntaksliste; jeg aner ikke hvorfor.
Prøvde med cpu1min og Greater than=10 og Less than=50 uten at jeg ser noe varsling. Her er resultatet om det kan være til hjelp:
Starting thresholdMon at Thu Dec 8 12:57:22 2011 -- NEW DATASOURCE (243784) -- Adding datasource 243784 Getting data from 243784 (cpu1min) Value returned = 16.370062 Threshold is 50 Threshold not surpassed (16.370062,50,None) -- NEW DATASOURCE (243785) -- cpu5min is in exceptions -- NEW DATASOURCE (185998) -- Adding datasource 185998 Getting data from 185998 (ifHCOutOctets) Value returned = 25458648.436 Threshold is 80 Threshold not surpassed (25458648.436,80,131072000) /usr/lib/nav/thresholdMon.py executed in 0 seconds. ------------------------------------------------------------------
Starting thresholdMon at Thu Dec 8 12:57:54 2011 -- NEW DATASOURCE (243784) -- Adding datasource 243784 Getting data from 243784 (cpu1min) Value returned = 16.370062 Threshold is 10 Threshold not surpassed (16.370062,10,None) -- NEW DATASOURCE (243785) -- cpu5min is in exceptions -- NEW DATASOURCE (185998) -- Adding datasource 185998 Getting data from 185998 (ifHCOutOctets) Value returned = 25458648.436 Threshold is 80 Threshold not surpassed (25458648.436,80,131072000) /usr/lib/nav/thresholdMon.py executed in 0 seconds. ------------------------------------------------------------------
-- +----------------------------------------------------------------------+ ! Rune Kittelsen E-post: rune.kittelsen@uia.no ! ! Universitetet i Agder, IT-avdelingen Tlf: 47-38 14 17 99 ! ! (University of Agder) Fax: 47-38 14 17 01 ! ! Gimlemoen 25D, Serviceboks 422 o Privat: 47-38 09 15 93 ! ! N-4604 Kristiansand S, Norway _ /-_ Mob.: 47-91 87 35 02 ! +--------------------------------(_)>(_)-------------------------------+