nav.ref August 2012

nav.ref@lister.sikt.no

6 participants
6 discussions

[nav-ref] Statistikk for IP-adresse forbruk
by John-Magne Bredal 11 Sep '12

11 Sep '12

Hei, en av oppgavene i oversikten vår over oppgaver som dere ønsker løst er å lage statistikk for IP-adresseforbruk. Her er det en del spørsmål som vi må ha svar på før vi går i gang med oppgaven. tl;dr: Det går an å bruke data fra databasen for hvert prefix og grafe med utgangspunkt i vlan ved å kombinere alle prefix på et vlan til en graf. Dette vil gi et korrekt bilde av nåsituasjonen, men et feil bilde av historikken. Så vidt jeg husker er det en slik løsning NTNU har nå. Mer detaljert: Å få ut statistikk over hvor mange ip-adresser som er aktive på et prefix gjøres enkelt med databasen som utgangspunkt. Dersom prefixet endres kan ikke NAV detektere dette og det er da et nytt prefix. Dette har betydning for historikk fordi man ved å endre prefixet i praksis lager en ny graf. I tillegg er det mulig at dere ønsker å ha vlan som utgangspunkt for statistikken. Et vlan kan inneholde flere prefix. Dette er fullt mulig å løse visuellt ved å kombinere data fra de aktuelle prefixene til en graf. Men med tanke på historikk blir det også her kameler å svelge. Dersom man fjerner et prefix fra vlan'et vil ikke data fra dette prefixet vises i grafen lenger, heller ikke i historikken, fordi datagrunnlaget for grafen har endret seg. Et annet spørsmål er hvordan ipv4 og ipv6-data skal behandles. Hvis man f.eks. ønsker å grafe "taket" på et vlan, dvs. hvor mange ip-adresser som er tilgjengelig for bruk, er dette noe som vil se fornuftig ut for ipv4 mens for ipv6, der subnettene er lange (ref. A.P.), vil det antagelig være meningsløst. mvh. -- John-Magne Bredal UNINETT AS

2 1

[nav-ref] Screencast - IP Device Info cleanup
by John-Magne Bredal 05 Sep '12

05 Sep '12

Hei, vi har ryddet opp i IP Device Info. Vi vil gi dere mulighet til å si hva dere synes, så her er en demo av hvordan IP Device Info ser ut nå. Tid: 4:20 http://www.youtube.com/watch?v=zZ4rWDJQ7ng&feature=youtu.be mvh. -- John-Magne Bredal UNINETT AS

4 6

[nav-ref] Ny Netmap, fremgang
by Morten Brekkevold 03 Sep '12

03 Sep '12

Hei alle sammen, da har Roy Sindre vært her en måneds tid og satt seg inn i NAV og kommet et stykke på nytt JavaScript-basert nettkart i NAV. Det hadde vært nyttig å få demonstrert det som er laget så langt, for å få tilbakemeldinger og gjøre evt. kurskorreksjoner. Vi tenkte derfor å lage en egen NAV+Netmap-pakke som kan installeres på Debian for de som har en verktøykasse og vil prøve kartet mot sine egne data. Ikke minst kan dette være nyttig for oss ift. å teste oppførslene på større datamengder. Hvem av dere er evt. interessert i få en slik demopakke direkte på sin egen VK? -- Morten Brekkevold UNINETT

4 17

Re: [nav-ref] Om arp og cam-innsamling og "end time" - system check
by Borge Brunes 24 Aug '12

24 Aug '12

Hei Morten, morten.brekkevold(a)uninett.no said: > On Wed, 25 Jul 2012 13:55:27 +0200 Borge Brunes <borge.brunes(a)uit.no> wrote: > > > Hei, > > > > om denne saken spesielt: > > Ifm. en sak vi skulle feilsÃ¸ke sÃ¥ dukket det opp noe som > > forvirret oss. Vi var pÃ¥ jakt etter en mac-adr i nettet > > da vi oppdaget at innsamlingen av cam og arp-data hadde > > stoppet opp (ipdevpoll gikk som den skulle). > > > > Selv om innsamlingen hadde stoppet opp for > > lenge siden sÃ¥ fikk man likevel opp status "still active" under > > "End time" i machinetracker. machinetracker gjÃ¸r altsÃ¥ > > en antakelse om at mac&arp-adr. lever evig dersom den > > er sett fÃ¸r innsamlingen stoppet opp, selv om den ikke > > er sett pÃ¥ en boks. Hvorfor det? Jeg mener at dette > > er feil. arp/mac-adr er ikke samlet inn pÃ¥ over en > > mnd. og da kan man ikke si at den er "still active" > > > > > > om slike ting generelt: > > i fÃ¸rste mÃ¸tet i NAV-ref-gruppa som diskuterte vi veien > > videre og vi ble enig om at datakvaliteten i NAV burde bedres. > > Man skal kunne stole pÃ¥ de dataene man har i NAV. > > Slik jeg ser det sÃ¥ er overnevnte et eks. pÃ¥ det motsatte. > > Dette er et godt og konkret innspill, BÃ¸rge. Da vi etterspurte hva som lÃ¥ > bak formuleringen "heve datakvaliteten" tidligere i Ã¥r var det relativt > fÃ¥ konkrete svar Ã¥ spore, bortsett fra mumling om "topologi". > > PÃ¥ helt generelt grunnlag kan jeg foreslÃ¥ at cam- og arp-innslag i > databasen kan utsettes for en expiry-mekanisme som er uavhengig av > innsamling. Dvs. at dersom en arp/cam-record ikke er blitt bekreftet av > innsamleren innen en viss tid, sÃ¥ vil den automatisk bli lukket. Ulempen > er at dersom innsamleren skal bekrefte alle Ã¥pne innslag til enhver tid, > vil det fÃ¸re til bloat i databasen. Alternativt kan innsamleren bare > bekrefte med timestamp at den har kjÃ¸rt ferdig for en gitt boks, slik at > expiry er relativt til dette tidspunktet. Problemet er slik jeg ser det at systemet ikke har noen mekanisme for å handtere feilsituasjoner. I dette tillfellet så hadde innsamleren ikke samlet inn noe data (men heller ikke stoppet). Kanskje burde det gjøres en sjekk etter at innsamleren er ferdig? Eks. når innsamleren melder at den er ferdig med å samle inn CAM-innslag fra en boks så burde det sjekkes hvorvidt den faktisk har samlet inn data. Det kan selvsagt dukke opp tilfeller hvor en switch ikke har noen devicer bak seg og at dermed ikke er samlet inn CAM-innslag, men det får vi leve med. Det er uansett nyttig å vite om at en switch står og trekker strøm uten gjøre noe fornuftig. Slik har jeg tenk at ting fungerer. ARP-innsamling starter og henter inn ARP-data fra box: 1) Dersom man oppdager ny IP-adr. så legges denne inn i en tabell med tidsstempel for når den ble oppdaget og tagges med AKTIV 2) Dersom en IP-adr. som samles inn eksisterer fra før av med status AKTIV så oppdateres tidstempel for sist sett. 3) Innsamling avsluttes og ryddejobb starter 4) Dersom det ligger IP-adr. i tabellen med status AKTIV og med tidsstempel eldre enn når siste innsamling ble avsluttet så tagges IP-adr. med IKKE-AKTIV (Dukker IP-adr opp igjen så betraktes IP-adr. som ny). UNNTATT 5) Dersom ikke tidsstempel på noen av de AKTIVE IP-adr. ble oppdatert (altså ikke sett) eller det ikke kom til noen nye IP-adr. så må det gå ut varsel (se tekst om varsel lenger ned i eposten) og IP-adr. settes til status DATARÅTE el. 6) ryddejobb avsluttes Nårjeg så gjør en spørring gjennom web-gresesnittet på en IP-adr. så bør det opplyses (i tillegg til dagens info) - hvilke GW/GSW IP-adr. ble samlet inn på og - når ble siste innsamling av ARP-data foretatt på denne GW/GSW - status på evnt. IP-adr. i punkt 5 må da være DATARÅTE el. Litt usikker på jeg fikk forklart dette på en møte som var forståelig, men Ingeborg skjønte det etter hvert :-) > Helt spesifikt, til din problemstilling, lurer jeg pÃ¥ hvordan dere > bekreftet at "innsamleren" hadde stoppet opp? Hadde NAV sluttet Ã¥ logge > ARP og CAM-innslag for alle bokser dere overvÃ¥ker, eller bare for > bestemte bokser? Hadde den sluttet Ã¥ logge _bÃ¥de_ ARP og CAM eller bare > en av delene? Se post fra Ingeborg i dag som gikk utenom nav-ref. > Dette er nyttig informasjon, da ARP og CAM samles inn av to forskjellige > jobber, til forskjellige tidspunkt og individuelt pr. boks, i motsetning > til tidligere, da bÃ¥de ARP-innsamling og CAM-innsamling var individuelle > prosesser som kjÃ¸rte fra cron og samlet inn for alle bokser i "runder". > > > > PÃ¥ mÃ¸tet ivret jeg for et internt system-check som fanget > > opp feilsituasjoner som f.eks. > > - cam/arp-innsamling har stoppet opp > > - bokser av type GW uten ruterporter > > - bokser av type SW uten switcheporter > > - annen datainnsamling som ikke virker som den skal. > > - osv. > > > > Jeg ivrer enda mer for et slikt system nÃ¥ :-) > > Hvilket grensesnitt skal et slikt system ha? > > * Skal systemsjekken kjÃ¸res manuelt av administrator, eller som en > cronjobb? > > * Dersom systemsjekken kjÃ¸rer automatisk i cron, hvem skal overvÃ¥ke at > systemsjekkeren virker? > > * Skal systemsjekken ha en statusside pÃ¥ web og/eller CLI? > > * Skal feil i systemsjekken sendes som alarmer i alert profiles, eller > bare direkte som mail til ADMIN_MAIL fra nav.conf? Her tenker jeg at systemcheck må/kan gjøres på ulike nivåer, og at varsler skjer via alarmer i alert profiles og/eller ADMIN_MAIL fra nav.conf Eks. 1) Ny box legges inn med type GW. Når den så legges inn så burde man sjekke at: - at boxen har ruterporter - at boxen ikke har vensentlig mindre støttede OIDer enn tilsvarende bokser som allerde ligger inne. - etc. Feiler overnevnte check så burde det sendes ut alarm i alert profiles 2) Nevnte checker bør kjøres (via cron?) med gjevne mellomrom slik at evnt. bug innført i nye versjoner av NAV blir fanget opp. I tillegg til varsel så kan det kanskje være lurt med en statusside som sier noe om hvilke checker som kjører og når de sist har kjørt 3) Siden den nye boxen er type GW så bør det finnes flere enn 2 x antall. aktive egne ruterporter i arp-tabell. Dette må det sjekkes på når ARP-innsamleren har kjørt. Børge > -- > Morten Brekkevold > UNINETT

3 4

[nav-ref] Om arp og cam-innsamling og "end time" - system check
by Borge Brunes 20 Aug '12

20 Aug '12

Hei, om denne saken spesielt: Ifm. en sak vi skulle feilsøke så dukket det opp noe som forvirret oss. Vi var på jakt etter en mac-adr i nettet da vi oppdaget at innsamlingen av cam og arp-data hadde stoppet opp (ipdevpoll gikk som den skulle). Selv om innsamlingen hadde stoppet opp for lenge siden så fikk man likevel opp status "still active" under "End time" i machinetracker. machinetracker gjør altså en antakelse om at mac&arp-adr. lever evig dersom den er sett før innsamlingen stoppet opp, selv om den ikke er sett på en boks. Hvorfor det? Jeg mener at dette er feil. arp/mac-adr er ikke samlet inn på over en mnd. og da kan man ikke si at den er "still active" om slike ting generelt: i første møtet i NAV-ref-gruppa som diskuterte vi veien videre og vi ble enig om at datakvaliteten i NAV burde bedres. Man skal kunne stole på de dataene man har i NAV. Slik jeg ser det så er overnevnte et eks. på det motsatte. På møtet ivret jeg for et internt system-check som fanget opp feilsituasjoner som f.eks. - cam/arp-innsamling har stoppet opp - bokser av type GW uten ruterporter - bokser av type SW uten switcheporter - annen datainnsamling som ikke virker som den skal. - osv. Jeg ivrer enda mer for et slikt system nå :-) Børge

2 1

[nav-ref] Ønske om tilbakemelding - Roomview
by John-Magne Bredal 20 Aug '12

20 Aug '12

Hei, etter dager med ferie, bagasjemisting og maling av hus var det tilbake til Uninett for å gjøre morsomme ting igjen. De fleste forbedringsforslag er implementert, ting ser etter egen mening bra ut. Gi ros og ris! Demo kan ses her: http://youtu.be/pMzfVNigTKY mvh. -- John-Magne Bredal UNINETT AS

2 2

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

nav.ref August 2012