giellalt / bugzilla-dummy

0 stars 0 forks source link

gtoahpa/gtlab omstarter (Bugzilla Bug 1483) #1154

Closed albbas closed 11 years ago

albbas commented 11 years ago

This issue was created automatically with bugzilla2github

Bugzilla Bug 1483

Date: 2012-10-26T13:07:41+02:00 From: Lene Antonsen <> To: Ryan Johnson <> CC: berit.a.baal, heli1401, lene.antonsen, ryan.txanson, trond.trosterud

Depends on: #1399 Last updated: 2012-11-07T01:20:33+01:00

albbas commented 11 years ago

Comment 7179

Date: 2012-10-26 13:07:41 +0200 From: Lene Antonsen <>

gtoahpa-server er nede

albbas commented 11 years ago

Comment 7180

Date: 2012-10-26 13:30:38 +0200 From: Heli Uibo <>

Jag loggade in på gtoahpa nu och såg att fastcgi var död. Jag sätte igång fastcgi igen och nu fungerar det.

albbas commented 11 years ago

Comment 7181

Date: 2012-10-26 19:51:09 +0200 From: Ryan Johnson <>

Me må granske litt kvifor fastcgi daudde. Eg hev ikkje tid akkurat no/idag, men i morgon kan eg sjå på det. So er det bra at det funkar no.

albbas commented 11 years ago

Comment 7182

Date: 2012-10-27 00:02:05 +0200 From: Heli Uibo <>

Jag loggade in på gtoahpa via ssh. Medan jag gjorde svn up, hängde servern sig. Och då var Oahpa också nere. Men efter en tid så kom den tillbaka, utan att jag skulle behövt omstarta fastcgi.

albbas commented 11 years ago

Comment 7190

Date: 2012-10-28 21:38:31 +0100 From: Ryan Johnson <>

Hei, eg kikka på loggene, og det ser ut som gtoahpa vart omstarta. Eg finn ikkje kvifor no, men eg lurer på om det er noko å gjera med nye dialoger? Eg hugsar at det samme skjedde på gtlab ein gong, og eg sjølv hev gjort det samme før på victorio når eg arbeidde med numra, og laga ein uheldig endless while loop.

Var det nokon dialog som du arbeidde med når systemet gjekk ned?

albbas commented 11 years ago

Comment 7196

Date: 2012-10-28 23:21:13 +0100 From: Ryan Johnson <>

Bug #1474 has been marked as a duplicate of this bug.

albbas commented 11 years ago

Comment 7197

Date: 2012-10-28 23:34:42 +0100 From: Ryan Johnson <>

Hei,

Eg testa litt med Sahka, og fekk ikkje buggen til å skje att. Anbefaler at me nyttar gtlab mykje for å finna ut kva det er som omstarter serverane. Når eg testa for eit par dagar sidan, før Lene sin presentasjon i Lund, testa eg alle oppgåvetyper, bortsett frå Sahka og Vasta; den siste såg Lene på, og den funka.

Det kan ogso vera at det er noko anna som gjer systemet tregt, som eg og Lene testa allerede, f.eks., med lookupserveren fann me at det var feil input (^D) som gjorde at lookupserveren ikkje fungerte, og soleis måtte nokon omstarta den. Denne buggen er fiksa, men det kan vera det er nye input som eg ikkje veit om som gjer samme feil.

Ein annan ting som kan hjelpe, er om eg og Heli ogso tester lokalt, ved å dumpa databasen frå gtlab eller gtoahpa, og lada den i maskinene våre. Med django sin runserver-prosess, so finn ein kva som gjer slik ein kræsj, fordi prosessen skal stansa utan at heile maskina går ned. Dette gjorde eg for å testa smaoahpa, før eg skjønte kva eg gjorde for å kræsja victorio, og det funka bra. :)

R

albbas commented 11 years ago

Comment 7221

Date: 2012-10-29 22:57:43 +0100 From: Heli Uibo <>

(In reply to comment #4)

Hei, eg kikka på loggene, og det ser ut som gtoahpa vart omstarta. Eg finn ikkje kvifor no, men eg lurer på om det er noko å gjera med nye dialoger? Eg hugsar at det samme skjedde på gtlab ein gong, og eg sjølv hev gjort det samme før på victorio når eg arbeidde med numra, og laga ein uheldig endless while loop.

Var det nokon dialog som du arbeidde med når systemet gjekk ned?

Nej, jag testade inte Sahka just då, utan höll på med svn up.

albbas commented 11 years ago

Comment 7224

Date: 2012-10-30 00:42:58 +0100 From: Ryan Johnson <>

Hmm, lurer på om det er noko anna då. Takk for at du testa. :) Sahka er den delen som eg veit mindre om, utifrå at eg kan skriva inn svar og få testa soleis.

Eg kikka på gtweb, der det er ingenting som køyrer akkurat no, men då er uptime 12 dagar, og med gtsvn er det 3 dagar. Det er ingen naudd til å omstarta gtweb og gtsvn, som tyder på at maskiner vert omstarta på noko anna grunn, av IT-gruppa eller systemet som dei bur i. Eg skriv til deim for å spyrja om dette, og kopierer du og andre. :)

[ryan@gtweb ~]$ uptime 00:38:39 up 12 days, 12:16, 1 user, load average: 0.00, 0.00, 0.00

[ryan@gtsvn ~]$ uptime 00:36:03 up 3 days, 15:39, 1 user, load average: 0.00, 0.00, 0.00

[ryan@gtoahpa ~]$ uptime 00:36:42 up 3 days, 15:40, 1 user, load average: 0.04, 0.03, 0.01

[ryan@gtlab ~]$ uptime 00:37:33 up 9 days, 23:39, 3 users, load average: 0.00, 0.00, 0.00

albbas commented 11 years ago

Comment 7243

Date: 2012-10-31 01:33:14 +0100 From: Ryan Johnson <>

Eg hev fått svar frå Steinar:

Hei, Jeg har en mistanke om hva som kan være årsaken ja. Og jeg beklager på det sterkeste. Det har kommet en del driftmeldinger om at det holder på å oppdaterer administrasjons verktøyet for de virituelle maskinene. Men det er også sagt at selve maskinene skal ikke bli berørt. Når det nå alikevel ser slik ut må det være pga. at SW biten fra vwmare som kjører på de virituelle maskinene er for gammel og må oppdaterers. Det kan hende at vi må ta en reboot etter at jeg har oppdatert sw, men det skal jeg komme tilbake til når oppdateringen er gjort.

Då hev eg førebudd oss for ein uforventa reboot, og håper at Steinar eller IT-avdelinga kan gjeva beskjed på forhånd om det er noko som skjer, slik at nokon av oss kan testa at alle servicer fungerar etterpå.

Beklager då at det hev vore litt meir stress om dette her, p.g.a. enten at systemet er nede under presentasjon, eller at me ikkje visste før kva årsaken til problemet er. Eg hadde førebudd oss litt tidlegare enn eg gjorde, men visste ikkje sjølv om det var noko som kunne skje att, eller randomt ulykke, og fann ingenting som var til nytte i logglesinga. No veit me i minsto at serverane ikkje hev ikkje omstarta seg sjølv p.g.a. noko i våre programmer, og at det var ein grunn. :)

albbas commented 11 years ago

Comment 7330

Date: 2012-11-07 01:20:33 +0100 From: Ryan Johnson <>

Hei,

Eg trur at problemet bak denne bugmeldinga er løyst no. Eg fekk svar frå Steinar:

Hei, da er oppdateringene gjort og det skal ikke være nødvendig med en reboot. Det er fortiden ingen epost liste for dette, men det er tatt til etterettning og jeg skal forhøre meg om dette. Hilsen

Trur han vil ta kontakt om det er noko som dette som skjer att, eller treng til administrativ akt som kjem med reboot. :)