htforum server was down dit weekend?

Started by GPO, December 7, 2015, 11:06:05

Previous topic - Next topic

0 Members and 1 Guest are viewing this topic.

Jeroen de Waal

Voorkomen kunnen we niet helemaal.
Dit was in ieder geval geen actie van buitenaf.


Jeroen.

Sk

Quote from: riwi on December  7, 2015, 22:03:12
't is weer typische management speak die de techneuten willen voorzien van technisch advies. Laat die jongen gewoon doen wat ie doet.

Ga je een scriptje maken dat de /tmp monitor'd loopt er volgende maand een andere folder/partitie vol.

Zet dan servers dubbel of triple op met replicatie en een loadbalancer ervoor. Liefst georedundant. Richt een managed service organisatie in. Laat een team van goedkope india'ers de servers ieder uur handmatig controleren of straffe van lijfelijke consequenties.
Strakke contracten met duidelijke SLA en boete clausules.

En leg even een paar ton per jaar neer om dit te realiseren  :baaa:

Zo was dit niet bedoeld Riwi. Ik gaf geen technisch advies maar vroeg alleen maar of hij kan scripten met het idee om er een definitieve oplossing voor te vinden. Laten we het zo dan is dat natuurlijk ook prima maar lopen we er over een tijd wellicht weer tegenaan. Ik probeer mee te denken :)
Je geeft aan dat er ook andere folder/partities kunnen vollopen. Welke zijn dit?

Je advies voor replicatie en loadbalancers is leuk maar het HTforum is geen onderdeel van een grote enterprise omgeving dus niet van toepassing. Ik kom zelf uit de techniek (beheer over zo'n 3000 servers) Als er b.v. een C schijf volloopt gaat er automatisch een script lopen die één en ander opruimt. Zo voorkom je dus dat servers unresponsive worden en gebruikers niet meer in kunnen loggen.
Lavardin IT | Resolution Audio Cantata Music Center | Living Voice Auditorium II | Velodyne DD15+ | DnM | LG OLED77C9

riwi

Quote from: Sk on December  8, 2015, 09:39:42
Je geeft aan dat er ook andere folder/partities kunnen vollopen. Welke zijn dit?

Je advies voor replicatie en loadbalancers is leuk maar het HTforum is geen onderdeel van een grote enterprise omgeving dus niet van toepassing. Ik kom zelf uit de techniek (beheer over zo'n 3000 servers) Als er b.v. een C schijf volloopt gaat er automatisch een script lopen die één en ander opruimt. Zo voorkom je dus dat servers unresponsive worden en gebruikers niet meer in kunnen loggen.

Er is van alles dat fout kan lopen op een server. Dus er is van alles wat je kan monitoren, diskspace, cpu  load, mem usage, temperaturen, disk health, fan status, hardware traps etc. Sommige alleen relevant voor fysieke hardware. Veel  software heeft ook een snmp interface naar een management systeeem voor alarmering voor als er iets mis is met de applicatie.  Het feit dat bv een /tmp vol loopt is een probleem van een applicatie die zijn tmp files niet opruimt. Gewoon files opruimen is dan een pleister pakken.

Mijn niet serieus te nemen commentaar was bedoeld om aan te geven dat je heel ver kan gaan maar dat dit niet nodig is voor het HTforum.

Kjelt

Zolang als het 1 dag per jaar ofzo is dan is er mijn inziens prima mee te leven.
Als iedere week er een dag uit zou vallen vanwege eenzelfde issue was het een ander verhaal.