Raid schijf valt uit na reboot

Started by Hanky Panky, October 31, 2014, 11:32:14

Previous topic - Next topic

0 Members and 1 Guest are viewing this topic.

Hanky Panky

Zit even met een probleempje: mijn server valt een enkele keer uit (windows.....) en na de reboot wordt bij het opstarten 1 van de drie raid schijven niet herkend. Gevolg: raid fout. Oplossing is afsluiten en opnieuw aanzetten (dus niet de optie herstarten kiezen bij het afsluiten). Daarna wordt de schijf weer herkend en gaat hij de raid array herbouwen. Dat duurt in rust ongeveer een uurtje of 3-4.

Er is opstart power zat met een 550 Watt voeding die een 45 watt TDP CPU, 6 HDD's moet voeden en verder niets.

Maar belangrijker: hoe voorkom ik dit?
Maak van jouw verwachting niet mijn verplichting.

LG OLED77C25LB // Denon AVR-X3400H // Nvidia Shield TV pro // 5 x B&W M1 // SVS SB3000

jantje112

Quote from: Hanky Panky on October 31, 2014, 11:32:14
Zit even met een probleempje: mijn server valt een enkele keer uit (windows.....) en na de reboot wordt bij het opstarten 1 van de drie raid schijven niet herkend. Gevolg: raid fout. Oplossing is afsluiten en opnieuw aanzetten (dus niet de optie herstarten kiezen bij het afsluiten). Daarna wordt de schijf weer herkend en gaat hij de raid array herbouwen. Dat duurt in rust ongeveer een uurtje of 3-4.

Er is opstart power zat met een 550 Watt voeding die een 45 watt TDP CPU, 6 HDD's moet voeden en verder niets.

Maar belangrijker: hoe voorkom ik dit?

Valt elke keer dezelfde disc uit? Kabel al eens vervangen en eventueel gekeken of je een bootdelay kan instellen?

dennism

Als eerste inderdaad de kabels controleren en waar mogelijk vervangen wanneer het dezelfde disk is. Verder een controle van de smart gegevens van de disk uitvoeren en een diskcontrole op de disk wanneer mogelijk (niet alle raid controllers ondersteunen dit). Wanneer er ook maar enige twijfel is de disk vervangen, want je wil hier niet tegenaan lopen mocht er een andere disk kuren gaan krijgen.

Verder zou een server (ook een windows server niet) niet mogen uitvallen wanneer er geen hardware problemen zijn of software issue's (bijvoorbeeld unsigned drivers, of brakke unsupported software pakketten uit bijvoorbeeld de spreekwoordelijke steentijd), de huidige windows versie's zijn zo enorm verbeterd de laatste 10 jaar dat mits goed beheerd downtime behoudens tijdens het maintenance window (windows updates of applicatie updates) een grote uitzondering moet zijn en zeker geen regel. Loopt je server dus wel regelmatig vast of meen je andere instabiliteit te herkennen controleer, of laat deze eens goed controleren qua hardware en software want dit soort problemen mogen bij een goed beheerde en goed functionerende server echt niet voorkomen.

Hanky Panky

Ik heb al een handvol nieuwe kabels besteld vanmiddag. Het rare is dat hij eigenlijk al dik twee jaar heel netjes draait en nu in een week tijd drie keer over zijn nek is gegaan.

In het begin heb ik dit ook een keer gehad en toen ook al de kabels vervangen tijdens de bouw.

@jantje: wat zou een bootdelay brengen (als het kan)? In het bios start scherm zie ik als het misgaat dat hij maar twee vd drie drives detecteert.
Maak van jouw verwachting niet mijn verplichting.

LG OLED77C25LB // Denon AVR-X3400H // Nvidia Shield TV pro // 5 x B&W M1 // SVS SB3000

dennism

Quote from: Hanky Panky on October 31, 2014, 22:48:43
Ik heb al een handvol nieuwe kabels besteld vanmiddag. Het rare is dat hij eigenlijk al dik twee jaar heel netjes draait en nu in een week tijd drie keer over zijn nek is gegaan.

In het begin heb ik dit ook een keer gehad en toen ook al de kabels vervangen tijdens de bouw.

@jantje: wat zou een bootdelay brengen (als het kan)? In het bios start scherm zie ik als het misgaat dat hij maar twee vd drie drives detecteert.

Ik denk dat hij staggered spinup bedoelt, waar de controller een vertraging in het boot proces opneemt zodat hij de de schijven 1 voor 1 kan starten (of een paar tegelijk, in plaats van alle disks in 1 keer), is vaak een best practise bij systemen met grote aantallen schijven of met een beperkte voedingscapaciteit.

Heb je toevallig ook de eventlogs (of raidcontroller logs mist beschikbaar) al eens bekeken om te kijken wat er gebeurt wanneer de server over zijn nek gaat? Want bij een server die 2 jaar stabiel draait, en dan ineens 3x in een week over zijn nek gaat heb ik het idee dat er iets aan het overlijden is hardwarematig, of er moet bijv. een software aanpassing zijn geweest in de afgelopen week waar hij niet vrolijk van wordt.

Raphie

Ik denk het laatste, driver > memory leak > bsod > reboot
Dat een schijf niet opspint is toeval en komt meestal door de warme reboot
Wanneer je server vaak even helemaal uit en aan zet, doet die vaak wel weer mee.
JBL PRX Power!

dennism

Een schijf die niet opspint hoeft geen toeval te zijn, zeker niet wanneer het altijd dezelfde schijf is die weigerd op te spinnen (al is niet duidelijk nog of dat hier het geval is), heb vaak genoeg schijven gezien die op die manier lieten blijken dat ze langzaam maar zeker aan het overlijden waren, maar het hoeft ook niet perse de oorzaak van de problemen. Daarom is ook een goed onderzoek (alle wijzigingen de van de laatste tijd + eventlogs / hardware logs doorlopen) erg belangrijk om de oorzaak te vinden.

Hanky Panky

Het is inderdaad altijd de derde schijf in het Rapidstore overzicht die uitvalt. Vandaar dat ik vast kabels heb besteld.
Maak van jouw verwachting niet mijn verplichting.

LG OLED77C25LB // Denon AVR-X3400H // Nvidia Shield TV pro // 5 x B&W M1 // SVS SB3000

Isflicka

Quote from: Hanky Panky on November  1, 2014, 12:10:11
Het is inderdaad altijd de derde schijf in het Rapidstore overzicht die uitvalt. Vandaar dat ik vast kabels heb besteld.
Toevallig heb ik sinds donderdag ook opvallend veel Raid uitval op verschillende systemen. Kan toeval zijn.
Als je ergens niet bent, ben je óf te vroeg óf te laat. Johan Cruijff

Hanky Panky

Ik zal ook eens kijken of ik de stroomvoorziening kan rerouten. Ik vermoed dat deze disk achteraan in de lijn zit en dan wellicht net niet genoeg spanning krijgt om op te spinnen bij een start. Even alles uitsluiten. Nieuwe kabels komen morgen (Post.nl bezorgt niet op maandag).
Maak van jouw verwachting niet mijn verplichting.

LG OLED77C25LB // Denon AVR-X3400H // Nvidia Shield TV pro // 5 x B&W M1 // SVS SB3000

dennism

Quote from: Hanky Panky on November  3, 2014, 13:28:55
Ik zal ook eens kijken of ik de stroomvoorziening kan rerouten. Ik vermoed dat deze disk achteraan in de lijn zit en dan wellicht net niet genoeg spanning krijgt om op te spinnen bij een start. Even alles uitsluiten. Nieuwe kabels komen morgen (Post.nl bezorgt niet op maandag).

Zou je inderdaad kunnen proberen, al zou een 550W voeding dat makkelijk moeten kunnen trekken (tenzij het een modelletje is waarbij de fabrikant wat te enthousiast is geweest met de specs). Maar ik zou ook zeker wanneer je dat nog niet gedaan hebt even de eventlogs / smart waardes uitlezen en deze analyseren (of desnoods hier even posten wanneer je er zelf niet uitkomt). Dan kun je mogelijk de oorzaak van de crashes ook achterhalen.

Hanky Panky

Smart waardes geven geen aanleiding tot zorgen. Ik gebruik CrystalDiskInfo 
Maak van jouw verwachting niet mijn verplichting.

LG OLED77C25LB // Denon AVR-X3400H // Nvidia Shield TV pro // 5 x B&W M1 // SVS SB3000

dennism

Die kun je voor smartwaardes prima gebruiken inderdaad.