IDE - praca ciągła
-

- Christian Vilsbeck,
- 31.10.2003
Coraz częściej dyski IDE pracują w serwerach i stacjach roboczych w cyklu 24/7; w przyszłości ten los czeka dyski Serial ATA. Problem w tym, że nie są one przystosowane do pracy ciągłej. Przeanalizujemy, jakie zagrożenia to ze sobą niesie. Różnica w cenie między dyskami IDE a SCSI o takiej samej pojemności kształtuje się od lat na niezmiennym poziomie. Dysk SCSI jest do czterech razy droższy od porównywalnego dysku IDE.
Coraz częściej dyski IDE pracują w serwerach i stacjach roboczych w cyklu 24/7; w przyszłości ten los czeka dyski Serial ATA. Problem w tym, że nie są one przystosowane do pracy ciągłej. Przeanalizujemy, jakie zagrożenia to ze sobą niesie. Różnica w cenie między dyskami IDE a SCSI o takiej samej pojemności kształtuje się od lat na niezmiennym poziomie. Dysk SCSI jest do czterech razy droższy od porównywalnego dysku IDE.
Dyski SCSI są wprawdzie nadal szybsze, ale w wielu serwerach wystarczy całkowicie wydajność dysków IDE. Nie dziwi zatem tendencja do stosowania dysków IDE w środowiskach serwerowych. W przyszłości, gdy rozpowszechnią się dyski Serial ATA, trend ten może się jeszcze wzmocnić.
Po co więc kupować drogi dysk SCSI, jeżeli najwyższa wydajność nie jest akurat potrzebna? Czy tylko dlatego, że ich MTBF (średni czas między awariami) wynosi milion godzin, a dysków IDE - 500 tysięcy godzin? Licząc w ten sposób, dyski SCSI miałyby trwałość 114 lat, natomiast dyski IDE - "zaledwie" 57 lat.
Producenci dysków nie podają w swoich danych technicznych i materiałach reklamowych, w jaki sposób wyliczają tak nieprawdopodobnie wysoki współczynnik niezawodności. Z drugiej strony, chętnie przemilczają fakt, że większość dysków IDE, w przeciwieństwie do napędów SCSI, nie jest zasadniczo przystosowana do pracy ciągłej.
Dlatego zrozumiałe poruszenie wywołała informacja podana przez IBM (obecnie Hitachi Global Storage), że zalecany czas eksploatacji dysku IDE Deskstar 120GXP wynosi 333 godziny miesięcznie. Miesiąc ma, jakby nie liczyć, 732 godziny. IBM nie opublikował tej informacji całkiem dobrowolnie i spontanicznie. Poprzednik modelu Deskstar 120GXP, model Deskstar 75GXP, przysporzył wielu użytkownikom sporo kłopotów w wyniku częstych awarii.
Nasza ankieta - dyski IDE w pracy ciągłej
IDE w stresie - bardzo wysoki odsetek naszych czytelników eksploatuje swoje dyski IDE w trybie 24/7, 12 procent miało już do czynienia z awarią.
Z ponad tysiąca respondentów 54 procent używa napędów IDE do pracy ciągłej w komputerach biurkowych. Napędy IDE do pracy ciągłej w serwerach stosuje 27 procent respondentów. Dwanaście procent ogółu respondentów miało już do czynienia z awarią. Trzy procent spośród tych ostatnich zaprzestało stosowania dysków IDE do pracy ciągłej. W sumie 26 procent użytkowników eksploatuje swoje dyski maksymalnie osiem godzin dziennie.
Zamieszanie wokół 333 godzin IBM
Pod koniec roku 2001 IBM (obecnie Hitachi Global Storage) przyznał otwarcie, wprowadzając do sprzedaży dysk Deskstar 120GXP, że dyski IDE to w żadnym razie maratończycy, a co najwyżej zawodnicy etapowi. Problem nie polegał na tym, że charakteryzowała je duża awaryjność. Punktem wyjścia do dyskusji stała się informacja zamieszczona po raz pierwszy w arkuszu danych technicznych dysku Deskstar 120GXP.
Power on hours - jeżeli zamiast 2400 godzin rocznie dysk pracuje bez przerwy (7680 godzin), prawdopodobieństwo awarii rośnie o współczynnik 1,8 (źródło - Seagate).
Złe języki twierdziły, że IBM zabezpiecza się w ten sposób po wpadce z dyskiem Deskstar 75GXP. To oczywiście prawdopodobne, ale w gruncie rzeczy IBM był po prostu uczciwy. Publikując zalecenie dotyczące dobowego czasu pracy, producent powiedział otwarcie to, co pozostali chętnie przemilczają - standardowe dyski IDE nie nadają się generalnie do pracy ciągłej.
Według IBM, 333 godziny pracy w miesiącu to typowy schemat pracy dysku w komputerze biurkowym. Statystycznie rzecz ujmując, jest to prawda, ale ta informacja wzbudziła zaniepokojenie użytkowników. Co się stanie, gdy Deskstar 120GXP będzie pracował dzień i noc całymi miesiącami?
IBM poinformował nas, że Deskstar 120GXP można z powodzeniem stosować również w pracy ciągłej. Trzeba tylko pamiętać, że zwiększa to prawdopodobieństwo awarii. Jeżeli dysk jest eksploatowany dłużej niż 333 godziny w miesiącu, to zdaniem IBM: "nie oznacza od razu, że w najbliższym czasie dysk ulegnie awarii."
Po upływie kilku miesięcy IBM wycofał zalecenie ze specyfikacji. "Opublikowanie zalecenia limitu czasu pracy wywołało pewne - nieusprawiedliwione - zaniepokojenie" - powiedział nam Uwe Kemmer z IBM Technology Group. Powstaje pytanie, czy w wyniku usunięcia jednego wiersza ze specyfikacji dysk stał się bardziej niezawodny.
Niejasne informacje producentów
Duty cycle - gdy spada przeciętne obciążenie (liczba operacji dyskowych), rośnie niezawodność, zwłaszcza dysków wielotalerzowych (źródło - Seagate).
Western Digital w odpowiedzi na nasze pytanie poinformował, że jego szacunki niezawodności dysków opierają się na 60-godzinnym tygodniu roboczym. To 240 godzin miesięcznie, a więc znacznie mniej niż w przypadku IBM
Dyski IDE firmy Seagate muszą być eksploatowane jeszcze bardziej oszczędnie. Tak przynajmniej zakłada producent - osiem godzin dziennie, pięć dni w tygodniu. To przeciętnie zaledwie 173 godziny miesięcznie.
Gdyby dysk IDE naprawdę był przystosowany do pracy ciągłej, akceptowany przez producenta czas pracy w miesiącu musiałby wynosić 732 godziny. Wydaje się, że tak jest w przypadku Maxtora. Jak twierdzi Thomas Astheimer, Manager Customer Engineering w firmie Maxtor, ich dyski IDE i SCSI nie wykazują różnic jakościowych. Oba typy napędów przystosowane są do pracy ciągłej. Jednak gdy przyjrzeć się dokładnie specyfikacjom dysków IDE i SCSI Maxtora, można zauważyć kilka różnic. Na przykład dysk SCSI Atlas 10K IV charakteryzuje się awaryjnością poniżej 0,7 procent, ale napędy IDE muszą zadowolić się współczynnikiem poniżej 1 procent.
Abstrakcyjne czasy MTBF
Wpływ temperatury - każdy stopień ponad temperaturę nominalną oznacza wzrost awaryjności dysku o 2 do 3 procent (źródło - IBM).
Wartość MTBF jest w przemyśle powszechnie przyjętym wskaźnikiem częstotliwości występowania błędów i znajduje zastosowanie nie tylko w odniesieniu do twardych dysków. W przypadku dysków SCSI typowa wartość MTBF to milion godzin. Czy to oznacza, że dysk pracuje 114 lat, zanim ulegnie awarii? Oczywiście nie; trwałość podzespołów dysku jest obliczana na pięć lat. Wysokie wartości MTBF wprowadzają w błąd, ponieważ nic nie mówią o rzeczywistej trwałości dysku. MTBF należy raczej traktować jako wskaźnik prawdopodobieństwa wystąpienia awarii. Przykład: tysiąc dysków, każdy o wskaźniku MTBF milion godzin, pracuje przez rok. Na podstawie wskaźnika MTBF można założyć, że awarii ulegnie 8,5 dysku. Wartość MTBF to liczba próbek, pomnożona przez liczbę roboczych godzin i podzielona przez liczbę awarii w okresie trwania testu.
Wskaźnikiem bardziej konkretnym niż MTBF jest wskaźnik prawdopodobieństwa awarii w ciągu roku (AFR). To prawdopodobieństwo wystąpienia awarii w procentach. Wskaźnik AFR wylicza się na podstawie liczby awarii zainstalowanych urządzeń w ciągu miesiąca, pomnożonej przez 12 (w przeliczeniu na rok). Typowa wartość AFR wynosi 0,9 procent. Jest również bezpośrednia zależność między AFR a MTBF: ARF% + 1/MTBF x POH x 100. Ze względu na małą czytelność informacja o MTBF coraz rzadziej znajduje się w specyfikacjach dysków. Niektórzy producenci, jak Maxtor, publikują już tylko wskaźnik AFR.