Monitoring merevlemezek segítségével intelligens, 1. rész

Ez csak azért történt, hogy a kerekek hajlamosak meghalni. De gyakran az oka a halál meghajtó nagyon egyszerű. Modern lemezek meghajtók forgási sebessége néhány ezer fordulat percenként. A távolság a fejét, hogy a lemez felületén egy frakciója egy mikron. Gyakran meghajtók dolgoznak éjjel-nappal nagy a környezetszennyezés vagy kedvezőtlen hőmérsékleti körülmények között, hogy nagyon magas terhelés, vagy nem túl jó ügyfélszolgálati rendszerek. Haladó felhasználók ismerik a tünetek egy haldokló meghajtó: a rendszer instabillá válik, összetörik, a kernel meg bizonyos hibákat nehéz megmagyarázni. A legtöbb esetben az elveszett adatokat vehet egy egész nap, feltéve természetesen, hogy van egy tartalék. Bár, akkor is, ha van, és másolatot az összes fontos adatot, hirtelen merevlemez meghibásodása tűnhet egy katasztrófa.







Monitoring merevlemezek segítségével intelligens, 1. rész

Sok felhasználó még a rendszergazdák fogalmam sincs, mi a SMART (Self-Monitoring, Analysis and Reporting Technology). amely azonban jelen van az összes modern merevlemezeket. Lemezek SMART egyedül nézte életfunkciók és működőképességét. Ezek a lemezek, abban az esetben a hibák maguk tudja határozni, hogy valami nem működik. Ez a lehetőség a legtöbb esetben megakadályozza, hogy a forgatókönyv „hirtelen” a merevlemez nem. Szinte az összes tervezett intelligens lehetővé teszi a felhasználók futtatni egy öntesztet meghajtók és megtekintheti az értékeket teljesítményt és megbízhatóságot paramétereket.

Ez a cikk leírja, hogyan kell használni az eszközöket és a szerver smartctl smartd megfigyelni a lemez állapotától a rendszerben. A projekt az oldalon lehet letölteni a szükséges fájlokat és szerelési utasítás. Mindenképpen olvassa el a fájlt figyelmeztetéseket. listáját tartalmazó problémás vezérlők / lemezeket, amelyek a közüzemi nem működnek megfelelően. További dokumentáció megtalálható a programban ember oldalak, valamint a projekt oldalán.

Smartmontools rendelkezésre adattárak Slackware, Debian, SuSE, Mandrake, Gentoo, Conectiva és néhány más Linux-disztribúciók, így jó eséllyel könnyen telepíthető a szoftvert a rendszer a hagyományos módszer a rendszer.

Az első lépés, a parancs futtatásához

smartctl -a / dev / hda

cseréje / dev / hda a fájl elérési útját a meghajtót. Ha a SMART a meghajtó nincs engedélyezve, akkor először engedélyeznie kell azt a parancsot







smartctl -s / dev / hda

Az alábbi részben a kiadási smartctl -a parancsot ad tájékoztatást a modell és a merevlemez firmware, ebben a példában - IBM / Hitachi GXP-180. Smartmontools saját adatbázis lemeztípusokkal. Ha a modell a meghajtó van jelen az adatbázisban, akkor képes lesz arra, hogy helyesen értelmezze az értéke SMART attribútumokat.

ID # ATTRIBUTE_NAME flag értéke legrosszabb THRESH Típus Frissítve WHEN_FAILED RAW_VALUE

1 Raw_Read_Error _ Rate 0x000b 100 100 060 Pre - nem mindig - 0

2 Teljesítmény _ Performance 0x0005 155 155 050 Pre - nem elérhető - 225

3 Spin_Up _ Idő 0x0007 097 097 024 Pre - nem mindig - 293 (átlag 270)

4 Start_Stop _ Count 0x0012 100 100 000 Old_age Always - 10

5 Reallocated_Sector _ Ct 0x0033 100 100 005 Pre - nem mindig - 0

7 Seek_Error _ Rate 0x000b 100 100 067 Pre - nem mindig - 0

8 Seek_Time _ Performance 0x0005 125 125 020 Pre - nem elérhető - 36

9 Power_On _ Óra 0x0012 100 100 000 Old_age Always - 3548

10 Spin_Retry _ Count 0x0013 100 100 060 Pre - nem mindig - 0

12 Power_Cycle _ Count 0x0032 100 100 000 Old_age Always - 10

192 Power - Off_Retract _ gróf 0x0032 100 100 050 Old_age Always - 158

193 Load_Cycle _ Count 0x0012 100 100 050 Old_age Always - 158

194 Hőmérséklet _ Celsius 0x0002 189 189 000 Old_age Always - 29 (Élettartam Min / Max 23/33)

196 Reallocated_Event _ Count 0x0032 100 100 000 Old_age Always - 0

197 Current_Pending _ Sector 0x0022 100 100 000 Old_age Always - 0

198 Offline _ javíthatatlan 0x0008 100 100 000 Old_age Offline - 0

199 UDMA_CRC_Error _ Count 0x000a 200200000 Old_age Always - 0

Tanulmányok kimutatták, hogy a munkaidő csökkentése csupán 5 Celsius fokos hőmérséklet a tárcsa jelentősen csökkentheti a hibák számát előforduló munkáját. Így lehet egy egyszerű módja annak, hogy javítsa a megbízhatóságát telepíteni, egy további ventilátor neki.

Minden attribútumnak hat bájtérték (RAW_VALUE) és bájtos normalizált értéke (VALUE). Példánkban egy hőmérséklet paraméter, azt látjuk, három érték RAW_VALUE. az aktuális hőmérséklet (29), az ajánlott minimális (23), és az ajánlott maximális (33). RAW_VALUE adatformátum nem határozza meg minden szabványnak és minden gyártó használ néhány saját szabványokat. Annak érdekében, hogy meghajtó megbízhatóságának nyomon követésére, a firmware-t átalakítja a nyers-értéket attribútum normalizált fekvő tartományban 1 253. Ha a normalizált érték kisebb vagy egyenlő, mint a küszöb (THRESH), ez hibát jelez megjelenítendő WHEN_FAILED oszlopban. Ebben a példában ez az oszlop üres, mert az értékeket minden jó tulajdonsága normális. Táblázatban is látható legkisebb normalizált érték; van beállítva idején felvétele a lemez SMART. Típus oszlop megmutatja, hogyan kell értelmezni a attribútum értéke, amely a hibát: Old_age - az eszköz élettartama alatt eléri a határértéket az adott termelői; Pre-fail - várható eredmény eszköz meghibásodása. Például, míg a lemez (ID # 3) egy pre-fail attribútumot. Ha egy ilyen tulajdonság lesz állítva, hogy nem. az lenne várható kudarc a készülék 24 órán keresztül.

Attribútumneveket és értelmezésük nem határozta meg semmilyen szabványoknak. A különböző gyártók azonos ID attribútum különböző célokra. Emiatt smartctl lehetővé teszi, hogy felülbírálja a értelmezésére attribútum értékeket a -v. Lásd smartctl ember oldalt további információkért. Például egyes lemezek alkalmazásával 9-én attribútum tárolási időt, amely alatt a készülék be van kapcsolva. Segítségével smartctl -v 9 perc, beállíthatja a helyes értelmezése ezen attribútum értékét. Ha a modell a lemez jelen van az adatbázisban smartmontools adatokat. akkor ezek a beállítások automatikusan beállításra kerül.




Kapcsolódó cikkek